TWI355647B - Analysis filterbank, synthesis filterbank, encoder - Google Patents

Analysis filterbank, synthesis filterbank, encoder Download PDF

Info

Publication number
TWI355647B
TWI355647B TW096138773A TW96138773A TWI355647B TW I355647 B TWI355647 B TW I355647B TW 096138773 A TW096138773 A TW 096138773A TW 96138773 A TW96138773 A TW 96138773A TW I355647 B TWI355647 B TW I355647B
Authority
TW
Taiwan
Prior art keywords
window
frame
input
samples
frames
Prior art date
Application number
TW096138773A
Other languages
English (en)
Other versions
TW200832357A (en
Inventor
Bernhard Grill
Markus Schnell
Ralf Geiger
Gerald Schuller
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200832357A publication Critical patent/TW200832357A/zh
Application granted granted Critical
Publication of TWI355647B publication Critical patent/TWI355647B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Facsimile Transmission Control (AREA)
  • Telephonic Communication Services (AREA)
  • Complex Calculations (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

1355647 九、發明說明: 【發明所屬之技術領域】 本發明係有關於一種分析濾波器組、一種合成濾波器 組,以及包含前述的彼等濾波器組之中的任一種濾波器組 的系統,其可以,例如實現於現代的音頻編碼、音頻解碼 或者其它的音頻傳輸相關應用領域中。更進一步地,本發 明也係關於一種混音器以及一種會議系統。 【先前技術】
現代的數位音頻處理典型地係依據,相較於該個別的 音頻資料的一種直接傳輸或者儲存的方式,可以在位元 率、傳輸頻寬以及儲存空間等方面顯著地降低的編碼方 案。這係藉由在該發送器地點對該音頻資料進行編碼,並 且在該接收器地點,在例如提供該解碼音頻資料給一收聽 者之前,對該已編碼資料進行解碼而達成的。 這樣的數位音頻處理系統可以相對於廣泛範圍的參數 實施,分別包含用於一典型的可能標準化音頻資料串流的 典型的儲存空間、位元率、特別係就實施架構的有效率性 與適用於不同應用的可達成的品質以及就這兩者所造成的 延遲等方面而言的計算複雜度、該音頻資料的編碼與解 碼、以及該已編碼的音頻資料等。換句話說,數位音頻系 統可以實行於各種不同的應用領域,其涵蓋範圍可以從一 種極低品質的傳輸一直延伸到音頻資料的一種高層次傳輸 (例如用於一高品質的音樂收聽體驗)。 然而,在許多情況中,必須就各種不同的參數之間達 1355647 成妥協’這些參數係例如位元率、計算複雜度、品質以及 延遲等。舉例而言,在一可比較的品質水準上,與具有一 較高延遲的音頻系統比較之下,具有較低延遲的一數位音 頻系統可以要求一傳輸頻寬的較高的位元率。 【發明內容】
用以過濾多數個由數個已排序的輸入取樣所構成的時 域輸入訊框的一種分析濾波器組的一個具體實施例,包含 一種視窗器’經過適當配置以產生多數個視窗型訊框,其 中一個視窗型訊框係包含多數個視窗型取樣,其中該視窗 器係經過配置以一種重疊的方式,使用取樣超前數値,處 理彼等輸入訊框,其中該取樣超前數値係小於一輸入訊框 的已排序輸入取樣的個數除以二,以及包含一時間/頻率轉 換器’經過適當配置以提供包含數個輸出値的一·輸出訊 框,其中一個輸出訊框係爲一視窗型訊框的一種光譜表示。 用以過濾多數個輸入訊框的一種合成濾波器組的具體 φ 實施例,其中每一個輸入訊框包含數個已排序的輸入値, 該合成濾波器組包含:一種頻率/時間轉換器,經過適當配 置以提供多數個輸出訊框’其中一輸出訊框係包含數個已 排序的輸出取樣,其中一輸出訊框係爲一輸入訊框的一種 時間表示;一種視窗器’經過適當配置以產生多數個視窗 型訊框。一視窗型訊框包含多數個視窗型取樣。該視窗器 係進一步經過適當配置以提供彼等視窗型取樣,用於以一 種重疊的方式,依據取樣超前値進行的一種處理程序。該 1355647
合成濾波器組的具體實施例進一步包含一種重疊/加法器 (overlap/adder) ’經過適當配置以提供—種加成訊框,包含 一起始區段以及一剩餘區段’其中一加成訊框包含多數個 加成取樣’係將來自於至少三個視窗型訊框的至少三個視 窗型取樣加在一起’以作爲在一加成訊框的剩餘區段中的 一個加成取樣’以及將來自於至少兩個不同的視窗型訊框 的至少兩個視窗型取樣加在一起,以作爲在該起始區段中 的一個加成取樣。該剩餘區段中,加在一起以得到一加成 取樣的視窗型取樣的個數,係至少高於在該起始區段中, 加在一起以得到一加成取樣的視窗型取樣的個數,或者該 視窗器係經過適當配置,依據彼等已排序的輸出取樣的順 序’至少忽略該最早的輸出値,或者對於彼等視窗型訊框 中的每一個視窗型訊框’設定彼等對應的視窗型取樣爲一 事先決定的數値,或者在一事先決定的範圍內的至少一個 數値。重疊/加法器(230)係經過適當配置以提供在一加成訊 框的該剩餘區段中的該加成取樣,依據來自於至少三個不 同的視窗型訊框的至少三個視窗型取樣,以及在該起始區 段中的一加成取樣,依據來自於至少兩個不同的視窗型訊 框的至少兩個視窗型取樣。
用以過濾多數個輸入訊框的一種合成濾波器組的具體 實施例’其中每一個輸入訊框包含Μ個已排序的輸入値 ^(〇),…,yk(M-l),其中Μ係一正整數,以及其中1係一表 示一訊框索引的整數,該合成濾波器組包含:一種反第IV 1355647 類型離散餘弦變換頻率/時間轉換器(in verse type-IV discrete cosine transform frequency/time converter),經過適 當配置,依據彼等輸入値yk(0),…,yk(M-l),以提供多數個 輸出訊框,一輸出訊框包含2M個已排序的輸出取樣 Xk(0),…,xic(2M-l); —種視窗器,經過適當配置以產生多數 個視窗型訊框,一視窗型訊框依據下列方程包含多數個視 窗型取樣zk(0),…,Zk(2M-l)式:
zk(n)= w(n) xk(n), 對於 0,.·.,2Μ- 1, 其中/7係一整數,表示取樣索引,以及其中ρΚλ)係一 實數視窗函數係數,對應於該取樣索引;2 ; —種重疊/加法 器,經過適當配置以提供一中間訊框,依據下列方程式包 含多數個中間取樣nu(0),···,nu(M-l): mk(n) = zk(n) + zk_i(n+M) 對於 η = M-l , 以及一種抬昇器(lifter),經過適當配置以提供一加成 訊框,依據下列方程式包含多數個加成取樣 ouU(O),···, 〇 u tk (Μ -1): 〇utk(n) = mk(n) + l(n-M/2) · ιη^ίΜ-Ι-η) 對於 η = 以及 〇utk (η) = m]c(n) + l(M-l-n) · outk-i (M-l-n) 對於 η=〇,...ΛΜ/2-1 , 其中八〇),···,八AM)係爲實數的提高係數(lifting coefficient) ° 一種編碼器的具體實施例,該編碼器包含一種分析濾 1355647 波器組,用以過濾多數個時域輸入訊框,其中一個輸人-訊 框包含數個已排序的輸入取樣,該分析濾波器組包含-胃 視窗器,經過適當配置以產生多數個視窗型訊框,其中_ 個視窗型訊框係包含多數個視窗型取樣,其中該視窗器@ 經過配置以一種重疊的方式,使用取樣超前數値,處理彼 等輸入訊框,其中該取樣超前數値係小於一輸入訊框的^_ 排序輸入取樣的個數除以二;以及一種時間/頻率轉換器,
經過適當配置以提供包含數個輸出値的一輸出訊框,其中 一個輸出訊框係爲一視窗型訊框的一種光譜表示。 一種解碼器的具體實施例,該解碼器包含一種合成濾 波器組,用以過濾多數個輸入訊框,其中每一個輸入訊框 包含數個已排序的輸入値,該合成濾波器組包含:一種頻 率/時間轉換器,經過適當配置以提供多數個輸出訊框,一 輸出訊框係包含數個已排序的輸出取樣,一輸出訊框係爲 一輸入訊框的一種時間表示;一種視窗器,經過適當配置 以產生多數個視窗型訊框,一視窗型訊框包含多數個視窗 型取樣;以及其中該視窗器係依據一取樣超前値進行的一 種處理程序,經過適當配置以提供一種用於重疊方式處理 之彼等視窗型取樣;一種重疊/加法器(overlap/adder),經 過適當配置以提供一種加成訊框,包含一起始區段以及一 剩餘區段,一加成訊框包含多數個加成取樣,係將來自於 至少三個視窗型訊框的至少三個視窗型取樣加在一起,以作 爲在一加成訊框的該剩餘區段中的一個加成取樣,以及將 1355647
來自於至少兩個不同的視窗型訊框的至少萍 加在一起,以作爲在該起始區段中的一個加 在該剩餘區段中,加在一起以得到一加成取 樣的個數,係至少比在該起始區段中加在一 成取樣的視窗型取樣的個數高於一個取樣數 視窗器係經過適當配置,以至少忽略依據彼 出取樣的順序之該最早的輸出値,或者對於 框中的每一個視窗型訊框,設定彼等對應的 一事先決定的數値,或者在一事先決定的範 個數値;以及其中該重疊/加法器係經過適當 自於至少三個不同的視窗型訊框的至少三個 加成訊框的該剩餘區段中提供該加成取樣, 於至少兩個不同的視窗型訊框的至少兩個視 起始區段中提供一加成取樣。
一種解碼器的另具體實施例,該解碼器 濾波器組,用以過濾多數個輸入訊框,其中 框包含Μ個已排序的輸入値yic(〇),.·.,yk(M. —正整數,以及其中i係一表示一訊框索弓 成爐波器組包含:一種反第IV類型離散餘 間轉換器,經過適當配置,依據彼等輸 y k (Μ -1),以提供多數個輸出訊框, 輸出舒 已排序的輸出取樣Xk(〇), (2M-1); 適當配置以產生多數個視窗型訊框 視 個視窗型取樣 成取樣,其中 樣的視窗型取 起以得到一加 :或者其中該 等已排序的輸 彼等視窗型訊 視窗型取樣爲 圍內的至少一 配置以依據來 視窗型取樣一 以及依據來自 窗型取樣,於 包含一種合成 每一個輸入訊 1),其中Μ係 的整數,該合 弦變換頻率/時 入値 yJO),.-·, ,框包含2M個 ΐ視窗器,經過 【型訊框依據下 -10- 1355647 列方程式包含多數個視窗型取樣Zk(〇),..·,Zk(2M-l): 之“η) = w(n) · xk (η) 對於 n = 0,···,2Μ-1 其中Λ係一整數,表示取樣索引,以及其中係一 實數視窗函數係數,對應於該取樣索引Λ —種重疊/加法 器’經過適當配置以提供一中間訊框,依據下列方程式包 含多數個中間取樣rru(O),…,mk(M-l): mk(n) = zic(n) + Zk-Hn+M) 對於 n = 0,...rM-l ,
以及一種抬昇器’經過適當配置以提供一加成訊框, 依據下列方程式包含多數個加成取樣〇uU(0),.··, outk(M-1): 〇utk(n) = mk(n) + l(n-M/2) · πι^ίΜ-Ι-η) 對於 η = Μ/2,···,Μ-1 以及 outk(n) = mk(n) + 1 (M-l-n) · outk-i (M-l-n) 對於 η=0,·",Μ/2-1 , 其中Α0),···,ΑΜ-1)係爲實數的提高係數。 一種用以混合多數個輸入訊框的混音器的具體實施 例’其中每一個輸入訊框係爲一對應時域訊框的一種光譜 表示’以及彼等輸入訊框的每一個輸入訊框係由不同的來 源提供,該混音器包含:一種熵解碼器,經過適當配置以 對彼等輸入訊框進行熵解碼一種縮放器(scaler),經過適當 配置以對彼等熵解碼輸入訊框在該頻域中進行縮放,以及 經過適當配置以獲得在該頻域中的多數個已經縮放過的訊 1355647 框’其中每一個已經縮放過的訊框係對應於一熵編碼訊 框;一種加法器(adder),經過適當配置,將在該頻域中的 彼等已經縮放過的訊框加在一起,以產生在該頻域中的一 加成訊框;以及一種熵編碼器(entropy encoder),經過適當 配置,對該加成訊框進行熵編碼,以獲得一混合訊框。
—種會議系統的具體實施例,該會議系統包含一種混 音器’用以混合多數個輸入訊框,其中每一個輸入訊框係 爲一對應時域訊框的一種光譜表示,以及彼等輸入訊框的 每一個輸入訊框係由不同的來源提供,該混音器包含:一 種熵解碼器,經過適當配置以對彼等輸入訊框進行熵解 碼;一種縮放器,經過適當配置以對彼等熵解碼輸入訊框 在該頻域中進行縮放,以及經過適當配置以獲得在該頻域 中的多數個已經縮放過的訊框,每一個已經縮放過的訊框 係對應於一熵解碼輸入訊框;一種加法器,經過適當配置, 將在該頻域中的彼等已經縮放過的訊框加在一起,以產生 在該頻域中的一加成訊框;以及一種熵編碼器,經過適當 配置,對該加成訊框進行熵編碼,以獲得一混合訊框。 【實施方式】 接下來,本發明的彼等具體實施例,將參考於所伴隨 的彼等圖示,於下文中詳加敘述。 第1至24圖顯示描述本發明的一分析濾波器組、一合 成濾波器組、編碼器 ' —解碼器、混合器、一會議系統的 不同具體實施例以及其它的具體實施例的功能特性與特徵 -12-
1355647 的數個方塊圖以及描述功能特性的圖式。 第1與第2圖,描述一合成濾波器組的具 將先詳細描述一分析濾波器組的具體實施 析濾波器組的具體實施例處理的輸入訊框 第1圖係爲一種分析濾波器組1 〇〇 例,包含一種視窗器1 1 0以及時間/頻率轉 確地來說,該視窗器1 1 0係經過適當的配 時域輸入框,在一輸入110i處,每一個 個已經排序的輸入取樣。該視窗器1 1 0更 於產生多數個視窗型訊框,係在該視窗# 1 1 0〇,由該視窗器提供。每」個視窗型訊 窗型取樣,其中該視窗器1 1 0係進一步經 同將在第 2圖的上下文中更詳細地解釋 値,以一種重疊的方式處理彼等視窗型取 該時間/頻率轉換器120,係具有接收 φ 所輸出的彼等視窗型訊框的能力,並且經 供包含數個輸出値的一輸出框架,使得一 視窗型訊框的一種光譜表示。 爲了闡明以及槪述一種分析濾波器組 例的彼等功能特性與特徵的綱要,第2圖 描繪五個輸入訊框130-(k-3)、130-(k-2)、 以及130-(k+l)的一槪略表示圖,如第2 ffl 所表示。 然而,在參考於 體實施例之前, 例以及利用一分 的槪要表示。 的一第具體實施 ί換器120。更精 置以接收多數個 輸入訊框包含數 進一步地係適用 i 1 10的該輸出 框包含多數個視 過適當配置,如 ,使用取樣超前 樣。 由該視窗器1 1 0 過適當配置以提 輸出框架係爲一 100的具體實施 係以時間的函數 130-(k-1) ' 130-k g底部的箭號mo -13- 1355647
接下來,將參考於該輸入訊框130-k,更詳細地敘述一 種分析濾波器100的具體實施例的操作’如第2圖中的虛 線所表示。相對於此輸入訊框130-k,該輸入訊框i3〇-(k+l) 係爲一未來的輸入訊框,而彼等三個輸入訊框130-(k-1)、 130-(^2)以及130-(13)係爲過去的輸入訊框。換句話說,]{ 係一表示一訊框索引的整數,使得越大的訊框索引,表示 該對應的輸入訊框係位於更遠的『未來』。因此,越小的 索引k,表示該輸入訊框係位於更遠的『過去』。 每一個輸入訊框130至少包含兩個子區段150,這兩個 區段的長度相同。更精確地來說,在第2圖中所描繪的該 綱要表示圖所依據的一種分析濾波器100的具體實施例的 情況中,該輸入訊框130-k以及其它的彼等輸入訊框130, 包含子區段150-2、150-3以及150-4,就輸入取樣而言,這 些子區段的長度係相等的。該輸入訊框130的這些子區段 150,每一個皆包含Μ個輸入取樣,其中Μ係一正整數。 〇 更進一步地,該輸入訊框130也包含·一第一子區段150-1, 該第一子區段也包含Μ個輸入訊框。在此情況中,該第一 子區段150-1包含該輸入訊框130的一初始區段160,其可 以包含輸入取樣或者其它的數値,如同將在稍後的一個階 段中的更詳細地解釋。然而,依據分析濾波器組的該具體 的實現架構而定,該第一子區段150-1可以完全不需要包 含一初始區段160»換句話說,該第一子區段150-1理論上 與其它的子區段150-2、150-3、150-4相較之下,可以包含 14- 1355647 較少個數的輸入取樣,這種情況的實例也將在稍後說明。 除了該第一子區段15 0-1以外,另外可供選擇的係其 它的彼等子區段150-2、150-3、15 0-4包含典型地相同的輸 入取樣個數Μ,係與該所謂的取樣超前値1 7 0相同,該取 樣超前値係表示兩個連續的輸入訊框.1 3 0,相對於時間以及 彼此,移動的輸入取樣的數目。換句話說,由於如同一箭 號17 0所指示之該取樣超前値Μ,在一分析濾波器組1 〇 〇
的該情況中,如同在第1與第2圖中所描繪的,係等於彼 等子區段150-2、150-3、150-4的長度,因此彼等輸入訊框 130係以一種重疊的方式,由該視窗器110產生以及處理。 更進一步地,該取樣超前値Μ(箭號170)也係與彼等子區段 150-2至150-4的長度相同》 因此,就輸入取樣的有效個數而言,在兩個輸入訊框 皆包含這些輸入取樣的意義上,彼等輸入訊框130-k與 13 0-(k+Ι)係相等的,同時它們係相對於這兩個輸入訊框130 的彼等個別的子區段150進行平移。更精確而言,該輸入 訊框 130-k的該第三子區段 150-3係等於該輸入訊框 130-(k+l)的該第四子區段150-4。於是該輸入訊框130-k的 該第二子區段150-2係與該輸入訊框130-(k+l)的該第三子 區段1 5 0 - 3完全相同。 又換句話說,對應於訊框索引k與k+Ι的這兩個輸入 訊框130-k 、:l30-(k+l),在第2圖中所顯示的彼等具體實 施例的情況中,就兩個子區段150而言,除了就具有該索 -15-
1355647 引訊框(k+l)的該輸入訊框而言,彼等取樣係已經被移 這個事實之外,係完全相同的。 前述的這兩個輸入訊框130-k與l30-(k+l),更進 地,共有來自於該輸入訊框130-k的該第一子區段 的至少一個取樣。更精確的來說,在第2圖中所顯示 具體實施例的情況中,並非該初始區段1 60的一部分 輸入訊框130-k的該第一子區段150-1中的全部輸入耳 係以該輸入訊框130-( k+l)的該第二子區段150-2的一 呈現。然而,對應於之前的該輸入訊框1 3 0 - k的該初 段160 ’該第二子區段150-2的彼等輸入取樣,可依據 不依據各自的該輸入訊框130的該初始區段的彼等數 或者輸入取樣,視一分析濾波器組的具體實施例的該 實現架構而定。 在該初始區段160存在使得在該第一子區段150 的輸入訊框的數目係等於在其它的子區段150-2至 中的輸入取樣個數的該情況中,理論上必須考慮兩種 的情況,雖然在這兩種『極端』的情況(將在稍後解: 間的其它情況也係可能的。 若該初始區段16CL·就在該初始區段160中的彼等 取樣確實係表示時域中的一音頻信號的意義而言,係 『有意義』的已編碼輸入取樣,則這些輸入取樣也將 下來的該輸入訊框130-( k+l)的該子區段150-2的一部 然而,這種情況在一分析濾波器組的具體實施例的許 動的 —步 150-1 的該 之該 5樣, 部分 始區 或可 入値 具體 -1中 150-4 不同 釋)之 輸入 包含 係接 丨分。 多應 -16- 1355647 用中’並非係一最佳的實現架構,因爲此選項可能造成額 外的延遲。
然而’在該初始區段160並未包含『有意義』的輸入 取樣(在此情況中也可以視爲係輸入値)的情況中,該初始 區段1 60的彼等對應的輸入値可以包含隨機的數値、一事 先決定的、固定的、可調整的或者可程式化的數値,這些 數値可以例如利用一單元或者模組的一種演算法計算、判 定或者其它固定的方式提供,該單元或者模組可以耦合於 該分析濾波器組的該具體實施例之該視窗器1 1 〇的輸入 1 1 0i。然而’在此情況中,此模組典型地係需要提供一輸 入訊框作爲該輸入訊框130-(k+l),該輸入訊框包含在該第 二子區段150-2中,在對應於f有意義』的輸入取樣(其確 實對應於該對應的音頻信號)之前的該輸入訊框的該初始 區段160的該區域中。此外,耦合於該視窗器11〇的該輸 入110i的單元或者模組,在該輸入訊框130-(k+l)的該第一 φ 子區段150-1的該架構中,典型地也係需要提供對應於該 音頻信號的有意義的輸入取樣。 換句話說,在此情況中,對應於該訊框索引k的該輸 入訊框130-k係在累積充分的輸入取樣之後,提供給一分 析濾波器組1 00的該具體實施例,使得這個輸入訊框的該 子區段150-1可以塡滿這些輸入取樣。該第一子區段丨”」 其餘的部分’亦即該初始區段1 60接著被塡滿輸入取樣或 者輸入値’包含隨機數値或者任何其它的數値例如預先決 -17- 1355647 定的、固定的、可調整的或者可程式化的數値’或者任何 其它數値的組合。由於這係在理論上與一典型的取樣頻率 比較之下,可以利用更高的速率完成,因此提供該輸入訊 框130-k的該初始區段160這些『無意義』的輸入取樣, 並不需要由一典型的取樣頻率所代表的規模上的一顯著的 時間週期,典型的取樣頻率係例如在幾個kHz至幾百個kHz 的範圍之內的取樣頻率。
然而,該單位或者模組係持續地收集以該音頻信號爲 基礎的輸入取樣,以將這些輸入取樣倂入至對應於該訊框 索引k+Ι的接下來的該輸入訊框130-(k+Ι)。換句話說,雖 然該模組或單元並未終止收集足夠的輸入取樣以提供給該 輸入取樣130-k,就該第一子區段150-1而言,具有充分的 輸入取樣以完全地塡滿此輸入取樣的該第一子區段 15 0-1,而係提供此輸入訊框至該分析濾波器組100的具體 實施例,一旦有足夠的輸入取樣可用時,使得該第一子區 段150-1可以被輸入取樣塡滿,不需要該初始區段160。 接下來的彼等輸入取樣將被用於塡滿接下來的該輸入 訊框130-(k+l)的該第二子區段150-2其餘的輸入取樣,一 直到已經聚集足夠的輸入取樣爲止,使得此接著的輸入訊 框的該第一子區段150-1也可以被塡滿,直到此訊框的該 初始區段160開始爲止。接著,再一次地,該初始區段160 將被塡滿隨機的數字或者其它的『無意義』的輸入取樣或 者輸入値。 -18- 1355647 結果,雖然與在第2圖中所顯示之該具體實施例的情 況中的彼等子區段150-2至150-4的長度相同的該取樣超前 値170係表示於第2圖中,以及表示該取樣超前値170的 該誤差係顯示於第2圖中’從該輸入訊框130-k的該初始 區段.160的起點一直到接下來的該輸入訊框130-(k+1)的該 初始區段160的起點爲止。
另一個結果係對應於在對應於該初始區段1 60的該音 頻信號中的一個事件的一個輸入取樣,在最後的兩種情況 中將不會出現在各自的彼等輸入訊框130-k中,而係在該 第二子區段 150-2的該架構中接下來的該輸入訊框 130-(k+l)中。 換句話說,一分析濾波器組100的許多具體實施例可 以提供具有一降低延遲的一輸出訊框,因爲對應於該初始 區段160的彼等輸入取樣並非各自的該輸入訊框130-k的 一部分,而將僅影響後來的該輸入訊框130-(k+l)。換句話 φ 說,一分析濾波器組的具體實施例,在許多的應用與實現 中具有可以依據該輸入訊框,更快地提供該輸出訊框的優 點,因爲該第一子區段150-1並不需要包含與其它的子區 段150-2至150.4,相同的輸入取樣個數。然而,包含在該 『遺失區段』中的該資訊,在該各自的輸入訊框130的該 第二子區段150-2的該架構中,係包含在接下來的該輸入 訊框1 30中。 然而,如同在稍早所指出的,也可能存在的情況係其 -19- 1355647
中的彼等輸入訊框130不包含該初始區段160。在此情況 中,每一個輸入訊框130的長度不再是該取樣超前値170 或者彼等子區段150-2至150-4長度的一整數倍》更精確而 言,在此情況中,每一個輸入訊框130的長度,與對應的 該取樣超前値的整數倍不同之處係爲該輸入取樣數,其中 該模組或者單元提供該視窗器110各自的彼等輸入訊框, 係在提供該完整的第一子區段150-1之後立即停止。換句 話說,這樣一種輸入訊框130的整體長度,與各自的取樣 超前値的整數値之間係相差,該第一子區段1 50-1的長度 與其它的子區段150-2至150-4比較之後的該差異量。 然而,在前述的最後兩種情況中,可以例如包含取樣 器(sampler)、取樣保持階段(sample-and-hold stage)' 取樣 保持器(sample-and-holder)或者量化器(quantizer)的該模組 或者單元,可以開始提供對應的該輸入訊框130,少於一事 先決定的輸入取樣個數,使得每一個輸入訊框130可以被 φ 提供給一分析濾波器組1〇〇的具體實施例,與其中該完整 的第一子區段150-1係塡滿對應的輸入取樣的該情況相較 之下,具有較短的延遲。 如同已經在先前指出的,可以係耦合於該視窗器丨i 0 的該輸入1 1 〇i的這樣的單元或者模組,可以係例如包含取 樣器以及/或者一量化器’例如類比/數位轉換器(A/D轉換 器)。然而,視具體的實施方式而定,這樣的模組或者單元 可以進一步包含一些記憶體或者暫存器,以儲存對應於該 -20-
1355647 音頻信號的彼等輸入取樣。 此外,這樣的單元或者模組可以係依據 Μ,以一種重疊的方式提供每一個輸入訊框。 一個輸入訊框包含,與每一個訊框或者區塊所 個數比較之下,兩倍以上的輸入取樣個數。在 實施例中’這樣的一個單元或者模組係經過適 得兩個接連產生的輸入訊框係依據相對於時間 超前値的多數個取樣。在此情況中,這兩個接 入訊框中’較晚的該輸入訊框係依據至少一個 樣’作爲該最早的輸出取樣,並且前述的彼等 後平移在這兩個輸入訊框中較早的該輸入訊框 前値。 雖然到目前爲止,分析濾波器組1 〇〇的具 係從每一個輸入訊框130包含四個子區段150, 子區段150並不需要包含與其它的子區段所包 樣個數相同的輸入取樣數的方式描述,並不需 如同第2圖中所描繪的該情況。更精確而言, 130理論上可以包含大於該取樣超前値Μ (箭號 兩倍之任意數目的輸入取樣,其中該初始區段 値數目’若存在的話,其輸入値的數目必須係 目中’因爲其可能對於考量依據使用訊框的一 體實施例的一些實現架構時係有幫助的,其中 係包含數個取樣,其個數係與該取樣超前値完 取樣超前値 換句話說, 聚集的取樣 許多的具體 當調整,使 平移該取樣 連產生的輸 新的輸出取 取樣係在稍 的該取樣超 體實施例, 其中該第一 含的輸入取 要等於四, 一輸入訊框 170)的大小 160之輸入 包含在此數 種系統的具 每一個訊框 全相同。換 -21 - 1355647 句話說’任意個數的子區段,每一個皆具有與該取樣超前 値Μ(箭號170)相同的長度,可以用於一種分析濾波器組 100的具體實施例的該架構中,在一訊框爲基礎的系統的該 情況中’子區段的數目係大於或等於三。若並非這種情況, 理論上毎一個輸入訊框130的輸入取樣的個數,可以使用 大於該取樣超前値兩倍的任何數目。
一種分析濾波器組100的具體實施例的該視窗器 1 1 0,如第1圖所示’係經過適當配置,依據彼等對應的輸 入訊框1 3 0,以該取樣超前値Μ (箭號1 7 0)爲基礎,以如同 之前所解釋的一種重疊的方式產生多數個視窗型訊框。更 精確而言,視一視窗器110的該具體的實施方式而定,該 視窗器1 1 0係經過適當配置以產生該視窗型訊框,依據一 加權函數,其可以例如包含一對數相依性,以描述人耳的 聽覺特性模型。然而,也可以實施其它的加權函數,例如 —種描述人耳的心理聲學特性模型的加權函數。然而,在 φ 一分析濾波器組的具體實施例中所實現的該視窗器函數也 可以係例如被實施,使得一輸入訊框的每一個輸入取樣係 被乘上包含多數個實數的取樣特定視窗係數的一實數値視 窗函數。 這樣的一種實施方式的實例係顯示於第2圖中,更精 確而言,第2圖描繪一可能的視窗函數或者視窗化函數1 80 的槪要的粗略表示,在第1圖中所示之該視窗器110利用 該視窗函數1 8 0,依據對應的彼等輸入訊框1 3 0,產生視窗 -22· 1355647 型訊框。視一分析瀘波器組1 00的該具體實施方式而定, 該視窗器1 1 0可以進一步以不同的方式提供視窗型訊框給 該時間/頻率轉.換器120。
依據彼等輸入訊框130中的每一個輸入訊框,該視窗 器1 1 0係經過適當配置以產生一視窗型訊框,其中每一個 視窗型訊框包含多數個視窗型取樣。更精確而言,該視窗 器110可以不同的方式配置。視一輸入訊框130的長度而 定,以及視將被提供給該時間/頻率提供器1 2 0的該視窗型 訊框的長度而定,幾種如何實施該視窗器11 〇以產生彼等 視窗型訊框的可能方法可以被實現。 例如’若一輸入訊框1 30包含一初始區段1 60使得在 第2圖中的具體實施例的一種情況中,彼等輸入訊框1 3 0 之中的每一個訊框的該第一子區段150-1包含與其它的子 區段1 5 0 - 2至1 5 0 - 4 —樣多的輸入値或者輸入取樣,則該視 窗器1 1 0可以例如經過適當配置使得該視窗型訊框也包含 與該輸入訊框130所包含的輸入値之輸入取樣相同個數的 視窗型取樣。在此情況中,由於彼等輸入訊框丨3 〇的結構, 如同之前所敘述的,除了在該初始區段丨6〇中的彼等輸入 訊框1 3 0的彼等輸入値以外,該輸入訊框的所有輸入取樣, 可以利用該視窗器1 1 〇,依據前述的該視窗化函數或者該視 窗函數進行處理。該初始區段160的彼等輸入値,在此情 況中’可以設定爲一事先決定的數値,或者在一事先決定 範圍之內的至少一個數値》 -23-
1355647 該事先決定的數値,例如在一些分析濾波器 具體實施例中,可以係等於該數値0(零),而在其 實施例中令人期望的可能係其它不同的數値。例 上可以使用與該輸入訊框13〇的該初始區段160 意數値’這係表示就該音頻信號而言,彼等對應 沒有重大意義。例如,該事先決定的數値可以係 信號的輸入取樣的一典型範圍之外的一個數値。 對應於該輸入訊框130之該初始區段160的該視 的一個區段之內的多數個視窗型取樣,可以設定 音頻信號的該最大振幅的兩倍或者兩倍以上,指 値並不對應於需要被進一步處理的信號。其它的 如一實施架構特定的絕對値的負値也可以使用。 更進一步地,在一分析濾波器組丨〇〇的數個 例中,對應於一輸入訊框1 3 〇之該初始區段1 6 〇 窗型訊框的視窗型取樣,也可以設定爲在一事先 ^ 之內的一個或者更多個數値。理論上,這樣的一 定的範圍,可以係例如小數値的一個範圍,其就 驗而言係無意義的,如此一來的結果在聽覺上係 的’或者如此一來該收聽經驗並不會被明顯地攪 情況中’該事先決定的範圍可以係例如表示爲一 集合,這些數値的絕對値係小於或者等於一事先 可程式化的、可調整的或者固定的極大臨界値。 種臨界値可以係例如以—1 〇的冪次或者—2的辜 組100的 它的具體 如,理論 有關的任 的數値並 在一音頻 例如,在 窗型訊框 爲一輸入 示這些數 數値,例 具體實施 的彼等視 決定範圍 個事先決 一音頻經 無法分辨 亂。在此 些數値的 決定的、 追樣的一 I次,表示 -24- 1355647 爲10s或者2s,其中該s係爲依據該具體的實施方式而定的 一整數値。 ·
然而’理論上該事先決定的範圍也可以包含大於一些 有意義數値的數値,更精確而言,該事先決定的範圍也可 以包.含一些數値,這些數値包含一絕對値,該絕對値係大 於或者等於一可程式化、事先決定的或者固定的最小臨界 値。這樣的一個最小臨界値理論上可以再一次地以一 2的 冪次或者10的冪次的方式,表示爲2s或者10s,其中s再 一次地係爲一整數,依據一分析瀘波器組的具體實施例的 該具體的實施方式而定。 在一數位的實施架構的情況中,該事先決定的範圍可 以例如包含一些數値,係可以藉由在包含小數値的一事先 決定的範圍的情況中,設定或者不設定該最低有效位元或 者多數個最低有效位元的方式來表示。在該事先決定的範 圍係包含較大數値的情況中,如同在先前所解釋的,該事 先決定的範圍可以包含一些數値,可以藉由設定或者不設 定該最高有效位元或者多數個最高有效位元的方式表示。 然而,該事先決定的數値以及彼等事先決定的範圍也可以 包含其它的數値,可以係例如依據前述的彼等數値以及臨 界値,藉由將這些數値乘上一個因子創建而得。 視一分析濾波器組100的具體實施例之該具體的實施 方式而定,該視窗器110也可以適當調整,使得在該輸出 1 1 0〇所提供的彼等視窗型訊框,並不包含對應於彼等輸入 -25- 1355647
訊框130的彼等初始區段160的數個輸入訊框的視窗型取 樣。在此情況中,該視窗型訊框的長度以及該對應的輸入 訊框1 30的長度可以係例如相差該初始區段1 60的長度》 換句話說,在此情況中,該視窗器1 1 0可以經過適當配置 或者調整以忽略至少一依據前述的彼等輸入取樣的該順序 就時間方面而言最後的輸入取樣。換句話說,在一分析濾 波器組1 00的一些具體實施例中,該視窗器1 1 0可以經過 適當配置使得一輸入訊框130的該初始區段160中的一個 或者更多個,或者甚至全部的輸入値或者輸入取樣可以被 忽略。在此情況中,該視窗型取樣的長度係等於該輸入訊 框130的長度,以及該輸入訊框130的該初始區段160的 長度的差値。 作爲另一種可用的選項,每一個輸入訊框130也可以 完全不包含一初始區段160,如同在先前所指出的。在此情 況中,該第一子區段150-1與其它子區段150-2至150-4之 φ 間的差異,係在各自k的該子區段150的長度或者在輸入的 取樣個數方面。在此情況中,該視窗型取樣,可以包含也 可以不包含視窗型取樣或者視窗型數値,使得對應於該輸 入訊框130的該第一子區段150-1之該視窗型訊框的一類 似的第一子區段,包含與對應於該輸入訊框130的彼等子 區段150的其它子區段相同個數之視窗型取樣或者視窗型 數値。在此情況中,如同在先前指出的,額外的彼等視窗 型取樣或者視窗型數値可以被設定爲一事先決定的數値, -26- 1355647 或者在該事先決定的範圍內,至少一個數値。 更進一步地,該視窗器110在一分析濾波器組100的 —些具體實施例中,可以經過適當配置使得該輸入訊框130 以及所得到的視窗型訊框兩者皆包含相同個數的數値或者 取樣’且其中該輸入訊框i 3 〇以及所得到的視窗型訊框兩 者皆不包含該初始區段160,或者對應於該初始區段160
的取樣。在此情況中,該輸入訊框130的該第一子區段150-1 以及該視窗型訊框的該對應的子區段,與該視窗型訊框的 彼等對應的子區段的該輸入訊框130的其它的子區段150-2 至150-4相較之下,係包含較少的數値或者取樣。 應該要注意的是,理論上該視窗型訊框並不需要對應 於包含一初始區段160的一輸入訊框的長度,也不需要對 應於不包含一初始區段160的一輸入訊框130。理論上,該 視窗器1 1 0也可以經過適當調整使得該視窗型訊框包含一 個或者更多個數値或者取樣,其對應於一輸入訊框130的 φ 該初始區段1 6 0的數値。 在此上下文中,應該也要注意的是在一分析濾波器組 1 00的一些具體實施例中,該初始區段1 6〇表示或者至少包 含對應於一輸入訊框130的輸入値或者輸入取樣的一連通 子集合的取樣索引η的一連通子集合。因此,若適用的話, 包含一對應的初始區段的彼等視窗型訊框也可以包含對應 於該視窗型訊框各自的該初始區段之視窗型取樣的取樣索 引η的一連通子集合’也可以稱之爲該視窗型訊框的該開 -27- 1355647 始區段(starting section)或者起始區段(start section)。不具 有該初始區段或者開始區段的該視窗型訊框的其餘部分, 有時候也稱之爲該剩餘區段(remainder section)。 如同已經在先前指出的,在一分析濾波器組1〇〇的一 些具體實施例中,該視窗器1 1 0可以經過適當調整以產生
一視窗型訊框的視窗數値的視窗取樣,其不對應於一輸入 訊框130的該初始區段160若真的存在的話,依據一視窗 函數,可以加入心理聲學模型,例如依據對應的彼等輸入 取樣,以依據一對數計算產生彼等視窗型取樣的方式。然 而,該視窗器1 1 0,在一分析濾波器組1 00的不同具體實施 例中’也可以適當調整使得彼等視窗型取樣之中的每一個 取樣係將一對應的輸入取樣,乘上定義在一定義集之上的 該視窗函數的取樣特定的視窗型係數而產生。 在一分析濾波器組1 00的許多具體實施例中,該對應 的視窗器1 1 0係經過適當調整,使得例如利用彼等視窗係 數描述之該視窗函數,在該定義集上,相對於該定義集的 一中間點而言係非對稱的。更進一步地,在一分析濾波器 組1 00的許多具體實施例中,該視窗函數的彼等視窗係數 係包含,在該定義集相對於該中間點而言的該第一個一半 中’該視窗函數的全部視窗係數的一最大絕對値的10%、 20 %或者30%、50 %以上的一絕對値,其中該視窗函數在該 定義集相對於該中間點而言的該第二個一半中,係包含較 少的視窗係數,其具有大於彼等視窗係數的該最大絕對値 -28- 1355647 的前述之該百分比的一絕對値。這樣的一種視窗函數’係 在第2圖中彼等輸入訊框130的每一個訊框的上下文中, 槪要地描繪爲該視窗函數18 0。更多視窗函數的實例將在第 5至11圖的上下文中詳細的敘述,包括由一分析濾波器組 的一些具體實施例所提供的光譜以及其它的性質或者機會 的簡短討論,以及如同在這些圖示中以及在一些段落中描 述的實施視窗函數的一合成濾波器組。
除了該視窗器1 1 0以外,一分析濾波器組1 00的具體 實施例中也包含該時間/頻率轉換器1 20,具有由該視窗器 Π 〇提供之彼等視窗型訊框。該時間/頻率轉換器1 20係從 而適當地調整以產生一輸出訊框或者多數個輸出訊框,用 於每一個視窗型訊框,使得該輸出訊框係爲該對應的視窗 型訊框的一種光譜表示。如同將在稍後更詳細地解釋的, 該時間/頻率轉換器1 20係適當地調整使得該輸出訊框包含 與一輸入訊框的輸入取樣個數相較之下,或者與一視窗型 訊框的視窗型取樣的一半個數相較之下,少於一半的輸出 數値個數。 更進一步地,可以實施該時間/頻率轉換器丨2 〇使得其 係依據一離散餘弦變換以及/或者一離散正弦變換,使得一 輸出訊框的輸出取樣的個數係少於一輸入訊框的輸入取樣 個數的一半。然而,一分析濾波器組i 〇 〇可能的數個具體 實施例之更詳細的實施細節將在稍後槪略描述。 在一分析濾波器組的一些具體實施例中,一時間/頻率 -29- 1355647
轉換器120係經過適當配置使得其可以輸出數個輸出取 樣,其個數係等於一開始區段150-2、150-3、150-4但是並 非該輸入訊框130的該第一子區段150-1的該開始區段的 輸入取樣個數,或者係與該取樣超前値170完全一致。換 句話說’在一分析濾波器組1 〇〇的許多具體實施例中,輸 出取樣的個數係等於該整數Μ,係表示該輸入訊框130前 述的該子區段150的長度之該取樣超前値。在許多具體實 施例中,該取樣超前値或者Μ的典型値係爲480或者512。 然而,應該要注意的係在一分析濾波器組的許多具體實施 例中,也可以很容易的實施其它不同的整數Μ,例如Μ = 3 60。 更進一步地,應該注意的係在一分析濾波器組的一些 具體實施例中,一輸入訊框1 3 0的該初始區段1 60,或者在 其它的彼等子區段150-2、150-3、150-4的取樣個數與一輸 入訊框130的該第一子區段150-1之間的差値係等於Μ/4。 換句話說,在其中Μ = 480的一分析濾波器組100的具體實 施例的情況中,該初始區段160的長度,或者前述的該差 値係等於120( = Μ/4)個取樣,而在Μ = 512的情況中,在一分 析濾波器組1 00的一些具體實施例中,前述的該差値之該 初始區段160的長度係等於128( = Μ/4)個取樣。然而,也應 該要注意的是在此情況中,也可以實施其它不同的長度, 並且依據一分析濾波器組100的具體實施例這方面而言, 並不代表一種限制。 而且如同在稍早所指出的,由於該時間/頻率轉換器 -30- 1355647 120可以係例如依據一離散餘弦變換或者一離散正弦變 換,分析濾波器組的一些具體實施例有時也可以根據參數 N = 2M這方面進行討論與解釋,其中參數N係表示一修改 過的離散餘弦變換(modified discrete cosine transform, MDCT)轉換器的一輸入訊框的長度。在前述分析濾波器組 100的彼等具體實施例中,該參數N因而係等於960(M = 480) 以及 1 024(M = 5 12)。
如同將在稍後更詳細地解釋,一分析濾波器組1 00的 數個具體實施例可以提供一個優點,亦即在完全不會降低 該音頻品質的情況下,或者總是不會明顯地降低的,作爲 一種較低延遲的數位音頻處理。換句話說,一分析濾波器 組的具體實施例提供實現一強化的低延遲編碼模式的機 會,例如以一種(音頻)編解碼器(codec = coder(編碼 器)/decoder(解碼器)或者 coding(編碼)/decoding(解碼))的 架構,與許多可用的編解碼技術相比之下,可提供一較低 φ 的延遲,具有至少可以比得上的頻率響應以及一強化的預 迴聲現象。更進一步地,如同將在一會議系統的彼等具體 實施例的上下文中更詳細地解釋的,在一分析濾波器組的 —些具體實施例中以及包含一分析濾波器組1 00的具體實 施例系統的一些具體實施例中,僅需要一個可以用於所有 信號類型的單一視窗型函數,即具有達成上述的效益之能 力。 必須強調的是,一分析濾波器組100的數個具體實施 -31 - 1355647
例的彼等輸入訊框,並不需要如第2圖所描繪的包含四個 子區段150-1至150-4。這僅係表示爲了簡化起見所選擇的 一種可能性。據此,該視窗器也不需要被調整,使得彼等 視窗型訊框也包含四個對應的子區段,或者調整該時間/頻 率轉換器120,使得其係具有依據包含四個子區段的一視窗 型訊框,以提供該輸出訊框的能力。這僅係在第2圖的上 下文中,被單純地選擇而得以一種簡潔且清楚的方式,解 釋一分析濾波器組100的一些具體實施例。然而,在該輸 入訊框的上下文中,根據彼等輸入訊框130的長度方面所 做的陳述,也可以轉移至彼等視窗型訊框的長度,如同在 關於該初始區段1 60以及其在彼等輸入訊框1 30中的存在 性之彼等不同選項的上下文中所解釋的。 接下來,考慮到一誤差恢復進階音頻編解碼低延遲 (error resilient advanced codec low delay, ER A AC LD)實施 架構’將相對於修改方面解釋一分析濾波器組具體實施例 的一種可能的實現方式,以調整該ERAACLD的該分析擴、 波器組’達成一分析濾波器組100的具體實施例,有時候 也稱之爲低延遲(分析濾波器組)。換句話說,爲了達到— 充分減低或者低延遲,在一 ERAAC LD的情況中,如同在 下文中所定義的對於一標準的編碼器進行一些修改,可能 是非常有用的。 在此情況中,一分析濾波器組1 〇 〇的具體實施例的該 視窗器1 1 0係經過適當配置,依據下列方程式或者表示式 -32- (1) 1355647 產生該視窗型取樣u, Zi,n = w (N-l-n) · x"i/n 其中/係一整數,表示一視窗型訊框以及/或者一輸入 訊框的一訊框索引或者一區塊索引,以及其中Λ係一整 數,表示在與iV-Ι範圍之內的取樣索引。
換句話說’在包含一初始區段160的數個具體實施例 中’在彼等輸出訊框1 3 0的架構中,該視窗化程序係延伸 至過去,藉由對於彼等取樣索引/? =-7V,-1實施上述的該 表示式或者方程式,其中吣/7)係對應於如同將在第5至1 1 圖的上下文中更詳細地解釋的一視窗函數的一視窗係數。 在該分析濾波器組100的具體實施例的上下文中,該合成 視窗函數w係以反轉該順序的方式作爲該分析視窗函數, 這可以經由比較該視窗函數 AM-λ)的該自變數而看出 來。如同在第3與第4圖的上下文中所槪略描述,一合成 濾波器組的具體實施例的視窗函數的建構或者產生,可以 根據該分析視窗函數,經過鏡射(例如相對於該.定義集的中 間點)之後得到的一個鏡射版本。換句話說,第5圖係顯示 彼等低延遲視窗函數的一圖示,其中該分析視窗僅單純地 係該合成視窗的一時間反轉複製品。在此上下文中,應該 注意的是係表示對應於該區塊索引i以及該取樣索引 η的一輸入取樣或者數入値。 換句話說,相較於係依據一視窗長度Ν爲1024或者 960數値爲基礎的正弦視窗之前述的該ER A AC LD的實施 -33- 1355647 架構(例如以一邊解碼器的形式)’包含在該分析濾波器組 1〇〇的具體實施例的該視窗π〇中的該低延遲視窗的視窗 長度係爲2N( = 4M),藉由延伸該視窗化程序至過去。
如同將在第5至11圖的該上下文中更詳細地解釋’對 於n = 0,…,2Ν·1之彼等視窗係數吣/〇在一些具體實施例 中,對於Ν = 960以及Ν= 1 024可以分別遵守在附件中的第1 表以及附件中的第3表中所給定之彼等關係式。此外,在 —些具體實施例的情況中,對於Ν = 960以及1024彼等視 窗係數可以分別包含附錄的第2與第4表中所給定的數値。 就該時間/頻率轉換器 120而言,該核心的 MDCT (MDCT = Modified Discrete Cosine Transform,修改過的離散 餘弦變換)演算法,如同在該ER A AC LD編解碼器架構中所 實施的,絕大部分係沒有改變的,但是如同已經解釋過的 係包含較長的視窗,使得η現在係從-N —直跑到N -1,以 取代從零到Ν -1。該輸出訊框的彼等光譜係數或者輸出 値可以依據下列的方程式或者表示式產生: Ν-Ι (2π \ Χι,κ = -2· Σ ·cos -ττ(« + «〇)-(^ + 1) (2) ιι«-" \ -iy ) fiM 〇<k<f 其中’如同先前所解釋係對應於該取樣索引D以及 該區塊索引/的一時間/頻率轉換器120的一視窗型訊框或 者一視窗型輸入序列的一視窗型取樣。此外係一整數, 表示該光譜係數索引,以及7V係一整數表示一輸出訊框的 -34- 1355647 輸出値個數的兩倍,或者如同先前所解釋的’依據如同在 該ER A AC LD編解碼器中實行之該視窗序列値的一個變換 視窗的該視窗長度。該整數心係一偏移量並且係給定爲:
如同在第2圖的上下文中所解釋的,依據一輸入訊框 130的具體長度而定,該時間/頻率轉換器的實施方式,可 以依據包含對應於彼等輸入訊框130的該初始區段160的 多數視窗型取樣的一視窗型訊框而定。換句話說,在ΜΜ 80 或者Ν = 9 60的情況中,上述的彼等方程式係依據包含長度 爲1 920的視窗型取樣之多數個視窗型訊框而定。在一分析 濾波器組1 00的具體實施例,在其中的彼等視窗型訊框並 未包含數個視窗型取樣,這些取樣係對應於彼等輸入訊框 130的該初始區段160,彼等視窗型訊框,在前述的μ = 480 的情況中,包含長度爲1800的視窗型取樣。在此情況中, 前述的彼等方程式可以適當調整使得彼等對應的方程式可 以被實行。在該視窗器1 1 0的情況中,這可以係例如導致 該取樣索引/2係從-Ν —直跑到7Ν/8-1,在該第一子區段缺 少Μ/4 = Ν/8視窗型取樣的該情況中,相較於該視窗型訊框 的其它子區段,如同先前所解釋的。 因此,在一時間/頻率轉換器1 20的該情況中,上述的 方程式可以藉由修改彼等總和索引使其不包含該視窗型訊 框的該初始區段或者開始區段的彼等視窗型取樣,很容易 -35- 1355647 地據此調整。當然,在彼等輸入訊框130的該初始區段160 的不同長度的該情況中,或者在該視窗型訊框的該第一子 區段與其它的子區段的長度之間的差値的該情況中,進一 步的修改可以很容易的據此而獲得,也於前面解釋過。
換句話說,根據一分析濾波器組100的具體實施例之 該具體的實現架構而定,並非由上述的彼等表示式以及方 程式所指示的全部計算皆需要被實行。分析濾波器組的另 外的具體實施例也可以包含一種實現,其中彼等計算的數 目理論上可以更進一步地降低,得到更高的計算效率性。 在合成濾波器組的情況中的一個實例,將在第19圖的上下 文中更詳細的敘述。 特別地,如同也將在一合成濾波器組之具體實施例的 上下文中解釋的,一分析濾波器組1 〇〇的具體實施例可以 利用由前述的該ER A AC LD編解碼所衍生出來的所謂的誤 差恢復進階音頻編解碼強化低延遲(error resilient advanced audio codec enhanced low-delay, ER A A C ELD)之 該架構來實現。如同已經敘述過的,該ER A AC LD編解碼 的該分析濾波器組係經過修改以達成一種分析濾波器組 100的具體實施例,以採用該低延遲濾波器組作爲一分析濾 波器組100的一種具體實施例。如同將在稍後更詳細解釋 的,該ER AAC ELD編解碼包含一分析濾波器組100的具 體實施例以及/或者一合成濾波器組的具體實施例(這將在 稍後更詳細地解釋),提供將一般通稱的低位元率音頻編碼 -36- 1355647 的使用延伸至需要該編碼/解碼鏈的—非常低延遲的應用 的能力。這些實例係,例如來自於全雙工即時通訊領域, 其中不同的具體實施例可以加入,例如分析濾波器組、合 成濾波器組、解碼器、以及編碼器、混音器以及會議系統 的多數個具體實施例。 在更詳細的敘述本發明的另外的具體實施例之前,應 該要注意的係具有相同的或者類似功能特性的物件、結構 φ 以及元件係以相同的參照符號表示。除非另外具體地指 明,與具有類似的或者相同的功能特性與特徵之物件、結 檎以及元件有關的敘述,可以相對於彼此之間互相交換。 更進一步地,在下文中,將使用槪括的參照符號用於在具 體實施例中或者在彼等圖示之中的一個圖示所描繪的一結 構中’相同的或者類似的物件、結構或者元件,除非係討 論一特定的物件、結構或者元件的特性或者特徵。舉例而 言’在彼等輸入訊框1 3 0的上下文中,已經倂入槪括參照。 ^ 在第2圖中與彼等輸入訊框相關的敘述中,若係參照於一 特定的輸入訊框’則係使用此輸入訊框的該特定的參照符 號’例如1 30-k ’而在參照於所有的輸入訊框或者係參照於 並未特別地與其它的輸入訊框區分的一個輸入訊框的情況 中,使用該槪括參照符號1 30,使用槪括參照符號以可更緊 密且更清楚地描述本發明的具體實施例。 此外’在此上下文中,應該注意的是在本應用的架構 中,耦合於一第二元件的一第一元件,可以直接地連接或 -37- 1355647 者透過另一電路系統或者另一元件連接至該第二元件。換 句話說,在本應用的架構中,兩個彼此之間互相靠近的元 件包含兩個可供選擇的選項’亦即彼此之間互相連接或者 透過另一元件的另一電路系統。
第3圖顯示一合成濾波器組200的具體實施例,用以 過濾多數個輸入訊框,其中每一個輸入訊框包含數個已排 序的輸入値。該合成濾波器組200的具體實施例包含一頻 率/時間轉換器210、一視窗器220以及一重疊/加法器230, 其以串聯的方式耦合。 提供給該合成濾波器組200的具體實施例之多數個輸 入訊框,將首先利用該頻率/時間轉換器2 1 0進行處理,其 具有依據彼等輸入訊框,產生多數個輸出訊框的能力,使 得每一個輸出訊框係爲該對應的輸入訊框的一種時間表 示。換句話說,該頻率/時間轉換器210對於每一個輸入訊 框,執行從頻域至時域的一種轉換。 耦合於該頻率/時間轉換器210之該視窗器220 ’接著 係可以處理由該頻率/時間轉換器2 1 0所提供的每一個輸出 訊框,依據此輸出訊框產生一視窗型訊框。在一合成濾波 器組200的一些具體實施例中’該視窗器220係可以藉由 處理每一個輸出訊框的彼等輸出取樣’以產生彼等視窗型 訊框,其中每一個視窗型訊框包含多數個視窗型取樣。 根據一合成濾波器組200具體實施例的該具體實施架 構而定,該視窗器220係可以依據彼等輸出訊框產生彼等 -38-
1355647 視窗型訊框’依據一加權函·數對彼等輸 如同先前在第1圖的該視窗器110的上 加權函數可例如係依據加入人耳的聽覺 種心理聲學模型,例如一音頻信號的響β 此外’或者二者擇一地,該視窗器 輸出訊框產生該視窗型訊框,藉由將一 輸出取樣,乘上一視窗、視窗化函數或 特定的數値。這些數値也稱之爲視窗1 數。換句話說’在一合成濾波器組200 施例中,該視窗器2 20可以適當調整, 框的彼等視窗型取樣,藉由將這些乘上 將一實數値視窗係數歸屬於一定義集元 的每一個集合。 這樣的視窗函數的實例,將在第5 : 中,更詳細地討論。此外,應該注意的 ^ 對於該定義集的一個中間點而言,可以 對稱的’該中間點因而並不需要爲該定 素。 此外’該視窗器220產生彼等視窗 重疊/加法器230’依據取樣超前値以— 進一步的處理’如同將在第4圖的該上 釋的。換句話說’每一個視窗型訊框, 器220的一個輸出之該重疊/加法器230 出取樣進行加權。 下文中所解釋,該 能力或者性質的一 【之該對數相依性。 220也可以依據該 輸出訊框的每一個 者視窗函數的取樣 系數或者視窗化係 的至少一些具體實 以產生一視窗型訊 一視窗函數,其係 素的一個集合之中 第11圖的上下文 是這些視窗函數相 係非對稱的或者不 義集本身的~個元 型取樣’用於由該 種重疊的方式進行 下文中更詳細地解 與由耦合於該視窗 所提供的加成取樣 •39- 1355647 的個數相較之下,包含兩倍以上個數的視窗型取樣。如此 一來,在一合成濾波器組200的一些具體實施例中,該重 疊/加法器係可以一種重疊的方式產生一加成訊框的能 力,對於彼等加成型取樣中至少一些加成型取樣,藉由將 至少來自於三個不同的視窗型訊框的至少三個視窗型取樣 加在一起。
耦合於該視窗器220的該重疊/加法器230之後,對於 每一個新接收到的視窗型訊框,可以產生或者提供一加成 型訊框。然而’如同在先前所提到的,該重疊/加法器2 3 0 係以一種重疊的方式操作彼等視窗型訊框,以產生單一加 成型訊框。每一個加成型訊框包含一起始區段以及一剩餘 區段’如同將在第4圖的該上下文中更詳細地解釋的,以 及進一步包含多數個加成型取樣,將來自於至少三個不同 的視窗型訊框的至少三個視窗型取樣相加,用於在一加成 訊框的該剩餘區段的一加成取樣,以及將來自於至少兩個 φ 不同的視窗型訊框的至少兩個視窗型取樣相加,作爲在該 開始區段中的一個加成型取樣。依據該實現方式而定,在 該剩餘區段中,相加在一起以獲得一加成型取樣的彼等視 窗型取樣的個數,與在該起始區段中,相加在一起以獲得 一加成型取樣的彼等視窗型取樣的個數相較之下,在該剩 餘區段中的個數係至少高一個取樣。 一者擇一地或者額外地並且係依據一合成濾波器組 200的具體實施例之具體的實現架構而定,該視窗器220 -40- 1355647
也可以經過適當架構以忽略依據彼等已排序的輸出取樣的 該順序之該最早的輸出値,對於彼等視窗型訊框的每一個 視窗型訊框’將對應的彼等視窗型取樣設定爲一事先決定 的數値’或者在該事先決定範圍內的至少一個數値。此外, 該重疊/加法器230在此情況中可以提供在一加成訊框的該 剩餘區段中的該加成性取樣,依據來自於至少三個不同的 視窗型訊框的至少三個視窗型取樣,以及在該開始區段中 的一個加成型取樣’根據來自於至少兩個不同視窗型訊框 的至少兩個視窗型取樣,如同將在第4圖的該上下文中解 釋的。 第4圖係描繪對應於彼等訊框索引k、k-1、k-2、k-3 與k+1的五個輸出訊框240的槪要表示,並且對應地標示 於圖中。類似於第2圖中所顯示之綱要表示,第4圖中所 顯示的這五個輸出訊框240係依據它們相對於時間的順序 排列,如一箭號250所指示的。參考於該輸出訊框240-k, φ 彼等輸出訊框240-(k-l)、240-(k-2)以及240-(k-3)係稱爲過 去的輸出訊框240。據此,相對於該輸出訊框240-k,該輸 出訊框240-(k+Ι)係爲一接著的或者未來的輸出訊框。 如同已經在第2圖中的彼等輸入訊框130的上下文中 所討論的,第4圖中所顯示的彼等輸出訊框240,在第4 圖中所顯示的該具體實啤例的情況中,每一個輸出訊框包 含四個子集合260-1、260-2、2 60-3以及260-4。依據一合 成濾波器組200的該具體實施例之該具體的實施方式而 -41 -
1355647 定,每一個輸出訊框240的該第一子區段260-1可 也可以不包含一初始區段270,如同已經在彼等輸 130的該初始區段160的上下文中,在第2圖的該架 經討論過的。如此一來,該第一子區段260- 1,與第 所描繪的該具體實施例中的其它彼等子區段2 60-2 以及260-4比較之下,可能較短。然而,其它的彼 段260-2、260-3以及260-4,每一個皆包含數個輸tt 其個數係等於前述的取樣超前値Μ。 如同已經在第3圖的該上下文中敘述的,在第 所顯示的該具體實施例中,該頻率/時間轉換器210 多數個輸入訊框,該頻率/時間轉換器210係以此爲 生多數個輸出訊框。在一合成濾波器組2 00的一些 施例中,每一個輸入訊框的長度係與該取樣超前値 一致,其中Μ再一次地係一正整數。然而,由該 間轉換器2 1 0所產生的彼等輸出訊框確實包含至少 φ 框的輸入數値個數兩倍以上的個數。更精確而言, 4圖中所顯示的該情況的具體實施例中,彼等輸 240’與輸入數値的個數比較之下,包含甚至係三 的輸出取樣240個數,其中在χ與所顯示的該情況相 體實施例中,每一個輸入値也包含Μ個輸入値。医 等輸出訊框可以劃分成數個子區段260,其中彼等 框24 0的每一個子區段2 60(如同在稍早所討論的, 擇不要該第一子區段260-1)包含Μ個輸出取樣。此夕 以包含 入訊框 構中已 4圖中 > 260-3 等子區 i取樣, 3圖中 係具備 基礎產 具體實 Μ完全 頻率/時 輸入訊 依據第 出訊框 倍以上 關的具 丨此,彼 ;輸出訊 可以選 f,該初 •42- 1355647 始區段27 0在一些具體實施例中包含m/4取樣。換句話說, 在M = 480或M = 512的情況中,該初始區段27〇,若真的存 在’可以包含120或者128個取樣或者數値。
又換句話說’如同已經在之前的該分析濾波器組1 00 的彼等具體實施例的上下文中所解釋,該取樣超前値Μ也 係與彼等輸出訊框240的彼等子區段260-2、260-3以及 26 0-4的長度相同。根據一合成濾波器組200的具體實施例 之該具體的實現方式而定,該輸出訊框240的該第一子區 段260-1也可以包含Μ個輸出取樣。然而,若該輸出訊框 240的該初始區段270並不存在,每一個輸出訊框240的該 第一子區段260-1,係較彼等輸出訊框240的彼等剩餘的子 區段260-2至260-4來的短。 如同先前所提到,該頻率/時間轉換器2 1 0提供多數個 輸出訊框240給該視窗器220,其中每一個輸出訊框包含數 個輸出取樣,其個數係大於該取樣超前値Μ的兩倍。之後, | 該視窗器220係可以依據由該頻率/時間轉換器2 1 0提供之 目前的該輸出訊框240,產生視窗型訊框。更具體而言,對 應於一輸出訊框240的每一個,視窗型訊框的產生係依據 前述的該加權函數。根據第4圖中所顯示的該情況的具體 實施例中,該加權函數因而係依據一視窗函數280,其係以 綱要圖的方式顯示於每一個輸出訊框240之上。在此上下 文中,應該也要注意的是該視窗函數280對於在該輸出訊 框240的該初始區段270中的輸出取樣,若存在的話,並 -43- 1355647
沒有任何 然而 體實施例 的情況。 的調整或 例如 係存在的 也包含Μ 彼等輸出 產生也可 窗器 220 框,這可 先決定的 或者在一 現,如同
以及該視 數値。然 視窗型取 出取樣有 之該輸出 相對於彼 總括 貢獻。 ,如此一來,根據一合成濾波器組200的不同具 的該具體實施方式而定,必須再一次地考慮不同 依據該頻率/時間轉換器210而定,該視窗器220 者配置可以係相當不同的。 ,若在一方面彼等輸出訊框240的該初始區段270 ,使得彼等輸出訊框240的該第一子區段260-1 個輸出取樣,依據包含相同個數的視窗型取樣之 訊框,該視窗器220可以適當的調整使得其可以 以不產生視窗型訊框。換句話說,可以實現該視 使得其產生也包含一初始區段270的視窗型訊 以係藉由例如設定對應的彼等視窗型取樣爲一事 數値(例如0、最大可允許的信號振幅的兩倍等), 事先決定範圍之內的至少一個數値的方式來實 之前在第1與第2圖的該上下文中所討論的。 情況中,依據該輸出訊框240的該輸出訊框240 窗型取樣,兩者皆可以包含相同個數的取樣或者 而’在該視窗型訊框的該初始區段270中的彼等 樣並不需要係與該輸出訊框240之對應的彼等輸 關的。然而,依據該頻率/時間轉換器210所提供 訊框240,該視窗型訊框的該第一子區段260-1, 等取樣’係不存在於該初始區段270中。 而西’若存在一輸出訊框240的該初始框架270 -44- 1355647 的至少一個輸出取樣’則對應的該視窗型取樣可以設定爲 一事先定義的數値’或者在一事先決定範圍內的一個數 値’如同已經在第1與第2圖中所描繪的一分析濾波器組 的具體實施例的該上下文中所解釋。在該初始區段270包 含多於一個視窗型取樣的情況中,對於該初始區段270的 這個或者這些其它的視窗型取樣或者數値,同樣的結果也 係成立的。
更進一步地’該視窗器220可以適當調整,使得彼等 視窗型取樣完全不包含一初始區段270。在一合成濾波器組 2 0 0的這樣一種具體實施例的該情況中,該視窗器2 2 0可以 適當配置’以忽略在該輸出訊框240的該初始區段270中 的彼等輸出訊框240的彼等輸出取樣。 在這些情況的任一情況中,依據這樣的具體實施例之 該具體的實施方式而定,一視窗型訊框的該第一子區段 2 60-1可以包含也可以不包含該初始區段27 0。若存在該視 ^ 窗型訊框的一初始區段’此區段的該視窗型取樣或者數値 可以完全不需要係與各自的該輸出訊框之對應的彼等輸出 取樣有關。 另一方面’若該輸出訊框240並不包含該初始區段 270 ’該視窗器220也可以經過適當配置,根據包含或者不 包含一初始區段270本身的該輸出訊框240,產生一視窗型 訊框。若該第一子區段260- 1的輸出取樣的個數係小於該 取樣超前値Μ,則該視窗器220在一合成濾波器組200的 -45- 1355647
—些具體實施例中’可以有能力設定對應於該視窗型訊框 的該初始區段270的彼等『遺失的輸出取樣』之彼等視窗 型取樣,爲該事先決定的數値,或者在該事先決定範圍之 內的至少一個數値。換句話說,該視窗器220在此情況中 可以有bS力將該視窗型訊框塡滿該事先決定的數値,或者 在該事先決定範圍之內的至少一個數値,使得所得到的該 視窗型訊框包含數個視窗型取樣,其個數係爲該取樣超前 値M、一輸入訊框的大小或者一加成型訊框的長度的整數 倍。 .然而’作爲另一種可以實施的選項,彼等輸出訊框24 0 以及彼等視窗型訊框兩者皆可以完全不包含一初始區段 27 0。在此情況中,該視窗器220可以經過適當配置以單純 地對該輸出訊框的至少一些輸出取樣進行加權,以獲得該 視窗型訊框。額外地或者二者擇一地,該視窗器2 2 0可以 使用一視窗函數2 8 0或者類似的函數。 如同之前已經在第1與第2圖中所顯示之該分析濾波 器組1 00的該具體實施例的上下文中所解釋,彼等輸出訊 框240的該初始區段270係對應於在該輸出訊框250中最 早的取樣,係在這些數値係對應於具有最小的取樣索引之 彼等『最新』的取樣的這層意義而言。換句話說,考慮該 輸出訊框240所有的輸出取樣,這些取樣係表示對應於當 播放由該重疊/加法器230所提供之一對應的加成取樣時, 與該輸出訊框240的其他彼等取樣相較之下’僅會流逝最 -46 - 1355647 小的時間總量的取樣。換句話說,在該輸出訊框240之內, 以及該輸出訊框的每一個子區段260之內,彼等最新的輸 出取樣係對應於在個別的該輸出訊框240或者子區段260 左邊的位置。又換句話說,由該箭號250所指示之該時間 係對應於輸出訊框240的該序列,而非對應於在彼等輸出 訊框240的每一個訊框之內的輸出取樣的序列。
然而,在更詳細的敘述利用該重疊/加法器230對彼等 視窗型訊框24Q進行處理之前,應該注意的係在該合成濾 波器組200的許多具體實施例中,該頻率/時間轉換器2 1 0 以及/或者該視窗器220係可以適當調整,使得該輸出訊框 240以及該視窗型訊框的該初始區段270,係完整地存在或 者完全不存在。在該第一種情況中,在該第一子區段260-1 中的輸出或者視窗型取樣的個數因此係等於在一輸出訊框 中的輸出取樣個數,係等於Μ。然而,一合成濾波器組200 的數個具體實施例也可以實現,其中該頻率/時間轉換器 210以及該視窗器2 20兩者或者兩者其中之一可以適當配 置’使得;該初始區段270係存在的,但是在該第一子區段 260-1中的取樣個數仍然係小於在—頻率/時間轉換器21〇 @ 一輸出訊框中的彼等輸出取樣個數。此外,應該注意的 是在許多的具體實施例中,彼等訊框的每一個訊框之所有 Μ樣或者數値皆係這樣處理,雖然彼等對應的數値或者取 樣當然僅有單一個或者一部份係可以使用的。 耦合於該視窗器220的該重疊/加法器230係有能力提 -47- 1355647
供一加成型訊框290,如第4圖的底部所示,該加成型訊框 290係包含一起始區段300以及一剩餘區段310。根據一合 成濾波器組200的具體實施例之該具體的實現架構而定, 該重疊/加法器2 30可以被實現使得包含在該起始區段的該 加成型訊框之中的一加成型取樣,可以將至少兩個不同的 視窗型訊框的至少兩個視窗型取樣相加而獲得。更精確而 言,由於在第4圖中所顯示的彼等具體實施例,在每一個 輸出訊框240以及對應的彼等視窗型訊框的該情況中,係 依據四個子區段260-1至260-4,因此在該起始區段300中 的一加成型取樣係依據三個或者四個視窗型取樣或者數 値’分別來自於至少三個或者四個不同的視窗型訊框,如 同由一箭號320所指示的。在第4圖中所使用的該具體實 施例的情況中’將使用三個或者四個視窗型取樣的問題, 係與該具體實施例的該具體實施方式,就該視窗型訊框的 該初始區段270方面而論有關’且依據對應的該輸出訊框 240-k ° ' 接下來,參考於第4圖’吾人可能認爲第4圖中所示 之彼等輸出訊框24〇,係爲該視窗器220依據各自的彼等輸 出訊框240所提供之彼等視窗型訊框,因爲在第4圖中所 描繪的該情況中’係將在該初始區段2 7 〇外面的彼等輸出 訊框240的至少彼等輸出取樣,乘上從該視窗函數280所 推得之數値’以獲得彼等視窗型訊框。因此,接下來,相 對於該重疊/加法器230,該參照符號240也可以用於一視 -48 - 1355647 窗型訊框。
在該視窗器220係適當地調整使得在一存在的初始區 段270中的彼等視窗型取樣,係設定爲一事先決定的數値 或者在該事先決定範圍內的一個數値的該情況中,在該初 始區段270中的該視窗型取樣或者視窗型數値可以被用於 將來自於該視窗型訊框240-(k-l)(對應於該輸出訊框 240-(k-l))的該第二子區段、來自於該視窗型訊框 240-(k-2)(對應於該輸出訊框240-(k-2))的該第三子區段以 及該視窗型訊框240-(k-3)(對應於該輸出訊框240-(k-3))的 該第四子區段中,剩下的三個加成型取樣加在一起,若該 事先決定的數値或者該事先決定的範圍係使得將來自於該 視窗型訊框240-k(對應於該輸出訊框240-k)的該初始區段 27 0的該視窗型取樣相加時並不會明顯地攪亂或者改變其 結果。 在該視窗器2 2 0係適當調整使得一初始區段2 7 0並未 ^ 存在於—視窗型訊框的情況中的該情況中,在該起始區段 3 00中對應的該加成型取樣,係正常地藉由將來自於至少兩 個視窗型訊框的至少兩個視窗型取樣相加而獲得。然而, 由於第4圖中所顯示的該具體實施例係依據每一個皆包含 四個子區段2 6 0的視窗取樣,在此情況中,在該加成型訊 框290的該起始區段中的該加成型取樣係藉由將前述的來 自於彼等視窗型訊框240-(k-l)、240-(k-2)以及240-(k_3)的 三個視窗型取樣相加在一起而獲得。 -49- 1355647
例如’這種情況可以由於該視窗器經過調整使得一輸 出訊框的一對應的輸出取樣係會被該視窗器220忽略所造 成的。此外’應該注意的是,若該事先決定的數値或者該 事先決定的範圍所包含的數値,會導致該加成型取樣的擾 動,該重疊/加法器230可以適.當配置,使得在將各自的視 窗型取樣相加在一起以獲得該加成型取樣時,並不會考慮 對應的該視窗型取樣。在此情況中,在該初始區段2 7 〇中 的視窗型取樣也可以考慮被該重疊/加法器所忽略,因爲對 應的彼等視窗型取樣將不會被使用於獲得在該起始區段 300中的該加成型取樣。 在該剩餘區段3 1 〇中’就一加成型取樣而言.,如第4 圖中的箭號330所指示,該重疊/加法器230係適合於將至 少來自於三個不同的視窗型訊框2 4 0 (對應於三個不同的輸 出訊框2 4 0)的至少三個視窗型取樣加在一起。再—次地, 由於在第4圖中所顯示之該具體實施例中的—視窗型訊框 ^ 240係包含四個子區段260這個事實,在該剩餘區段310 中的一個加成型取樣將利用該重疊/加法器230產生,藉由 將來自於四個不同的視窗型訊框240的四個視窗型取樣相 加。更精確而言,在該加成型訊框2 9 0的該剩餘區段3 1 0 中的一個加成型取樣,係利用該重疊/加法器230,將來自 於該視窗型訊框24〇-k的該第一子區段260-1、來自於該該 視窗型訊框240-(k-l)的該第二子區段260-2、來自於該視 窗型訊框240-(k-2)的該第三子區段260-3以及來自於該視 -50- 1355647 窗型訊框240-(k-3)的該第四子區段260-4的對應的彼等視 窗型取樣相加而獲得。 由於前述的該已敘述過的重疊/加法程序,該加成型訊 框290係包含M = N/2個加成型取樣。換句話說,該取樣超 前値Μ係等於該加成型訊框29〇的長度。此外,至少就— 合成濾波器組200的一些具體實施例而言,一輸入訊框的 長度也係,如同之前所敘述的,等於該取樣超前値Μ。
在第4圖中所顯示之該具體實施例中,至少三個或者 四個視窗型取樣係使用於各自在該加成型取樣的該起始區 段3 0 0以及該剩餘區段3 1 0中獲得一加成型取樣的這個事 實,僅係爲了簡化起見所做的選擇。在第4圖中所顯示之 該具體實施例,彼等輸出/視窗型訊框240之中的每一個輸 出/視窗型訊框係包含四個開始區段260-1至260-4。然而, 理論上,可以很容易的實現該合成濾波器組的具體實施 例,使得其中一輸出或者視窗型訊框僅包含較一加成型訊 φ 框290的彼等加成型取樣個數的兩倍還要多一個視窗型取 樣。換句話說,一合成濾波器組200的具體實施例可以適 當調整,使得每一個視窗型訊框僅包含2Μ+ 1個視窗型取 樣。 如同在一分析濾波器組1 〇〇的具體實施例的上下文中 所解釋的,一合成濾波器組200的具體實施例也可以藉由 修改一 ER AAC LD 編解碼器(codec = coder/decoder’ 編碼 器/解碼器)的方式’倂入一 ER A AC ELD編解碼器的該架構 -51 - 1355647
中。因此,一合成濾波器組200的具體實施例可以用於一 A AC LD編解碼器的該上下文中,以定義一低位元率以及低 延遲的音頻編碼/解碼系統。舉例而言,一合成濾波器組的 具體實施例可以與一可選用的 SBR(SBR = Spectral Bank Replication,光譜組複製)工具一起包含於該ER AAC ELD 編解碼器的一解碼器中》然而,爲了達到一足夠低的延遲, 與一 ER A AC LD編解碼器比較之下,實行一些修改係恰當 的,以達成一合成濾波器組200的具體實施例之實現架構。 前述的彼等編解碼器的該合成濾波器組可以經過修改 以改造一低(合成)濾波器組的具體實施例,其中該核心的 IMDCT 演算法(IMDCT = Inverse Modified Discrete Cosine Transform,修改過的反離散餘弦變換),就該頻率/時間轉 換器210而言,大部分係維持不變的。然而,相較於一IMDCT 頻率/時間轉換器,該頻率/時間轉換器210可以使用較長的 視窗函數實現,使得該取樣索引 η現在係一直延伸至 2Ν-1,而非延伸至Ν-1。 更精確而言,該頻率/時間轉換器210可以被實現,使 得其係經過適當配置,依據下列表示式以提供多數個輸出 數値Xi,n : 2 (2τι = ~T;Z.sPecW^'cos + n〇^k+i)
N t=0 、以 J mn 〇<n<2N , 其中,n係如同之前所提到的,爲一整數,表示取樣 索引,i係一整數表示一視窗索引,k係一光譜係數索引, -52- 1355647 N係一視窗長度’係依據一 ER AAC LD編解碼器實現的該 參數 windows_sequence(視窗_序列)而定,使得該整數N 係爲一加成型訊框290的彼等加成取樣個數的兩倍。更精 確而Η,η。係一偏移値給定爲: 其中spec[i][k]係一輸入値’其對應於該輸入訊框的該 光譜係數索引k以及該視窗索引I。在一合成濾波器組200 φ 的一些具體實施例中’該參數N係等於960或者1024。然 而’理論上’該參數N也可以係任意數値。換句話說,一 合成濾波器組200的另一些具體實施例可以依據一參數 N = 3 60或者其他的數値運作。
該視窗器220以及該重疊/加法器230也可以與在一 ER A AC LD編解碼器的該架構中實施的該視窗化以及重疊/加 法相較之下,進行修改。更精確而言,相較於前述的該編 解碼器,一視窗函數的長度N,係以在過去具有較多的重 疊以及在未來較少的重疊的一長度2N的視窗函數取代。如 同將在接下來的第5至11圖的該上下文中所解釋的,在一 合成濾波器組200的許多具體實施例中,包含M/4 = N/8個 數値或者視窗係數的視窗函數,實際上可以被設定爲〇。 如此一來,這些視窗係數係對應於各自的彼等訊框的該 初始區段160、270。如前所述,此區段不需被全部實 施。在一可替代的情況中,對應模組(例如,視窗器1 1 0、 220)可被建構,故不需以數値〇來相乘。如同在先前 -53- 1355647 解釋的,彼等視窗型取樣一僅提出兩個可能與具體實施例 的實現方式相關的差異一可以設定爲零,或者被忽略。 據此,由該視窗器2 2 0所執行的該視窗化程序,在包 含這樣的低延遲視窗函數的一合成濾波器組的這樣一種具 體實施例的情況中,可以依據下列方程式來實現: z,,„=w⑻〜 ,
其中具有視窗係數w(n)的該視窗函數現在具有長度 2N的視窗係數。因此,該取樣索引係從N = 0 —直延伸到 N = 2N-2,對於一合成濾波器組的不同具體實施例,其中不 同的視窗函數的彼等視窗係數的關係以及數値係包含在附 錄的第1至第4表中。 此外,該重疊/加法器230可以進一步根據或者依據下 列表示式或方程式來實現: 對於, 其中之前所給定的彼等表示式以及方程式,可以根據 一合成濾波器組200的具體實施例的該具體的實施架構, 稍微的改變。換句話說,依據該具體的實施架構而定,特 別係考慮到一視窗型訊框並不一定需要包含一初始區段的 這個事實,上述的彼等方程式以及表示式可以’例如就其 總和索引的邊界方面,進行改變以在一初始區段並不存在 或者包含無義視窗取樣(例如,零値取樣)的該情況中,排 除該初始區段的視窗型取樣。換句話說,藉由實施一分析 -54- 1355647 濾波器組100或者一合成濾波器組200之中的至少一個具 體實施例,可以實現可選用具有一適當的SBR工具的一 ER AAC LD編解碼器,以獲得一種ER AAC ELD編解碼器,其 可以係例如用以達成一低位元率以及/或者低延遲的音頻 編碼與解碼系統。一編碼器以及一解碼器的槪觀,將在第 12與第13圖的該架構中,分別給定。
如同已經多次指出的,一分析濾波器組1 00以及一合 成濾波器組200兩者的一些具體實施例係可以提供如下之 優點:藉由在一分析/合成濾波器組100、200的該架構中 以及在編碼器與解碼器的具體實施例的該架構中,實現一 低延遲視窗函數,使得一種強化的低延遲編碼模式係可能 的。藉由實施一分析濾波器組或者一合成濾波器組的具體 實施例(可以包含彼等視窗函數中的一個視窗函數,視窗函 數將在第5至11圖的該上下文中更詳細的敘述),根據包 含一低延遲視窗函數的一濾波器組的具體實施例之該具體 的實現架構,可以達成許多的優點。參考第2圖的該上下 文,一濾波器組的具體實施例的一實現架構可以有能力產 生該延遲,與依據正交視窗(orthogonal windows)的該編解 碼器比較之下,其中正交視窗係用於所有目前最新技術的 編解碼器中。例如,在以該參數N = 960爲基礎的系統的情 況中,該延遲從960個取樣(在一48 kHz的取樣頻率中,係 等於20毫秒的延遲)降低至700個取樣(在相同的48 kHz取 樣頻率中,係等於15毫秒的延遲)係可以被實現的。此外, -55- 1355647
如同將在稍後顯示的,一合成濾波器組以及/或者一分析濾 波器組的具體實施例的該頻率響應係非常類似於使用一符 號視窗(sign function)的該濾波器組。與使用所謂的低重疊 視窗(low overlap window)的一濾波器組比較之下,該頻率 響應甚至更好。更進一步地,預迴聲現象係類似於該低重 疊視窗,因此一合成濾波器組以及/或者一分析濾波器組的 具體實施例,依據彼等濾波器組的具體實施例的該具體實 施方式而定,係表示在品質與低延遲之間一種優越的取 捨。作爲另一個優點,可以例如在一會議系統的具體實施 例的該架構中使用,係爲僅需要一個視窗函數,即可以用 於處理所有種類的信號。 第5圖係顯示一可能的視窗函數的圖形表示,其可以 係例如使用於在一分析濾波器組1 00的具體實施例的情況 中,以及在一合成濾波器組200的具體實施例的情況中的 一視窗器110、220的架構中。更精確而言,在第5圖的上 半部的該圖形中所顯示之彼等視窗函數係對應於M = 4 80頻 帶的一分析視窗函數,或者在一分析濾波器組的具體實施 例的該情況中的輸出取樣的數目。第5圖的該下半部的圖 形顯示用於一合成濾波器組的具體實施例中,對應的該合 成視窗函數。由於第5圖中所顯示的兩個視窗函數皆係對 應於一輸出訊框(分析濾波器組)以及一加成型訊框(合成濾 波器組)的M = 48 0個頻帶或者取樣,因此在第5圖中所顯示 的彼等視窗函數係包含19 20個數値的該定義集,每一個的 -56-
1355647 索引係爲n = 0,…,1 9 1 9。 此外’如第5圖中的兩個圖形所清楚顯示的 該定義集的一個中間點,在此處的情況中,該中 該定義集本身的一部分,當該中間點位於彼等索 以及N = 960中間時,兩個視窗函數在該定義集相 的’具有彼等視窗係數絕對値的該中間點的一半 含明顯地更高數量的視窗係數其係大於所有視窗 大絕對値的1 0 %、2 0 %、3 0 %或者5 0 %。在第5圖 形之分析視窗函數的情況中,該定義集各自的一 含彼等索引N = 960,…,1919的該定義集,而在第5 形之該合成視窗函數的情況中,該定義集相對於 的各自的一半包含彼等索引N = 0,…959。如此一 於該中間點,該分析視窗函數以及該合成視窗函 是非常不對稱的。 如同已經在該分析濾波器組的具體實施例的 φ 11 〇與在該合成濾波器組的具體實施例的該視窗: 該情況兩者的該上下文中所顯示,該分析視窗函 合成視窗函數,就彼等索引而言係爲彼此的反逆 有關於第5圖的兩個圖形中所顯示的該視窗 個重要特徵爲在該上半部圖形中所顯示的該分析 情況中,最後的12 0個視窗化係數,以及在第5 部圖形中,該合成視窗函數的情況中,前1 2 0個 係設定爲零,或者包含一絕對値,使得它們可以 ,相對於 間點並非 引 N=959 對於.前述 中,皆包 係數的最 上半部圖 半係爲包 圖下半圖 該中間點 來,相對 數兩者皆 該視窗器 器2 2 0的 數以及該 〇 函數的一 視窗的該 圖的下半 視窗係數 在一合理 -57- 1355647
的精確度之內被視爲係等於〇。換句話說,前述的這兩個 視窗函數的120個視窗化係數因此可以被視爲係造成一適 當數目的取樣被設定爲在一事先決定的範圍之內的至少一 個數値,藉由將彼等1 20個視窗係數,乘上各自的取樣。 換句話說,依據一分析濾波器組1 00或者一合成濾波器組 200的數個具體實施例的該具體的實現方式而定,彼等120 個零値視窗型係數將造成,若適用的話,如同先前所解釋 的,一分析濾波器組以及一合成濾波器組的具體實施例 中,彼等視窗型訊框的該初始區段160、270的創建。然而, 既使彼等初始區段160、270並不存在,彼等120個零値視 窗係數可以在一分析濾波器組1 00以及一合成濾波器組 200中,利用該視窗器1 10、利用該時間/頻率轉換器120、 利用該視窗器22Q以及利用該重疊/加法器23 0解釋,以相 應地處置或者處理不同的訊框,既使在彼等適當的訊框的 彼等初始區段1 60、270係完全不存在的該情況中。 藉著實施如第5圖所示之在Μ = 480(Ν = 960)的情況中, 包含1 20個零値視窗化係數的一分析視窗函數或者一合成 視窗函數,可以建立一分析濾波器組1 〇〇以及一合成濾波 器組200的一些合適的具體實施例,其中對應的彼等訊框 的彼等初始區段160、270,包含Μ/4個取樣,或者以更一 般的術語來說的話,對應的彼等第一子區段150-1、260-1 包含ΜΜ個數値或者取樣少於其它的彼等子區段。 如同先前所提到的,在第5圖上半部圖.形中所示之該 -58- 1355647 分析視窗函數,以及在第5圖下半部圖形中所示之該合成 視窗函數,澍於一分析濾波器組以及一合成濾波器組兩者 而言,係表示低延遲視窗函數。然而,第5圖中所示之該 分析視窗函數以及該合成視窗函數兩者皆係爲彼此之間相 對於該定義集的前述的該中間點的鏡射版本,其中這兩個 視窗函數皆係定義在該定義集上。
應該注意的是在許多的情況中,該低延遲視窗的使用 以及/或者使用一分析濾波器組或者一合成濾波器組的具 體實施例’並不會造成計算複雜度有任何顯著的增加,.並 且僅有在儲存的要求上有微小的增加,如同將在稍後的該 複雜度分析中槪略敘述的。 第5圖中所示之彼等視窗函數包含在附錄的第2表中 所給定的數値,這些數値放在這裡僅係爲了簡化起見。然 而,到目前爲止,對於操作在M = 480的一分析濾波器組或 者一合成濾波器組的一具體實施例而言,並不需要包含在 φ 附錄的第2表中所給定的彼等確切的數値。自然地,一分 析濾波器組或者一合成濾波器組的具體實施例之該具體的 實現方式可以很容易地在適合的視窗函數的架構中,使用 可變的視窗係數,使得在許多情況中,使用視窗係數已經 足夠’在M = 4 80的情況中,這些視窗係數係爲附錄的第1 表中所給定的關係式。 , 此外’在許多具有濾波器係數、視窗係數以及抬升係 數(lifting coefficients,將在隨後介紹)的具體實施例中, -59-
1355647 所給定的彼等圖示並不需要如所給定的一般精確地實 換句話說’在一分析濾波器組以及一分析濾波器組的 具體實施例中’以及本發明的相關具體實施例中,也 行其它的視窗函數,這些視窗函數係爲濾波器係數、 係數以及其它係數’例如抬升係數,這些視窗函數係 下面的該附錄中所給定的彼等係數不同,只要變動量 接著該逗號之後的第三個數位之內,或者在更高數 內,例如第四、第五等數位。 考慮在第5圖底部圖形中的該合成視窗函數,如 前所提到的,最前面的M/4= 1 20個視窗係數係設定爲 之後’一直到大約索引350,該視窗函數包含一陡峭 升’接著係一較爲和緩的上升一直到一大約600的索 在此上下文中,應該注意的是在一4 8 0( = M)索引的附近 視窗函數變的大於壹或者大於一。接著索引600,一直 約取樣1 1 00,該視窗函數從其最大値降回一小於0.1 φ 準。在該定義集的其餘部分之上,該視窗函數包含在 値0附近的些微振盪。 在第6圖上半部的圖形中之一分析視窗函數的情 以及在第6圖下半部圖形中之一合成視窗函數的情況 6圖係描繪第5圖中所示之該視窗函數的一比較圖。此 以虛線表示,兩個圖形也包含所謂的正弦視窗函數, 例如用於前述的該 ER AAC編解碼器 AAC LC以及 LD。如同在第6圖的兩個圖形中所顯示的該正弦視窗 施。 其它 可實 視窗 與在 係在 位之 同先 零, 的上 引。 ,該 到大 的水 該數 況, ,第 :外, 其係 AAC 以及 -60- 1355647
該低延遲視窗函數的直接比較,描繪該時間視窗的不同的· 時間物件,如同在第5圖的該上下文中所解釋的。除了該 正弦視窗係僅定義於960個取樣之上的事實之外,在一分 析濾波器組(上半部圖形)的具體實施例的情況中以及在一 合成濾波器組(下半部圖形)的情況中所顯示的兩個視窗函 數之間,最令人注目的差異係該正弦視窗訊框函數相對於 縮短的定義集的各自的中間點係對稱的,並且包含在該定 義集(大部分)的前120個元素中大於零視窗係數。相較之 下,如同先前所解釋的,該低延遲視窗包含1 20個(理想上) 零値視窗型係數,並且明顯地相對於與該正弦視窗的該定 義集比較之下更爲延長的該定義集的各自的中間點而言係 非對稱的。 該低延遲視窗與該正弦視窗之間存在另一個差異,區 分這兩種視窗,當這兩種視窗大致地擷取近似於1的一個 數値,以及一4 80( = M)的取樣索引時,該低延遲視窗函數在 φ 變成大於1之後再經過大約120個取樣以及大約 600( = M + M/4; M = 480)的取樣索引時,到達一大於一的最大 値,同時該對稱的正弦視窗係對稱的遞減至0。換句話說, 將被處置的彼等取樣’例如將在一第一訊框中被乘上零, 將在接下來的該訊框中’由於該重疊的操作模式以及在這 些情況中M = 4 8 0的該取樣優越(超前)値,被乘上大於1的 數値。 另外的低延遲視窗的進一步描述將被提出.,其可以係 -61 - 1355647
例如使用於一分析濾波器組或者一合成濾波器組200的其 它具體實施例中,利用第5與第6圖中所示之彼等視窗函 數所能達成的該延遲減低的槪念,將參考於具有Μ/4= 120 個零値或者足夠低的數値之該參數Μ = 4 80、Ν = 960進行解 釋。在第6圖上半部圖形中所示之該分析視窗中,存取未 來輸入數値(取樣索引從1 800至1920)的彼等部.分,係減少 120個取樣。相應地,在第6圖下半部圖形中之該合成視窗 中,在一合成濾波器組的情況中需要一對應的延遲與過去 的輸出取樣重疊的部分,係又另外減少120個取樣。換句 話說,在一合成視窗的情況中,與爲完成該重疊/加法操 作’或者在一分析視窗的情況中完成該重疊/加法同時降低 120個取樣所需要的過去的彼等輸出取樣的該重疊,在包含 一分析濾波器組以及一合成濾波器組兩者的具體實施例的 一個系統的該情況中’將會導致整體的一 240個取樣的延 遲減低。 然而’該延伸的重疊並不會造成任何額外的延遲,因 爲其僅牽涉到來自於過去的數値間的加法,這可以很容易 地儲存’至少在該取樣頻率的規模上不會造成額外的延 遲。在第5與第6圖中所示之該傳統的正弦視窗以及該低 延遲視窗的集合之時間的比較,闡明這個結果。 第7圖包含在三個圖形中的三個不同的視窗函數,更 精確而g ’第7圖上部圖形係顯示前述的該正弦視窗,而 中間的圖形顯示所謂的低重疊視窗以及該底部的圖形係顯 -62- 1355647 示該低延遲視窗。然而,在第7圖中所示之這三個視窗係 對應於取樣超前値或者參數M = 512(N = 2M= 1 024)。再一次 地,在第7圖最上面的兩個圖形中,該正弦視窗以及該低 重疊視窗係在有限制的或者縮短的定義集之上有定義,僅 包含1 024個取樣索引,相較於在第7圖底部的該圖形中所 示之該低延遲視窗函數,其係定義在2048個取樣索引上。
在第7圖中的正弦視窗、該低重疊視窗以及該低延遲 視窗的彼等視窗形狀的彼等圖示,係或多或少包含與前面 中依據該正弦視窗以及該低延遲視窗進行討論的情況相同 的特性。更精確而言,該正弦視窗(第7圖中上部圖形)再 一次地相對於該定義集的合適的中間點(位於索引5 1 1以及 5 12之間)而言係對稱的。該正弦視窗在大約該數値m = 5 12 時獲得一最大値,並且從該最大値再一次地在該定義集的 邊界上掉回到零。 在第7圖底部圖形中所示之該低延遲視窗的情況中, φ 此低延遲視窗包含1 28個零値視窗係數,這再一次地係爲 該取樣超前値Μ的四分之一。此外,該低延遲視窗在取樣 索引Μ處’獲得近似於1的一個數値,同時彼等視窗係數 的最大値係在變成大於1之後,從一遞增索引的觀點來看 的大約128個取樣索引處獲得(在索引640附近)。同時,有 關於該視窗函數的該圖示的其它特徵,在第7圖底部圖形 中’對於Μ = 512時,該視窗函數與第5及第6圖中所示之 對於Μ = 48 0時的該低延遲視窗,並沒有顯著的不同,除了 -63-
1355647 —個由於該較長的定義集(相較於1 920個= 引)所造成的一可選擇的平移之外。在第7 示之該低延遲視窗,包含在附錄的第4表弓 然而,如同先前所解釋的,對於合成 析濾波器組的具體實施例而言,並不需要 給定之精確的數値來實現該視窗函數。換 數可以與第4表中所給定的彼等數値不同 在附件的第3表中所給定的關係式即可。 的一些具體實施例中,相對於彼等視窗係 很容易的實現,只要這些變量係在該逗號 位之內,或者在更高的數位例如第四、第 可,如同先前所解釋的。 在第7圖之中間圖形中,該低重疊視 未敘述。如同之前所提到的,該低延遲視
1 024個元素的定義集。此外,該低重疊視 ^ 起點以及在定義集的末端也包含一連通子 疊視窗消失。然而,在其中該低重疊視窗 合之後,係接著一個陡峭的上升或者衰減 含稍微超過100個取樣索引。此外,對稱 不每含大於1的數値,並且與在一些具體 的視窗函數相較之下,可能包含較少的K 減。 換句話說,該低重疊視窗包含一明顯 旨引之204 8個索 圖底部圖形中所 1所給定之數値。 濾波器組或者分 使用第4表中所 句話說,視窗係 ,只要它們滿足 此外,在本發明 數的變量也可以 之後的第三個數 五等數位之內即 窗到目前爲止尙 窗也包含一具有 窗在一定義集的 集,其中該低重 消失的連通子集 ,每一個係僅包 的低重疊視窗並 實施例中所使用 【帶(stop-band)衰 較低的定義集, -64- 1355647 同時具有與該低延遲視窗相同的取樣超前値,以及並未獲 得大於一的數値。此外,該正弦視窗以及該低重疊視窗兩 者’相對於它們各自的定義集的中間點而言,係爲正交的 或者對稱的,同時該低延遲視窗就已經敘述的方式而言, 在其定義集的該中間點之上係爲非對稱的。
引入該低重疊視窗係爲了用於暫態時消去預迴聲人爲 效應。該較低的重疊可以避免在信號侵襲之前,展開該量 化雜訊,如第8圖中所描繪。然而,該新的低延遲視窗具 有相同的特性,但是提供更好的頻率響應,這在比較第1〇 與第Π圖中所示之彼等頻率響應之後更爲顯而易見。因 此’該低延遲視窗係有能力可以取代兩種傳統的AAC LD 視窗,亦即該低重疊視窗以及該符號視窗,如此一來係不 再需要實現一動態的視窗形狀改造。 第8圖係顯示對於在第7圖中以相同的圖形順序顯示 的相同的彼等視窗函數,對於該正弦視窗或者該低重疊視 ^ 窗以及該低延遲視窗之不同視窗形狀之量化雜訊展開的實 例。在第8圖底部圖形中所示之該低延遲視窗的預迴聲現 象,係類似於在第8圖的中間圖形中所示之該低重疊視窗 行爲’同時在第8圖頂部圖形中的正弦視窗的預迴聲現 象’在最前面的128(M = 512)個取樣中,係包含明顯的貢獻。 換句話說’在合成濾波器組或者分析濾波器組的具體 貫施例中,使用低延遲視窗可以得到—個優點,與改善預 迴聲現象有關。在一分析視窗的情況中,存取未來輸入數 -65- 1355647
値且因此需要延遲的該路徑,係減低至少超過一個取樣, 且在一區塊長度或者取樣超前値爲480/512個取樣的情況 中,較佳係減低1 20/1 28取樣,使得與該MDCT(Modified Discrete Cosine Transform,修改過的離散餘弦轉換)比較之 下,可以減低延遲。同時,可以改善該預迴聲現象,因爲 在該信號中可能係在這些120/128個取樣中的一個可能的 侵襲,將僅出現一個區塊或者一個訊框之後。對應地,在 該合成視窗中,與過去的輸出取樣之間重疊以完成它們的 重疊/相加運算(這也需要一對應的延遲),係可以再降低 120/128個取樣,造成整體的240/2 56個取樣的延遲減低。 因爲在一可能的侵襲之前,不然這些1 2 0/128個取樣也會 對展開至過去的該雜訊有所貢獻,這也會造成預迴聲現象 的改善。總而言之,這代表可能出現在一個區塊或者訊框 之後的預迴聲,以及由該合成側單獨所造成的預迴聲係短 少1 2 0 / 1 2 8個取樣。 可以藉由使用此種低延遲視窗而達成的這樣的一種減 低’如第5至7圖中所描述的,依合成濾波器組或者分析 濾波器組的具體實施例的具體實現架構,當考慮人耳的聽 覺特性時,特別係就遮蔽這方面而言可以特別有用的。爲 闡明這個觀點,第9圖係顯示人耳的該遮蔽行爲的槪要 圖。更精確而言,第9圖係顯示人耳的該聽力臨界水準的 槪要表示圖,當具有特定頻率的音頻或者聲調係出現在大 約200毫秒的一段時間期間出現時,作爲一個時間的函數。 -66 - 1355647 然而’在前述的該音頻或者聲調出現的稍早之前,如 第9圖中的該箭號350所指示的,在大約20毫秒的短時間 之內,係出現一前遮蔽’因此使得在該聲調或者音頻存在 的期間之內’該無遮蔽以及遮蔽之間可以平順地轉變,這 有時候係稱之爲同時遮蔽。在該音頻或者聲調存在的期間 之內,開啓該遮蔽。然而,當該聲調或者音頻消失時,如 同第9圖中的箭號360所指示的,該遮蔽並非立即地抬升,
但是在大約.1 5 0毫秒的一段時間之內 低,這有時候也稱之爲後遮蔽。 該遮蔽係緩慢地減 亦即’第9圖係顯示一般的人類聽覺的時間遮蔽特 性,在音頻或者聲調出現之前和之後,係包含前遮蔽階段 以及一後遮蔽階段。由於藉由倂用低延遲視窗於分析濾波 器組1 00以及/或者合成濾波器組200的具體實施例中,使 得該預迴聲現象的減低,在許多的情況中,可聽見的失真 將被嚴格地限制,因爲該聽覺的預迴聲,至少在某個程度 φ 之內’將落在人耳的時間遮蔽效應的前遮蔽期間內,如第 9圖所示。 此外,使用如第5至7圖所描繪並且相對於附件中的 第1至4表中的關係以及數値更詳細地描述的低延遲視窗 函數’提供類似於正弦視窗的一種頻率響應。爲了進一步 說明’第1 0圖係顯示該正弦視窗(虛線)以及低延遲視窗的 實例(實線)之間頻率響應的一個比較。在比較第丨〇圖中前 述的這兩個視窗的兩個頻率響應之後,該延遲視窗就頻率 -67- 1355647 選擇性方面而言,與該正弦函數係可比較的。該低延遲視 窗的頻率響應係類似於或者比得上該正弦視窗的頻率響 應,並且比該低重疊視窗的頻率響應還要好,如同在第11 圖中所示與彼等頻率響應比較所描繪的。
更精確而言,第Π圖係顯示該正弦視窗(虛線)以及該 低重疊視窗(實線)之間的頻率響應之比較。可以看出,該 低重疊視窗的頻率響應的實線,係明顯地大於該正弦視窗 對應的頻率響應。藉由比較第ίο圖中所示之兩個頻率響應 的結果可看出該低延遲視窗以及該正弦視窗顯示可以比得 上的頻率響應,也可以很容易地畫出該低重疊視窗以及該 低延遲視窗之間的比較,如第1 0與11圖中所示之該圖示, 兩者皆顯示該正弦視窗的頻率響應,並且包含相對於該頻 率軸以及該強度軸(dB)而言,相同的尺寸。因此,可以很 容易地得到一個結論,亦即可以很容易地實現合成濾波器 組的具體實施例以及分析濾波器組的具體實施例中的正弦 視窗,與該低重疊視窗比較之下,可以提供一明顯更好的 頻率響應。 在第8圖中所示之該預迴聲現象的比較也顯示在該低 延遲視窗與預迴聲現象比較之下,可提供重大的優點,同 時該低延遲視窗的該預迴聲現象係可與低重疊視窗的預迴 聲現象比得上的,因此該低延遲視窗係表示前述的兩種視 窗之間一種極佳的取捨。 如此一來,可以在分析濾波器組的具體實施例以及合 -68- 1355647 成濾波器組的具體實施例以及相關的具體實施例的架構中 實現的該低延遲視窗,由於此取捨,該相同的視窗函數可 以用於暫態信號以及音調的信號,使得在不同的區塊長度 之間或者不同的視窗之間的切換係不必要的。換句話說, 分析濾波器組、合成濾波器組的具體實施例,以及其它相 關的具體實施例’提供建立編碼器、解碼器以及另外的系
統的可能性,其可以不需要在不同的操作參數集之間進行 •切換,這些參數係例如不同的區塊大小、或者區塊長度、 或者不同的視窗或者視窗形狀。換句話說,藉著使用具有 該低延遲視窗的分析濾波器組或者合成濾波器組的具體實 施例,編碼器、解碼器以及相關的系統的具體實施例的建 構可以大大地簡化。在一種額外的機會下,由於在不同的 參數集之間不需要切換的這個事實,故來自於不同來源的 信號可以在頻域中處理,而非在時域中,其需要額外的延 遲’將在接下來的章自卩中槪略描述。 又換句話說,使用合成濾波器組或者分析濾波器組的 具體實施例提供受益於在一些具體實施例中的低計算複雜 度的優點的可能性。爲了補償與例如具有正弦視窗的MD CT 比較之下,較低的延遲,係引入不會創建額外的延遲的較 長的重疊。儘管該較長的延遲以及對應地,具有兩倍的重 疊總量的對應正弦視窗約兩倍長度的一個視窗,以及如同 之前所槪述之該頻率選擇性的相應的效益,由於區塊長度 乘法以及記憶體元素的可能增加的大小,故可以獲得僅有 -69- 1355647 額外的小幅度複雜度增加。然而,這樣的一種實現架構的 更詳細的細節,將在第19至24圖的該上下文中解釋。
第12圖顯示編碼器400的具體實施例的槪要方塊圖。 該編碼器400包含分析濾波器組的具體實施例,以及作爲 可選用的元件’熵編碼器410,係經過適當配置以編碼由該 分析濾波器組1 00所提供的各數個輸出訊框,以及經過適 當配置以輸出依據彼等輸出訊框而定之多數個已編碼訊 框。舉例而言,該熵編碼器410的實現,可以利用一霍夫 曼編碼器(Huffman encoder)或者使用有效率的烟編碼方案 (例如算術編碼方案)之另舛的熵編碼器。 由於在編碼器400的具體實施例的該架構中,使-用分 析濾波器組100的具體實施例,該編碼器提供個數爲N個 頻帶的一個輸出,同時具有小於2N或者2N-1的重建的延 遲。此外,理論上編碼器的具體實施例也表示濾波器,編 碼器400的具體實施例提供超過2N取樣的的有限’脈衝響 應。亦即,編碼器400的具體實施例表示一種編碼器,具 有以一種延遲效率的方式處理(音頻)資料的能力。 依如第12圖所示之編碼器400的具體實施例的具體的 實現架構,此一具體實施例也可以包含量化器、濾波器或 者其它的元件,以預先處理提供給該分析濾波器組100的該 具體實施例之輸入訊框,或者在熵編碼各自的訊框之前, 處理彼等輸出訊框。如一個實例,一個額外的量化器可以 在該分析濾波器組100之前,提供給編碼器400的具體實 -70- 1355647 施例,以量化該資料或者重新量化該資料,依該具體的實 施架構以及應用的領域而定。如同在該分析濾波器組之後 進行處理之實例,可以在該頻域中以彼等輸出訊框的方 式,實現等化程序或者另外的增益調整。
第13圖顯示解碼器450的具體實施例,包含熵解碼器 460以及如同先前所敘述的合成濾波器組的具體實施例。該 解碼器450的具體實施例之熵解碼器460,代表一個可選用 的元件,其可以係例如經過適當配置用以解碼多數個已編 碼的訊框,這些訊框可以係,例如由編碼器400的具體實 施例提供。相應地,該熵解碼器460可以係依據熵編碼/解 碼方案而適用於在近處之解碼器450之應用的霍夫曼或者 演算法的解碼器或者另外的熵解碼器。此外,該熵解碼器 460可以適當配置以提供多數的輸入訊框給該合成濾波器 組200’該合成滤波器組從而在該合成據波器組200的一輸 出,或者在該解碼器450的輸出提供多數個加成訊框。 然而,依具體的實施方式,該解碼器45 0也可以包含 額外的元件,例如解量化器或者其它的元件,例如增益調 整器(gain adjuster)。更精確而言,在該熵解碼器460以及 該合成濾波器組之間,可以實現增益調整器作爲一種可選 用的元件’以可在該音頻資料將被該合成濾波器組200轉 移至該時域之前,在該頻域中進行增益調整或者等化程 序。相應地,在提供彼等可選的重新量化的加成型訊框至 該解碼器450的外部元件之前,可在該合成濾波器組200 -71 - 1355647 之後在解碼器4 5 0中實現額外的量化器’以提供重新量化 彼等加成型訊框的機會。 如第12圖所示的編碼器400的一些具體實施例,以及 如第13圖所示的解碼器450的一些具體實施可以應用於許 多的音頻編碼/解碼以及音頻處理之領域中。編碼器400以 及解碼器45 0的這些具體實施例可例如使用於高品質通信 的領域中。
編碼器(encoder或者coder)的具體實施例以及解碼器 的具體實施例兩者,在不需要實現例如切換該區塊長度或 者在不同的視窗之間切換的參數變換的情況下,皆可以提 供操作該具體實施例之機會。換句話說,與其它的編碼器 與解碼器比較之下,在合成濾波器組、分析濾波器組以及 相關的具體實施例的形式之下,本發明的具體實施例到目 前爲止係並不需要實施不同的區塊長度以及/或者不同的 視窗函數。 在該MPEG-4音頻規範第二版本最初的定義中,低延 遲AAC編碼器(AAC LD),在時間上,作爲一全頻寬高品質 通信編碼器,係具有遞增的適應性變化,其並不會受限於 一般的語音編碼器的限制,例如集中在單一揚聲器、語音 實質、音樂信號的性能不佳等。這種特別的編解碼器在其 它的通信應用中,係廣泛地使用於視訊/電傳會議,其係例 如由於工業界的需求已經觸發低延遲AAC設定檔的創建。 然而,彼等編碼器的編碼效率的強化,在使用者的社群中, -72- 1355647 係廣爲關注的,並且是本發明的一些具體實施例有能力提 供的該貢獻的主題。
目前,MPEG-4 ER AAC LD編解碼器,在毎個聲道的位 兀率在64 kbit/s至48 kbit/s的範圍內,係可以產生很好的 音頻品質。爲了增加彼等編碼器的編碼效率,以與語音編 碼器抗衡,使用被證明的該光譜帶複製工具(SB R)係一種完 美的選擇。然而,在此主題上一個較早的提案,並未進一 步追求該標準化的路線。 爲了不損失對於許多應用(例如服務電信應用)皆是非 常蓽要的該低編解碼器延遲,必須取得額外的量測。在許 多的情況中,作爲開發各自的編碼器的需求,係定義這樣 的一個編碼器應該可以提供低至20毫秒的演算延遲。幸運 地,僅需在現存的規格上,施行些許的修改即可符合此目 標。具體而言,可發現結果係僅需兩個簡單的修改,其中 之一係於此文件中提出。利用一低延遲濾波器組100、200 的具體實施例,取代該AAC LD編解碼濾波器組,在許多 的應用中,可以減緩明顯的延遲增加。該SBR工具伴隨微 小的修改可以藉由將此引入至該編碼器之內減低該加成延 遲,例如第12圖中所示之該編碼器400的具體實施例。 如此一來,包含低延遲濾波器組的具體實施例之該強 化的AAC ELD編碼器,或者AAC EL解碼器顯示出可以比 得上一單純的AAC LD編碼器的延遲,但是具有在該相同 的品質水準上,依據該具體的實施方式而定,節省一顯著 -73- 1355647 的位元率總量的能力。更精確而言,又AAC ELD編碼器’ ^^〆 在相同的品質水準上’與AAC LD編碼器比較之下,可 ^^ 以具有節省最高到2 5 %或者甚至高到3 3 %的位元率的能力。 合成濾波器組或者分析濾波器組的一些具體實施例, 可以實現於一種所謂的強化低延遲 AAC編解碼器(AAC ELD)中,依據該具體的實施方式以及應用規格而定,其係 具有延伸該操作範圍低至每個聲道24 kbit/s的能力。換句
話說,本發明的許多具體實施例,可以實現於一編碼架構 中,作爲使用可選的額外之編碼工具之該A AC LD方案的 一種延伸。此種可選的編碼工具係爲該光譜頻帶複製(SB R) 工具,其係可以整合於或者額外的使用於編碼器的具體實 施例以及解碼器的具體實施例兩者的架構中。特別在低位 元率編碼的領域中,SBR係一種具吸引力的增強,當其使 得一雙重速率編碼器的實現爲可能時,其中對於該頻譜的 較低的部分,該取樣頻率係僅使用原始的取樣器的取樣頻 φ 率的一半,進行編碼。同時,SBR係具有,依據該較低的 部分,編碼較高的頻率光譜範圍的能力,使得整體的取樣 頻率可以在理論上減少兩倍。 換句話說,使用SBR工具使得延遲最佳化元件的實施 架構係特別吸引人而且係有幫助的,因爲由於雙核心編碼 器的減低的取樣頻率,理論上節省的延遲可以節省的延遲 的2倍的係數,減低系統整體的延遲。 相應地,然而簡單的AAC LD與SBR的組合,可以導 -74- 1355647 $ 60毫秒的全部演算延遲,如同將在稍後更詳細地解釋。 医1此’這樣的一種組合,將使得所得到的該編解碼器變成 不適合於通信應用,如同一般而言,用於互動式的雙向通 信的一個系統的延遲,不應該超過5〇毫秒。
藉著使用分析濾波器組以及/或者合成濾波器組的具 體實施例,且因此利用這些專用的低延遲瀘波器組之中的 一個,取代該MDCT濾波器組,可以因此減緩如同先前所 解釋的由於實施一雙速率編碼器所造成的延遲遞增。藉由 使用前述的彼等具體實施例,對於雙向的通信,AAC ELD 編碼器所顯現出來的延遲’可’以徹底地落在可接受的範圍 之內,與正規的AAC LD編碼器比較之下,同時節省最高 可達25 %至33%的速率,同時維持音頻品質的水準。 因此,就合成濾波器組、一分係濾波器組之的具體實 施例以及其它的相關具體實施例方面而言,本申請案描述 一種可能的技術修改的說明,以及至少對於本發明的一些 具體實施例而言,一可達成的編碼器性能的評估。這樣的 一種低延遲濾波器組係有能力可以藉著使用如同先前所解 釋的,具有多重延遲的不同的視窗函數,取代使用MDCT 或者IMDCT,以達成實質的延遲減低,而且同時根據該具 體的實施方式提供完美重建的可能性。這樣的一種低延遲 濾波器組的具體實施例,在一些具體實施例的情況中,係 有能力可以在不減少該濾波器長度的情況下,減低該重建 延遲,並且在一些情況底下仍然可以維持該完美重建的特 -75-
1355647 性。 所得到的彼等瀘波器組具有與傳統的MDCT 弦調變函數,但是可以有較長的視窗函數,可以 義的或者低重建延遲之非對稱的或者不對稱的。 所解釋的,此種使用新的低延遲視窗的新的低延 組的具體實施例,係可以有能力在訊框的大小爲M 取樣的該情況中,將該MDCT延遲從960個取樣, 7 2 0個取樣。一般而言,該濾波器組的具體實施例保 可以降低2M的延遲至(2M-M/2),藉著實現M/4個零 係數或者藉由相應地調整適當的彼等元件,如同先 釋的,使得對應的彼等訊框的彼等第一子區段1 50-包含較其它的子區段少之M/4個取樣。 這些低延遲視窗函數的實例係已經顯示於第5 的上下文中,其中第6與7圖也包含與該傳統的农 的該比較圖。然而,應該注意的係該分析視窗僅是 前所解釋的該合成視窗的時間反轉的複製版本。 接下來,將描述SBR工具與一AACLD編碼器 以達成低位元率以及低延遲音頻編碼系統的技術 同在稍早所解釋的’相較於單一速率系統而言, 統係用以達成較高的編碼增益/藉著實行雙速率 於可能具有較少的頻帶而更有能量效率的編碼, 的該編碼器提供’這在某個程度上係由於從由該 提供之彼等訊框中’移除冗餘資訊而這將導致逐 丨同的餘 :具有廣 I同先前 :濾波器 = 480 個 減低至 丨有能力 〖値視窗 :前所解 1、 260-1 至7圖 F號視窗 :如同先 的組合, 明。如 速率系 統,由 由對應 碼器所 元的減 -76- 1355647 低。更精確而言,如同先前所敘述的低延遲濾波器組的具 體實施例係用於該AAC LD核心編碼器的該架構中,以達 到對於通信應用而言係可接受的整體的延遲。換句話說, 在下文中,該延遲將就該AAC LD核心以及該AAC ELD核 心編碼器兩個方面進行描述。
藉著使用合成濾波器組或者分析濾波器組的具體實施 例,延遲降低可以利用實行修改過的MDCT視窗/濾波器組 而達成。藉著使用前面所提到的以及描述的不同的具有多 重重疊的視窗函數,以延伸該MDCT以及該IMDCT以獲得 低延遲濾波器組而達成。該低延遲濾波器的技術,允許使 用具有多重重疊的非正交視窗。以此方式,係可能得到延 遲,其係小於該視窗長度。因此具有仍然是長的脈衝響應 的低延遲,獲得好的頻率選擇性係可達成的。 如同先前所解釋的,對於訊框大小爲M = 4 80個取樣的 該低延遲視窗,將該MDCT延遲從960個取樣降低至720 φ個取樣。 總括而言,與MPEG-4 ER AAC LD編解碼器相比之下, 編碼器的具體實施例以及解碼器450的具體實施例,在特 定的情況下,係有能力可以在非常小的位元範圍之內,產 生好的音頻品質。當前述的該ER A AC LD編解碼器,在每 個聲道的64 kb/sec至48 kb/sec的位元範圍內,可以產生 好的音頻品質時,該編碼器400以及該解碼器450的彼等 具體實施例,如同在本文章中所描述的,係有能力可以提 -77- 1355647 供音頻編碼器以及解碼器,其係在一些情況下,可以一更 低的大約每個聲道32 kb/sec的位元率,產生相同的音頻品 質。此外,編碼器以及解碼器的許多具體實施例具有足夠 小的演算法延遲,可以使用於雙向的通信系統,可以在僅 使用最小的修正之下,實現於現有的技術中。
本發明的一些具體實施例,特別係以編碼器400以及 解碼器450的形式,可以藉著結合現有的MPEG-4音頻技 術與最小數量的甩於低延遲運作所需要的改變,以達成本 發明的許多具體實施例。具體而言,該MPEG-4 ER A AC低 延遲編碼器可以與一MPEG-4光譜帶複製(SBR)工具,藉著 考慮所描述的彼等修正,以實現編碼器400以及解碼器450 的具體實施例。所造成的演算法延遲的增加,可以藉著對 該SBR進行少量的修改(這將不會在本申請案中敘述),以 及使用低延遲核心編碼器濾波器組的具體實施例,以及分 析濾波器組或者合成濾波器組的具體實施例而減緩。根據 φ 該具體的實施方式,這樣的一種強化的AAC LD編碼器係 有能力,與一簡單的ACC LD編碼器相較之下,可以節省 最高至33 %的位元率,同時保持對雙向通信應用而言,足 夠低的延遲。 在參考於第14圖,更詳細地描述延遲分析之前,描述 包含一 SBR工具的編碼系統。換句話說,在此章節中,第 14a圖中所示之編碼系統500的所有成分,將針對它們對於 整體系統延遲的貢獻進行分析。第14a圖係爲該完整系統 -78- 1355647 的詳細槪觀’其中第14b圖係將重點放在延遲的來源。
第14a圖中所示之該系統包含編碼器5〇〇,該編碼器依 次係包含一 MDCT時間/頻率轉換器,以雙速率的方式操 作’作爲雙速率編碼器。此外,該編碼器500也包含QMF 分析濾波器組520,其係爲該SBR工具的一部份。該MDCT 時間/頻率轉換器以及該 qmf分析濾波器組 (QMF = Quadr at ure Mirror Filter,正交鏡像濾波器)兩者就它 們的輸入以及它們的輸出兩者而言,係耦合在一起。換句 話說’相同知輸入資料係提供給該MDCT轉換器510以及 該QMF分析濾波器組520兩者。然而,當該MDCT轉換器 510提供該低頻帶資訊時,該QMF分析濾波器組520係提 供該SBR資料。這兩種資料係結合在一起成爲位元串流, 並且提供給解碼器5 30。 該解碼器5 3 0包含IMDCT頻率/時間轉換器540,其係 有能力可以解碼該位元串流以獲得,至少對於該低頻帶部 Φ 分,時域信號,該時域信號將經由延遲'器5 5 0提供給該解 碼器的一個輸出。此外,該IMDCT轉換器540的一個輸出 係耦合於另一 QMF分析濾波器組5 60,其係該解碼器530 的SBR工具的一部份。更進一步地,該SBR工具包含HF 產生器570,係耦合於該QMF分析濾波器組560的一個輸 出,並且有能力可以依據該編碼器5 00的該QMF分析濾波 器組520的SBR資料,產生該較高頻率的成分。該HF產 生器570的一個輸出係親合於QMF合成爐波器組580,其 -79- 1355647 係將在該QMF域中的彼等信號,轉換回到該時域中,其中 彼等延遲的低頻帶信號係與彼等高頻帶信號結合,如同有 該解碼器5 3 0的該S B R工具所提供的。所得到的資料之後 將接著提供作爲該解碼器530的輸出資料。
與弟14 a圖比較之下’弟14b圖係強調第14a圖中所, 示之該系統的彼等延遲來源。更精確而言,根據該編碼器 500以及該解碼器530的具體實現架構,第14b圖係描繪包 含SBR工具的MPEG-4 ER AAC LD系統的彼等延遲來源。 此音頻系統的適合的編碼器,使用 MDCT/IMDCT濾波器 組,用於5 1 2或者480個取樣大小的訊框的時間/頻率/時間 變換或者轉換。因此,這造成重建延遲,其依據該具體的 實施方式係等於1 024或者960個取樣。在雙速率模式中與 SBR組合使用該MPEG-4 ER AAC LD編解碼器的情況中, 由於該取樣率轉換,故該延遲數値必須加倍。 更詳細的整體延遲分析以及需求,顯示在與S BR工具 組合使用AAC LD編解碼器的該情況中,在48 kHz的取樣 率以及48 0個取樣大小的核心編碼器訊框的情況下,其結 果是一整體的16毫秒的演算法延遲。第15圖包含一個圖 表,其係顯示假設48 kHz的取樣率以及該核心編碼器訊框 大小爲480取樣時不同的成分所產生的延遲的一個槪觀, 其中該核心編碼器,由於該雙速率方法,係有效率地執行 於24 kHz的取樣率。 . 在第15圖中彼等延遲來源的槪觀顯示在SBR工具一起 -80- 1355647 的A AC LD編解碼器與之情況中,將得到1 6毫秒的整體演 算法延遲,這係明顯地高於電信應用所允許的。此評估包 含該AACLD編碼器與該SBR工具的該標準的組合,係包含 來自於彼等MDCT/IMDCT雙速率成分、彼等QMF成分以及 彼等SBR重疊成分的延遲貢獻。
然而,使用前述的彼等調整以及藉著使用之前所描述 的具體實施例,僅有42毫秒的整體延遲係可達成的,這係 包含在該雙速率模式中(ELD MDCT + IMDCT)及QMF成分, 來自於彼等低延遲濾波器組的彼等具體實施例的彼等延遲 貢獻。 相對於在該AAC核心編解碼器的架構中的一些延遲來 源,以及相對於該SBR模組,該AAC LD核心的演算法延 遲可以描述爲2M個取樣,其中,再一次地,Μ係該核心編 碼器的基本訊框長度。相較之下,該低延遲濾波器組,由 於引入該初始區段160、270或者藉著在彼等合適的視窗函 φ 數的該架構中引入適當個數的零値或者其它的數値,係可 以將彼等取樣個數降低Μ/2。在將AAC核心與SBR工具組 合使用的情況中,由於一雙速率系統的該取樣率轉換,該 延遲係爲兩倍。 爲進一步澄清,在第15圖的該圖表中所給定的一些數 値,在一典型的SBR解碼器的該架構中,可以辨識出兩個 延遲來源。在一方面,該QMF成分包含640個取樣的一濾 波器組重建延遲。然而,由於64- 1 =63個取樣的該訊框延 -81 - 1355647 遲係已經由該核心編碼器本身所引入,因此係可以被減去 以獲得在第15圖的該圖表中所給定之577個取樣的該延遲 數値。 另一方面,由於該可變的時間格點,該SBR HF重建係 會造成,具有6個QMF時槽之標準SBR工具的額外的延 遲。據此,在該標準SBR中,該延遲係爲六乘上64個取樣 爲3 84個取樣。
藉著實現濾波器組的具體實施例以及實現改進過的 SBR工具,節省18毫秒的延遲亦可達成的,係藉著不要實 現A AC LD編碼器與具有60毫秒的整體延遲的SBR工具的 直接組合,但是42毫秒的整體延遲係可以達成的。如同先 前所提到的,這些圖示係以48 kHz的取樣率,以及依據 M = 480個取樣的訊框長度爲基礎。換句話說,除了在前述 的該實例中所謂的訊框延遲M = 4 80個取樣之外,該重疊延 遲(就延遲最隹化這分面而言,係爲第二重要的特徵)可以 藉著引入合成濾波器組或者分析濾波器組的具體實施例顯 著地降低,以達成低位元率以及低延遲音頻編碼系統。 本發明的許多具體實施例可以實行於許多的應用領 域,例如會議系統以及其它的雙向通信系統。大約在西元 1 9 97年,在其槪念剛成型的時期,對於低延遲的一般音頻 編碼方案所設定的延遲需求(這係導致該AAC LD編解碼器 的設計),係將達成20毫秒的演算法延遲,這在該AAC LD 係以48 KHz的取樣率以及M = 480的訊框大小執行時係可以 -82-
1355647 滿足的。相較於此’這個編解碼器的許多實際的應用 如電傳會議’係使用32 kHz的取樣率,且因此係工作 毫秒的延遲。類似地’由於以IP爲基礎的通信的重要 漸增加’現代的ITU電信編解碼器的彼等延遲需求, 允許大致而言約40毫秒的延遲。不同的實例包括最 G.72 2.1附件C編解碼器,具有40毫秒的演算法延遲 及該G.729.1編解碼器,具有48毫秒的演算法延遲。B 藉由可以操作強化的AAC LD編解碼器或者包含低延 波器組的具體實施例的AAC ELD編解碼器,達成的該 延遲’以完全地落在常見的電信編碼器的延遲範圍之 第16圖顯示混音器6 00的具體實施例的方塊圖, 混合多數的輸入訊框,其中每一個輸入訊框係爲由不 來源所提供的對應的時域訊框的光譜表示。例如,該 器600的每一個輸入訊框可以係由編碼器400的具體 例或者其它合適的系統或者元件所提供。應該注意的 第16圖中,該混音器600係適合於從三個不同的來 收輸入訊框。然而,這並不表示任何限制。更精確而 理論上,混音器600的具體實施例可以適合於或者ρ 過適當配置以處理與接收任意個數的輸入訊框,每一 入訊框係由不同的來源,例如不同的編碼器4 0 0所提 第1 6圖中所示之該混音器600的具體實施例,电 解碼器6 1 0,其係有能力可以由彼等不同的來源所提俘 等輸入訊框熵解碼。根據該具體的實施方式,該熵饀 ,例 於30 性逐 係可 近的 ,以 司此, 遲濾 整體 內。 用以 同的 混音 實施 係在 (,接 — '以經 個輸 供。 :含摘 ί之彼 1碼器 -83-
1355647 6 1 0的實現,係可以例如利用一霍夫曼摘解碼器,或 另外的熵解碼演算法的熵解碼器’例如所謂的算: (Arithmetic Coding)、單一元素編碼(Unary Coding) Gamma 編碼、Fibonacci 編碼、Golomb 編碼或者 Rice 彼等已經熵解碼的輸入訊框接著係提供給可選 量化器620,其可以適當調整使得彼等熵解碼輸入訊 被解量化,以適合於應用特定的情況,例如人耳的 性。該熵解碼以及可選的解量化輸入訊框接著係提 放器630,其係有能力可以在該頻域中縮放多數個熵 依據混音器600的具體實施例之具體昀實施方式, 器63 0可以例如藉由將每一個數値乘上一常數因子 縮放每一個可選的解量化以及熵解碼輸入訊框,其| 表示不同的來源或者編碼器400的個數的整數。 換句話說,該縮放器630在此情況中係有能力 小由該解量化器620或者該熵解碼器6 1 0所提供的 框,將它們縮小以避免彼等對應的信號變的太大, 步避免溢位或者另外的計算錯誤,或者避免可聽 真,例如鉗位(clipping)。該縮放器630的不同的實 也可以被實現,例如縮放器具有能力以一種能量守 式縮放所提供的訊框,例如藉由依據一個或者更多 頻帶評估每一個輸入訊框的能量。在這樣的情況中 一個光譜頻帶中,在該頻域中的彼等對應的數値可 一常數因子,使得相對於全部的頻率範圍而言該整 者使用 術編碼 ' Elias 編碼。 用的解 框可以 響度特 供給縮 訊框。 該縮放 1/P,以 中P係 可以縮 彼等訊 以進一 見的失 施架構 恆的方 個光譜 ,在每 以乘上 體的能 -84- 1355647 量係相同的。額外地或者二者擇一地,該縮放器630也可 以經過適當調整使得每一個光譜子群的能量’相對於所有 不同的來源的所有輸入訊框而言,係相同的’或者每—個 輸入訊框的全部的能量係爲常數。
該縮放器6 30接著係耦合於加法器640 ’該加法器640 係有能力可以將該縮放器所提供的彼等訊框加在一起,這 些訊框也稱之爲頻域中的已縮放訊框,以產生也是在頻域 中的加成型訊框。這可以係,例如將來自於該縮放器6 3 0 所提供的所..有已縮放訊框,對應於相同的取樣索引的所有 數値加在一起而完成。 該加法器640係有能力可以在頻域中將該縮放器630 所提供的彼等訊框加在一起,以釋得加成型訊框,其包含 如同該縮放器63 0所提供的所有來源的資訊。作爲另一種 可選的元件’混音器600的具體實施例也可以包含量化器 650’可以將該加法器640的彼等加成訊框提供給該量化器 φ 65 0。依據彼等特定應用的需求,該可選的量化器650可以 係,例如用於調整該加成型訊框以滿足一些條件。例如, 該量化器6 5 0可以經過調整使得該解量化器6 2 〇的機制可 以被反轉。換句話說’例如若提供給該混音器的彼等輸入 訊框的根本的特殊性質,係已經被該解量化器62〇移除或 者改Μ ’該量化器650可以經過適當調整,以提供這些特 殊需求的條件給該加成型訊框。作爲—個實例,該量’化器 65 0可以係例如適當調整以適應於人耳的特徵。 -85- 1355647 作爲另一個元件’該混音器600的具體實施例可以進 一步包含熵編碼器6 60’其係有能力可以對該可選的量化加 成型訊框進行熵編碼,並且提供已混音的訊框給一個或者 多個接收器,例如包含編碼器450的具體實施例。再一次 地,該熵編碼器660可以適用於依據該霍夫曼演算法或者 前述的彼等演算法之中的一種,熵編碼該加成型訊框。
藉著使用分析濾波器組、合成濾波器組的具體實施 例,或者在編碼器以及解碼器的架構中其它的相關具體實 施例,可以建立以及實現混音器,其係有能力可以在該頻 域中混合多數個信號。換句話說,藉著實現先前所描述的 彼等強化的低延遲AAC編解碼器之中的具體實施例,可以 實現混音器,係具有能力直接的混合在頻域中的多數個輸 入訊框,不需要轉換各自的彼等輸入訊框至該時域中,以 適應可能的參數切換,這係實現於目前最新技術的編解碼 器於語音通信。如同已經在分析濾波器組以及合成濾波器 φ 組的彼等具體實施例的上下文中解釋過的,這些具體實施 例使得不需要切換參數,例如不需要切換彼等區塊長度或 者不需要在不同的視窗之間切換的運作係可能的。 第17圖顯示在MCU (媒體控制單元)形式中的會議系統 7 00的具體實施例,其係可以例如以伺服器的架構實現。該 會議系統7 00或者MCU 700,包含多數個位元串流,這其 中在第17圖係顯示兩個。一組合式的熵解碼器以及解量化 器 610、6 20,以及一組合式的單元 630、640,係在第17 -86- 640 640
1355647 圖中標示爲『混音器』。此外,該組合式單元630、 的輸出係提供給包含量化器650以及熵編碼器660的 式單元,其提供往外發送的位元串流組作爲彼等混合 框。 換句話說,第17圖顯示會議系統7 00的具體實施 其係有能力可以在頻域中混合多數個進來的位元串流 該進來的位元串流以及彼等外出的位元串流係使用低 視窗在該編碼器側創建,然而彼等外出的位元串流係 在該解碼器側的相同的低延遲視窗,預備並且有能力 理的。換句話說,第17圖中所示之該MCU700係基於 用一個通用的低延遲視窗。 混音器600的具體實施例以及會議系統700的具 施例係因此適合應用於本發明的具體實施例的架構中 分析濾波器組、合成濾波器組以及其它相關的具體實 的形式。更精確而言,僅具有一個視窗的低延遲編解 的具體實施例的技術應用,允許在該頻域中進行混音 如,在具有多於兩個參與者或者來源的(電傳)會議的 中,經常係期望可以接收多數的編解碼信號,將它們 成一個信號並且進一步傳送所得到的已編碼信號。藉 該編碼器側以及該解碼器側使用本發明的具體實施例 會議系統700以及該混音器600的一些具體實施例中 較於以直接的方式解碼彼等進入的信號、在該時域中 彼等解碼信號以及重新編碼該混合信號再一次進入頻 組合 型訊 例, ,當 延遲 依據 被處 僅使 體實 ,以 施例 碼器 。例 情境 混合 由在 ,在 ,相 混合 域, -87-
1355647 可以減低該實現的方法。 以一種MCU形式表示的這樣—_ 架構係顯不於第18圖中,作爲會議: 7 5 0也包含一組合式模組760,用於接 個進入的位兀串流,並且係有能力a 彼等進入的位元串流。然而,在第1 ; 統7 5 0中’彼等模組7 6 0每一個係耦 7 7 0 ’其中的一個係操作於正弦視窗$ 前係操作在該低重疊視窗運作模式 IMDCT轉換器770,將彼等進入的仓 換至該時域,這在會議系統750的| 該彼等進入的位元串流係根據編碼器 用該正弦視窗以及該低重疊視窗兩者 以編碼各自的彼等信號。 該會議系統750進一步包含混音 混合來自於兩個IMDCT轉換器770 & 且提供混合型時域信號給M D C T轉換 器將該信號從時域中轉移至頻域中。 由該MDCT 790所提供之在頻塌 後係提供給一組合式模組795,其之核 及熵編碼該信號,以形成該外出的位 然而,根據該會議系統7 5 0的戈 由該等兩個IMDCT轉換器770以及g :直接的混音器的實現 备統750。該會議系統 !作於該頻域中之每一 以熵編碼以及解量化 圖中所示之該會議系 合於該IMDCT轉換器 I作模式,而另一個目 。換句話說,這兩個 :元串流,從該頻域變 :情況中係必要的’當 ,該編碼器係同時使 ,根據該音頻信號’ 器780,其在該時域中 ]兩個進入的信號,並 器790,該MDCT轉換 丨中的該混合型信號之 :係有能力可以量化以 元串流。 •法有兩個缺點。由於 家MDCT 790所完成的 -88- 1355647 全部的解碼以及編碼,實現該會議系統750必須付出很高 的計算成本。此外,由於引入該解碼以及編碼程序,會引 人一個額外的延遲,這在特定的情況之下可能很高。
藉著在該編碼器與解碼器地點使用本發明的一些具體 實施例,或者更精確而言,在一些具體實施例的情況中依 據實際的實現架構,藉著實行新的低延遲視窗,這些缺點 可以克服或者消除。這係可以藉由在該頻域中進行該混合 程序而達成,如同在第17圖中在該會議系統700的該上下 文中所解釋的。如此一來,如第17圖所示之會議系統700 的具體實施例並不包含必須在該會議系統750的架構中的 轉換以及/或者濾波器組,用以解碼正在編碼的彼等信號, 以將這些信號從該頻域中轉換至該時域中且再一次轉回 去。換句話說,在不同的視窗形狀的情況中,由於該 MDCT/IMDCT轉換器770、790,故該位元串流混合可導致 額外的區塊延遲的花費。 如此一來,在該混音器600的一些具體實施例中,以 及在該會議系統700的一些具體實施例中,作爲一個額外 的優點,較低的計算花費以及與額外的延遲有關的限制可 以被實現,使得在一些情況中,甚至可以達成完全沒有額 外的延遲。 第19圖顯示低延遲濾波器組的有效率的實施架構的 具體實施例。更精確而言,在討論該計算複雜度以及相關 特徵的進一步應用之前,在第1 9圖的該架構中,將詳細描 -89- 1355647 述合成濾波器組800的具體實施例,該合成濾波器組係可 以例如以解碼器的具體實施例來實現。因此低延遲分析濾 波器組800的具體實施例係象徵合成濾波器組或者編碼器 的具體實施例之反轉。 該合成濾波器組8 00包含反逆第IV類型離散餘弦轉換 頻率/時間轉換器(inverse type-iv discrete cosine transform
frequency/time converter)810,其係有能力可以提供多數個 輸出訊框,給包含視窗器以及重疊/加法器的組合式模組 820。更精確而言,該時間/頻率轉換器810係反逆第IV類 型離散餘弦轉換轉換器,係將接收包含Μ個已排序的輸入 値yk(0),…,yk(M_l)的輸入訊框,其中Μ再一次地係正整 數,以及其中k係整數,表示訊框索引。該時間/頻率轉換 器8 1 0係根據彼等輸入値,以提供2M個已排序的輸出取樣 xk(0),…,xk(2M-l) ’並且提供這些輸出取樣値給該模組 8 20 ’該模組820係依次包含先前提過的該視窗器以及該重 φ 疊/加法器。 該模組820的視窗器係有能力可以產生多數個視窗型 訊框’其中每一個視窗型訊框係係依據下列方程式或者表 示式包含多數個視窗型取樣Zk(〇),…,Zk(2M-1)決定:
Zk(n) = w(n) · xk(n) 對於 η = 〇λ·.·,2Μ-1 , 其中η再一次地爲一整數,表示取樣索引,以及w(n) 係一實數値視窗函數係數’對應於該取樣索引n。也包含 在該模組820中的該重疊/加法器,接著提供或者產生在該 -90- 1355647 中間訊框中,依據下列方程式或者表示式包含多數個中間 取樣 Mk(0),…,Mk(M-l): mk(n) = zk(n) + zk.x (n+M) 對於 η = 0,..·,Μ-1 . 該合成濾波器組800的具體實施例進一步包含抬昇器 (lifter) 8 50,其依據下列方程式或者表示式可以產生包含 多數個加成型取樣outk(0),···,outk(m-l)的加成型訊框: outk(n) = mk(n) + l(n-M/2) · mk_i(M-l-n)
.對於 η = M/2, ···, M-l , 以及 outk(n) = mk(n) + l(M-l-n) · outk_x (M-l-n) 對於 η=0,·.·,Μ/2-1 , 其中AAf-1-/7),…,八你-1)係爲實數的抬昇係數。在第19 圖中,低延遲濾波器組800的有計算效率的實施架構的具 體實施例係包含,在該抬昇器8 30的架構中,多數個組合 式延遲器(combined delayer)與乘法器(multiplier) 840,以及 多數個加法器85 0,用以執行在該抬昇器8 3 0的架構中之前 述計算。 依據合成濾波器組800的具體實施例之該具體的實現 架構,該視窗係數或者視窗函數係數w(/2),在每一個輸入 訊框具有M = 512個輸入値的具體實施例的情況中,係滿足 附件的第5表中所給定的關係式。該附錄的第9表中包含 —組關係式,在每一個輸入訊框包含M = 480個輸入値的情 況中,彼等視窗型係數w(/〇必須滿足這些關係式。此外’ -91 - 1355647 第6與10表分別包含對於M = 512以及m = 480時的具體實 施例中,用於彼等抬昇係數八λ)的關係式。 然而’在合成濾波器組800的一些具體實施例中,該
視窗係數W(/7)包含,對於每一個輸入訊框分別具有m = 512 以及M = 480個輸入數値的具體實施例中,在第7與11表中 所給定之彼等數値。相應地,在附件的第8以及第1 2表中, 包含對於每個輸入訊框分別具有M = 5 12以及M = 4 80個輸入 取樣的具體實施例中,用於該抬昇係數八;2)的彼等數値。 換句話說,低延遲濾波器組800的具體實施例可以像 一個正規的MDCT轉換器一樣,充分地實現。這樣的一種 具體實施例的一般結構係描繪於第19圖中。該反逆DCT-IV 以及該反逆視窗重疊/加法係以與傳統的視窗相同的方式 執行,然而,依據該具體實施例的具體實施方式,使用前 述的視窗係數。如同在該合成濾波器組200的具體實施例 之架構中的視窗係數的情況中一樣,在現在這個情況中, 也有M74個視窗係數係爲零値視窗型係數,因此理論上並 不需要牽涉到任何運算。對於延伸至過去的重疊,如同可 以從該提昇器830的架構中看出來的,僅需要Μ個額外的 乘加運算。這些額外的運算有時也稱之爲『零延遲矩陣』 (zero-delay matrices),這些運算有時亦稱爲『抬昇步驟』 (lifting steps)。 第1 9圖中所示之有效率的實施架構’在一些情況之 下,可以更有效率,如同合成濾波器組200的直接實現方 -92- 1355647 式。更精確而言’依據該具體的實施方式,這樣一種更有 效率的實現方式可以節省Μ個運算,如同在用於Μ個運算 的直接實現架構的情況中一樣,如同在第19圖中所示之實 現架構,且理論上係需要的,在該模組820的架構中實行 2Μ個運算,以及在該抬昇器8 30的架構中實行Μ個運算係 明智的。 就關於低延遲濾波器組的具體實施例的一種評估而
言,特別係按照計算複雜度而言,第20圖包含一個圖表, 描繪依據第19圖在每一個輸入框架係有Μ = 512個輸入數値 的情況中,·合成濾波器組800的具體實施例的實現架構的 具體實施例的算術複雜度。更精確而言,在第20圖的該圖 表中,包含在(修改過的)IMDCT轉換器與低延遲視窗函數 的情況一起使用的情況中,所得到的整體的運算個數的一 個估測。該整體的運算數目係爲9600。 比較之下,第21圖包含IMDCT的算術複雜度以及依 據該正弦視窗對於參數M = 512視窗化所需要的複雜度的一 個圖表,該參數M = 512係對於該編解碼器,例如該AAC LD 編解碼器給定運算的總個數。更精確而言,此IMDCT轉換 器與該正弦視窗的視窗化程序一起的該算術複雜度係爲 9216個運算,其係與第19圖中所示之該合成濾波器組800 的具體實施例的情況中,所得到的整體的運算個數,位於 相同的大小層級。 作爲另一個比較,第22圖包含對於A AC LC編解碼器 -93- 1355647 情況的一個圖表’aaclc也係習知的具有低複雜度的進階 音頻編解碼器。此IMDCT轉換器的算術複雜度’包括對該 AACLC(M = l〇24)的視窗化重疊,係爲19968。
總括言之’這些圖示的比較顯示包含強化的低延遲濾 波器組的具體實施例之核心編碼器的複雜度’基本上係可 以比得上使用正規的MDCT-IMDCT濾波器組的核心編碼 器。此外,彼等運算的個數,大致而言係爲A AC LC編解 碼器的運算個數的一半。 第23圖包含兩個圖表,其中第23a圖包含不同的編解 碼器的記憶體需求的一個比較表,以及第23b圖包含有關 於ROM需求的相同的估測。更精確而言,在第23a與23b 兩個圖中的彼等圖表,每一個係包含,對於前述的彼等編 解碼器AAC LD、AAC ELD以及AAC LC資訊,與該訊框長 度、工作緩衝區有關,以及與就RAM需求(第23a圖)方面 而言的狀態緩衝區有關,以及就該ROM記憶體(第23b圖) 需求方面而言,與該訊框長度、視窗係數的個數以及總和 有關的資訊。如同先前在第2 3 a與2 3 b圖的彼等圖表中所 提到的,縮寫AAC、ELD係參考於合成濾波器組、分析濾 波器組、編碼器、解碼器的具體實施例,或者稍候的具體 實施例。總括百之’相較於具有正弦視窗的該IMDCT,依 據第19圖所敘述的該低延遲濾波器組的具體實施例的有 效率的實現架構,需要長度爲Μ的額外的狀態記憶體,以 及Μ個額外的係數’亦即該抬昇係數八0),·..,八豕丨)。因 -94- 1355647 此’由於該AAC LD的一個訊框長度係爲該AAC LC的該訊 框長度的一半,所得到的該記憶體需求係在該AAC LC記 億體需求的範圍之內。 就該記憶體需求方面而言,第23a與23b圖中所示之 圖表中因此係對於前述的三種編解碼器,比較該RAM與 RQM需求。可以看的出來,對於該低延遲濾波器組而言, 該記憶體僅係適度的增加。該整體的記憶體需求,與AAC LC編解碼器或者實現架構比較之下,仍然是非常低的。.
第24圖包含,在用於性能評估的架構中的MUSHRA 試驗中所使用的編解碼器的列表。在第24圖所示的圖表 中,縮寫AOT係代表音頻物件類型(Audio Object Type), 其中項目『X』係表示該音頻物件類型ER AAC ELD,其也 可以設定爲39。換句話說,該AOT、X或者AOT 39可以 與合成濾波器組或者分析濾波器組的具體實施例視爲同一 件事物。該縮寫 AOT在此上下文中係代表『音頻物件類 在MUSHRA試驗的架構中’在前述的該編解碼器之 上,使用該低延遲濾波器組的具體實施例的影響,係藉由 對於在該列表中的所有組合執行收聽測試來進行測試。更 精確而言,從這些試驗的結果可得到下列的結論。在每個 聲道32 kbit/s的情況下’該AAC ELD解碼器的性能明顯地 優於該原始的AAC L解碼器在32 kb/s的情況。此外,在 每個聲道32 kb/s的情況下’該AAC ELD解碼器的性能, -95-
1355647 在統計上而言係無法與該原始AAC LD解碼器在每個 4 8 kb/s的情況時區別。作爲一種檢查點編解碼器,結合 LD與該低延遲濾波器組的性能,在統計上而言當兩者 48 kb/s執行時係無法與原始的AAC LD編碼器區分。 確認低延遲濾波器組的合適性》 因此,該整體的編碼器性能係維持爲可比得上的 時在編解碼延遲上的可觀的節省係可達成的。此外, 壓力的情況下,維持該編碼器壓力性能係可能的。 如同先前所解釋的,本發明的具體實施例的有希 情況或者應用,例如AAC ELD編解碼器的具體實施例 高傳真視訊電傳會議,以及下一代的網路電話(V〇1Ce IP)應用。此包含具有高品質水準以及具競爭力的位元 任意的音頻信號的傳輸,例如語音或者音樂,或者多 表現的背景中。本發明的具體實施例之該低演算法延 使得此編解碼器,對於所有類型的通信以及應用而言 φ 係極佳的選擇。 此外,本文件係已經敘述強化 AAC ELD解碼器 構,其係可以選擇與光譜頻帶複製(SB R)工具組合使用 了限制延遲的相關增加,在一真實的、實況的實現架 面的些許修改,可能在該S B R工具以及彼等核心編碼 組中變成係必要的。依據前述的技術所得到的強化的 遲音頻解碼的性能,與目前的MPEG-4音頻標準所能 的性能比較之下,係可以顯著地增加。然而’該核心 聲道 AAC 皆以 這可 ,同 在有 望的 係爲 over 率的 媒體 遲係 ,皆 的建 。爲 構方 器模 低延 實現 編碼 -96-
1355647 方案的複雜度’基本上仍然係相同的。此外,本 等具體實施例包含分析濾波器組或者合成據波器 低延遲分析視窗或者低延遲合成濾波器。此外, 信號或者合成一個信號的一種方法的具體實施例 延遲分析濾波步驟或者低延遲合成濾波步驟。同 低延遲分析濾波器,或者低延遲合成濾波器的數 施例。此外,揭露具有一程式碼的電腦程式,當 式在一電腦上執行時,可以實現上述的彼等方法 方法。本發明的具體實施例也包含具有低延遲的 器的一種編解碼器’或者具有低延遲的分析濾波 解碼器,或者對應的彼等方法中的一種β 依據本發明方法的彼等具體實施例的某些特 需求’本發明方法的具體實施例可以使用硬體或 現。該貫現方式可以使用一數位儲存媒介,特別 電氣可讀取控制訊號儲存在其上之碟片、DVD或 φ 與一可程式電腦或處理器共同配合執行。大體而 明的具體實施例因此係具有儲存在機器可讀: (carrier)上之程式碼的電腦程式產品,當該電腦程 電腦或處理器上執行時,該程式碼可以有效的實 方法之實施例。換句話說,本發明方法的具體實 是具有程式碼之電腦程式,當該電腦程式碼在一 理器上執行時,可以實行本發明彼等方法的彼等 例之中至少一種具體實施例的電腦程式。在此上 發明的彼 組,包括 分析一個 ,具有低 時也描述 個具體實 該電腦程 中的一種 分析濾波 器的一種 定的實施 者軟體實 係指具有 者CD其 言,本發 K承載體 式產品在 行本發明 施例因此 電腦或處 具體實施 下文中, -97- 1355647 處理器係包含CPUs (中央處理單元)、ASIC (應用特定積體 電路)或者其它的積體電路(1C)。 雖然在前面中已參考於特別的具體實施例進行特別的 陳述與描述,但是應該被瞭解的是,在該技術中所使用的 各種技巧,在不偏離本發明精神以及範圍的情況下,任何 熟悉該項技術所屬之領域者,可以在其形式上以及細節上 做各種不同的改變。應該被瞭解的是,在不偏離於此所揭 露以及於接下來的申請專利範圍中所界定的廣泛槪念之 下,可以進行各種不同的改變以使其適用於不同的具體實 施例。 【圖式簡單說明】 第1圖描繪分析濾波器組的方塊圖 第2圖爲描繪利用分析濾波器組的具體實施例進行處 理的輸入訊框的槪略圖表示; 第3圖描繪合成濾波器組的具體實施例的方塊圖;
第4圖描繪在該由合成濾波器組的具體實施例所處理 的架構中的輸出訊框的槪略圖表示; 第5圖描繪分析濾波器組以及分析濾波器組的具體實 施例的分析視窗函數以及合成視窗函數的槪略圖表示; 第6圖描繪相較'於符號視窗函數分析視窗函數與合成 視窗函數之比較圖; 第7圖顯示不同的視窗函數之另一比較圖; 第8圖爲在第7圖中所描繪的三個不同的視窗函數的 -98- 1355647 預迴聲現象的比較圖; 第9圖槪要地描繪人耳普遍的暫時遮蔽特性; 第10圖描繪符號視窗以及低延遲視窗的頻率響應的 比較圖; 第Π圖描繪正弦函數以及低重疊視窗的頻率響應的 比較圖; 第12圖描繪編碼器的具體實施例;
第13圖描繪解碼器的具體實施例; 第14a圖描繪包含編碼器以及解碼器的—種系統; 第14b圖描繪包含在第14a圖中所描繪的系統中,不 同的延遲來源; 第15圖描繪包含延遲比較的圖表; 第16圖描繪包含一種混音器的具體實施例之一種會 議系統的具體實施例; 第1 7圖係描繪會議系統的另具體實施例,作爲一種伺 φ 服器或者一種媒體控制單元; 第18圖係描繪一種媒體控制單元的方塊圖; 第1 9圖描繪一種合成濾波器組的具體實施例,係作爲 一種有效率的實施架構; 第2 〇圖係爲圖表,包含合成濾波器組或者分析濾波器 組(AAC ELC編解碼器)的具體實施例的計算效率的評估; 第21圖係爲圖表’包含A AC LD編解碼器的計算效率 的評估; -99- 1355647 第22圖係爲圖表,包含A AC LC編解碼器的計算複雜 度的評估; 第23a與23b圖係爲三種不同的編解碼器的RAM以及 ROM的記憶體效率評估的比較圖表;以及 第24圖係爲圖表,包含用於MUSHRA試驗的編解碼器 列表。 【主要元件符號說明】
100 分析濾波器組 1 10 視窗器 1 1 0i 輸入 1 10〇 輸出 120 時間/頻率轉換器 130-(k-3) 輸入訊框 130-(k-2) 輸入訊框 130-(k-l) 輸入訊框 1 30-k 輸入訊框 130-(k+l) 輸入訊框 150 子區段 150-1 子區段 150-2 子區段 150-3 子區段 150-4 子區段 160 初始區段 170 取樣超前値 -100- 1355647
200 合成濾波器組 210 0 頻率/時間轉換器 220 視窗器 230 重疊/加法器 240 輸出訊框 250 Drfe 則m 260 子區段 270 初始區段 280 視窗函數 290 加成型訊框 300 起始區段 3 10 剩餘區段 320 斤斤 Dpfe m m 330 箭號 350 箭號 360 箭號 400 編碼器 410 熵編碼器 450 解碼器 460 熵解碼器 500 編.碼系統 5 10 MDCT轉換器 520 QMF分析濾波器組 -101 - 1355647
530 解碼器 540 IMDCT頻率/時間轉 550 延遲器 560 QMF分析濾波器組 570 HF產生器 580 QMF合成濾波器組 600 混音器 610 熵解碼器 620 解量化器 630 縮放器 640 加法器 650 量化器 660 烟編碼器 700 會議系統 750 會議系統 760 組合式模組 770 IMDCT轉換器 780 混音器 790 MDCT轉換器 795 組合式模組 800 合成濾波器組 8 10 反逆第IV類型離散 轉換器 換器 餘弦變換頻率/時間 -102- 1355647 820 組合式模組 830 抬昇器 840 乘法器 850 加法器
-103-

Claims (1)

1355647 第096138773號「分析濾波器組合、合成濾波器組、編碼器、 解碼器與包含在會議系統中的混音器」專利案 (201 1年7月21日修正) 十、申請專利範圍: 1. 一種分析濾波器組,用以過濾複數個時域輸入訊框,輸 入訊框包括數個已排序的輸入取樣,包含:
一種視窗器(windower),經過適當配置以產生複數個視 窗型訊框(windowed frame),視窗型訊框包含複數個視窗 型取樣’其中該視窗器係經過配置以一種重疊的方式, 使用取樣超前數値(sample advance value),處理彼等複數 個輸入訊框, 其中該取樣超前數値係小於輸入訊框的已排序輸入取 樣的個數除以二;以及 一種時間/頻率轉換器(time/frequency converter),經過 適當配置以提供包含數個輸出値的輸出訊框,輸出訊框 係爲視窗型訊框的一種光譜表示。 2 ·如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置,以依據兩個輸入訊框,連續地產生兩 個視窗型訊框,其中彼等輸入訊框係包含彼等相同的已 排序輸入取樣中,一半以上的取樣數。 3 ·如申請專利範圍第2項之分析濾波器組,其中該視窗器 係經過適當配置以產生複數個視窗型訊框,使得兩個輸 入訊框之相同的彼等已排序輸入取樣(兩個連續的視窗 型訊框係依據該等兩個輸入訊框產生的),係以取樣超前 1355647 修正本 値移動與該輸入訊框的彼等輸入取樣相關連的順序。 4 ·如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置,以至少忽略依據彼等已排序取樣的順 序之最後一個輸入取樣,或者至少設定對應於彼等輸入 取樣的順序中,最後的一個視窗型取樣爲一事先決定的 數値’或者至少設定爲在一事先定義的範圍之內的一個 數値。 5 ·如申請專利範圍第4項之分析濾波器組,其中該視窗器 係經過適當配置以產生複數個視窗型訊框,使得在這兩 個輸入訊框中(兩個連續的視窗型訊框係依據該等兩個 輸入訊框產生的),在時間上係較晚的輸入訊框包含至少 —個新的輸入取樣,作爲該最後的輸入取樣,以及在時 間上’這兩個輸入訊框中,較早的該輸入訊框的相同的 彼等輸入取樣,在輸入取樣的順序上係較早的。 6 .如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置以忽略或者設定複數個輸入取樣爲該事 先決定的數値,或者至少係在該事先決定的範圍內的一 個數値’其中彼等複數個輸入取樣包含輸入取樣的一連 通的子集合’彼等輸入取樣包含按照彼等已排序輸入取 樣的該順序之該最後輸入取樣。 7 .如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置以產生視窗型訊框,依據輸入訊框以及 加權函數’依據該加權函數在至少一個輸入取樣上進行 加權。 1355647 修正本 8 .如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置,依據輸入訊框,藉著利用視窗函數在該 輸入訊框的至少複數個輸入取樣上進行加權,以產生視窗 型訊框。 9.如申請專利範圍第8項之分析濾波器組,其中該視窗器 係經過適當配置,使得對該輸入訊框進行加權,該輸入 訊框包含對該訊框的至少數個輸入取樣乘上該視窗函數 的輸入取樣特定的視窗係數。 1 0 ·如申請專利範圍第8項之分析濾波器組,其中該視窗器 係經過適當配置,使得對該輸入訊框進行加權,該輸入 訊框包含對該輸入訊框的每一個輸入取樣乘上該視窗 函數的輸入取樣特定的視窗係數》 1 1 ·如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置以產生視窗型取樣Ζ/ /ι,依據下列表示 式: zitn = W(N-l-n) . . 1 / n f 其中係一整數,表示視窗型訊框以及/或者輸入訊框 的訊框索引或者區塊索引,其中Ν,··./Ν_ 1係—整數, 表示取樣索引’其中7V係—整數,表示輸出訊框的彼等 輸出値的兩倍的該數字,其中MyV—bW係爲該視窗函 數’以及其中 係一輸入取樣,具有取樣索引/7,以及 該訊框索引7·。 12·如申請專利範圍第1項之分析濾波器組,其中該視窗器 1355647 修正本 係經過適當配置以產生視窗型取樣,依據下列表示 式: Zi,n = w(N-l-n). X’i'n , •其中/係一整數,表示一視窗型訊框以及/或者一輸入 訊框的訊框索引或者區塊索引,其中η= - ΑΓ,·.·,7Ν/8_ 1係一 整數,表示取樣索引,其中TV係一整數,表示一輸出訊 框的彼等輸出値的兩倍的該個數,其中w(7V-l·λ)係爲該 視窗函數’以及其中;c',,„係輸入取樣,具有取樣索引;7, 以及該訊框索引/。 1 3 .如申請專利範圍第1 1項之分析濾波器組,其中該視窗 器係經過適當配置使得7V係等於960,並且彼等視窗係 數w(0)至w(2AM)滿足在該附件的第1表中所給定的關 係式。 1 4 ·如申請專利範圍第1 3項之分析濾波器組,其中該視窗 器係經過適當配置使得彼等視窗係數w(0)至w(27V-l)包 含在該附錄的第2表中的數値。 1 5 .如申請專利範圍第1 1項之分析濾波器組,其中該視窗 器係經過適當配置使得AM系等於1 024,並且彼等視窗係 數w(0)至w(2AM)滿足在該附件的第3表中所給定的關 係式。 1 6 .如申請專利範圍第1 5項之分析濾波器組,其中該視窗 器係經過適當配置使得彼等視窗係數w(0)至w(2AM)包 含在該附錄的第4表中所給定的數値。 1 7 .如申請專利範圍第8項之分析濾波器組,其中該視窗器 -4 - 1355647 修正本 係經過適當配置使得該視窗函數係將實數的視窗係數 値細屬於—疋義集(definition set)。 18.如申請專利範圍第17項之分析濾波器組,其中該視窗 器係經過適當配置使得該定義集至少包含的元素個數 係大於或者等於輸入訊框的彼等已排序的輸入取樣個 數’以及將被忽略的彼等輸入取樣個數之間的差値,或 者視窗型訊框的視窗型取樣的個數係設定爲該事先決 定的數値’或者至少設定爲在由該視窗器所事先決定的 範圍內的一個數値,或者大於或等於彼等已排序輸入取 樣的個數。 1 9.如申請專利範圍第8項之分析濾波器組,其中該視窗器 係經過適當配置使得該視窗函數在該定義集上,對該定 義集的中間點而言係非對稱的。 20.如申請專利範圍第19項之分析濾波器組,其中該視窗 器係經過適當配置使得該視窗函數,相較於就該定義集 的該中間點而言的該定義集的第二個一半,係包含較多 的具有在該定義集的第一個一半中,該視窗函數的彼等 視窗係數的最大絕對値的1 〇%以上的絕對値之視窗係 數,其中該第一個一半係對應於彼等輸入取樣的該最後 的一半。 2 1.如申請專利範圍第1項之分析濾波器組,其中該取樣超 前値係大於輸出訊框的輸出値個數的兩倍。 22.如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置使得該事先定義的數値係爲0 1355647 修正本 23. 如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置以設定一視窗型取樣的數値係在該事 先定義的範圍內,係藉由將該對應的視窗型取樣設定爲 包含小於最小臨界値的絕對値,以及/或者設定爲包含大 於最大臨界値的絕對値。 24. 如申請專利範圍第23項之分析濾波器組,其中該最小 臨界値以及/或者該最大臨界値係爲10s或者2»,其中s 係一整數。 25. 如申請專利範圍第23項之分析濾波器組,其中,在彼 等輸入取樣以及/或者該視窗型取樣係爲二位元表示的 該情況中,該最小臨界値係由可以利用最低有效位元或 者數個最低有效位元表示的一絕對極大値決定,以及/ 或者最大臨界値係由可以利用一最局有效位元或者複 數個最高有效位元表示的絕對極小値決定。 2 6 ·如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置’使得被忽略的輸入取樣的個數、設定 爲該事先決定的數値或者在該事先定義的範圍內的至 少一個數値之視窗型取樣的個數,係大於或者等於輸出 訊框的輸出値的個數除以16後之個數値。 2 7 ·如申請專利範圍第1項之分析濾波器組,其中該視窗器 係經過適當配置以忽略或者設定爲該事先決定的數 値’或者忽略或設定爲在該事先決定的範圍128或120 視窗型取樣內的一個數値。 28.如申請專利範圍第1項之分析濾波器組,其中該時間/ 1355647 修正本 頻率轉換器係經過適當配置,相較於輸入訊框之輸入取 樣數,以提供包含小於輸出値之個數的一半之輸出訊 框。 29. 如申請專利範圍第1項之分析濾波器組,其中該時間/ 頻率轉換器係經過適當配置,以提供包含數個輸出値的 輸出訊框,其中該輸出値個數係等於輸入訊框的輸入取 樣數藉除以一個大於2的整數後之個數値。' 30. 如申請專利範圍第1項之分析濾波器組,其中該時間/ 頻率轉換器係經過適當配置,以提供包含數個輸出値的 輸出訊框,其中該輸出値個數係等於輸入訊框的輸入取 樣數除以4·後之個數値。 3 1 ·如申請專利範圍第1項之分析濾波器組,其中該時間/ 頻率轉換器係根據離散餘弦轉換以及離散正弦轉換之 中的至少一種轉換。 3 2 ·如申請專利範圍第1項之分析濾波器組,其中該時間/ 頻率轉換器係經過適當配置,依據一表示式提供輸出値
對於〇幺k < N/2 其中/係一整數,表示區塊索引或者訊框索引,其中 係一整數,表示光譜係數索引,其中係取樣索引, 其中7V係一整數,表示輸出訊框的輸出値個數的兩倍, 1355647 修正本 其中 -f+i na =—-—— 0 2 係一偏移値,以及其中Ζ/.Λ係視窗型取樣,對應於該 光譜係數1以及該訊框索引i·。 33.如申請專利範圍第32項之分析濾波器組,其中該時間/ 頻率轉換器係經過適當配置,使得7V係等於960或1024。 φ 34.—種合成濾波器組,用以過濾複數個輸入訊框,每一個 輸入訊框包含數個已排序的輸入値,包含: 一種頻率/時間轉換器,經過適當配置以提供複數個 輸出訊框,輸出訊框係包含數個已排序的輸出取樣,輸 出訊框係爲輸入訊框的一種時間表示; 一種視窗器,經過適當配置以產生複數個視窗型訊 框’視窗型訊框包含複數個視窗型取樣;以及 其中該視窗器係經過適當配置以提供複數個視窗型 # 取樣用於以一種重疊的方式,依據取樣超前値進行的一 種處理程序; 一種重疊/加法器(overlap/adder),經過適當配置以提 供一種加成訊框,包含起始區段以及剩餘區段,加成訊 框包含複數個加成取樣,係將來自於至少三個視窗型訊 框的至少三個視窗型取樣加在一起’以作爲在一加成訊 框的該剩餘區段中的一個加成取樣,以及將來自於至少 兩個不同的視窗型訊框的至少兩個視窗型取樣加在一 起’以作爲在該起始區段中的一個加成取樣; 1355647 • 修正本 其中在該剩餘區段中,加在一起以得到加成取樣的視 窗型取樣的個數,係至少比在該起始區段中,加在一起 以得到加成取樣的視窗型取樣的個數還高之一個取樣 數: 或者 其中該視窗器係經過適當配置,以至少忽略依據彼等 已排序的輸出取樣的順序之該最早的輸出値,或者對於 ^ 複數個視窗型訊框中的每一個視窗型訊框,設定彼等對 應的視窗型取樣爲事先決定的數値,或者在一事先決定 的範圍內的至少一個數値;以及 其中依據來自於至少三個不同的視窗型訊框的至少 三個視窗型取樣’以及在該起始區段中的加成取樣,依 據來自於至少兩個不同的視窗型訊框的至少兩個視窗 型取樣,該重疊/加法器係經過適當配置以提供在一加 成訊框的該剩餘區段中的該加成取樣。 φ 3 5 .如申請專利範圍第3 4項之合成濾波器組,其中該重疊/ 加法器係經過適當配置,使得在加成訊框的該剩餘區段 中的加成取樣係對應於未被忽略的輸出取樣、設定爲該 事先決定的數値或者由該視窗器設定爲在該事先決定 範圍內的一個數値之視窗型取樣,以及其中在加成訊框 的該起始區段中的加成取樣,對應於被忽略的輸出取 樣’或者對應於設定爲該事先決定的數値或者由該視窗 器設定爲在該事先決定範圍內之個數値的一視窗型取 樣。 1355647 修正本 3 6.如申請專利範圍第34項之合成濾波器組,其中該頻率/ 時間轉換器係經過適當配置,相較於輸入訊框之輸入値 個數’以提供包含大於輸出取樣數的兩倍之的輸出訊 框。 3 7 ·如申請專利範圍第3 4項之合成濾波器組,其中該頻率/ 時間轉換器係經過適當配置,以提供包含數個輸出取樣 的數個輸出訊框,其中該輸出取樣的個數係等於輸入訊 框的輸入値個數乘上大於2的整數。 3 8 ·如申請專利範圍第3 4項之合成濾波器組,其中該頻率/ 時間轉換器係經過適當配置,以提供包含數個輸出取樣 的數個輸出訊框,其中該輸出取樣的個數係等於輸入訊 框的該輸入値個數乘上4。 3 9 ·如申請專利範圍第3 4項之合成濾波器組,其中該頻率/ 時間轉換器係根據離散餘弦轉換或者離散正弦轉換之 中的至少一種轉換。 40.如申請專利範圍第34項之合成濾波器組,其中該頻率/ 時間轉換器係經過適當配置,依據一種表示式以提供輸 出取樣;r/./>, ^ = ~Τ7 · cosi4r(n + n〇^k + 2·)! 八 *=〇 \N ) 對於0 < η < 2N 其中7係一整數,表示視窗索引、區塊索引或者訊框 索引,其中β係一整數,表示取樣索引,其中t係一整 -10- 1355647 修正本 數,表示光譜係數索引,其中yv係一整數,表示輸出訊 框之輸出取樣數一半的個數,其中 =zi±i 2 係一偏移値,以及其中Spec[/][幻係一輸入値,對應 於該光譜係數索引以及該視窗索引;_。 4 1 .如申請專利範圍第4 0項之合成濾波器組,其中該頻率/ 時間轉換器係經過適當配置,使得7V係等於960或者 1 024 ° 42. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置以忽略輸出訊框的複數個輸出取 樣,或者設定複數個視窗型取樣爲該事先決定的數値, 或者在該事先決定的範圍內的至少一個數値。 43. 如申請專利範圍第42項之合成濾波器組,其中該視窗 器係經過適當配置,使得彼等被忽略的輸出取樣包含複 數個輸出取樣的連通子集合,該子集合包含,依據彼等 已排序輸出取樣的順序之該最早的輸出取樣;或者其中 被設定爲該事先決定的數値或者在該事先決定的範圍 內的至少一個數値之彼等視窗型取樣,包含,至少包含 對應於該最早的輸出取樣的視窗型取樣的複數個視窗 型取樣的連通子集合。 44 .如申請專利範圍第3 4項之合成濾波器組,其中該視窗 器係經過適當配置,依據輸出訊框以及加權函數,以產 生一視窗型訊框,依據該加權函數在至少一個輸出訊框 • 11 - 1355647 修正本 之輸出取樣上進行加權而產生。 45 ·如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置’依據該輸出訊框,藉由該輸出訊框 的輸出取樣乘上依據視窗函數決定的一個數値,以產生 視窗型訊框。 46. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置’對該輸出訊框的至少數個輸出取樣 乘上視窗函數的輸出取樣特定的視窗係數。 47. 如申請專利範圍第46項之合成濾波器組,其中該視窗 器係經過適當配置,對該輸出訊框的每一個輸出取樣, 乘上視窗函數的輸出取樣特定的視窗係數。 48. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置’以產生視窗型取樣,依據下列 表示式: 其中/係一整數,表示視窗型訊框以及/或者輸出訊框 的訊框索引或者區塊索引,其中m= 0,··.,2W- 1係一整數, 表示取樣索引,其中7V係一整數,表示輸出訊框的彼等 輸出値的兩倍’以及/或者輸出訊框的輸出取樣數以及/ 或者視窗型訊框的彼等視窗型取樣的個數的一半的個 數,其中係爲該視窗函數,以及其中;^,„係一輸入取 樣’具有取樣索引λ,以及該訊框索引y。 49. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置’以依據下列表示式產生視窗型取樣 -12- 1355647 修正本 ζίιΛ =w(n)^x^ , 其中/係一整數,表示視窗型訊框以及/或者輸出訊框 的訊框索引或者區塊索引,其中n= N/8,...,2N- 1係一整 數’表示取樣索引,其中#係一整數,表示輸入訊框的 彼等輸入値的兩倍的該數字,以及/或者輸出訊框的輸 出取樣數以及/或者視窗型訊框的彼等視窗型取樣的個 數的一半的個數,其中吣/〇係爲該視窗函數,以及其中 Χ,·,„係輸出取樣,具有取樣索引;3以及該訊框索引7。 5 0 .如申請專利範圍第4 8項之合成濾波器組,其中該視窗 器係經過適當配置使得#係等於960,並且彼等視窗係 數w(0)至w(2;V-l)滿足在該附件的第1表中所給定的關 係式。 5 1.如申請專利範圍第5 0項之合成濾波器組,其中該視窗 器係經過適當配置使得彼等視窗係數w(〇)至w(2jV-1)包 含在該附錄的第2表中所給定的數値。 52.如申請專利範圍第48項之合成濾波器組,其中該視窗 器係經過適當配置使得W係等於1 〇24 ,並且彼等視窗係 數w(0)至W(2AM)滿足在該附件的第3表中所給定的關 係式。 5 3 ·如申請專利範圍第52項之合成濾波器組,其中該視窗 器係經過適當配置使得彼等視窗係數〜(〇)至…以^^包 含在該附錄的第4表中所給定的數値。 54_如申請專利範圍第45項之合成濾波器組,其中該視窗 -13- 1355647 修正本 器係經過適當配置使得該視窗函數係將實數的視窗係 數値§币屬於一疋義集(definition set)。 55. 如申請專利範圍第45項之合成濾波器組,其中該視窗 器係經過適當配置使得該視窗函數在該定義集上,對定 義集的中間點而言係非對稱的。 56. 如申請專利範圍第55項之合成濾波器組,其中該視窗 器係經過適當配置使得該視窗函數,相對於就該定義集 的該中間點其中該第一個一半係對應於彼等輸出値的 該最早的一半’係於比該定義集的第二個一半還多的該 定義集的第一個一半中包含該視窗函數的彼等視窗係 數的最大絕對値的1 0 %的絕對値之視窗係數。 5 7 ·如申請專利範圍第4 5項之合成濾波器組,其中該視窗 器係經過適當配置使得該視窗函數係依據視窗函數的鏡 射變體,或者與產生至該合成濾波器組的彼等輸入訊框 所依據的視窗函數完全一致。 58. 如申請專利範圍第45項之合成濾波器組,其中該視窗 器係經過適當配置使得該視窗函數,相較於產生至該合 成濾波器組的彼等輸入訊框所依據的視窗函數,係爲相 對於該視窗函數的定義集的中間點而言的鏡射視窗函 數。 59. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置使得該事先決定的數値爲0。 60. 如申請專利範圍第34項之合成瀘波器組,其中該視窗器 係經過適當配置以設定視窗型取樣爲在該事先決定範 -14- 1355647 修正本 圍內的一個數値,係利用下列的至少一種方式,亦即將 該對應的視窗型取樣設定爲包含小於最小臨界値的絕 對値的一個數値,或者將該對應的視窗型取樣設定爲包 含大於最大臨界値的絕對値的一個數値。 61. 如申請專利範圍第60項之合成濾波器組,其中該最小 臨界値或者該最大臨界値係爲10s或者2s,其中s係一 整數。 62. 如申請專利範圍第60項之合成濾波器組,其中,在彼 等輸入値、彼等輸出取樣以及彼等視窗型取樣之中的至 少一個係爲二位元表示的情況中,該最小臨界値係由可 以利用一最低有效位元或者數個最低有效位元表示的 極大絕對値決定’或者該最大臨界値係由可以利用最高 有效位元或者數個最高有效位元表示的極小絕對値決 定。 63. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置,使得被忽略的輸出取樣的個數或者 設定爲該事先決定的數値或者在該事先定義的範圍內 的至少一個數値之視窗型取樣的個數,係大於或者等於 輸出訊框的輸出取樣的個數除以64之後所得到的一個 數値。 64. 如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適声配置,使得被忽略的輸出個數或者設定爲 該事先決定的數値或者在該事先定義的範圍內的至少 一個數値之視窗型取樣的個數,係大於或者等於加成訊 -15- 1355647 修正本 框的加成取樣的個數除以1 6之後所得到的一個數値。 65.如申請專利範圍第34項之合成濾波器組,其中該視窗 器係經過適當配置以忽略128或者120,或者設定爲該 事先決定的數値’或者設定爲在該事先決定的範圍128 或1 2 0視窗型取樣之中的至少二個數値。 66·如申請專利範圍第34項之合成濾波器組,其中該重疊/ 加法器係經過適當配置,依據由該視窗器的至少三個連 •續產生的視窗型訊框,產生該加成訊框。 6 7 ·如申請專利範圍第3 4項之合成濾波器組,其中該重疊/ 加法器係經過適當配置,依據由該頻率/時間轉換器的至 少三個連續產生的輸出訊框,產生該加成訊框。 68·如申請專利範圍第34項之合成濾波器組,其中該重疊/ 加法器係經過適當配置以產生包含與該取樣超前數値 相同個數的數個加成取樣之加成訊框。 69·如申請專利範圍第34項之合成濾波器組,其中該重疊/ 加法器係經過適當配置以提供一種加成訊框,包含複數 個加成取樣,係依據來自於對應於視窗型取樣的加成取 樣的至少4 .個不同的視窗型訊框的至少4個視窗型取 樣’並不依據被忽略的輸出取樣,由該視窗器設定爲該 事先決定的數値,以及在該事先決定範圍內的數値,以 及依據來自於對應於被該視窗器忽略或者設定爲事先 決定的數値或者設定爲在該事先決定範圍內的一個數 値的輸出取樣的加成取樣之至少3個不同的視窗型訊框 的至少3個視窗型取樣。 -16 - 1355647 修正本 7 0.如申請專利範圍第34項之合,成濾波器組,其中該重疊/ 加法器係經過適當配置以提供數個加成訊框,彼等加成 訊框包含數個加成取樣,其個數係小於輸出訊框的輸出 値個數除以2。 71. 如申請專利範圍第34項之合成濾波器組,其中該重疊/ 加法器係經過適當配置以提供數個加成訊框,彼等加成 訊框包含數個加成取樣,其個數保等於輸出訊框的輸出 取樣個數除以大於2的整數。 72. 如申請專利範圍第34項之合成濾波器組,其中該重疊/ 加法器係經過適當配置以提供數個加成訊框,彼等加成 訊框包含數個加成取樣,其個數係等於輸出訊框的輸出 取樣個數除以4。 7 3 ·如申請專利範圍第3 4項之合成濾波器組,其中該重疊/ 加法器係經過適當配置以依據下列表示式提供加成取 樣 OUti.n :
气 r 對於0彡η < N/2 其中’ /係一整數表示視窗型訊框以及/或者加成訊框 的一訊框索引或者區塊索引,其中力係一整數,表示取 樣索引’其中yy係一整數,表示輸出訊框的彼等輸出取 樣以及/或者該視窗型訊框的彼等視窗型取樣的個數之 一半的數目,其中Zi.n係該視窗型取樣,對應於取樣索 引λ以及該訊框索引/。 -17- 1355647 修正本 7 4.—種合成濾波器組,用以過濾複數個輸入訊框,每一個 輸入訊框包含Μ個已排序的輸入値yk(0),…,yk(M-l),其 中Μ係一正整數,以及其中1係一整數,表示訊框索引, 包含: 一種反逆第IV類型離散餘弦轉換頻率/時間轉換器 (inverse type-IV discrete cosine transform frequency/time converter),經過適當配置,依據彼等輸 入値yk(0),··.,yk(M-l),以提供複數個輸出訊框,輸出訊 框包含2M個已排序的輸出取樣xt(0),·..,xk(2M-l); 一種視窗器,經過適當配置以產生複數個視窗型訊 框’視窗型訊框依據下列方程式包含複數個視窗型取樣 Zk(〇), ... , zk(2M-l): 2k(n) = w(n〉· xk(n) 對於 n = 0 A …,2M-1 r 其中;^係一整數,表示取樣索引,以及其中w(/?)係一 胃數視窗函數係數,對應於該取樣索引/7 ; 〜種重疊/加法器,經過適當配置以提供中間訊框,依 據下列方程式包含複數個中間取樣nu(0),...,nu(M-l): mk(n) = zk(n) + zk-:L(n+M) 對於 η = 0,.."Μ-1 ; 以及 〜種抬昇器(lifter) ’經過適當配置以提供加成訊框, 依據下列方程式包含複數個加成取樣0UU (0),..., -18- 1355647 修正本 outk(M-1): out)c(n) = mk(n) + l(n-M/2) . mk_i(M-l-n) 對於 n = 以及 outk(n) = mk(n) + l(M-l-n) . outk—i (M-l-n) 對於 n=0,_..,M/2-l , 其中八0),...,/(M-l)係爲實數的提高係霍 coefficient) 0 7 5.如申請專利範圍第74項之合成濾波器組,其 器係經過適當配置使得Af係等於5 1 2,以及彼 數w(0),…,w(2H)係滿足在該附件的第5表中 關係式’並且其中該抬昇器係經過適當配置使 高係數八0),·· J(M-l)係滿足在該附件的第6表 之關係式。 76. 如申請專利範圍第75項之合成濾波器組,其 器係經過適當配置使得彼等視窗係數w(〇),... 包含在該附件的第7表中所給定之數値,以及 昇器係經過適當配置使得彼等提高係數A〇),. 包含在第8表中所給定之彼等數値。 77. 如申請專利範圍第74項之合成濾波器組,其 器係經過適當配置使得M係等於4 8 〇,以及彼 數w(0)’…,W(2M-1)係滿足在該附件的第9表中 關係式’並且其中該抬昇器係經過適當配置使 改(lifting 中該視窗 等視窗係 所給定之 得彼等提 中所給定 中該視窗 ,w (2 Af -1) 其中該抬 ·,1{2Μ-\) 中該視窗 等視窗係 所給定之 得彼等提 -19- 1355647 修正本 (¾係數八0),··.,八AM)係滿足在該附件的第ι〇表中所給 定之關係式。 7 8 ·如申請專利範圍第7 7項之合成濾波器組,其中該視窗 器係經過適虽配置使得彼等視窗係數w (0),…,w (2 Μ · 1) 包含在該附件的第11表中所給定之數値,以及其中該 抬昇器係經過適當配置使得彼等提高係數 7(0),…,/(2Μ-1)包含在第12表中所給定之彼等數値。 7 9 . —種編碼器,包含 一種分析濾波器組,用以過濾複數個時域輸入訊框, —個包含數個已排序輸入取樣的輸入訊框,包含: 一種視窗器,經過適當配置以產生複數個視窗型訊 框’視窗型訊框包含複數個視窗型取樣,其中該視窗器 係經過配置以一種重疊的方式,使用取樣超前數値,處 理複數個輸入訊框, 其中該取樣超前數値係小於輸入訊框的已排序輸入 取樣的個數除以二;以及 一種時間/頻率轉換器,經過適當配置以提供包含數 個輸出値的輸出訊框,輸出訊框係爲視窗型訊框的一種 光譜表示。 80. 如申請專利範圍第79項之編碼器,進一步包含一種熵編 碼器(entropy encoder),經過適當配置以對由該分析濾、波 器組所提供的複數個輸出訊框進行編碼,以及經過適當 配置以依據彼等輸出訊框輸出複數個已編碼訊框。 81. —種解碼器,包含: -20- 1355647
一種合成濾波器組,用以過濾複數個輸入訊相 個輸入訊框包含數個已排序的輸入値,包含: 一種頻率/時間轉換器,經過適當配置以提供 輸出訊框’輸出訊框包含數個已排序的輸出取樣 訊框係爲輸入訊框的一種時間表示; 一種視窗器,經過適當配置以產生複數個視 框’視窗型訊框包含複數個視窗型取樣;以及 其中該視窗器係經過適當配置以提供複數個 取樣,用於以一種重疊的方式,依據取樣超前値 一種處理程序; —種重疊/加法器(overlap/adder),經過適當配 供一種加成訊框,包含起始區段以及剩餘區段, 框包含複數個加成取樣,係將來自於至少三個視 框的至少三個視窗型取樣加在一起,以作爲在加 的該剩餘區段中的加成取樣,以及將來自於至少 同的視窗型訊框的至少兩個視窗型取樣加在一起 爲在該起始區段中的加成取樣; ’ 其中在該剩餘區段中,加在一起以得到加成取 窗型取樣的個數,係至少比在該起始區段中加在 得到加成取樣的視窗型取樣的個數還高之一個取 或者 其中該視窗器係經過適當配置,依據彼等已排 出取樣的順序以忽略至少最早的輸出値,或者對 個視窗型訊框中的每一個視窗型訊框,設定彼等 修正本 ’ φ — 複數個 ,輸出 窗型訊 視窗型 進行的 置以提 加成訊 窗型訊 成訊框 兩個不 ,以作 樣的視 一起以 樣數; 序的輸 於複數 對應的 -21 - 1355647 修正本 視窗型取樣爲事先決定的數値,或者在事先決定的範圍 內的至少一個數値;以及 其中該重疊/加法器係經過適當配置以提供在加成訊 框的該剩餘區段中的加成取樣,依據來自於至少三個不 同的視窗型訊框的至少三個視窗型取樣,以及在該起始 區段中的加成取樣,依據來自於至少兩個不同的視窗型 訊框的至少兩個視窗型取樣。 82. 如申請專利範圍第81項之解碼器,進一步包含—種熵 解碼器(entropy decoder),經過適當配置以對複數個已編 碼訊框進行解碼,並且經過適當配置,依據彼等已編碼 訊框’提供複數個輸入訊框至該合成濾波器組。 83. —種解碼器,包含 一種合成濾波器組,用以過濾複數個輸入訊框,每一 個輸入訊框包含 Μ個已排序的輸入値yk(〇),..., yk(M-l)’其中Μ係一正整數,以及其中&係一整數,表 示訊框索引,包含: 一種反逆第IV類型離散餘弦轉換頻率/時間轉換器, 經過適當配置,依據輸入値yk(0),···,yk(M-l),以提供複 數個輸出訊框,輸出訊框包含2M個已排序的輸出取樣 Xk(0),.··,Xk(2M-l); 一種視窗器’經過適當配·置以產生複數個視窗型訊 框’視窗型訊框依據下列方程式包含複數個視窗型取樣 Zk(0),..., Zk(2M-1): -22- 1355647 修正本 Zk(n) = w(n) · xk(n) 對於 n = 2M-1 , 其中/2係一整數,表示取樣索引,以及其中W(/7)係實 數視窗函數係數,對應於該取樣索引/7 ; 一種重疊/加法器,經過適當配置以提供中間訊框,依 據下列方程式包含複數個中間取樣nu(0),···,mk(M-l): mk(n) = zk(n) + zk-i(n+M) 對於 n = 0,···αμ-1 ; Φ 以及 一種抬昇器,經過適當配置以提供加成訊框,依據下 列方程式包含複數個加成取樣〇UU(0),…,0UU(M -1): outk(n) = mk(n) + 1 (n-M/2) . mj^ (M-1-n) 對於 η = Μ/2,·..,Μ-1 以及 outk(n) = mic (η) + 1 (M-l-n) . 〇utfc-i (M-l-n) 對於 n=0,...,M/2-l , 其中/(0), ...J(M-l)係爲實數的提高係數。 84.如申請專利範圍第83項之解碼器,進一步包含一種熵 解碼器,經過適當配置以對複數個已編碼訊框進行解 碼,並且經過適當配置,依據彼等已編碼訊框,提供複 數個輸入訊框至該合成濾波器組。 8 5.—種混音器(〇1“6〇,用以混合多數個輸入訊框,每—個 -23- 1355647 修正本 輸入訊框係爲對應時域訊框的一種光譜表示,以及複數 個輸入訊框的每一個輸入訊框係由不同的來源提供’包 含: 一種熵解碼器,經過適當配置以對複數個輸入訊框進 行熵解碼; —種縮放器(scaler),經過適當配置以對複數個熵解碼 輸入訊框在該頻域中進行縮放,以及經過適當配置以獲 得在該頻域中的複數個已經縮放過的訊框,每一個已經 縮放過的訊框對應於熵解碼輸入訊框; —種加法器(adder),經過適當配置,將在該頻域中的 彼等已經縮放過的訊框加在一起,以產生在該頻域中的 加成訊框;以及 —種熵編碼器(entropy encoder),經過適當配置,對 該加成訊框進行編碼,以獲得混合訊框。 8 6 ·如申請專利範圍第8 5項之混音器,進一步包含解量化 器(dequantizer),經過適當配置以解量化彼等熵解碼輸 入訊框,以及以一種解量化的形式,提供彼等熵解碼輸 入訊框至該縮放器。 87. 如申請專利範圍第85項之混音器,進一步包含一量化 器(quantizer),經過適當配置以量化加成訊框,以及以 一種量化的形式,提供該加成訊框至熵編碼器。 88. 如申請專利範圍第85項之混音器,其中該縮放器係經 過適當配置,對複數個輸入訊框的每一個輸入値乘上 1/P,以對彼等已解量化的輸入扔框進行縮放,其中p係 -24- 1355647 修正本 一整數,表示不同來源的個數。 89. 如申請專利範圍第85項之混音器,其中該縮放器係經 過適當配置,以一種能量.守恆的方式,對彼等輸入訊框 的彼等輸入直進行縮放,以縮放彼等熵解碼輸入訊框。 90. 如申請專利範圍第85項之混音器,其中該混音器係經 過適當配置,依據複數個輸入訊框,提供該混合訊框, 其中複數個輸入訊框的每一個輸入訊框係依據相同的 合成視窗函數產生。
9 1 ·如申請專利範圍第8 5項之混音器,其中該混音器係經 過適當配置,依據複數個輸入訊框產生該混合訊框,其 中複數個輸入訊框中的每一個輸入訊框利用包含用以 過濾複數個時域輸入訊框的分析濾波器組的一種編碼 器來產生,輸入訊框包含數個已排序的輸入取樣,其中 該分析濾波器組包含一種視窗器,經過適當配置以產生 複數個視窗型訊框,視窗型訊框係包含複數個視窗型取 樣,其中該視窗器係經過配置,以一種重疊的方式,使 用取樣超前數値,處理複數個輸入訊框,其中該取樣超 前數値係小於輸入訊框的已排序輸入取樣的個數除以 二;以及一種時間/頻率轉換器,經過適當配置以提供包 含數個輸出値的輸出訊框,輸出訊框係爲視窗型訊框的 —種光譜表示。 92.如申請專利範圍第85項之混音器,其中該混音器係經 過適當配置,以處理彼等輸入訊框,以及提供基本上對 應於每一個聲道的位元率係小於36kbit/s之該混合訊 -25- 1355647 修正本 框。 9 3.如申請專利範圍第85項之混音器,其中該混音器係包括 在一會議系統中。 9 4. 一種用以過濾複數個時域輸入訊框的方法,輸入訊框包 含數個已排序的輸入取樣,包含: 使用取樣超前數値,藉由一種重疊的方式處理複數個 輸入訊框,產生複數個視窗型訊框; 其中該取樣超前數値係小於輸入訊框的已排序輸入 取樣的個數除以二;以及 藉由執行時間/頻率轉換,提供包含數個輸出値的複 數個輸出訊框,輸出訊框係爲視窗型訊框的一種光譜表 不 。 95. —種用以過瀘複數個輸入訊框的方法,每一個輸入訊框 包含數個已排序的輸入値,包含: 執行頻率/時間轉換,並且提供複數個輸出訊框,輸 出訊框包含數個已排序的輸出取樣,輸出訊框係爲輸入 訊框的一種時間表示; 產生複數個視窗型訊框,視窗型訊框包含複數個視窗 型取樣,依據取樣超前値以一種重疊的方式藉由處理複 數輸出取樣處理彼等視窗型訊框; 產生加成訊框,包含起始區段以及剩餘區段, 其中加成訊框包含加成取樣,係將來自於至少三個視 窗型訊框的至少三個視窗型取樣加在一起,以作爲在加 成訊框的該剩餘區段中的一個加成取樣,以及包含加成 -26- 1355647 修正本 取樣’係將來自於至少兩個不同的視窗型訊框的至少兩 個視窗型取樣加在一起,以作爲在該起始區段中的加成 取樣; 其中在該剩餘區段中,加在一起以得到加成取樣的視 窗型取樣的個數,係至少比在該起始區段中,加在一起 以得到加成取樣的視窗型取樣的個數還高之一個取樣 數; 或者 其中產生彼等視窗型訊框,依據彼等已排序的輸出取 樣的順序,包含忽略至少該最早的輸出取樣,或者對於 複數個視窗型訊框中的每一個視窗型訊框,設定彼等對 應的視窗型取樣爲事先決定的數値,或者在事先決定的 範圍內的至少一個數値;以及 其中提供加成訊框,包含提供加成取樣,係將來自於 至少三個不同的視窗型訊框的至少三個視窗型取樣加 在一起,以作爲在加成訊框的該剩餘區段中的加成取 樣,以及加成取樣,係將來自於至少兩個不同的視窗型 訊框的至少兩個視窗型取樣加在一起,以作爲在該起始 區段中的加成取樣。 96. —種用以過濾複數個輸入訊框的方法,每—個輸入訊框 包含Μ個已排序的輸入値yk(〇),...,yk(M-l),其中Μ係 —正整數’以及其中k係一整數,表示該輸入訊框的索 引,包含: 執行反逆第IV類型離散餘弦轉換,並且依據彼等輸 -27- 1355647 修正本 入値yk(0),…,yk(M-l),提供複數個輸出訊框xk(0),..., Xk(2M-l); 產生複數個視窗型訊框,視窗型訊框依據下列方程式 包含複數個視窗型取樣Zk(0),.·.,zk(2M-l): Ζ|ς(η) = w(n) · Xk(n) 對於 η = 0,…,2M-1 , 其中Λ係一整數; 產生複數個中間訊框,每一中間訊框依據下列方程式 包含複數個中間取樣rru(O),.··,nu(M-l): mic(n)= zk(n) + zk_:L (n+M) 對於 n = 0,···,Μ-1 ; 以及 產生複數個加成訊框,依據下列方程式包含複數個加 成取樣 ouU(O),···,outk(M): outk (η) = mk (η) + l(n-M/2) · mk-i (M-l-n) 對於 n = M/2,.“,M-1 以及 outk(n) = mk (n) + l(M-l-n) · outk-χ (M-l-n) 對於 n = 0,...,M/2-l , 其中w(0),…,w(2M-l)係爲實數視窗係數;以及 其中八0),...J(M-1)係爲實數的提高係數。 -28- 1355647 修正本 97.—種用來執行之電腦程式,當該程式在一電腦上執行 時,可以實行一種用以過濾複數個時域輸入訊框的方 法,輸入訊框包含數個已排序的輸入取樣,該方法包含: 使用取樣超前數値以一種重疊的方式,藉由處理複數 個輸入訊框,產生複數個視窗型訊框; 其中.該取樣超前數値係小於輸入訊框的已排序輸入 取樣的個數除以二;以及 藉由執行時間/頻率轉換,提供包含數個輸出値的複 數個輸出訊框,輸出訊框係爲視窗型訊框的一種光譜表 示0 9 8 . —種用來執行之電腦程式,當該程式在電腦上執行時, 可以實行過濾複數個輸入訊框的方法,每一個輸入訊框 包含數個已排序的輸入値,該方法包含: 執行頻率/時間轉換,並且提供複數個輸出訊框,輸 出訊框包含數個已排序的輸出取樣,輸出訊框係爲輸入 訊框的一種時間表示; 產生多數個視窗型訊框,視窗型訊框包含複數個視窗 型取樣,依據取樣超前値以一種重疊的方式,藉由處理 複數個輸出取樣,處理視窗型訊框; 產生加成訊框,包含起始區段以及剩餘區段, 其中加成訊框包含加成取樣,係將來自於至少三個不 同的視窗型訊框的至少三個視窗型取樣加在一起,以作 爲在加成訊框的該剩餘區段中的加成取樣,以及包含加 成取樣,係將來自於至少兩個不同的視窗型訊框的至少 -29- 1355647 修正本 兩個視窗型取樣加在一起,以作爲在該起始區段中的加 成取樣; 其中在該剩餘區段中,加在一起以得到加成取樣的視 窗型取樣的個數係至少比在該起始區段中加在一起以 得到加成取樣的視窗型取樣的個數還高一個取樣數; 或者 其中產生複數個視窗型訊框依據彼等已排序的輸出 取樣的順序,包含忽略至少該最早的輸出取樣,或者對 於複數個視窗型訊框中的每一個視窗型訊框,設定彼等 對應的視窗型取樣爲事先決定的數値,或者在事先決定 的範圍內的至少一個數値;以及 其中提供加成訊框包含提供加成取樣,係將來自於至 少三個不同的視窗型訊框的至少三個視窗型取樣加在 一起,以作爲在加成訊框的該剩餘區段中的加成取樣, 以及加成取樣,係將來自於至少兩個不同的視窗型訊框 的至少兩個視窗型取樣加在一起,以作爲在該起始區段 中的一個加成取樣。 99. 一種用來執行之電腦程式,當該程式在電腦上執行時, 可以實行一種用以過濾複數個輸入訊框的方法,每-個 輸入訊框包含Μ個已排序的輸入値yk(0),...,yk(M-l卜 其中Μ係一正整數,以及其中k係一整數,表示該輸入 訊框的索引,該方法包含: 執行反逆第IV類型離散餘弦轉變,並且依據彼等輸f 入値yk(〇),...,yk(M-l),提供複數個輸出訊框Xk(〇),..., -30- 1355647 修正本 Xk(2M-l); 產生多數個視窗型訊框,視窗型訊框依據下列方程式 包含複數個視窗型取樣zk(0),...,zk(2M-l): Zk(n) = w(n) · xk(n) 對於 n = 0,.··,2Μ-1 , 其中Λ係一整數;
產生複數個中間訊框,每一中間訊框依據下列方程式 包含複數個中間取樣nu(0),·.·,nu(M-l): mk(n) = zic(n) + zk_i '(n+M) 對於 n = 〇,··,,Μ-1 ; 以及 產生複數個加成訊框,依據下列方程式包含複數個加 成取樣 outk(O),.·.,ouU(M-l): 〇utk (n) = rnic(n) + l(n-M/2) · mk-i(M-l-n) 對於 n =
以及 〇utk(n) = itik(n) + 1 (M-l-n) . outk-i (M-l-n) mn n = 0,...,M/2-l , 其中w(0),...,w(2M-l)係爲實數視窗係數;以及 其中八0),...,八M-1)係爲實數的提高係數。 -31- 1355647 /V、圖式· |〇〇年;)月二I曰修正本 100
1355647
»t
第2圖 1355647 200
210 220 230
第3圖 1355647
第4圖 -4- 1355647
1.2 1 0.80.6 0.4 0.2 0 -0.2 1.2 10.8 0.6 0.4 0.2 0 -0.2 分析視窗,M=480頻帶 > 、 > / V / \ / \ > / \ \ 3 21 30 4 〕0 6 〕0 8( 〕0 10 00 1200 14 00 1600 18 00 20 合成視窗,M=480頻帶 _____— \ / \ / \ / \ / 、 0 2 〕0 400 6 ]〇 8 )0 10 00 1200 14 00 1600 18 00 20 第5匱 1355647 分析視窗 1.2 1H 0.81 0.61 0.41 0.2| 〇! -0.21 1.2 1 0.8 0.6 0.4 0.2 mmmm 正彌窗
I ! ! /·Κ INN ! ί I ! I //-! I \\} j r/ i _ ! V K i // ! ! i I ! i ! ! 200 400 600 800 1000 1200 1400 1600 1800 2000 合成視窗 i 厂丨 厂— ——i&mmm I • • •X ! i | ……正弦視窗 i·/ I ! ! | /y . 1 ! ! ! I /A !',\ ! j I ! / /! i \又 i i i i r ! i ! ! I 0 200 4( ]〇 6( 30 - 800 1000 1200 1400 1600 1800 20 第6圖 1355647
正弦視窗
第7匱 1355647
正弦視窗
第8匱 1355647
第9圖
1355647
頻率響應正弦視窗對低麵視窗
Omega/pi
第10圓 -10- 1355647
頻率響應正弦視窗對低重疊視窗
第11圖 -11- 4001355647
100 410
-12- 4501355647
-13- 1355647
第14a圖 1355647
520 第14b匱 -15- 1355647 編解碼器 麵來源 麵 [取樣] mm [雜 AAC-LD MDCT/IMDCT/ 960*2 40 + SBR 雙速率 577 12 QMF SBR-重叠. 384 8 2881 60 AAC-ELD 滤讎麵率 720.2 30 QMF 577 π 12 SBR-重疊. U 2017 42
第15圖
-16 - 1355647
-17- 700 1355647
第17圖
-18- 7501355647
760 780 790 第18圖 -19- 1355647 § Ds
醒 6I« -20- 1355647 M=512 指令 第一調變 2.Μ 1024 複數FFT大小 m2= f 256 Bfy個數 ψ 128 讎Bfy的運算個數 6 6 階段個數 l〇g2(M2) 8 總計=6-log2(Mz)· ψ 6144 6144 第二調變 2-Μ 1024 視窗與重疊-加法 2.75· Μ 1408 總計 9600 第20圖 -21 - M=512 指令 第一調變 2-Μ 1024 複數FFT大小 M2= 256 Bfy個數 ψ 128 _Bfy的運算個數 6 6 階段個數 l〇g2(M2) 8 總計=6-!og2(M2)· ψ 6144 6144 第二調變 2.Μ 1024 視窗與重疊-加法 2·Μ 1024 總計 9216 1355647 第21圖 -22- M=1024 指令 2*M 2048 第一調變 M2 =M/2 512 Bfy個數 (M2/2) 256 讎Bfy的運算個數 6 6 階段個數 log2(M2) 9 總計=6*log2(M2)(M2/2) 13824 13824 第二調變 2*M - 2048 視窗與重-麵法 2*M 2048 總計 19968 1355647 第22圖 -23- 1355647 編_器. imgft 度 工作》S 狀態 總和[字元] AAC-LD 512 512 256 768 AAC-ELD 512 512 256+512 1280 AAC-LC 1024 1024 512 1536 第23a圖 編解碼器 資度 視窗係數 總和[字元] AAC-LD 512 2-512 1024 AAC-ELD 512 3-512-¾2 1408 AAC-LC 1024 2-1024 + 2-128 2304 # 第23b圖 -24- 1355647
編_器編號· AOT 說明 獅率 採樣率 1 0 原始 / / 2 3.5 kHz 錨 / / 3 7 kHz 瞄 / / 4 23 AACLD 32 kBii/s 24 kHz 5 23 AAC LD 48 kBit/s 32 kHz 6 X+5 AAC LD+LDFB+LD SBR 32 kBit/s 48/24 kHz 7 X MC LD+LDFB 48 kBiVs 32 kHz 8 23+5 AAC LD+LDSBR 32 kBit/s 48/24 kHz 第24圖 -25-
TW096138773A 2006-10-18 2007-10-17 Analysis filterbank, synthesis filterbank, encoder TWI355647B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86203206P 2006-10-18 2006-10-18
US11/744,641 US8036903B2 (en) 2006-10-18 2007-05-04 Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system

Publications (2)

Publication Number Publication Date
TW200832357A TW200832357A (en) 2008-08-01
TWI355647B true TWI355647B (en) 2012-01-01

Family

ID=38904615

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096138773A TWI355647B (en) 2006-10-18 2007-10-17 Analysis filterbank, synthesis filterbank, encoder

Country Status (22)

Country Link
US (6) US8036903B2 (zh)
EP (5) EP2113910B1 (zh)
JP (5) JP5546863B2 (zh)
KR (3) KR101209410B1 (zh)
CN (4) CN102243874B (zh)
AT (3) ATE539432T1 (zh)
AU (3) AU2007312696B2 (zh)
BR (2) BRPI0716004B1 (zh)
CA (3) CA2782476C (zh)
ES (5) ES2592253T3 (zh)
HK (4) HK1138674A1 (zh)
IL (4) IL197757A (zh)
MX (1) MX2009004046A (zh)
MY (4) MY155487A (zh)
NO (5) NO342445B1 (zh)
PL (5) PL2884490T3 (zh)
PT (1) PT2884490T (zh)
RU (1) RU2426178C2 (zh)
SG (2) SG174836A1 (zh)
TW (1) TWI355647B (zh)
WO (1) WO2008046468A2 (zh)
ZA (1) ZA200901650B (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7422840B2 (en) * 2004-11-12 2008-09-09 E.I. Du Pont De Nemours And Company Apparatus and process for forming a printing form having a cylindrical support
US7916711B2 (en) * 2005-03-24 2011-03-29 Siport, Inc. Systems and methods for saving power in a digital broadcast receiver
GB2439685B (en) 2005-03-24 2010-04-28 Siport Inc Low power digital media broadcast receiver with time division
US7945233B2 (en) * 2005-06-16 2011-05-17 Siport, Inc. Systems and methods for dynamically controlling a tuner
US8335484B1 (en) 2005-07-29 2012-12-18 Siport, Inc. Systems and methods for dynamically controlling an analog-to-digital converter
ES2631906T3 (es) 2006-10-25 2017-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
US8199769B2 (en) 2007-05-25 2012-06-12 Siport, Inc. Timeslot scheduling in digital audio and hybrid audio radio systems
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN102789782B (zh) * 2008-03-04 2015-10-14 弗劳恩霍夫应用研究促进协会 对输入数据流进行混合以及从中产生输出数据流
EP2410522B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
TWI496479B (zh) * 2008-09-03 2015-08-11 Dolby Lab Licensing Corp 增進多聲道之再生
JP2012516462A (ja) 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム
TWI569573B (zh) 2009-02-18 2017-02-01 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
US8320823B2 (en) * 2009-05-04 2012-11-27 Siport, Inc. Digital radio broadcast transmission using a table of contents
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
US8831318B2 (en) * 2009-07-06 2014-09-09 The Board Of Trustees Of The University Of Illinois Auto-calibrating parallel MRI technique with distortion-optimal image reconstruction
KR101732208B1 (ko) * 2009-10-09 2017-05-02 디티에스, 인코포레이티드 오디오 녹음의 적응적 동적 범위 강화
EP3693963B1 (en) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
EP2372703A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
MY156027A (en) * 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
US8489053B2 (en) 2011-01-16 2013-07-16 Siport, Inc. Compensation of local oscillator phase jitter
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
AU2012217158B2 (en) * 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
EP3441967A1 (en) * 2011-04-05 2019-02-13 Nippon Telegraph and Telephone Corporation Decoding method, decoder, program, and recording medium
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
WO2014046916A1 (en) * 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
JP5894347B2 (ja) * 2012-10-15 2016-03-30 ドルビー・インターナショナル・アーベー 転移器に基づく仮想ベース・システムにおけるレイテンシーを低減するシステムおよび方法
WO2015036348A1 (en) * 2013-09-12 2015-03-19 Dolby International Ab Time- alignment of qmf based processing data
DE102014214143B4 (de) 2014-03-14 2015-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals im Frequenzbereich
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
CN104732979A (zh) * 2015-03-24 2015-06-24 无锡天脉聚源传媒科技有限公司 一种音频数据的处理方法及装置
CN106297813A (zh) 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10762911B2 (en) * 2015-12-01 2020-09-01 Ati Technologies Ulc Audio encoding using video information
JP2018101826A (ja) * 2016-12-19 2018-06-28 株式会社Cri・ミドルウェア 音声通話システム、音声通話方法およびプログラム
US11282492B2 (en) 2019-02-18 2022-03-22 Bose Corporation Smart-safe masking and alerting system
US10991355B2 (en) 2019-02-18 2021-04-27 Bose Corporation Dynamic sound masking based on monitoring biosignals and environmental noises
US11071843B2 (en) 2019-02-18 2021-07-27 Bose Corporation Dynamic masking depending on source of snoring

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5869819A (en) * 1994-08-17 1999-02-09 Metrologic Instuments Inc. Internet-based system and method for tracking objects bearing URL-encoded bar code symbols
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
FI935609A (fi) 1992-12-18 1994-06-19 Lonza Ag Dihydrofuroimidatsolijohdannaisten asymmetrinen hydraus
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
US5570363A (en) 1994-09-30 1996-10-29 Intel Corporation Transform based scalable audio compression algorithms and low cost audio multi-point conferencing systems
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
JP4174859B2 (ja) * 1998-07-15 2008-11-05 ヤマハ株式会社 デジタルオーディオ信号のミキシング方法およびミキシング装置
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
JP2000267682A (ja) * 1999-03-19 2000-09-29 Victor Co Of Japan Ltd 畳み込み演算装置
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
JP2001134274A (ja) * 1999-11-04 2001-05-18 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6707869B1 (en) 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US6963842B2 (en) 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
CN1682281B (zh) * 2002-09-17 2010-05-26 皇家飞利浦电子股份有限公司 在语音合成中用于控制持续时间的方法
JP2004184536A (ja) * 2002-11-29 2004-07-02 Mitsubishi Electric Corp 畳み込み演算装置及び畳み込み演算プログラム
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US6982377B2 (en) * 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7639823B2 (en) * 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
EP1728243A1 (en) * 2004-03-17 2006-12-06 Koninklijke Philips Electronics N.V. Audio coding
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
GB2426168B (en) * 2005-05-09 2008-08-27 Sony Comp Entertainment Europe Audio processing

Also Published As

Publication number Publication date
HK1163332A1 (zh) 2012-09-07
EP2378516A1 (en) 2011-10-19
EP2113911B1 (en) 2011-12-28
TW200832357A (en) 2008-08-01
NO20170988A1 (no) 2009-05-14
US8036903B2 (en) 2011-10-11
USRE45526E1 (en) 2015-05-19
EP2074615B1 (en) 2012-04-18
ES2386206T3 (es) 2012-08-13
ES2531568T3 (es) 2015-03-17
KR20110049886A (ko) 2011-05-12
NO342516B1 (no) 2018-06-04
IL226224A0 (en) 2013-06-27
ATE554480T1 (de) 2012-05-15
AU2011201330A1 (en) 2011-04-14
AU2011201331B2 (en) 2012-02-09
JP2013210656A (ja) 2013-10-10
JP2014059570A (ja) 2014-04-03
JP2013228740A (ja) 2013-11-07
NO342476B1 (no) 2018-05-28
SG174836A1 (en) 2011-10-28
ES2380177T3 (es) 2012-05-09
JP5520994B2 (ja) 2014-06-11
IL226223A (en) 2016-02-29
BRPI0716004A8 (pt) 2019-10-08
NO20170986A1 (no) 2009-05-14
JP5546863B2 (ja) 2014-07-09
CN102243875B (zh) 2013-04-03
EP2113910B1 (en) 2011-09-21
KR101209410B1 (ko) 2012-12-10
NO342445B1 (no) 2018-05-22
USRE45277E1 (en) 2014-12-02
EP2378516B1 (en) 2015-01-07
CN102243874B (zh) 2013-04-24
JP2010507111A (ja) 2010-03-04
NO342515B1 (no) 2018-06-04
BRPI0716004B1 (pt) 2020-11-17
ATE525720T1 (de) 2011-10-15
PT2884490T (pt) 2016-10-13
HK1138674A1 (en) 2010-08-27
USRE45339E1 (en) 2015-01-13
AU2007312696A1 (en) 2008-04-24
JP5700714B2 (ja) 2015-04-15
RU2009109129A (ru) 2010-11-27
KR20110049885A (ko) 2011-05-12
CA2667059A1 (en) 2008-04-24
USRE45294E1 (en) 2014-12-16
CN101529502A (zh) 2009-09-09
NO20170982A1 (no) 2009-05-14
CN102243874A (zh) 2011-11-16
JP5700713B2 (ja) 2015-04-15
IL226225A0 (en) 2013-06-27
NO342514B1 (no) 2018-06-04
CN102243873A (zh) 2011-11-16
NO20091900L (no) 2009-05-14
HK1138423A1 (en) 2010-08-20
RU2426178C2 (ru) 2011-08-10
CA2782476C (en) 2016-02-23
CN102243875A (zh) 2011-11-16
EP2074615A2 (en) 2009-07-01
MY164995A (en) 2018-02-28
WO2008046468A3 (en) 2008-06-26
AU2007312696A8 (en) 2009-05-14
JP2012150507A (ja) 2012-08-09
PL2378516T3 (pl) 2015-06-30
CA2782609A1 (en) 2008-04-24
SG174835A1 (en) 2011-10-28
WO2008046468A2 (en) 2008-04-24
MY155486A (en) 2015-10-30
IL226224A (en) 2016-02-29
CA2782609C (en) 2016-10-04
ES2374014T3 (es) 2012-02-13
ES2592253T3 (es) 2016-11-29
KR101162462B1 (ko) 2012-07-04
EP2884490B1 (en) 2016-06-29
MY153289A (en) 2015-01-29
PL2113910T3 (pl) 2012-02-29
JP5859504B2 (ja) 2016-02-10
BRPI0716004A2 (pt) 2013-07-30
USRE45276E1 (en) 2014-12-02
BR122019020171B1 (pt) 2021-05-25
IL197757A (en) 2014-09-30
AU2007312696B2 (en) 2011-04-21
CA2782476A1 (en) 2008-04-24
EP2884490A1 (en) 2015-06-17
CN102243873B (zh) 2013-04-24
NO20170985A1 (no) 2009-05-14
IL226225A (en) 2016-02-29
CA2667059C (en) 2014-10-21
EP2113911A2 (en) 2009-11-04
ZA200901650B (en) 2010-03-31
PL2884490T3 (pl) 2016-12-30
MX2009004046A (es) 2009-04-27
AU2011201330B2 (en) 2011-08-25
KR101162455B1 (ko) 2012-07-04
US20080097764A1 (en) 2008-04-24
CN101529502B (zh) 2012-07-25
PL2113911T3 (pl) 2012-06-29
PL2074615T3 (pl) 2012-10-31
IL226223A0 (en) 2013-06-27
EP2113911A3 (en) 2009-11-18
IL197757A0 (en) 2009-12-24
ATE539432T1 (de) 2012-01-15
EP2113910A1 (en) 2009-11-04
KR20090076924A (ko) 2009-07-13
MY155487A (en) 2015-10-30
HK1128058A1 (en) 2009-10-16
AU2011201331A1 (en) 2011-04-14

Similar Documents

Publication Publication Date Title
TWI355647B (en) Analysis filterbank, synthesis filterbank, encoder
US11646047B2 (en) Subband block based harmonic transposition
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
KR101290486B1 (ko) 다운믹스 오디오 신호를 업믹싱하는 장치, 방법 및 컴퓨터 프로그램
KR101646650B1 (ko) 최적의 저-스루풋 파라메트릭 코딩/디코딩
JP3814611B2 (ja) 時間離散オーディオサンプル値を処理する方法と装置
TW200926148A (en) An encoder