TWI446337B - 用以使用級聯濾波器排組處理輸入音訊信號的裝置與方法 - Google Patents
用以使用級聯濾波器排組處理輸入音訊信號的裝置與方法 Download PDFInfo
- Publication number
- TWI446337B TWI446337B TW100107724A TW100107724A TWI446337B TW I446337 B TWI446337 B TW I446337B TW 100107724 A TW100107724 A TW 100107724A TW 100107724 A TW100107724 A TW 100107724A TW I446337 B TWI446337 B TW I446337B
- Authority
- TW
- Taiwan
- Prior art keywords
- filter bank
- sub
- signal
- band
- analysis
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims description 104
- 238000000034 method Methods 0.000 title claims description 78
- 230000005236 sound signal Effects 0.000 title claims description 57
- 230000015572 biosynthetic process Effects 0.000 claims description 124
- 238000003786 synthesis reaction Methods 0.000 claims description 124
- 230000017105 transposition Effects 0.000 claims description 83
- 238000005070 sampling Methods 0.000 claims description 68
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 239000002131 composite material Substances 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 59
- 230000003595 spectral effect Effects 0.000 description 40
- 230000006870 function Effects 0.000 description 24
- 230000008439 repair process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 238000012952 Resampling Methods 0.000 description 7
- 230000010076 replication Effects 0.000 description 5
- 230000007480 spreading Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001373 regressive effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Networks Using Active Elements (AREA)
- Auxiliary Devices For Music (AREA)
Description
本發明係有關於音頻源編碼系統,該系統利用一供高頻重建(HFR)之用的諧波移調方法,且與數位效果處理器,例如所謂之激發器有關,其中諧波失真的產生增加被處理信號及時間伸展器的亮度,其中一信號之持續時間被延長同時維持原始的頻譜內容。
在PCT WO 98/57436中,移調的觀念被建立成一種由一音訊信號的一低頻帶再生一高頻帶的方法。一位元率上的可觀節省能藉由在音訊編碼中使用此項觀念獲得。在一基於HFR的音訊編碼系統中,一低帶寬信號被一核心波形編碼器處理,且較高頻率利用移調及在解碼器端描述目標頻譜形狀的極低位元率附加旁側資訊被再生。對於低位元率,在核心編碼信號的頻寬窄的情況,再生一具有感知愉悅特性之高頻帶的重要性漸增。在PCT WO 98/57436中定義的諧波移調在一種低交越頻率情形中對複雜音樂資料執行得很好。諧波移調的原則是一具有頻率ω的正弦曲線映射到一具有頻率Tω而T>1是一定義移調階之整數的正弦曲線。與此相反,以邊帶調制(SSB)為基礎的HFR方法使一具有頻率ω的正弦曲線映射至一具有頻率ω+△ω之頻率而△ω是一固定頻移的頻率。假設一核信號具有低帶寬的,一不諧和偽差可能由SSB移調產生。
為了要達到最佳可能的音訊品質,最新的高品質諧波HFR方法使用複雜的調制濾波器排組,例如一短時間傅立葉轉換(STFT),以高頻解析度與一高度的超取樣獲得需要的音訊品質。需要高解析度以避免因非線性處理正弦曲線總和所發生的有害互調制失真。藉由充分高的頻率解析度,即狹窄子頻帶,高品質方法目的是在每一子頻帶中有一正弦曲線極大點。一時間上之高度超取樣為避免混疊型失真所必需,且在頻率上之特定程度超取樣是避免暫態信號之預回聲所必需。明顯的不利則是計算的複雜度可能變高。
基於子頻帶區塊的諧波移調是另一使用於抑制互調制產物的HFR方法,在此情況下一具有較粗頻率解析度及一低程度超取樣的濾波器排組,例如一多通道QMF排組被應用。在此一方法中,一複合子頻帶樣本的時間區塊被一普通調相器處理而數個調整試樣的疊加形成一輸出子頻帶樣本。此具有抑制互調制產物的淨效應,否則該互調制產物將會發生在輸入子頻帶信號由數個正弦曲線組成時。基於以區塊為基礎的子頻帶處理的移調在計算複雜度上比高品質移調器為低且對許多信號幾乎取得相同的品質。然而,複雜度仍然遠高於普通基於SSB的HFR方法者,由於在一典型的HFR應用中需要複數個分析濾波器排組,各個濾波器排組處理不同移調階T
的信號,以便合成需要的頻寬。此外一通常的方式是使輸入信號的取樣率適配一具有固定大小的分析濾波器排組,儘管濾波器排組處理不同移調階的信號。同時也屬常見的是對輸入信號用使用帶通濾波器以獲得經由不同移調階處理、具有非重疊功率譜密度的輸出信號。
音訊信號的儲存或傳輸時常受到嚴格的位元率限制。在過去,當只有一非常低的位元率可利用時,編碼器被迫大幅減少傳輸的音訊頻寬。現代音頻編解碼器現在能藉由使用頻寬擴展(BWE)方法[1-12]編碼寬帶信號。這些演算法依賴高頻成分(HF)之一參數表示,該高頻成分是藉由移調至HF頻譜區域中(「修補」)且應用一參數驅動後處理從解碼信號的低頻部份(LF)生成。LF部份以任何音訊或語音編碼器被編碼。舉例而言,在[1-4]中描述的頻寬擴展方法依賴單一邊帶調制(SSB),通常也稱為「複製」方法,以產生多數HF補丁。
近來,一種使用一組相位聲碼器[15-17]產生不同補丁的新演算法已經被提出[13](見第20圖)。此一方法已經被發展用來避免聽覺粗糙,聽覺粗糙時常在受制於SSB頻寬擴展的信號上被觀察到。然而,因為BWE演算法在一編解碼器鏈的解碼器端被執行,計算的複雜度是一嚴重問題。最先進的方法,尤其是基於聲碼器之HBE,是以一與基於SSB方法相較大為增加的計算複雜度為代價之下得到。
如同以上概略說明,現存頻寬擴展方案在一特定的信號區塊上一次僅使用一種修補方法,它是基於SSB的修補[1-4]或基於HBE聲碼器的修補[15-17]。另外,現代的音訊編碼器[19-20]提供在可選擇的修補方案之間的一時間區塊基礎上總體切換修補方法的可能性。
SSB複製形成補丁將不必要的粗糙引入音訊信號,但是,計算複雜度顯著地增加超過計算非常簡單的SSB複製方法。
在論及複雜度減少時,取樣率具有特殊的重要性。這是由於一高取樣率意味高複雜度,且一低取樣率由於減少所需要的操作數目而通常意味低複雜度。然而,另一方面,在頻寬擴展應用的情形尤其如此而使得核心編碼器輸出信號的取樣率將典型地是低到使得對一全頻寬信號的取樣率過低。以不同方式陳述,當解碼器輸出信號的取樣率例如是2或者2.5乘以核心編碼器輸出信號的最大頻率時,則一例如因數為2的頻寬擴展意味需要一增取樣操作,使得頻寬擴展取樣信號的取樣率高到使取樣能「涵蓋」額外產生的高頻成分。
另外,濾波器排組,諸如分析濾波器排組和合成濾波器排組負責相當大量的處理操作。因此,濾波器排組的大小,即是否濾波器排組是一32通道濾波器排組、一64通道濾波器排組或者是甚至更高數目的濾波器排組將顯著地影響音頻處理演算法的複雜度。通常可以說,一高數目的濾波器排組通道需要較多的處理操作,且因而比數目較少的濾波器排組通道複雜度高。有鑑於此,在頻寬擴展應用以及不同的取樣率是一關鍵的其他音頻處理應用中,諸如在具聲碼器特徵之應用或任何其他音頻效果應用中,在複雜度與取樣率或音頻帶寬之間有一特定的互相依存,意指當錯誤的工具或者演算法被選擇作特定操作之用時,增取樣或子頻帶濾波的操作能在正面意義上未特別影響音頻品質之下大幅提高複雜度。
本發明的一目的是提供一改進的音頻處理概念,該一音頻處理概念一方面容許低複雜度處理能,另一方面得到一良好音頻品質。
此一目的藉由依據申請專利範圍第1項或18項的一種處理一輸入音訊信號的裝置,或藉由依據申請專利範圍第20或21項的一種處理一輸入音訊信號的方法,或依據申請專利範圍第22項的一種電腦程式被達成。
本發明的實施例依賴一特定級聯布局的分析及/或合成濾波器排組以在未犧牲音訊的品質之下獲得低複雜度重取樣。在一實施例中,處理一輸入音訊信號的裝置包含一合成濾波器排組用以從輸入音訊信號合成一音訊中間信號,該輸入音訊信號是以由一在處理方向上置於合成濾波器之前的分析濾波器排組所產生的複數第一子頻帶信號代表,其中該合成濾波器排組的濾波器排組通道數目小於該分析濾波器排組的通道數目。中間信號進一步由另一分析濾波器排組處理以從該音訊中間信號產生複數第二子頻帶信號,其中該另一分析濾波器排組的通道數目不同於該合成濾波器排組之通道數目,因此該複數子頻帶信號的取樣率不同於由該分析濾波器排組所產生之複數第一子頻帶信號的取樣率。
一合成濾波器排組與一隨後連接之另一分析濾波器排組的級聯提供一取樣率轉換,且另外提供已輸入至一基本頻帶之合成濾波器排組之原始音訊輸入信號的一頻寬部分調制。此一已擷取自原始輸入音訊信號,例如可為一頻寬擴展系統之一核心解碼器之輸出信號的時間中間信號目前最好被表示成調制至基本頻帶的一臨界取樣信號,且已發現此一表示,即該重取樣輸出信號,當被另一分析濾波器排組處理以獲得一子頻帶表示時,容許進一步處理操作的低複雜度處理,該進一步處理操作可能會或可能不會發生,且該進一步處理操作例如是與頻寬擴展相關的處理操作,諸如非線性子頻帶操作接隨高頻率重建處理及在最後合成濾波器排組中合併子頻帶。
本申請案提供在頻寬擴展及與頻寬擴展無關之其他音訊應用環境中處理音訊信號的裝置、方法或電腦程式的不同層面。接著被描述與請求之個別層面的特徵可能被部分或完全合併,但也能互相獨立地使用,因該等個別層面被實施在一電腦系統或微處理器中時已提供有關知覺品質、計算複雜度以及處理器/記憶體資源的優點。
實施例提供一種方法,其藉由輸入信號的有效濾波及對HFR分析濾波器排組分析階段之取樣率轉換而減少一基於子頻帶區塊之諧波HFR方法的計算複雜度。再者,應用至輸入信號的帶通濾波器可以被證明在一基於子頻帶區塊移調器中是無用的。
本實施例藉由在一單一分析與合成濾波器排組對的架構中有效地以子頻帶為基礎實施數階移調而促進減少基於子頻帶區塊的諧波移調計算複雜度。取決於知覺品質與計算複雜度的權衡,只有移調階的一適當子集或所有的移調階可在一濾波器排組中共同被執行。此外,一合併的移調方案中僅有某些移調階是被直接計算而剩下的頻寬是由可利用的複製,即先前計算的移調階(例如第二階)及/或核心編碼頻寬填充。在此一情況,修補可使用可得到的複製來源範圍的每一可能組合被實施。
另外,實施例提供一方法藉由HFR工具的頻譜對準改善高品質諧波HFR方法以及基於子頻帶區塊的諧波HFR方法。尤其,藉由將HFR產生信號的頻譜邊界與包跡調整頻率表的頻譜邊界對準可達成性能增進。更進一步,限制器工具的頻譜邊界是以同一原則被對準到HFR產生信號的頻譜邊界。
進一步的實施例被配置用來改進暫態的知覺品質並同時,舉例而言,藉由應用一修補方案減少計算複雜度,該修補方案施加由諧波修補與複製修補所組成的一混合修補。
在特定的實施例中,級聯濾波器排組結構的個別濾波器排組是正交鏡像濾波器排組(QMF),所有皆依賴使用一組定義濾波器排組通道中心頻率的調制頻率被調制的一個低通原型濾波器或窗函數。最好,所有的窗函數或原型濾波器以一種不同尺寸之濾波器排組(濾波器排組通道)的濾波器也彼此依賴的方式彼此依賴。最好,濾波器排組級聯構造中的最大濾波器排組,在一實施例中包含一第一分析濾波器排組、一隨後連接的濾波器排組、一另一分析濾波器排組,以及在稍後處理狀態中之一最後合成濾波器排組,有一具有特定數目窗函數或原型濾波器係數的窗函數或原型濾波器響應。製作成較小尺寸的濾波器排組皆為此一窗函數的子取樣版本,意指該另一濾波器排組的窗函數是「大」窗函數的子取樣版本。舉例而言,如果一濾波器排組具有大濾波器排組的一半大小,則窗函數有係數數目的一半,而且製作成較小的濾波器排組的係數藉由子取樣得到。在此一情形中,子取樣意指,例如,每一第二濾波器係數被具有一半大小的較小濾波器排組採用。然而,當非整數的濾波器排組大小之間有其他關係時,窗係數的一特定類型插值法被執行,使得較小濾波器排組的窗末端再度是較大濾波器排組之窗的一子取樣版本。
本發明的實施例在僅有一部分的輸入音訊信號需要做進一步處理的情形下特別有用,且此一情形特別發生在諧波頻寬擴展的場合中。在此一場合中,聲碼器之類的處理操作尤其為佳。
實施例的一項優點是藉由有效的時域與頻域操作提供一QMF移調器較低的複雜度,且利用頻譜對準對基於諧波頻譜帶複製之QMF和DFT為提供改良的音質。
實施例有關音源編碼系統,該系統使用一例如基於子頻帶區塊的諧波移調方法以供高頻重建(HFR),以及數位效果處理器,例如所謂的激發器,其中諧波失真的產生增加處理信號的亮度,及時間伸展器的亮度,此情況之下一信號的期間被延長同時維持原始者的頻譜成分。實施例藉由輸入信號有效濾波及在HFR濾波器排組分析階段之前的取樣率轉換提供一種減少基於子頻帶區塊之諧波HFR方法的計算複雜度。更進一步,實施例證明應用於輸入信號的習知帶通濾波器在一基於子頻帶區塊的HFR系統中是無用的。另外地,實施例提供一方法藉由HFR工具的頻譜對準改善高品質諧波HFR方法和以子頻帶區塊基礎的諧波HFR方法。尤其,實施例教示如何藉由對準HFR產生之信號與包跡調整頻率表格的頻譜邊界而達成性能的增進。更進一步,限制器工具的頻譜邊界是藉相同的原則對準至HFR產生信號的頻譜邊界。
本發明現在將藉由非限制本發明的範圍或精神的說明性實例參照附圖被描述,其中:第1圖說明在一HFR增強型解碼器架構中使用2、3及4階移調之一基於區塊移調器的操作;第2圖說明第1圖中之非線性子頻帶伸展單元的操作;第3圖說明第1圖的基於區塊移調器的有效實施,在HFR分析濾波器排組之前的重取樣器和帶通濾波器使用多速率時域重取樣器及基於QMF的帶通濾波器被實施;第4圖繪示可供有效實施第3圖的多速率時域重取樣器的一建構塊的實例;第5a-5f圖說明對於以第4圖中之不同方塊2階移調處理的一信號實例的效果;第6圖說明第1圖之基於區塊移調器的有效施,在HFR分析濾波器排組之前的重取樣器和帶通濾波器被更換成在從一32-頻帶分析濾波器排組中選出的子頻帶上操作的小子取樣合成濾波器排組;第7圖說明說明對於以第6圖中之一子取樣合成濾波器排組2階移調處理之一實例信號的效果;第8a-8e圖說明一因數2之有效多速率時域降取樣器的實施塊;第9a-9e圖說明一因數3/2之有效多速率時域降取樣器的實施塊;第10a-10c圖說明在一HFR增強型編碼器中的HFR移調器信號之頻譜邊界與包跡調整頻帶之邊界的對準;第11a-11c圖說明在由於未對準之HFR移調器信號頻譜邊界物而出現偽差的情形;第12a-12c圖說明第11圖之偽差由於HFR移調器信號之對準頻譜邊界而被避免的情形;第13a-13c圖說明限制器工具中的頻譜邊界適應HFR移調器信號的頻譜邊界;第14圖說明基於子頻帶區塊的諧波移調原則;第15圖繪示在一HFR增強型音頻編解碼器中使用數階移調之基於子頻帶區塊移調的應用的一實例情形;第16圖繪示每一移調階應用一單獨之分析濾波器排組的基於多階子頻帶區塊移調之操作的一前案實例情形;第17圖繪示有效操作應用一單一64頻帶QMF分析濾波器排組之一多階基於子頻帶移調的一發明實例情形;第18圖說明形成以子頻帶信號處理的另一實例;第19圖說明一邊帶調制(SSB)修補;第20圖說明一諧波頻寬擴展(HBE)修補;第21圖說明一混合修補,第一修補是藉由頻率擴展而產生且第二修補是藉由一低頻部分的SSB拷貝而產生;第22圖說明對一SSB拷貝操作利用第一HBE以產生一第二修補的一種可選擇的混合修補;第23圖說明分析與合成濾波器排組的一較佳級聯結構;第24a圖說明第23圖之小合成濾波器排組的一較佳實施;第24b圖說明第23圖的另一分析濾波器排組的一較佳實施;第25a圖說明ISO/IEC 14496-3: 2005(E)的某種分析與合成濾波器排組的概觀,且特別是一可被使用作第23圖之分析濾波器排組之一分析濾波器排組的實施,以及可使用作第23圖之最後合成濾波器排組的一合成濾波器排組的實施;第25b圖以第25a圖之分析濾波器排組的一流程圖說明一種實施;第25c圖說明第25a圖之合成濾波器排組之一較佳實施;第26圖說明在一頻寬擴展處理背景中之架構的概觀;以及第27a-27b圖說明藉由第23圖的另一分析濾波器排組處理子頻帶信號輸出的一較佳實施。
下述的實施例僅為說明性且可藉由有效的時間和頻域操作之前可能提供QMF移調器的一低複雜度,以及藉由頻譜對準提供以QMF和DFT兩者為基礎之諧波SBR的音訊品質。可理解的是本文中所描述的修改以及配置變化對於熟習此技藝者顯而易見的。因此僅欲被限制於專利請求項的範圍而不欲受限於由本文中實施例之描述與說明提出的特定細節。
第23圖說明處理一輸入音訊信號的裝置的一較佳實施,其中輸入音訊信號可以是例如一核心音訊解碼器2301在線2300上輸出的一時域輸入信號。輸入音訊信號被輸入至一第一分析濾波器排組2302,其例如為一具有M通道之分析濾波器排組。詳言之,分析濾波器排組2302因此輸出M子頻帶信號2303,其所具有之取樣率為fS
=fS
/M。此意指分析濾波器排組是一臨界取樣分析濾波器排組。意指分析濾波器排組2302在線2300上對每一區塊之M輸入樣本提供每一子頻帶通道的一單一試樣。較佳地,分析濾波器排組2302是一被複合調制的濾波器排組,意指每一子頻帶樣本具有一值與及一相或相等地一實部及一虛部。因此,在線2300上的輸入音訊信號由分析濾波器排組2302產生的複數第一子頻帶信號2303代表。
所有第一子頻帶信號的子集輸入至一合成濾波器排組2304中。合成濾波器排組2304具有Ms通道,其中Ms小於M。因此,並非所有由濾波器排組2302產生子頻帶信號被輸入合成濾波器排組2304,而是只有一子集,亦即由2305所指示的一特定較少數量的通道。在第23圖實施例中,子集2305涵蓋一個特定的中間頻寬,但可選擇地,子集也能涵蓋始於濾波器排組2302直到一通道數目小於M為止的一頻寬,或者子集2305也能涵蓋與最高通道M一致且被延伸到通道數目高於通數目1的低通道的一組子頻帶信號。或者,通道索引取決於實際上使用的記數可從0開始。然而最好在頻寬擴展操作上一由2305表示之子頻帶信號組代表的一特定中間頻寬被輸入至合成濾波器排組2304中。
其他不屬於組2305的通道不被輸入合成濾波器排組2304中。合成濾波器排組2304產生一中間音訊信號2306,其具有一個取樣率fS
‧MS
/M。因為MS
比M小,中間信號的取樣率2306將小於線2300上的輸入音訊信號的取樣率。因此,中間信號2306代表符合子頻帶2305代表之頻帶信號的的降取樣且解調之信號,其中信號被解調到基帶,因為組2305的最低通道被輸入MS
合成濾波器排組的通道1內,且方塊2305的最高通道被輸入方塊2304的最高輸入內,此外對最低或最高通道有一些為避免子集2305之邊界混疊問題的補零操作。處理一輸入音訊信號的裝置包含另一分析濾波器排組2307以供分析中間信號2306,且該另一分析濾波器排組具有MA
通道,其中MA
不同於MS
且最好大於MS
。當MA
大於MS
時,則該另一分析濾波器排組輸出的子頻帶信號且以2308表示的取樣率將低於一子頻帶信號2303的取樣率。然而,當MA
低於MS
時,則一子頻帶信號2308的取樣率將高於複數第一子頻帶信號之一子頻帶信號的取樣率。
因此,濾波器排組2304和2307(且最好2302)的級聯提供非常有效且高品質的增取樣或降取樣操作或一般而言一種非常有效的重取樣處理工具。複數第二子頻帶信號2308最好進一步在一處理器2309中被進一步處理,該處理器使資料被級聯的濾波器排組2304,2307(且最好2302)重取樣而執行處理。另外,最好方塊2309也執行頻寬擴展操作之一增取樣操作,以便最後方塊2309的子頻帶輸出與方塊2302的子頻帶輸出有相同的取樣率。然後,在一頻寬擴展處理應用中,這些子頻帶是連同以2310表示之另外子頻帶一起被輸入一合成波器排組2311,該另外的子頻帶最好例如是由分析濾波器排組2302所產生,最後提供一處理時域信號,例如一具有一取樣率2 fS
的頻寬擴展信號。方塊2311輸出的取樣率在本實施例中是線2300上之信號之取樣率的兩倍,且此一由方塊2311輸出的取樣率足夠大而使得由方塊2309中之處理產生的額外帶寬可在處理時域信號中以高音頻品質表示。
視本發明之級聯濾波器排組的特定應用而定,濾波器排組2302可以在一單獨裝置中且一處理輸入音訊信號的裝置可僅包含合成濾波器排組2304與另一分析濾波器排組2307。換言之,分析濾波器排組2302與一「後」-處理器可以是個別配給的,該「後」-處理器包含方塊2304,2307且視實施而定也可包含2309與2311。
在其他的實施例中,本發明應用於實施級聯濾波器排組的不同處可在於一特定的裝置包含分析濾波器排組2302和較小的合成濾波器排組2304,且中間信號被提供至一由不同銷售者配給或通過一不同分配通道的不同處理器。於是,分析濾波器排組2302和較小的合成濾波器排組2304的組合代表一非常有效的降取樣方式且同時將由子集2305所代表的頻寬信號解調到基帶。此一降取樣和解調到基帶已被實施而無音訊品質上的任何損失,且特別是沒有音訊訊息上的任何損失,因此為一高品質處理。
第23圖中之表說明不同裝置的特定的示範數目。較佳地,分析濾波器排組2302有32個通道,合成濾波器排組有12個通道,另一分析濾波器排組有兩倍於合成濾波器排組的通道,諸如24個通道,而最後合成濾波器排組2311有64個通道。一般而言,在分析濾波器排組2302的通道數目大,合成濾波器排組2304的通道數目小,另一分析濾波器排組2307的通道數目居中且合成濾波器排組2311的通道數目非常大。分析濾波器排組2302輸出的子頻帶信號的取樣率是fS
/M。中間信號具有取樣率fS
‧MS
/M。以2308表示的另一分析濾波器排組的子頻帶通道有一取樣率fS
‧MS
/(M‧MA
),且當在方塊2309中之處理使取樣率加倍時,合成濾波器排組2311提供一取樣率2fS
的輸出信號。然而,當方塊2309中的處理未將取樣率加倍時,則由合成濾波器排組輸出的取樣率對應地將較低。其次將討論關於本發明的進一步實施例。
第14圖說明基於子頻帶區塊的移調原則。輸入時域信號被饋給到提供大量複值子頻帶信號的分析濾波器排組1401。這些複值子頻帶信號被饋給到子頻帶處理裝置1402。該大量的複值輸出子頻帶被饋給到合成濾波器排組1403,進而輸出修改時域信號。子頻帶處理單元1402執行基於非線性區塊之子頻帶處理操作,以使得修改之時域信號是符合階T>1的輸入信號的一移調版本。基於區塊的子頻帶處理觀念是定義成包含在區塊上一次多於一子頻帶樣本的非線性操作,其中後續的區塊被窗化且重疊相加以產生輸出子頻帶信號。
濾波器排組1401和1403可以是任何複指數調制型態,諸如QMF或窗化DFT。他們在調制中可被偶數或奇數堆疊且可由一大範圍的原型濾波器或窗定義。重要的是知道下列二濾波器排組以物理單位被量測之參數的商數Δf S
/Δf A
。Δf A
:分析濾波器排組1401的子頻帶頻率間距;Δf S
:合成濾波器排組1403的子頻帶頻率間距。
對於子頻帶處理1402的配置,需要找出來源和目標子頻帶索引之間的對應。觀察到一實際頻率Ω的輸入正弦曲線將導致發生在具有索引n Ω/Δf A
之輸入子頻帶上的主要貢獻。需要移調之實際頻率T
‧Ω的輸出正弦曲線將由饋給具有索引m T
‧Ω/Δf S
之合成子頻帶產生。因此,一特定目標子頻帶索引的子頻帶處理的適當來源子頻帶索引值m
必需遵守
第15圖說明在一增強型HFR音訊編解碼器中使用數階移調之基於子頻帶區塊應用的一實例方案。一傳輸位元流被核心解碼器1501接收,該核心解碼器以取樣頻率fs提供一低帶寬解碼核信號。低頻藉由一複調制32頻帶QMF分析排組1502接隨一64頻帶QMF分合成排組(反向QMF)1505重取樣到輸出取樣頻率2fs。此二濾波器排組1502和1505具有相同的實際解析度參數Δf S
=Δf A
,且HFR處理單元1504僅讓對應於低帶寬核信號的未修改較低子頻帶通過。輸出信號的高頻成分藉由使用多重移調器單元1503的輸出頻帶饋給64頻帶QMF合成排組1505之較高子頻帶被獲得,受到由HFR處理單元1504執行的頻譜成形和修改。多重移調器1503將核信號當做輸入且輸出許多代表若干移調信號成分之疊加或組合的64QMF頻帶分析的子頻帶信號。目的是如果HFR處理被略過,每一成分相當於核信號之一整數實際移調,(T
=2,3...)。
第16圖說明基於多階子頻帶區塊移調1603之操作的前案實例方案,該操作每一移調階應用一單獨的分析濾波器排組。此處三個移調階T=2.3.4在一64頻帶以2fs
取樣率操作的QMF域中被產生且輸。合併單元1604簡單地選擇與合併來自每一移調因數支路的相關子頻帶成為一將被饋給至HFR處理單元中的單一量子頻帶。
首先考慮T=2的情形,具體地,目的是一64頻帶QMF分析1602-2的處理鏈,一子頻帶處理單元1603-2,以及一64頻帶QMF合成1505造成一T=2的實際移調。第14圖中將這三個方塊標識為1401,1402和1403,發現Δf S
/Δf A
=2,使得(1)造成1603-2的規格為來源n與目標子頻帶m之間的對應被規定成n=m。
至於T=3的情形,示範系統包括一取樣率轉換器1601-3,其將輸入取樣率以一因數3/2由fs降轉換到2fs/3。具體地,目的是該64頻帶QMF分析1602-3的處理鏈,該子頻帶處理單元1603-3,以及一64頻帶QMF合成1505造成一T=3的實際移調。第14圖中將這三個方塊標識為1401,1402和1403,發現由於重取樣Δf S
/Δf A
=3,使得(1)造成1603-3的規格為來源n與目標子頻帶m之間的對應再次被規定成n=m
至於T=4的情形,示範系統包括一取樣率轉換器1601-4,其將輸入取樣率以一因數2由fs降轉換到fs/2。具體地,目的是該64頻帶QMF分析1602-4的處理鏈,該子頻帶處理單元1603-4,以及一64頻帶QMF合成1505造成一T=4的實際移調。第14圖中將這三個方塊標識為1401,1402和1403,發現由於重取樣Δf S
/Δf A
=3,使得(1)造成1603-4的規格為來源n
與目標子頻帶m
之間的對應也被規定成n=m
第17圖說明應用一單一64頻帶QMF分析濾波器排組的基於多階子頻帶區塊移調的有效操作之發明實例方案。實際上,在第16圖中使用三個單獨的QMF分析排組和兩個取樣率轉換器造成一相當高的計算複雜度,且由於取樣率轉換1601-3而對基於音框之處理造成一些實施上的缺點。目前的實施例教示分別以子頻帶處理1703-3和1703-4取代二支路1601-3->1602-3->1603-3和1601-4->1602-4->1603-4,然而支路1602-2->1603-2與第16圖相較保持不變。所有的三階移調目前必需在在一參見第14圖的濾波器排組域中被執行,其中Δf S
/Δf A
=2。就T
=3的情形而言,1703-3的規格是被規定為n 2m
/3。就T
=4的情形而言,1703-4的規格是被規定為(1)來源n
與目標子頻帶m
之間的對應被規定為n 2m
。為了更進一步減少複雜度,一些移調階可藉由複製已被計算的移調及或核心解碼器的輸出能被產生。
第1圖說明在一HFR增強型解碼器架構,諸如SBR[ISO/IEC 14496-3:2009,資訊技術-音視對象之編碼-第三部分:音頻]中,一使用2,3及4移調階之基於子頻帶區塊移調器的操作。位元流藉核心解碼器101對時域解碼且傳遞到HFR模組103,其由基本頻帶核信號產生一高頻信號。在產生後,HFR產生的信號藉由傳送的旁側資訊被動態地調整成儘可能密切的匹配原始信號。此一調整由HFR處理器105執行在由一或數個分析QMF排組所獲得的子頻帶信號上。一個典型的方案是其中核心解碼器在一輸入和輸出信號的一半頻率上取樣之一時域信號上操作,亦即,HFR解碼器模組將有效地重取樣核信號達兩倍取樣頻率。此一樣本率轉換通常是藉由一32頻帶分析QMF排組102濾波核心編碼器信號的第一步驟102被獲得。在所謂的交越頻率以下的子頻帶,即含有全部核心編碼器信號能量的32個子頻帶的較低子集與攜帶HFR產生信號之子頻帶組組合。通常,如此組合的子頻帶數目是64,在經由合成QMF排組106濾波後造成一取樣率轉換之核心編碼器信號與HFR模組的輸出組合。
在HFR模組103的基於子頻帶區塊移調器中,三移調階T=2,3和4,係欲在以輸出取樣率2f S
操作的64頻帶QMF之域中被產生及傳送。輸入時域信號在方塊103-12,103-13和103-14中被帶通濾波。此是為了使被不同移調階處理的輸出信號具有非重疊的頻譜成分。信號進一步被降取樣(103-23,103-24)使輸入信號的取樣率被適應成配合一固定大小的分析濾波器排組(本情況為64)。可注意的是取樣率從fs增加到2fs可由取樣率轉換器使用降取樣因數T/2而非T,其中後者將造成具有與輸入信號相等之取樣率的移調之子頻帶信號的事實來解釋。降取樣信號被饋給分離的HFR分析濾波器排組(103-32,103-33和103-34),每一移調階一個,該濾波器排組提供多數複值子頻帶信號。這些信號與子取樣分析排組102的輸出一起被饋給非線性子頻帶伸展單元(103-42,103-43和103-44)。該多數複值輸出子頻帶被饋給合併/組合模組104。合併/組合單元將來自核分析濾波器排組102的子頻帶及每一伸展因數支路合併成一將被饋給至HFR處理單元105內的一單一量QMF子頻帶。
當來自不同的移調階的信號頻譜被設定成不重疊時,亦即,第T個移調階信號的頻譜應起始於T-1階信號之頻譜終止處,移調之信號需要是帶通特性。第1圖中的傳統帶通濾波器103-12-103-14由此而來。然而,經由合併/組合單元104在可利用子頻帶中的一簡單互斥選擇,單獨的帶通濾波器是多餘的且可被撤除。替代地,由QMF排組所提供的固有帶通特性藉由將移調器支路的不同貢獻獨立地饋給104中的不同子頻帶而被利用。僅對在104中被組合的頻帶應用時間伸展也滿足需求。
第2圖說明一非線性子頻帶伸展單元的操作。區塊擷取器201從複值輸入信號取樣一樣本的一有限音框。音框是由一輸入指標位置定義。此一音框在202接受非線性處理且接著以203中的有限長度窗被窗化。產生的樣本在重疊及加法單元204中被加入先前輸出樣本,於該單元處輸出音框位置由一輸出指標位置定義。輸入指標以一固定量被增值且輸出指標以該子頻帶伸展因數乘上相同量被增值。此一操作鏈的重複將造成一長度為子頻帶伸展因數乘上輸入子頻帶信號期間,直到合成窗的長度為止的輸出信號。
雖然SBR[ISO/IEC 14496-3:2009,資訊技術-音視對象之編碼-第三部分:音頻]應用的SSB移調器典型地利用第一子頻帶除外的整個基本頻帶產生高頻帶信號,一諧波移調器通常使用核心編碼器頻譜的一較小部份。所使用的量,所謂來源範圍,是取決於移調階、頻寬擴展因數以及適用於組合結果的規則,例如若由不同移調階產生的信號是否允許頻譜重疊。因此,諧波移調器就一特定移調階的輸出頻譜僅一有限部分將實際上被HFR處理模組105使用。
第18圖說明處理單一子頻帶信號的示範性處理實施的另一個實施例。單一子頻帶在一未示於第18圖之分析濾波器排組濾波之前抑或之後已接收任任類型的抽取。因此,單一子頻帶信號之時間長度比形成抽取之前的時間長度為短。單一子頻帶信號被輸入至一區塊擷取器1800中,該擷取器可與區塊擷取器201相同,但亦能以不同方式被實施。在第18圖中的區塊擷取器1800使用一示範性地稱為e的樣本/區塊提前值操作。該樣本/區塊提前值操作可以是變數或者可以是固定設定且在第18圖中繪示成一指向區塊擷取器方格1800內的箭頭記號。在區塊擷取器1800的輸出,存在複數個擷取區塊。這些區塊是高度地重疊,因為樣本/區塊提前值e顯著地小於區塊擷取器的區塊長度。一實例是區塊擷取器擷取12個樣本的區塊。第一區塊包含樣本0-11,第二區塊包含樣本1-12,第三個區塊包含樣本2-13,等等。在此實施例中,樣本/區塊提前值e等於1,且有一11重的重疊。
個別的區塊被輸入窗程式1802以針對每一區塊使用一窗函數使區塊窗化。另外,一個相位計算器1804被提供,該計算器計算每一區塊的一相位。相位計算器1804可在窗化之前或之後使用個別區塊。然後,相位調整值p x k被計算且輸入一相位調整器1806內。相位調整器將調整值應用至區塊中的每個樣本。此外,因數k等於頻寬擴展因數。舉例而言,當一因數為2的頻寬擴展被獲得時,則針對區塊擷取器1800擷取的一區塊計算的相位p被乘以2且應用至相調整器1806中之區塊的每一樣本是p乘以2。此為一示範值/規則。或者,合成的修正相位是k*
p,p+(k-1)*
p。因此在此一實例中,如果被乘算,校正因數是2,如果被加算,則是1*
p。其他值/規則可被適用於計算相位校正值。
在一實施例中,單一子頻帶信號是一複合子頻帶信號,而一區塊的相位能以多數不同方法計算。一種方法是採用區塊中間或環繞區塊中間的樣本且計算此一複合樣本的相位。針對每一樣本計算相位亦屬可行。
雖然在第18圖中係被繪示成一相位調整器在窗程式之後操作,此二方塊也能互換,使得相位調整被執行於由區塊擷取器所擷取的區塊且接著執行窗化操作。由於二操作,即窗化和相位調整是實值或複值乘算法,這兩個操作能被使用一複乘算法因數歸納成一單一操作,該複乘算法因數本身是相位調整乘算法因數與一窗化因數的乘積。
相位調整區塊被輸入一重疊/相加及振幅校正方塊1808,其中該窗化及調整相位區塊是被重疊相加。然而,更重要的是,在方塊1808中的樣本/區塊提前值不同於在區塊擷取器1800中被使用的值。特別地,在方塊1808的樣本/區塊提前值大於在方塊1800中使用的值e,所以方塊1808輸出信號之一時間伸展被獲得。因此,方塊1808輸出的已處理子頻帶信號長度比輸入至方塊1800中之子頻帶信號長度為長。當一頻寬擴展為二欲被獲得時,則樣本/區塊提前值被使用,該提前值是方塊1800中之對應值的兩倍。此造成一因數為二的時間伸展。然而當需要其他時間伸展因數時,則可使用其他的樣本/區塊提前值以使方塊1808的輸出有一需要的時間長度。
為了處理重疊問題,最好執行一振幅校正以便處理方塊1800和1808中之不同重疊的問題。然而,此一振幅校正也可以被引入窗程式/相位調整器乘算法因數中,但振幅校正也能被執行於重疊/處理之後。
在上述一區塊長度為12且在區塊擷取器中的樣本/區塊提前值為一之實例中,當執行二倍的頻寬擴展時,重疊/相加方塊1808的樣本/區塊提前值將等於二。此仍將造成一五區塊的重疊。當三倍的頻寬擴展被執行時,則方塊1808使用的樣本/區塊提前值等於三,且重疊將會下降至一重疊數三。當四倍頻擴展被執行時,則重疊/相加方塊1808必需使用四為樣本/區塊提前值,其仍將造成多於二區塊的重疊。
藉由將移調器支路的輸入信號限制成單只包含來源範圍可達成大幅計算減少,且此在一取樣率之下適應於每一移調階。此一系統對一基於子頻帶區塊的HFR產生器的基本區塊設計以第3圖中例示說明。輸入核心編碼器信號由在HFR分析濾波器排組之前的專用降取樣器處理。
各降取樣器的實質作用是濾除來源範圍信號且將其以最低可能的取樣率傳送至分析濾波器排組。此處,最低可能
指仍適於下游處理的最低取樣率,不必然是避免抽取後混疊的最低取樣率。取樣率轉換可以各種不同的方式被獲得。在不制本發明範圍之下將提供兩個實例:第一實例說明由多速率時域處理進行的重取樣,且第二實例說明藉由QMF子頻帶處理所達成的重取樣。
第4圖繪示一移調階為二的多速率時域降取樣器中之區塊的一實例。具有頻寬B
赫茲且取樣頻率為f S
的輸入信號被一複指數(401)調制以使來源範圍的開始被頻移到DC頻率如下
調制後之一輸入信號與頻譜的實例被繪示在第5(a)及(b)圖中。調制信號被插值(402)且以一複值低通濾波器用帶通限制0和B
/2赫茲濾波(403)。在各別步驟後的頻譜繪示於第5(c)和(d)圖。濾波信號接著被抽取(404)且信號的實部被計算(405)。這些步驟後的結果顯示在第5(e)和(f)圖中。在此一特別的實例中,當T=2,B=0.6時(在一歸一化標度上,也就是fs=2),為了要安全地涵蓋來源範圍,P2被選擇為24。降取樣因數得到
,其中分數已用公因數8化簡,因此,插值因數是3(如第5(c)圖所見),且抽取因數是8。藉由使用Noble恆等式[“Multirate Systems And Filter Banks,”",P.P. Vaidyanathan,1993,Prentice Hall,Englewood Cliffs],在第4圖中抽取器能被移動直到左方,且插值器能被移動直到右方。如此,調制和濾波是在最低可能取樣率上被完成且計算複雜度更進一步被減少。
另一途徑是使用已存在SBR HFR方法中之子取樣32頻帶分析QMF排組102的子頻帶輸出。涵蓋不同移調器支路的來源範圍之子頻帶由HFR分析濾波器排組之前的小子取樣的QMF排組合成至時域。此型態的HFR系統被說明於第6圖中。小QMF排組由子取樣原始的64頻帶QMF排組被得到,其中原型濾波器係數藉由原始原型濾波器的線性插值法被找出。注意第6圖中的標誌,在第二階移調器支路前的合成QMF排組具有Q2
=12個頻帶(在32頻帶QMF中具有零基索引8至19的子頻帶)。為了要避免在合成程序中混疊,第一(索引8)和最後(索引19)頻帶設為零。產生的頻譜輸出被顯示在第7圖。注意基於區塊的移調器分析濾波器排組有2 Q2
=24個頻帶,即與以多速率時域降取樣器為基礎的實例(第3圖)中數目相同的頻帶。
當第6圖和第23圖被比較時,可以瞭解第6圖的元件601對應於第23圖的分析濾波器排組2302。此外,第23圖的合成濾波器排組2304對應於元件602-2,且第23圖之另一分析濾波器排組2307對應於元件603-2。方塊604-2對應於方塊2309,且組合器605可對應於合成濾波器排組2311,但是在其他的實施例中,組合器能被配置成輸出子頻帶信號且此外被連接到組合器的另一合成濾波器排組可被使用。然而,取決於實施,稍後在第26圖的背景中所討論的一特定的高頻重建可在合成濾波前藉由合成濾波器排組2311或組合器205被執行,或能在第23圖之濾波器排組2311合成濾波之後或第6圖之方塊605中的組合器之後被執行。
從602-3延伸到604-3或從602-T延伸到604-T的其他支路未被繪示在第23圖中,但能以相似的方法被實施,除了濾波器排組的大小不同,其中第6圖中的T相當於一移調因數。然而,如在第27圖之背景中所討論者,移調因數3之移調與移調因數4之移調可被引入至由元件602-2至604-2所組成的處理支路中,因此方塊604-2不僅提供一因數2的移調,且亦與在第26與27圖之背景中討論之一使用的特定合成濾波器排組一起提供一因數3及一因數4的移調。
在第1圖中概略說明的系統可被視為第3與第4圖中概述之重取樣的一簡化特例。為了要簡化配置,調制器被省略。更進一步,所有的HFR分析濾波使用64頻帶的分析濾波器排組被獲得。因此,第3圖中的P2
=P3
=P4
=64,且第二、第三和第4階移調器支路之降取樣因數分別是1、1.5和2。
本發明的一項優點是在發明的臨界取樣處理環境下,對應於第23圖中的方塊2302或如在MPEG-4(ISO/IEC14496-3)中所定義之第6圖中的601的32頻帶分析QMF排組的子頻帶信號可被使用。MPEG-4中之分析濾波器排組的定義繪示在第25a圖之上方部分且在第25b圖中被繪示成一流程圖,其亦採取MPEG-4標準。此一標準的SBR(頻寬複製)部分係併入本文以供參考。具體地,第23圖之分析濾波器排組2302或第6圖之32頻帶QMF601可如第25a圖上方部分、第25b圖之流程圖所繪示被實施。
此外,第23圖的方塊2311所說明的合成濾波器排組也可被實施成在被如第25a圖的下方部分與第25c圖的流程表所指示者。然而,任何其他的濾波器排組定義可被應用,但是至少就分析濾波器排組2302而言,如第25a與25b中所說明的實施為較佳者,因為至少在頻寬擴展應用的環境,諸如頻寬複製,或通常而言,重建處理應用中,具有32通道之MPEG-4分析濾波器排組提供堅固性、穩定性和高品質。
合成濾波器排組2304被配置成子頻帶涵蓋移調器的一來源範圍的子集。此一合成是為了合成時域中的中間信號2306。最好,合成濾波器排組2304為一小子取樣實值QMF。
此一濾波器排組的時域輸出2306接著被饋給到一個濾波器排組兩倍大小的複值分析QMF排組。此一QMF排組以第23圖的方塊2307說明。此一程序使得當僅有相關的來源範圍被轉換到具有雙倍頻率解析度之QMF子頻帶域時使計算複雜度上能有大幅節省,小QMF排組由子取樣原始64頻帶的QMF排組被得到,其中原型濾波器係數藉由原始原型濾波器的線性插值被獲得。較佳地,與具有640個樣本的MPEG-4合成分析濾波器排組關聯的原型濾波器被使用,其中MPEG-4合成分析濾波器排組具有一320個窗樣本的窗。
子取樣濾波器排組的處理在繪示流程圖的第24a與24b圖中被描述。下列的變數首先被決定:
M S
=4‧floor{(f TableLow
(0)+4)/8+1}
k L
=startSubband2kL
(f TableLow
(0))
其中MS是子取樣合成濾波器排組的大小且k L
代表從32頻帶QMF排組進入子取樣合成濾波器排組的子頻道索引。陣列startSubband2kL
被列出於表1。函數floor(x}四捨五入自變數x為負朝無限大方向的最接近整數。
因此,值MS
定義第23圖的合成濾波器排組2304的大小,且KL
是在第23圖中指出之子集2305的第一通道。明確地,在方程式ftableLow
中的值定義於ISO/IEC 14496-3,section 4.6.18.3.2,該標準也被合併在本文中以供參考。注意到值MS
是以4增量的狀態,意指合成濾波器排組2304的大小可為4,8,12,16,20,24,28,或32。
最好,合成濾波器排組2304是一實值合成濾波器排組。為此,一組MS實值子頻帶樣本依據第24a圖的第一步驟從MS新複值子頻帶被計算。下列的方程式為此一目的被使用
在方程式中,exp()指示複指數函數,i是虛數單位且k L
前已定義。
‧使陣列v的樣本移調2MS位置。最舊的2個MS樣本被丟棄。
‧MS實值子頻帶樣本是與矩陣N相乘,亦即,矩陣-向量乘積N‧V被計算,其中
此一操作的輸出被儲存在陣列v的0-至2MS-1位置。
‧依據第24a圖中的流程圖從v擷取樣本以產生10M S
-元素的陣列g。
‧陣列g的樣本乘以窗ci以產生陣列w。窗係數ci由係數c的線性插值,即透過以下方程式被獲得
其中μ
(n
)和ρ
(n
)分別被定義成64‧n
/M S
的整數與分數部分。窗係數c可在ISO/IEC 14496-3:2009之表4.A87中找到。
因此,合成濾波器排組具有一原型窗函數計算器,用於藉由使用一具有不同大小的濾波器排組之儲存窗函數子取樣或插值來計算一原型窗函數。
‧依據第24 a圖中之流程圖的最後一步驟藉由陣列w的樣本總和計算MS的新輸出樣本。
接著,在第23圖中的另一分析濾波器排組2307的較佳實施與流程圖一起被說明於第24 b圖中。
‧依據第24b圖的第一步驟使陣列x的樣本移調2M S
位置。最舊的2M S
樣本被丟棄且2M S
新樣本被儲存在位置0-至2M S
-1中。
‧陣列x的樣本乘以窗係數c2i
。窗係數c2i
由係數c的線性插值,亦即透過以下方程式獲得
其中μ
(n
)和ρ
(n
)分別被定義成32‧n
/M S
的整數與分數部分。窗係數c可在ISO/IEC 14496-3:2009之表4.A87中找到。
因此,另一分析濾波器排組2307具有一原型窗函數計算器,用於藉由使用一具有不同大小的濾波器排組之儲存窗函數子取樣或插值來計算一原型窗函數。
‧依據第24b圖中之流程圖的公式總計樣本以產生4M S
-元素的陣列u。
‧藉複值矩陣-向量乘法運算M‧u計算2M S
的新子頻帶樣本,其中
在方程式中,exp()表示複指數函數,且i為虛數單位。
一因數2的降取樣器的方塊圖繪示在第8(a)圖中。新的實值低通濾波器可被寫成H
(z
)=B
(z
)/A
(z
),其中B
(z
)是非遞迴部份(FIR)且A(z
)是遞迴部份(IIR)。然而,為了有效實施,使用Noble恆等式以減少計算的複雜度,設計一濾波器其中所有極點具有重數2(雙極點)如A
(z 2
)是有益的。因此濾波器可以被分解成如第8(b)圖所示。使用Noble恆等式1,遞迴部份可如同在第8(c)圖地被移動通過取樣器。非遞迴濾波器B
(z
)可使用標準的2‧3=6成分多相分解被實施
因此,降取樣器可被可能被構造成如第8(d)圖所示。在使用Noble恆等式1之後,FIR部份以最低可能取樣率被計算,如第8(e)圖所示。從第8(e)圖很容易看出FIR操作(延遲、抽取及多相成分)可被視為一使用二樣本輸入步長的窗-相加操作。對於二輸入樣本,一新輸出樣本將被生成,有效地造成因數2的降取樣。
因數1.5=3/2降取樣器的一方塊圖繪示在第9(a)圖中。實值低通濾波器可以再度被寫成H
(z
)=B
(z
)/A
(z
),其中B
(z
)是非遞迴部份(FIR)且A
(z
)是遞迴部份(IIR)。如同前述,為了有效實施,使用Noble恆等式以減少計算的複雜度,設計一濾波器其中所有極點各別地具有重數2(雙極點)A
(z 2
)抑或重數3(三極點)A
(z 3
)任一者是有益的。此處,雙點被選擇作為低通濾波器的設計演算法更加有效,但遞迴部份與三極點方式相較在實施上複雜1.5倍。因此濾波器可被分解成如第9(b)圖所示。使用Noble恆等式2,遞迴部份可以被移動在插值器之前,如第9(c)圖所示。非遞迴濾波器B
(z
)可使用標準2‧3=6成分多相分解被實施
因此,降取樣器可被構造成如第9(d)圖中所示。在使用Noble恆等式1和2之後,FIR部份以最低可能取樣率被計算,如第9(e)圖中所繪示。從第9(e)圖很容易看出偶數索引輸出樣本使用較低組的三個多相濾波器E 0
(z
),E 2
(z
),E 4
(z
)被計算,而奇數索引的樣本由較高組E 1
(z
),E 3
(z
),E 5
(z
)被計算。每一組(延遲鏈,取樣和多相元件)的操作可被視為一使用三樣本輸入步長的窗-相加操作。上方組使用的窗係數是奇數索引係數,而下方組使用來自原始濾波器B
(z
)的奇數索引係數。因此,對於一組三個輸入樣本,二新輸出樣本將被生成,有效地造成因數1.5的降取樣。
來自核心解碼器(第1圖中之101)的時域信號在核心解碼器中也可使用一較小的子取樣合成轉換被子取樣。使用一較小的合成轉換甚至提供更進一步減少的計算複雜度。取決於交越頻率,即核心編碼器信號的頻寬,合成轉換尺度與標稱尺度Q(Q<1)的比率,造成一具有一取樣率Qfs
的核心編碼器輸出信號。在本應用中概述之實例中處理子取樣核心編碼器信號時,所有的分析濾波器排組1(102,103-32,103-33和103-34),連同第3圖的降取樣器(301-2,301-3和301-T),第4圖的取樣器404,以及第6圖的分析濾波器排組601需要以因數Q比例縮放。顯然地,Q必須被選擇成使所有的濾波器排組大小是整數。
第10圖說明HFR移調信號的頻譜邊界與一HFR增強型解碼器,諸如SBR[ISO/IEC 14496-3:2009,資訊技術-音視對象之編碼-第三部分:音頻]中的包跡調整頻率表的對準。第10(a)圖繪示包含包跡調整表的頻帶的格式圖,所稱之比例因數涵蓋從交越頻率k x
到終止頻率k s
的頻率範圍。比例縮放因數頻帶構成在一HFR增強型解碼器中調整再生高頻帶頻率之能階,即頻率包跡時所使用的頻率格柵。為了調整包跡,信號能量對一受比例因數頻帶邊界與選擇時間邊界限制的時間/頻率區塊平均。如果由不同移調階產生的信號不對準比例因數頻帶,如第10(b)圖中所示,由於包跡調整程序將頻譜結構維持於一比例因數頻帶中,若頻譜能量在移調頻帶邊界附近激烈變化則偽差產生。因此,建議的解決方法是令移調信號的頻率邊界適應如第10(c)圖中所示之比例因數頻帶的邊界。在此圖中,由移調階2與3(T
=2,3)產生之信號的上邊界與第10(b)圖相較降低一小量,俾使移調頻帶的頻率邊界對準現存的比例因數頻帶邊界。
一顯示當使用非對準邊界時的潛在偽差的現實情景繪示在第11圖。第11(a)圖再度顯示比例因數頻帶邊界。第11(b)圖顯示移調階T
=2,3和4之未調整HFR連同核心解碼基礎頻帶信號。第11(c)繪示當採用一平坦目標包跡時的包跡調整信號。具有網紋區域的區塊代表具有高頻帶內能量變化的比例因數頻帶,其可引起輸出信號中的異常。
第12圖說明第11圖之情景,但此次使用對準的邊界。第12(a)圖繪示比例因數頻帶邊界,第12(b)圖描繪移調階T=2,3和4之未調整HFR產生的信號連同核心解碼基礎頻帶信號,且與第11(c)圖一致地,第12(c)圖顯示當採用一平坦目標包跡時的包跡調整信號。由此圖中可見,因移調信號頻帶與比例因數頻帶未對準,故沒有具高頻帶內能量的比例因數頻帶,且因此潛在偽差被減少。
第13圖說明HFR限制器頻帶邊界,例如在[SBR[ISO/IEC 14496-3:2009,資訊技術-音視對象之編碼-第三部分:音頻]中被描述對在一HFR增強型解碼器中之諧波修補的適應。限制器在一具有遠粗於比例因數之解析度的頻帶上操作,但操作原則非常相同。在限制器中,每一個限制器頻帶的平均增益值被計算。個別增益值,亦即,針對每一比例因數頻帶被計算的包跡增益值不允許超過限制器平均增益值的一特定乘算因數以上。限制器的目的是抑制每一限制器頻帶內的比例因數頻帶增益的大變化。雖然移調器產生頻帶對比例因數的適應確保一比例因數頻帶內的頻帶內能變化小,依據本發明,限制器頻帶邊界對移調器頻帶邊界的適應處理經移調器處理之頻帶間的較大尺度能量差。第13(a)圖繪示移調階T=2,3和4的HFR產生信號。不同移調信號的能階差可能實質上不同。第13(b)圖繪示限制器的頻帶,該限制器典型地是在一對數頻標上具有固定寬度。移調器頻帶邊界被相加成固定的限制器邊界且剩下的限制器邊界被重新計算以將對數關係維持儘可能接近,如同在第13(c)圖的實例中說明。雖然某些層面已經就裝置的背景說明,顯然地這些層面也相當於對應之方法的描述,其中一方塊或裝置對應於一方法步驟或一方法步驟的特徵。
更進一步的實施例使用在第21圖中繪示之一混合修補系統,其中在一時間方塊內的混合修補方法被執行。為完全涵蓋HF頻譜的不同區域,BWE包含數個修補。在HBE中,較高的修補需要在相位聲碼器中的高移調因數,此特別地降低暫態的知覺品質。
因此實施例最好藉由計算上有效的SSB複製修補產生佔據上方頻譜區域的較高階修補,並最好藉由HBE修補產生諧波結構欲被維持的涵蓋中間頻譜區域的較低階修補。修補方法的個別混合可以隨時間經過是靜態的,或最好是在位元流中獲得信號。
關於複製操作,低頻訊息可如第21圖所示被使用。或者,來自使用HBE方法產生之修補的資料可如同第21圖所示被使用。後者導致對於較高修補的較不密集音調結構。除這兩個實例之外,複製與HBE的一切可能組合也是可以想到的。
所提出概念的優點是
‧改進暫態知覺品質
‧減少計算複雜度
第26圖說明頻寬擴展的一較佳處理鏈,其中不同的處理操作能在方塊1020a,1020b指出的非線性子頻帶處理中被實行。級聯濾波器排組2302,2304,2307在第26圖中以方塊1010代表。此外,方塊2309可對應於元件1020a,1020b且包跡調整器1030可安置在第23圖的方塊2309與方塊2311之間,或可安置成在方塊2311之處理後。在此一實施中,已處理時域信號,諸如頻寬擴充信號的頻帶選擇性處理是在時域而非子頻帶域中被執行,該子頻帶域存在於合成濾波器排組2311之前。
第26圖說明依據另一實施例從一低頻帶信號1000產生頻寬擴充音訊信號的裝置。裝置包含一分析濾波器排組1010,一子頻帶非線性子頻帶處理器1020a,1020b,一其後相連的包跡調整器1030或,就一般而言,在高頻重建參數,例如,參數線1040之輸入上操作的高頻重建處理器。包跡調整器,或就一般而言,高頻重建處理器處理每一子頻帶的個別子頻帶信號且將每一子頻帶通道的已處理子頻帶信號輸入合成濾波器排組1050中。合成濾波器排組在其較低通道輸入信號上接收低頻帶核心核心解碼器信號的一個子頻帶表示。視實施而定,低頻帶也能由第26圖中的分析濾波器排組1010的輸出導出。移調子頻帶信號饋給至合成濾波器排組的較高濾波器排組通道內以實行高頻重建。
濾波器排組1050最後輸出一移調器輸出信號,其包含移調因數2,3和4之頻寬擴展,且方塊1050輸出的信號頻寬不再被限制於交越頻率,即不再被限制於相當於SBR或HFR產生之信號成分的核心編碼器信號的最高頻率。
在第26圖實施例中,分析濾波器排組執行一增加至兩的取取樣且有一特定的分析子頻帶間距1060。合成濾波器排組1050有一合成子頻帶間距1070,在本實施例,此係使分析子頻帶間距大小加倍,將造成一稍後將在第27圖的背景中討論的移調貢獻。
第27圖說明第26圖中之非線性子頻帶處理器1020a的較佳實施例的一詳細實施。第27圖繪示的電路接收一子頻帶信號108作為一輸入,其在三個「支路」中被處理:上支路110a是用來以一移調因數2移調。在第27圖中間以110b標示的支路是用來以一移調因數3移調,且第27圖中以參考數字110c標示的下支路是用於以一移調因數4移調。然而,由第27圖中的每一處理元件所獲得的實際移調對支路110a僅是1(即沒有移調)。由第27圖中繪示的處理元件對於中間支路110b所獲得的實際移調等於1.5且對下支路所獲得之實際移調等於2。此以數字指示於第27圖左方標示移調因數T的括弧內。1.5和2移調代表藉由在支路110b,110c中進行一個抽取操作及藉由重疊與相加處理器的時間伸展所獲得的第一移調貢獻。第二貢獻,即移調的加倍是由合成濾波器排組105所獲得,該合成濾波器排組105有一兩倍於分析濾波器排組子頻帶間距的合成子頻帶間距107。因此,因為合成濾波器排組具有兩倍的分析子頻帶間距,任何取樣功能不在支路110a中發生。
然而,支路110b具有一取樣功能以便獲得一1.5的移調。由於事實上合成濾波器排組具有兩倍的分析濾波器排組實際子頻帶間距,一移調因數為3被獲得,如標示在第27圖中之第二支路110b的區塊擷取器左方。
類似地,第三支路有一對應於移調因數2的取樣功能,且分析濾波器排組與合成濾波器排組中之不同子頻帶間距的最貢獻對應第三支路110c的一移調因數4。
特別地,每一支路有一區塊擷取器120a,120b,120c且每一個這些區塊擷取器均可與第18圖的區塊擷取器1800類似。此外,每一支路有一相位計算器122a,122b和122c,且相位計算器可與第18圖的相位計算器1804類似。再者,每一支路有一相位調整器124a,124b,124c且此相位調整器能與第18圖的相位調整器1806類似。此外,每一支路有一窗程式126a,126b,126c,其中這些窗程式的每一者可與第18圖的窗程式1802類似。然而,窗程式126a,126b,126c也能配置成連同若干「補零」一起應用一矩形窗。在第27圖的實施例中,來自每一支路110a,110b,110c的移調或修補信號被輸入加法器128,加法器128將來自每一支路的貢獻加到現行子頻帶信號以便最終在加法器128的輸出得到所謂的移調區塊。然後,一重疊-相加程序在重疊-加法器130中被執行,且重疊-加法器130可與第18圖之重疊/相加方塊1808相似。重疊-加法器應用一重疊相加提前值2-e,其中e是區塊擷取器120a,120b,120c的重疊-提前值或「步長值」,且重疊加法器130輸出移調之信號,其在第27圖的實施例中是一對通道k,即對目前觀察到的子頻帶通道的單一子頻帶輸出。第27圖中的處理對於每一分析子頻帶或對於一特定群組的分析子頻帶被執行,且如第26圖中繪示,移調之子頻帶信號在由方塊1030處理之後被輸入到合成濾波器排組1050而最後在方塊1050的輸出獲得移調器輸出信號。
在一個實施例中,第一移調器支路110a的區塊擷取器120a擷取10個子頻帶樣本且其後這10個QMF子頻帶樣被執行本轉換為極坐標。由相位調整器124a產生之輸出接著被發送到窗程式126a,窗程式126a對區塊的第一與最後一值以零擴展輸出,此一操作等同於一長度10之矩形窗的(合成)窗化。在支路110a中的區塊擷取器120a不執行抽取。因此,由區塊擷取器擷取的樣本以他們被擷取的同一試樣間距被映射至一被擷取的區塊之內。
然而,對於支路110b和110c這是不同的。區塊擷取器120b最好擷取一8個子頻帶樣本的區塊且將擷取區塊中的這8個子頻帶樣本以不同的子頻帶樣本間距分配。擷取區塊的非整數子頻帶樣本項目由插值獲得,且如此得到的QMF樣本連同插值的樣本一起被轉換到極坐標而由相位調整器處理。然後,再度執行窗程式中的窗化以便藉由相位調整器124b對最初及最後的二樣本用零擴充b區塊輸出,此操作相等於一長度8之矩形窗的(合成)窗化.
區塊擷取器120c配置成用於擷取一具有6子頻帶樣本的時間寬度且執行一抽取因數2的抽取,完成QMF樣本的極坐標轉換且再度執行相位調整器124b中的操作,且輸出再次以零延伸,然而目前是針對最初三個子頻帶樣本與最後三個子頻帶樣本。此一操作相等於以一長度6之矩形窗的(合成)窗化。
每一支路的移調輸出接著被加算以形成以加法器128輸出的組合QMF,且組合QMF輸出最後在方塊130中使用重疊加法器被疊加,其中該重疊相加提前值或步長值為前文所述之區塊擷取器120a,120b,120c的兩倍。
一個實施例包含藉由使用子頻帶區塊基礎的諧波移調解碼一音訊信號的一種方法,包含一核心解碼信號經由一M-頻帶分析濾波器排組濾波以獲得一組子頻帶信號;藉由具有一減少子頻帶數目的子取樣合成濾波器排組合成該子頻帶信號的一子集,以獲得子取樣來源範圍信號。
一實施例與一種對準HFR產生信號之頻譜帶邊界與參數程序中所利用的頻譜邊界的方法有關。
一實施例與一種對準HFR產生信號之頻譜帶邊界與包跡調整頻率表的方法有關,包含:搜尋包跡調整頻率表中不超過移調因數T之HFR產生信號的基本頻寬限制的最高邊界;且使用找到的最高邊界作為移調因數T之HFR產生信號的頻率限制。
一實施例與一種對準限制器工具之頻譜邊界與HFR產生信號之頻譜邊界的方法有關,包含:將HFR產生信號的頻率邊界加到在建立限制器工具所使用之頻帶邊界的邊界表;且強制限制器使用該加入的頻率邊界為常量邊界並相應地調整剩餘的邊界。
一實施例與一音訊信號的組合移調有關,包含在一低解析度濾波器排組域中的一些整數移調階,其中該移調操作被執行於子頻帶信號的時間區塊上。
一進一步的實施例與組合移調有關,其中大於2的移調階被嵌入一2階移調環境中。
一進一步的實施例有關於組合移調,其中大於3的移調階被嵌入一3階移調環境中,而低於4的移調階分開地被執行。
一進一步的實施例有關於組合移調,其中移調階(例如移調階大於2)是藉由複製包含核心編碼頻寬之先前計算移調階(即尤其是較低階)被建立。可利用之移調階與核心頻寬階的每一可得組合皆可行而無限制。
一實施例與由於移調所需要的分析濾波器排組減少數目的計算複雜度減少有關。
一實施例與從一輸入音訊信號產生一雨頻寬擴展信號的裝置有關,該裝置包括一用於修補一輸入音訊信號以獲得一第一修補信號與一第二修補信號的修補程式,該第二修補信號具有與第一修補信號相較為不同的一修補頻率,其中該第一修補信號使用一第一修補演算法被產生,且該第二修補信號使用一第二修補演算法被產生;以及一用於組合第一修補信號與第二修補信號以獲得頻寬擴展信號的組合器。
與此一裝置有關的一另一實施例其中第一修補演算法是一諧波修補演算法,且第二修補演算法是一非諧波的修補演算法。
與前述裝置有關的另一實施例中,修補頻率低於第二修補頻率或反之亦然。
與前述裝置有關的又一實施例中,輸入信號包含一修補訊息;且其中修補程式配置成由從輸入信號擷取的修補訊息控制,以依據修補訊息改變第一修補演算法或第二修補演算法。
與前述裝置有關的另一實施例中,該修補程式係可運作用以修補音訊信號樣本的隨後區塊,且其中該修補程式配置成將第一修補演算法和第二修補演算法應用至音訊樣本的相同區塊。
與前述裝置有關的另一實施例中,一修補程式以任意順序包含一由頻寬擴展因數控制的抽取器,一濾波器排組和一用於濾波器排組子頻帶信號的伸展器。
與前述裝置有關的又一實施例中,伸展器包含依據一擷取提前值擷取一些重疊區塊的一個區塊擷取器;基於一窗函數或一相位校正調整每一區塊中之子頻帶樣本值的相位調整器;以及使用一大於擷取提前值的重疊提前值執行窗化及相位調整區塊之一重疊相加處理。
有關於一頻寬擴展一音訊信號的裝置的進一步實施例包含:用於濾波音訊信號以獲得降取樣子頻帶信號的濾波器排組;用於以不同方式處理不同的子頻帶信號的複數不同子頻帶處理器,該子頻帶處理器使用不同的伸展因數執行不同的子頻帶信號時間伸展操作;以及一合併由複數不同之子頻帶處理器輸出的處理子頻帶以獲得一頻寬擴展音訊信號的合併器。
一進一步的實施例有關於一用於降取樣一音訊信號的裝置,包含一調制器;使用一插值因數的一插值器;一複值低通濾波器;以及一使用一抽取因數的抽取器,其中該抽取因數高於插值因數。
一實施例有關於一用以降取樣一音訊信號的裝置,包含:由音訊信號產生複數子頻帶信號的第一濾波器排組,其中該子頻帶信號的取樣率小於音訊信號的取樣率;至少一跟隨有分析濾波器排組的合成濾波器排組,用來執行樣本率轉換,合成濾波器排組的通道數目不同於分析濾波器排組的通道數目;用於處理樣本率已轉換信號的時間伸展處理器;以及用於組時間伸展信號和一低頻帶信號或一不同時間伸展信號的組合器。
另一實施例有關於用以藉由一非整數降取樣因數降取樣一音訊信號的裝置,包含:一數位濾波器;一具有一插值因數的插值器;一具有數與偶數分接頭之多相元件;及一具有大於插值因數的一抽取因數的抽取器,該抽取因數與插值因數係被選擇成使得插值因數與抽取因數的比率是非整數。
一實施例與處理一音訊信號的裝置有關,包含:一合成轉換大小為標稱轉換大小的一因數的核心解碼器,所以一輸出信號是由一取樣率小於對應於標稱轉換大小之標稱取樣率的核心解碼器所產生;以及一具有一或更多濾波器排組、一或更多時間伸展器及一合併器的後處理器,其中該一或更多濾波器排組的濾波器排組通道數目相較於由標稱轉換大小決定之數目被減少。
另一實施例有關用以處理一低頻帶信號的裝置,包含:一修補產生器用於利用低頻帶音訊信號產生多數修補;使用給予具有比例因數頻帶邊界的鄰接比例因數頻帶調整信號之一包跡,其中該修補產生器配置成執行多重修補,使得鄰接修補之間的邊界與頻標中鄰接比例因數頻帶間的邊界一致。
一實施例與用來處理一低頻帶音訊信號的裝置有關,包含:一用以使用低頻帶音訊信號產生多個修補的修補產生器;及一藉由在具有限制器頻帶邊界之相鄰限制器頻帶中的限制來限制一信號的包跡調整值的包跡調整限制器,其中該修補產生器配置成執行多重修補以使得相鄰修補之間的邊界與一頻標中的相鄰限制器頻帶間的邊界一致。
本發明之處理可有效強化依賴一頻寬擴展系統的音訊編解碼器,尤其是若一給定的位元率下一最佳的知覺品質高度地重要且同時處理電源為一受限制資源之下。
最傑出的應用是音訊解碼器,通常被實施在手持裝置上且因而以一電池電源操作。
本發明之編碼音訊信號能被儲存在一數位儲存媒體上,或可在諸如一無線傳輸媒體或一有限傳輸媒體的一傳輸媒體,諸如網際網路上被傳輸。
視特定的實施需求而定,本發明的實施例能在硬體或軟體中被實施。實施可利用一數位儲存媒體被執行,舉例而言,一軟式磁碟、一數位影像光碟、一光碟、一唯讀記憶體、一可程式唯讀記憶體、一可抹除程式化唯讀記憶體,或者快閃記憶體,其上儲存有電子可讀控制信號,其與一可程式的電腦系統合作(或能夠合作)以使得各別的方法被執行。
依據本發明的一些實施例包含一具有電子可讀控制信號的資料載體,該控制信號能夠與一可程式的電腦系統合作,使得本文中所描述的諸方法中之一者被執行。
通常,本發明的實施例可被實施成一具有程式碼的電腦程式產品,程式碼在電腦程式於一電腦上執行時可操作內來執行諸方法中之一者。程式碼例如可被儲存在一機器可讀的載體上。
其他的實施例包含執行本文所描述之諸方法之一的電腦程式,儲存在一機器可讀的載體上。
換句話說,本發明方法的一實施例因此是一具有程式碼的電腦程式,當電腦程式在一電腦上執行時該程式碼用來實施本文所述之諸方式中之一。
本發明方法的又一實施例因此是一資料載體(或一數位儲存介體,或一電腦可讀媒體)包含被儲存於其上可供執行本文所描述的諸方法之一的電腦程式。
本發明方法的另一實施例因此是一資料流或一代表用來執行本文所描述衣諸方法之一的電腦程式的信號序列。資料流或信號序列例如可配置成經由一資料通訊連接,例如經由網際網路被轉移。
另一實施例包含一處理設備,例如一電腦、或一可程式的邏輯裝置,該邏輯裝置被配置或適應為執行本文所描述的諸方法中之一。
又一實施例包含其上安裝有用於執行本文描述的諸方法之一的電腦程式的電腦。
在一些實施例中,一可程式邏輯裝置(例如現場可程式邏輯閘陣列)可被使用來執行本文描述方法的一些或全部功能。在一些實施例中,一現場可程式邏輯閘陣列可與一微處理器合作俾執行本文所描述的諸方法之一。通常,方法最好由任一硬體裝置執行。
上述的實施例僅供說明本發明的原理。可以瞭解本文所述之配置及細節的修改與變化對於熟習此技藝者是顯而易見的。因此僅意圖被隨後的專利申請範圍所限制,而不受本文中的實施例描述與說明提出的特定細節所限。
文獻:
[1] M. Dietz,L. Liljeryd,K. Kjrling and O. Kunz,“Spectral Band Replication,a novel approach in audio coding,”in 112th AES Convention,Munich,May 2002.
[2] S. Meltzer,R. Bhm and F. Henn,“SBR enhanced audio codecs for digital broadcasting such as“Digital Radio Mondiale”(DRM),”in 112th AES Convention,Munich,May 2002.
[3] T. Ziegler,A. Ehret,P. Ekstrand and M. Lutzky,“Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,”in 112th AES Convention,Munich,May 2002.
[4] International Standard ISO/IEC 14496-3:2001/FPDAM 1,“Bandwidth Extension,”ISO/IEC,2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al
[5] E. Larsen,R. M. Aarts,and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention,Munich,Germany,May 2002.
[6] R. M. Aarts,E. Larsen,and O. Ouweltjes. A unified approach to low-and high frequency bandwidth extension. In AES 115th Convention,New York,USA,October 2003.
[7] K. Kyhk. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report,Helsinki University of Technology,Laboratory of Acoustics and Audio Signal Processing,2001.
[8] E. Larsen and R. M. Aarts.Audio Bandwidth Extension-Application to psychoacoustics,Signal Processing and Loudspeaker Design.John Wiley & Sons,Ltd,2004.
[9] E. Larsen,R. M. Aarts,and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention,Munich,Germany,May 2002.
[10] J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics,AU-21(3),June 1973.
[11] United States Patent Application 08/951,029,Ohmori,et al. Audio band width extending system and method
[12] United States Patent 6895375,Malah,D & Cox,R. V.: System for bandwidth extension of Narrow-band speech
[13] Frederik Nagel,Sascha Disch,“A harmonic bandwidth extension method for audio codecs,”ICASSP International Conference on Acoustics,Speech and Signal Processing,IEEE CNF,Taipei,Taiwan,April 2009
[14] Frederik Nagel,Sascha Disch,Nikolaus Rettelbach,“A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs,”126th AES Convention,Munich,Germany,May 2009
[15] M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics,Mohonk 1995.",Rbel,A.: Transient detection and preservation in the phase vocoder;citeseer.ist.psu.edu/679246.html
[16] Laroche L.,Dolson M.:“Improved phase vocoder timescale modification of audio",IEEE Trans. Speech and Audio Processing,vol. 7,no. 3,pp. 323--332,
[17] United States Patent 6549884 Laroche,J. & Dolson,M.: Phase-vocoder pitch-shifting
[18] Herre, J.; Faller, C.; Ertel, C.; Hilpert, J.; Hölzer, A.; Spenger, C, “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio,” 116th Conv. Aud. Eng. Soc., May 2004
[19] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jérémie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates, ICASSP 2009, April 19-24, 2009, Taipei, Taiwan Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jérémie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126th AES Convention, May 7, 2009, München
101...核心解碼器
103...HFR模組
1020a,1020b...子頻帶非線性子頻帶處理器
107...合成子頻帶間距
108...子頻帶信號
1010...分析濾波器排組
1020a...非線性子頻帶處理器
1030...包跡調整器
1040...參數線
105...HFR處理模組
1050...合成濾波器排組
106...合成QMF排組
1060...分析子頻帶間距
1070...合成子頻帶間距
110a...上支路
110c...下支路
102...核分析濾波器排組
104...合併/組合單元
106...合成QMF排組
120a,120b,120c...區塊擷取器
122a,122b和122c...相位計算器
124a,124b,124c...相位調整器
124b...相位調整器
126a,126b,126c...窗程式
128...加法器
130...重疊-加法器
1401...分析濾波器排組
1402...子頻帶處理裝置
1403...合成濾波器排組
1501...核心解碼器
1502...分析排組
1503...多重移調器
1504...HFR處理單元
1505...合成排組
1601-3...取樣率轉換器
1601-4...取樣率轉換器
1602-2...64頻帶QMF分析
1603...區塊移調
1603-2...子頻帶處理單元
1603-3...子頻帶處理單元
1603-4...子頻帶處理單元
1604...合併單元
1603...區塊移調
1603-2...子頻帶處理單元
1603-3...子頻帶處理單元
1603-4...子頻帶處理單元
1800...區塊擷取器
1802...窗程式
1804...相位計算器
1806...相位調整器
1808...重疊/相加方塊/振幅校正方塊
201...區塊擷取器
204...重疊及加法單元
205...組合器
2300...線
2301...核心音訊解碼器
2302...分析濾波器排組
2303...M子頻帶信號
2304...合成濾波器排組
2305...子集通道
2306...中間音訊信號
2307...另一分析濾波器排組
2308...子頻帶信號
2309...處理器
2310...子頻帶
2311...合成波器排組
第1圖說明在一HFR增強型解碼器架構中使用2、3及4階移調之一基於區塊移調器的操作;
第2圖說明第1圖中之非線性子頻帶伸展單元的操作;
第3圖說明第1圖的基於區塊移調器的有效實施,在HFR分析濾波器排組之前的重取樣器和帶通濾波器使用多速率時域重取樣器及基於QMF的帶通濾波器被實施;
第4圖繪示可供有效實施第3圖的多速率時域重取樣器的一建構塊的實例;
第5a-5f圖說明對於以第4圖中之不同方塊2階移調處理的一信號實例的效果;
第6圖說明第1圖之基於區塊移調器的有效 施,在HFR分析濾波器排組之前的重取樣器和帶通濾波器被更換成在從一32-頻帶分析濾波器排組中選出的子頻帶上操作的小子取樣合成濾波器排組;
第7圖說明說明對於以第6圖中之一子取樣合成濾波器排組2階移調處理之一實例信號的效果;
第8a-8e圖說明一因數2之有效多速率時域降取樣器的實施塊;
第9a-9e圖說明一因數3/2之有效多速率時域降取樣器的實施塊;
第10a-10c圖說明在一HFR增強型編碼器中的HFR移調器信號之頻譜邊界與包跡調整頻帶之邊界的對準;
第11a-11c圖說明在由於未對準之HFR移調器信號頻譜邊界物而出現偽差的情形;
第12a-12c圖說明第11圖之偽差由於HFR移調器信號之對準頻譜邊界而被避免的情形;
第13a-13c圖說明限制器工具中的頻譜邊界適應HFR移調器信號的頻譜邊界;
第14圖說明基於子頻帶區塊的諧波移調原則;
第15圖繪示在一HFR增強型音頻編解碼器中使用數階移調之基於子頻帶區塊移調的應用的一實例情形;
第16圖繪示每一移調階應用一單獨之分析濾波器排組的基於多階子頻帶區塊移調之操作的一前案實例情形;
第17圖繪示有效操作應用一單一64頻帶QMF分析濾波器排組之一多階基於子頻帶移調的一發明實例情形;
第18圖說明形成以子頻帶信號處理的另一實例;
第19圖說明一邊帶調制(SSB)修補;
第20圖說明一諧波頻寬擴展(HBE)修補;
第21圖說明一混合修補,第一修補是藉由頻率擴展而產生且第二修補是藉由一低頻部分的SSB拷貝而產生;
第22圖說明對一SSB拷貝操作利用第一HBE以產生一第二修補的一種可選擇的混合修補;
第23圖說明分析與合成濾波器排組的一較佳級聯結構;
第24a圖說明第23圖之小合成濾波器排組的一較佳實施;
第24b圖說明第23圖的另一分析濾波器排組的一較佳實施;
第25a圖說明ISO/IEC 14496-3: 2005(E)的某種分析與合成濾波器排組的概觀,且特別是一可被使用作第23圖之分析濾波器排組之一分析濾波器排組的實施,以及可使用作第23圖之最後合成濾波器排組的一合成濾波器排組的實施;
第25b圖以第25a圖之分析濾波器排組的一流程圖說明一種實施;
第25c圖說明第25a圖之合成濾波器排組之一較佳實施;
第26圖說明在一頻寬擴展處理背景中之架構的概觀;以及
第27a-27b圖說明藉由第23圖的另一分析濾波器排組處理子頻帶信號輸出的一較佳實施。
2301...核心音訊解碼器
2302...分析濾波器排組
2303...M子頻帶信號
2304...合成濾波器排組
2305...子集通道
2306...中間音訊信號
2307...另一分析濾波器排組
2308...子頻帶信號
2309...處理器
2310...子頻帶
2311...合成波器排組
Claims (22)
- 一種處理一輸入音訊信號的裝置,包含:一合成濾波器排組,用以從該輸入音訊信號合成一音訊中間信號,該輸入音訊信號係由一分析濾波器排組產生之複數第一子頻帶信號表示,其中該合成濾波器排組的濾波器排組通道數目小於該分析濾波器排組的通道數目;以及一另一分析濾波器排組,用以從該音訊中間信號產生複數第二子頻帶信號,其中該另一分析濾波器排組具有一與該合成濾波器排組的通道數目不同的通道數目,使得該等複數第二子頻帶信號之一子頻帶信號的取樣率與該等複數第一子頻帶信號的一第一子頻帶信號的取樣率不同。
- 依據申請專利範圍第1項之裝置,其中該合成濾波器排組是一實值濾波器排組。
- 依據申請專利範圍第1項之裝置,其中該等複數第一子頻帶信號之第一子頻帶信號的數目大於或等於24,且其中該合成濾波器排組的濾波器排組通道數目是小於或等於22。
- 依據申請專利範圍第1項的裝置,其中該合成濾波器排組組配來僅用於處理代表全頻寬輸入音訊信號的該等複數第一子頻帶信號的所有第一子頻帶信號的一子群,且其中該合成濾波器排組組配來用於產生該音訊中間信號作為調制到基本頻帶之全頻寬輸入音訊信號的一頻帶片 段。
- 依據申請專利範圍第1項的裝置,進一步包含:該分析濾波器排組用於接收該輸入音訊信號之一時域表示並用於分析該時域表示以獲得該等複數第一子頻帶信號,其中該等複數第一子頻帶信號的一個子群被輸入至該合成濾波器排組內,且其中該等複數第一子頻帶信號的剩餘子頻帶信號不被輸入至該合成濾波器排組內。
- 依據申請專利範圍第1項的裝置,其中該分析濾波器排組是一複值濾波器排組,其中該合成濾波器排組包含一用於自該等第一子頻帶信號計算實值子頻帶信號的實值計算器,其中由該實值計算器所計算的該等實值子頻帶信號進一步由該合成濾波器排組處理以獲得該音訊中間信號。
- 依據申請專利範圍第1項的裝置,其中該另一分析濾波器排組是一複值濾波器排組而且組配來產生該等複數第二子頻帶信號為複合子頻帶信號。
- 依據申請專利範圍第1項的裝置,其中該合成濾波器排組、該另一分析濾波器排組或該分析濾波器排組組配來使用同一濾波器排組窗的子取樣版本。
- 依據申請專利範圍第1項的裝置,進一步包含:一子頻帶信號處理器,用於處理該等複數第二子頻帶;及一另一合成濾波器排組,用於過濾複數已處理子頻 帶,其中該另一合成濾波器排組、該合成濾波器排組、該分析濾波器排組或該另一分析濾波器排組組配來使用同一濾波器排組窗的子取樣版本,或其中該另一合成濾波器排組組配來應用一合成窗,和其中該另一分析濾波器排組、該合成濾波器排組或該分析濾波器排組組配來應用該另一合成濾波器排組所使用之合成窗的一子取樣版本。
- 依據申請專利範圍第1項的裝置,進一步包含用以執行每子頻帶之一非線性處理操作以獲得複數已處理子頻帶的子頻帶處理器;一高頻重建處理器,用以根據傳輸參數調整一輸入信號;以及一另一合成濾波器排組,用以組合該輸入音訊信號與該等複數已處理子頻帶信號;其中該高頻重建處理器組配來處理該另一合成濾波器排組的一輸出或處理該等複數已處理子頻帶,其在該等複數已處理子頻帶被輸入至該另一合成濾波器排組之前。
- 依據申請專利範圍第1項的裝置,其中該另一分析濾波器排組或該合成濾波器排組具有一原型窗函數計算器,利用具有一不同大小之濾波器排組所儲存的窗函數,藉由使用該另一分析濾波器排組或該合成濾波器排組的通道數目資訊子取樣或插值以計算一原型窗函數。
- 依據申請專利範圍第1項的裝置,其中該合成濾波器排 組組配來將該合成濾波器排組之一最低與一最高濾波器排組通道的輸入設成零。
- 依據申請專利範圍第1項的裝置,係組配來執行一基於區塊的諧波移調,其中該合成濾波器排組是一子取樣濾波器排組。
- 依據申請專利範圍第1項的裝置,進一步包含用以處理該等複數第二子頻帶的一子頻帶處理器,其中該子頻帶處理器以任意順序包含一由一頻寬擴展因數控制的抽減取樣器(decimator),及一子頻帶信號之伸展器,其中該伸展器包含一區塊擷取器用以依據一擷取提前值來擷取一些重疊區塊;一相位調整器或窗程式(windower)用以基於一窗函數或一相位校正調整每一區塊中的子頻帶取樣值;以及一重疊加法器用以使用大於該擷取提前值之一重疊提前值執行經窗口化及經相位調整之區塊的一重疊相加處理。
- 依據申請專利範圍第1項的裝置,進一步包含一子頻帶處理器,其中該子頻帶處理器包含:複數不同的處理支路,針對不同移調因數獲得一移調信號,其中每一處理支路組配來擷取子頻帶樣本的區塊;一加法器用於加算該移調信號以獲得移調區塊;及一重疊加法器用以使用比在該等複數不同處理支路中用來擷取區塊之區塊提前值更大的一區塊提前值,重疊相加時間連續的移調區塊。
- 依據申請專利範圍第1項的裝置,進一步包含:分析濾波器排組,其中該合成濾波器排組及該另一分析濾波器排組組配來執行一樣本率轉換,一時間伸展處理器,用以處理樣本率已轉換之信號;及一組合器,用以組合由該時間伸展處理器產生的已處理子頻帶信號以獲得一已處理時域信號。
- 依據申請專利範圍第1項的裝置,其中該另一分析濾波器排組之通道數目大於該合成濾波器排組之通道數目。
- 一種用以處理一輸入音訊信號的裝置,包含:一分析濾波器排組,具有一數目之分析濾波器排組通道,其中該分析濾波器排組組配來過濾該輸入音訊信號以獲得複數第一子頻帶信號;及一合成濾波器排組,用於使用一群第一子頻帶信號合成一音訊中間信號,其中該群包含一數目少於該分析濾波器排組之濾波器排組通道數目的子頻帶信號,其中該中間音訊信號是該輸入音訊信號之一頻寬部分的子取樣表示。
- 依據申請專利範圍第18項的裝置,其中該分析濾波器排組是臨界取樣的複合QMF濾波器排組,及其中該合成濾波器排組是一臨界取樣的實值QMF濾波器排組。
- 一種處理一輸入音訊信號的方法,包含:使用一合成濾波器排組合成濾波,以從該輸入音訊 信號合成一音訊中間信號,該輸入音訊信號係以由一分析濾波器排組產生的複數第一子頻帶信號所代表,其中該合成濾波器排組的濾波器排組的通道數目小於該分析濾波器排組的通道數目;及使用一另一分析濾波器排組分析濾波,以從該音訊中間信號產生複數第二子頻帶信號,其中該另一分析濾波器排組具有一不同於該合成濾波器排組之通道數目的通道數目,因此該等複數第二子頻帶信號的一子頻帶信號的取樣率不同於該等複數第一子頻帶信號的一第一子頻帶信號的取樣率。
- 一種用以處理一輸入音訊信號的方法,包含:使用一具有一分析濾波器排組通道數目之分析濾波器排組分析濾波,其中該分析濾波器排組係組配來濾波該輸入音訊信號以獲得複數第一子頻帶信號;及使用一合成濾波器排組合成濾波,用以使用一群第一子頻帶信號合成一音訊中間信號,其中該群包含一小於該分析濾波器排組之濾波器排組通道數目的子頻帶信號數目,其中該中間音訊信號是該輸入音訊信號之一頻寬部分的子取樣表示。
- 一種電腦程式,具有當在一電腦上執行時用以實行一種依據申請專利範圍第20項或依據申請專利範圍第21項的方法的一程式碼。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31212710P | 2010-03-09 | 2010-03-09 | |
PCT/EP2011/053315 WO2011110500A1 (en) | 2010-03-09 | 2011-03-04 | Apparatus and method for processing an input audio signal using cascaded filterbanks |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201207842A TW201207842A (en) | 2012-02-16 |
TWI446337B true TWI446337B (zh) | 2014-07-21 |
Family
ID=43987731
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100107715A TWI444991B (zh) | 2010-03-09 | 2011-03-08 | 用以利用補丁邊界對齊處理音訊信號之裝置與方法 |
TW100107724A TWI446337B (zh) | 2010-03-09 | 2011-03-08 | 用以使用級聯濾波器排組處理輸入音訊信號的裝置與方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100107715A TWI444991B (zh) | 2010-03-09 | 2011-03-08 | 用以利用補丁邊界對齊處理音訊信號之裝置與方法 |
Country Status (18)
Country | Link |
---|---|
US (7) | US9305557B2 (zh) |
EP (4) | EP3570278B1 (zh) |
JP (2) | JP5523589B2 (zh) |
KR (2) | KR101425154B1 (zh) |
CN (2) | CN103038819B (zh) |
AR (2) | AR080477A1 (zh) |
AU (2) | AU2011226211B2 (zh) |
BR (5) | BR112012022574B1 (zh) |
CA (2) | CA2792450C (zh) |
ES (2) | ES2522171T3 (zh) |
HK (1) | HK1181180A1 (zh) |
MX (2) | MX2012010415A (zh) |
MY (1) | MY154204A (zh) |
PL (2) | PL2545553T3 (zh) |
RU (1) | RU2586846C2 (zh) |
SG (1) | SG183967A1 (zh) |
TW (2) | TWI444991B (zh) |
WO (2) | WO2011110499A1 (zh) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102257567B (zh) * | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
EP2362375A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using harmonic locking |
ES2522171T3 (es) * | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
MX2012001696A (es) | 2010-06-09 | 2012-02-22 | Panasonic Corp | Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio. |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CA3191597C (en) | 2010-09-16 | 2024-01-02 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
EP3544006A1 (en) | 2011-11-11 | 2019-09-25 | Dolby International AB | Upsampling using oversampled sbr |
TWI478548B (zh) * | 2012-05-09 | 2015-03-21 | Univ Nat Pingtung Sci & Tech | 對等網路串流傳輸方法 |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
CN103915104B (zh) * | 2012-12-31 | 2017-07-21 | 华为技术有限公司 | 信号带宽扩展方法和用户设备 |
US9530430B2 (en) * | 2013-02-22 | 2016-12-27 | Mitsubishi Electric Corporation | Voice emphasis device |
WO2014142576A1 (ko) * | 2013-03-14 | 2014-09-18 | 엘지전자 주식회사 | 무선 통신 시스템에서 단말 간 직접 통신을 이용한 신호 수신 방법 |
JP6573869B2 (ja) * | 2013-03-26 | 2019-09-11 | バラット, ラックラン, ポールBARRATT, Lachlan, Paul | 仮想サンプルレートを増大させた音声フィルタリング |
US9305031B2 (en) * | 2013-04-17 | 2016-04-05 | International Business Machines Corporation | Exiting windowing early for stream computing |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
US9454970B2 (en) * | 2013-07-03 | 2016-09-27 | Bose Corporation | Processing multichannel audio signals |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
TWI584567B (zh) * | 2013-08-12 | 2017-05-21 | Idt歐洲有限公司 | 功率轉換器及用於功率轉換器的控制方法 |
BR112016004029B1 (pt) * | 2013-08-28 | 2022-06-14 | Landr Audio Inc | Método para realizar a produção automática de áudio, meio legível por computador, e, sistema de produção automática de áudio |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
KR101782916B1 (ko) * | 2013-09-17 | 2017-09-28 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
WO2015060654A1 (ko) | 2013-10-22 | 2015-04-30 | 한국전자통신연구원 | 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치 |
CN104681034A (zh) * | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
US9922660B2 (en) * | 2013-11-29 | 2018-03-20 | Sony Corporation | Device for expanding frequency band of input signal via up-sampling |
WO2015099429A1 (ko) | 2013-12-23 | 2015-07-02 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
JP6593173B2 (ja) | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
CN108600935B (zh) | 2014-03-19 | 2020-11-03 | 韦勒斯标准与技术协会公司 | 音频信号处理方法和设备 |
KR101856127B1 (ko) | 2014-04-02 | 2018-05-09 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
KR101523559B1 (ko) * | 2014-11-24 | 2015-05-28 | 가락전자 주식회사 | 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI693595B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
WO2016180704A1 (en) | 2015-05-08 | 2016-11-17 | Dolby International Ab | Dialog enhancement complemented with frequency transposition |
KR101661713B1 (ko) * | 2015-05-28 | 2016-10-04 | 제주대학교 산학협력단 | 파라메트릭 어레이 응용을 위한 변조 방법 및 장치 |
US9514766B1 (en) * | 2015-07-08 | 2016-12-06 | Continental Automotive Systems, Inc. | Computationally efficient data rate mismatch compensation for telephony clocks |
US10672408B2 (en) | 2015-08-25 | 2020-06-02 | Dolby Laboratories Licensing Corporation | Audio decoder and decoding method |
RU2727968C2 (ru) * | 2015-09-22 | 2020-07-28 | Конинклейке Филипс Н.В. | Обработка аудиосигнала |
WO2017053447A1 (en) | 2015-09-25 | 2017-03-30 | Dolby Laboratories Licensing Corporation | Processing high-definition audio data |
EP3171362B1 (en) * | 2015-11-19 | 2019-08-28 | Harman Becker Automotive Systems GmbH | Bass enhancement and separation of an audio signal into a harmonic and transient signal component |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
US10157621B2 (en) * | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US10848363B2 (en) | 2017-11-09 | 2020-11-24 | Qualcomm Incorporated | Frequency division multiplexing for mixed numerology |
WO2019121982A1 (en) * | 2017-12-19 | 2019-06-27 | Dolby International Ab | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
TWI702594B (zh) | 2018-01-26 | 2020-08-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建技術之回溯相容整合 |
IL313348A (en) * | 2018-04-25 | 2024-08-01 | Dolby Int Ab | Combining high-frequency restoration techniques with reduced post-processing delay |
IL278223B2 (en) | 2018-04-25 | 2023-12-01 | Dolby Int Ab | Combining high-frequency audio reconstruction techniques |
US20230085013A1 (en) * | 2020-01-28 | 2023-03-16 | Hewlett-Packard Development Company, L.P. | Multi-channel decomposition and harmonic synthesis |
CN111768793B (zh) * | 2020-07-11 | 2023-09-01 | 北京百瑞互联技术有限公司 | 一种lc3音频编码器编码优化方法、系统、存储介质 |
TWI834408B (zh) * | 2022-12-02 | 2024-03-01 | 元智大學 | 兩階濾波器 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55107313A (en) | 1979-02-08 | 1980-08-18 | Pioneer Electronic Corp | Adjuster for audio quality |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US6766300B1 (en) | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
EP1377967B1 (en) | 2001-04-13 | 2013-04-10 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
EP1351401B1 (en) | 2001-07-13 | 2009-01-14 | Panasonic Corporation | Audio signal decoding device and audio signal encoding device |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP4227772B2 (ja) | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
JP4313993B2 (ja) | 2002-07-19 | 2009-08-12 | パナソニック株式会社 | オーディオ復号化装置およびオーディオ復号化方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
US7372907B2 (en) * | 2003-06-09 | 2008-05-13 | Northrop Grumman Corporation | Efficient and flexible oversampled filterbank with near perfect reconstruction constraint |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
US7337108B2 (en) | 2003-09-10 | 2008-02-26 | Microsoft Corporation | System and method for providing high-quality stretching and compression of a digital audio signal |
CN100507485C (zh) * | 2003-10-23 | 2009-07-01 | 松下电器产业株式会社 | 频谱编码装置和频谱解码装置 |
JP4254479B2 (ja) | 2003-10-27 | 2009-04-15 | ヤマハ株式会社 | オーディオ帯域拡張再生装置 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
JP4939424B2 (ja) * | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
CN1668058B (zh) * | 2005-02-21 | 2011-06-15 | 南望信息产业集团有限公司 | 基于递归最小平方差的子带回声抵消器 |
CN101138274B (zh) | 2005-04-15 | 2011-07-06 | 杜比国际公司 | 用于处理去相干信号或组合信号的设备和方法 |
JP2007017628A (ja) | 2005-07-06 | 2007-01-25 | Matsushita Electric Ind Co Ltd | 復号化装置 |
US7565289B2 (en) | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
JP4760278B2 (ja) | 2005-10-04 | 2011-08-31 | 株式会社ケンウッド | 補間装置、オーディオ再生装置、補間方法および補間プログラム |
DE602006012370D1 (de) | 2005-12-13 | 2010-04-01 | Nxp Bv | Einrichtung und verfahren zum verarbeiten eines audio-datenstroms |
US7676374B2 (en) * | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
FR2910743B1 (fr) * | 2006-12-22 | 2009-02-20 | Thales Sa | Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade. |
CA2708861C (en) * | 2007-12-18 | 2016-06-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101471072B (zh) * | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
KR101230479B1 (ko) | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
US9147902B2 (en) | 2008-07-04 | 2015-09-29 | Guangdong Institute of Eco-Environmental and Soil Sciences | Microbial fuel cell stack |
EP2301028B1 (en) | 2008-07-11 | 2012-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for calculating a number of spectral envelopes |
KR101239812B1 (ko) * | 2008-07-11 | 2013-03-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 신호를 생성하기 위한 장치 및 방법 |
JP5010743B2 (ja) | 2008-07-11 | 2012-08-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
US8831958B2 (en) | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
EP2169665B1 (en) | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
PL4231290T3 (pl) * | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
RU2493618C2 (ru) | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
ES2805349T3 (es) * | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
US8321216B2 (en) | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
ES2522171T3 (es) * | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
PL2545551T3 (pl) | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
-
2011
- 2011-03-04 ES ES11715452.6T patent/ES2522171T3/es active Active
- 2011-03-04 WO PCT/EP2011/053313 patent/WO2011110499A1/en active Application Filing
- 2011-03-04 EP EP19179788.5A patent/EP3570278B1/en active Active
- 2011-03-04 MY MYPI2012004003A patent/MY154204A/en unknown
- 2011-03-04 BR BR112012022574-0A patent/BR112012022574B1/pt active IP Right Grant
- 2011-03-04 BR BR112012022740-8A patent/BR112012022740B1/pt active IP Right Grant
- 2011-03-04 BR BR122021014312-9A patent/BR122021014312B1/pt active IP Right Grant
- 2011-03-04 AU AU2011226211A patent/AU2011226211B2/en active Active
- 2011-03-04 WO PCT/EP2011/053315 patent/WO2011110500A1/en active Application Filing
- 2011-03-04 MX MX2012010415A patent/MX2012010415A/es active IP Right Grant
- 2011-03-04 SG SG2012066544A patent/SG183967A1/en unknown
- 2011-03-04 MX MX2012010416A patent/MX2012010416A/es active IP Right Grant
- 2011-03-04 CN CN201180023444.1A patent/CN103038819B/zh active Active
- 2011-03-04 BR BR122021019082-8A patent/BR122021019082B1/pt active IP Right Grant
- 2011-03-04 JP JP2012556464A patent/JP5523589B2/ja active Active
- 2011-03-04 CA CA2792450A patent/CA2792450C/en active Active
- 2011-03-04 AU AU2011226212A patent/AU2011226212B2/en active Active
- 2011-03-04 PL PL11715452T patent/PL2545553T3/pl unknown
- 2011-03-04 RU RU2012142732/08A patent/RU2586846C2/ru active
- 2011-03-04 PL PL19179788.5T patent/PL3570278T3/pl unknown
- 2011-03-04 EP EP22203358.1A patent/EP4148729A1/en active Pending
- 2011-03-04 CN CN201180023443.7A patent/CN102939628B/zh active Active
- 2011-03-04 BR BR122021014305-6A patent/BR122021014305B1/pt active IP Right Grant
- 2011-03-04 EP EP11707400A patent/EP2545548A1/en not_active Ceased
- 2011-03-04 ES ES19179788T patent/ES2935637T3/es active Active
- 2011-03-04 CA CA2792452A patent/CA2792452C/en active Active
- 2011-03-04 KR KR1020127026267A patent/KR101425154B1/ko active IP Right Grant
- 2011-03-04 KR KR1020127026332A patent/KR101414736B1/ko active IP Right Grant
- 2011-03-04 EP EP11715452.6A patent/EP2545553B1/en active Active
- 2011-03-04 JP JP2012556463A patent/JP5588025B2/ja active Active
- 2011-03-08 TW TW100107715A patent/TWI444991B/zh active
- 2011-03-08 TW TW100107724A patent/TWI446337B/zh active
- 2011-03-09 AR ARP110100724A patent/AR080477A1/es active IP Right Grant
- 2011-03-09 AR ARP110100723A patent/AR080476A1/es active IP Right Grant
-
2012
- 2012-09-05 US US13/604,336 patent/US9305557B2/en active Active
- 2012-09-05 US US13/604,364 patent/US9792915B2/en active Active
-
2013
- 2013-07-16 HK HK13108340.5A patent/HK1181180A1/zh unknown
-
2017
- 2017-03-15 US US15/459,520 patent/US10032458B2/en active Active
-
2018
- 2018-06-22 US US16/016,284 patent/US10770079B2/en active Active
-
2020
- 2020-05-19 US US16/878,313 patent/US11495236B2/en active Active
-
2022
- 2022-10-21 US US18/048,810 patent/US11894002B2/en active Active
-
2023
- 2023-12-27 US US18/397,158 patent/US20240135939A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI446337B (zh) | 用以使用級聯濾波器排組處理輸入音訊信號的裝置與方法 | |
RU2455710C2 (ru) | Устройство и способ расширения полосы пропускания аудио сигнала | |
TWI505265B (zh) | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 | |
AU2011263191B2 (en) | Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus | |
RU2452044C1 (ru) | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот | |
BR122021019078B1 (pt) | Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata |