TW201519220A - 用於多聲道音源編碼的雜訊填充 - Google Patents

用於多聲道音源編碼的雜訊填充 Download PDF

Info

Publication number
TW201519220A
TW201519220A TW103124813A TW103124813A TW201519220A TW 201519220 A TW201519220 A TW 201519220A TW 103124813 A TW103124813 A TW 103124813A TW 103124813 A TW103124813 A TW 103124813A TW 201519220 A TW201519220 A TW 201519220A
Authority
TW
Taiwan
Prior art keywords
channel
spectrum
factor band
noise
rate factor
Prior art date
Application number
TW103124813A
Other languages
English (en)
Other versions
TWI566238B (zh
Inventor
Maria Luis Valero
Christian Helmrich
Johannes Hilpert
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201519220A publication Critical patent/TW201519220A/zh
Application granted granted Critical
Publication of TWI566238B publication Critical patent/TWI566238B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

在多聲道音源編碼,一增加的編碼效率可透過下列方式取得:使用雜訊填充訊號源執行零量化的倍率因數頻帶之雜訊填充,而不是使用人為產生的雜訊或頻譜複製等。尤其是,基於使用來自一先前訊框之頻譜線或目前訊框之一不同聲道之頻譜線、多聲道音源訊號之頻譜線來產生雜訊,在多聲道音源編碼之編碼效率可以透過執行雜訊填充以呈現更高的效率。

Description

用於多聲道音源編碼的雜訊填充
本發明係有關於一種填充於多聲道音源編碼的雜訊。
現代頻率域語音/音源編碼系統,例如IETF[1]之Opus/Celt編解碼器及MPEG-4 HE-AAC[2],或者,特別是MPEG-D xHE-AAC(USAC)[3],用以編碼音訊訊框,所述之音訊框不是使用一長轉換及一長區塊,就是使用八個連續短轉換及短區塊,其取決於訊號之時間之穩定性。除此之外,對於低位元率編碼,這些方案使用相同聲道之偽隨機雜訊或低頻係數並且提供工具以重建一聲道之頻率係數。在xHE-AAC,所述之工具分別作為雜訊填充及頻譜帶複製。
然而,對於非常音調或瞬時之立體聲效之輸入,單獨的雜訊填充及/或頻譜帶複製在非常低的位元率係限制可實現的編碼品質,主要因為兩個聲道之過多的頻譜係數需要被明確地傳遞。
因此,本發明目的係提供一概念用於執行雜訊填充於多聲道音源編碼,所述之多聲道音源編碼係提供一更高效率的編碼,特別是在非常低的位元率。
本發明目的可由獨立權利項之標的所實現。
本發明係基於在多聲道音源編碼之雜訊填充,如果使用雜訊填充訊號源而不是人工產生之雜訊或相同聲道之頻譜複製來執行一聲道之零量化比例因數頻帶之雜訊填充,可實現編碼之效率之提升。尤其是,基於使用頻譜線產生雜訊,所述之頻譜線來自多聲道音源訊號之一先前訊框或目前訊框之一不同聲道,在多聲道音源編碼之效率透過執行雜訊填充,可以呈現更高的效率。
透過使用頻譜頻譜共置一先前訊框之頻譜線,或是使用一多聲道音源訊號之其它聲道之頻譜時序共置的頻譜線,這能夠實現重建的多聲道音源訊號之一高舒適的品質,特別在非常低的位元率,編碼器需要接近零量化的頻譜線的一情況,以作為一整體之零量化比例因數帶。由於雜訊填充的提升,編碼器有較低的品質損失,一編碼器可以選擇零量化更多比例因數帶,以提高編碼的效率。
關於本發明之一實施例,用於執行雜訊填充的訊號源係與用於執行複數值的立體聲預測的訊號源部分地重疊。尤其是,一先前訊框之降混合可以被使用作為雜訊填充之訊號源以及共用為執行或至少改進虛擬部分估計並且應用於執行複數聲道間預測的訊號源。
關於實施例,一現有的多聲道音源編解碼器以反向相容的方式被延伸,以便以逐框方式發出信號,應用於聲道間的雜訊填充。依照下面所述之具體實施例,例如一訊號使用一反向相容的方法以延伸xHE-AAC,並且利用有條件地編碼之雜訊填充參數之未使用狀態,使訊號開啟及關閉聲道間之雜訊填充。
10‧‧‧解碼器
100‧‧‧解碼器、編碼器
102‧‧‧轉換器
104‧‧‧轉換長度及相對應的轉換視窗
106‧‧‧參考符號
108‧‧‧量化器
12‧‧‧比例因數帶辨識器
12’‧‧‧辨識器
14‧‧‧反量化器
16‧‧‧雜訊填充器
16’‧‧‧序列之雜訊填充、雜訊填充器
18‧‧‧反轉換裝置
20‧‧‧頻譜線擷取器、擷取器
22‧‧‧比例因數擷取器、擷取器
24‧‧‧複數聲道間預測器、複數立體聲預測器、聲道間預測器、預測器、複數聲道間預測
24’‧‧‧聲道間預測器、聲道間預測
26‧‧‧MS解碼器、MS解碼模組
26’‧‧‧MS解碼器
28‧‧‧反TNS濾波器
28a、28b‧‧‧反TNS模組、反TNS濾波
28a’‧‧‧選擇性的反轉換TNS填充器
28b’‧‧‧TNS填充器
30‧‧‧數據流、降混供應器
31、31’‧‧‧降混供應器、降混
32‧‧‧輸出
34‧‧‧元件、部分
40、42‧‧‧頻譜、頻譜圖
42d、44、44a、44b、44c、44d‧‧‧訊框
46、48‧‧‧頻譜
50、50b、50d‧‧‧比例因數帶、倍率因數頻帶
50b、50c、50d、50e、50f‧‧‧比例因數帶
52‧‧‧特定開始頻率
54‧‧‧雜訊底部
56‧‧‧雜訊填充
58‧‧‧虛線框、聲道間預測、複雜預測
60‧‧‧頻譜共置部分
70‧‧‧部分
74‧‧‧部分、延遲元件
76‧‧‧延遲元件、先前訊框之降混合
圖1係為根據本發明之一實施例之一參數化頻率域解碼器之一方塊圖。
圖2係顯示一序列之頻譜之一示意圖,所述之一序列之頻譜係由一多聲道音源訊號之聲道之頻譜所組成,以容易理解圖1之解碼器之描述。
圖3係顯示圖2所示之頻譜圖之外的目前頻譜之示意圖,以容易理解圖1之解碼器之描述。
圖4係顯示另一實施例之一參數化頻率域音源解碼器之一方塊圖,此參數化頻率域音源解碼器之先前訊框之降混被用作聲道間雜訊填充之一基底。
圖5係顯示一實施例之一參數化頻率域音源編碼器之一方塊圖。
圖1係顯示關於本發明之一實施例之一頻率域音源解碼 器。此解碼器使用參考符號10標示解碼器,並且此解碼器包含一比例因數帶辨識器12、一反量化器14、一雜訊填充器16及一反轉換裝置18及一頻譜線擷取器20,以及一比例因數擷取器22。所述之解碼器10更包含一複數立體聲預測器24、一MS(mid-side)解碼器26及一反TNS(Temporal Noise Shaping)濾波工具,圖1係顯示兩個反TNS濾波工具之實例28a及28b。除此之外,係顯示一降混供應器30,其詳細介紹如下。
圖1之頻率域音源解碼器10係一支援雜訊填充之參數化解碼器,依據使用比例因數帶的比例因數進行一特定零量化比例因數帶的雜訊填充,比例因數帶作為一工具,控制雜訊填充於比例因數帶之等級。除此之外,圖1之解碼器10代表一多聲道音源解碼器,用以重建來自一入站(inbound)數據流30之一多聲道音源訊號。然而,圖1係聚焦於解碼器10中涉及重建多聲道音源訊號之一的元件,所述多聲道音源訊號被編碼於數據流30並輸出位於一輸出32的(輸出)聲道。一參考符號34表示解碼器10更可包含其它的元件或一些管線的操作控制,係用以負責重建多聲道音源訊號之其它聲道,其中以下說明指出位於輸出32之聲道之解碼器10的重建如何與其它聲道之解碼器交互作用。
透過數據流30顯示多聲道音源訊號可包含兩個或多個聲道。如下所述,本發明之實施例之描述專注於立體聲案例,立體聲案例係僅包含兩個聲道的多聲道音源訊號,但是依下面敘述提出之原則,實施例可以容易的被轉換成另一實施例,所述之另一實施例關於多聲道音源訊號及其編碼,並且包含兩個以上之聲道。
如下圖1之描述中將更清楚,圖1的解碼器10係一轉換解碼器,亦即根據解碼器10之編碼方法,聲道被編碼於一轉換域,例如使用聲道之一重疊轉換。此外,依據音源訊號之創建器,在音源訊號的聲道中代表相同的音源內容的時間相位,彼此之間僅透過它們之間的微量或確定性的改變而偏離,例如以不同振福及/或相位代表不同聲道間之一音源場,使音源場之音源訊號源之虛擬位置能夠相對於虛擬揚聲器之位置,所述之虛擬揚聲器位置相關聯於多聲道音源訊號的輸出聲道。在一些其他時間相位,然而,音源訊號之不同聲道彼此可更多或是更少非相關,且甚至可代 表不同完全不同的音源。
為了說明音源訊號的聲道之間會隨時間改變的關係的可能性,圖1之音源編解碼器之下方解碼器10允許不同量測之隨著時間改變使用,以充分利用聲道之間的重複性。例如,MS編碼器允許一立體聲音源訊號之左聲道及右聲道之間的切換,或作為一對M聲道及S聲道代表左聲道及右聲道之降混,並且分別減半它們之間的差異。亦即,在一頻譜時序感測,兩個聲道之頻譜連續地被數據流30轉換,但這些(傳輸的)聲道意味著可以分別隨時間及相對於輸出聲道而改變。
複雜的立體聲預測,其係另一聲道間冗餘開發工具,在一頻譜域裡能夠預測一聲道之頻譜域係數或頻譜線,透過使用另一聲道之頻譜共置線。更多與此相關的被描述如下。
為了方便理解圖1後面的描述及顯示於圖2的元件,透過數據流30來表示一立體聲音源訊號的實施例,對於兩聲道之頻譜線如何取樣數值,有一可能的方法係透過圖1之編碼器10來處理,將所述兩聲道之頻譜線編碼於數據流30。尤其是,圖2之上半部分係顯示一立體聲音源訊號之第一通道之頻譜圖40,圖2之下半部分係顯示所述之立體音源訊號之其它聲道之頻譜圖42。再者,值得我們注意的是頻譜圖40及42,它們意味著可能會隨著時間而改變,例如在一MS編碼域及一非MS編碼域兩者之間的一隨時間改變的切換。在第一實施例,頻譜圖40及42分別地涉及一M聲道及一S聲道,其中在後面的案例,頻譜圖40和42涉及左聲道和右聲道。MS編碼域及非MS編碼域之間的切換可以被訊號化於數據流30。
圖2係顯示在一隨時間變化之頻譜時序解析度上,頻譜圖40及42可以被編碼於數據流30。舉例來說,兩個(傳輸)聲道可以以時間同步的方式,將所述之兩聲道細分成一序列的訊框並且用大括號44標示,大括號44可以係相同長度並且彼此相連沒有重疊。如剛才所提到的,被表示於數據流30之頻譜圖40及42之頻譜解析度可以隨時間而改變。初步地,假設頻譜時序解析度於時間上的改變相同於頻譜圖40及42,但在下面的描述中將可明顯的看到一簡單的延伸也是可行的。頻譜時間解析度的改變,例如頻譜時間解析度以訊框44為單位被訊號化於數據流30,亦即頻譜時間 解析度以訊框44為單位而改變。在頻譜圖40及42之頻譜解析度之改變可透過切換轉換長度及轉換數量來實現,被用以描述每個訊框44之內的頻譜圖40及42。在圖2之示例中,以訊框44a及訊框44b為例,為了取樣訊框內音源訊號的聲道,透過使用一長轉換產生高頻譜解析度,此高頻譜解析度之每個頻譜線具有一頻譜線取樣值,應用於每個聲道之每個此類之訊框,每個頻譜線有一頻譜線取樣值。在圖2中,頻譜線之取樣值在格子內使用小叉來標示,反過來,其中所述的格子被排列成行及列,並代表一頻譜時序之網格,所述之頻譜時序之網格中每列係相對應於一頻譜線及每行相對應於訊框44之時間間隔,所述之訊框44係相對於參與形成頻譜40及42之最短轉換。尤其是,圖2顯示,例如對於訊框44d,一訊框可能受制於替換成較短長度之連續轉換,從而導致如訊框44d此類的訊框產生降低的頻譜解析度之複數個時序連續之頻譜。以八個短轉換被用於訊框44為示例,所述之八個短轉換在訊框42d內產生之頻譜圖40及42之一頻譜時序取樣,並且在頻譜線彼此間隔開,使得僅有第八個頻譜線被填充,但是對於八個轉換視窗或較短長度之轉換之每一個轉換有一取樣值,並且被用以轉換訊框44d。為了說明目的,圖2係顯示出對於一訊框其它數量的轉換也是可行的,例如一轉換長度之兩個轉換的使用,舉例來說,對於訊框44a及44b,長轉換的半個轉換長度產生時序頻譜的網格或頻譜圖40及42,其中每第二個頻譜線獲得兩頻譜線取樣值,上述之兩頻譜線取樣值其中一個涉及領先的轉換,另一個尾隨的轉換。
此轉換視窗應用於轉換至訊框,所述之訊框被細分顯示於圖2下方的每個頻譜,所述的每個頻譜被交疊成像窗口狀的線。時間重疊供應,例如應用於時域別訊消除(Time-Domain Aliasing Cancellation,TDAC)的用途。
儘管如此,但在下面進一步描述的實施例也可以以另一種方式來實現,圖2係顯示在不同頻譜時序解析度之間切換的情況,其使用一方法來執行個別的訊框44,使得對於每個訊框44有相同數量的頻譜線值,從而產生頻譜圖40及42,差異僅在頻譜時序線條的取樣方式,所述之頻譜線值係由圖2之小叉標示,相對應於頻譜時序磚相對於相對應的訊框44, 在時間上超過相對應的訊框44的時間,並且在頻譜上跨越零頻率到最大頻率fmax。
圖2係顯示關於訊框44d,透過合適地分記頻譜線取樣值,對於所有的訊框44可獲得相似的頻譜,所述之頻譜線取樣值屬於相同的頻譜線但不屬於在一聲道之一訊框內的短轉換視窗,在圖2中使用箭頭,所述之箭頭從在訊框內未被占用(空的)頻譜線上至相同訊框的下一個被占用的頻譜線。透過上述得到的頻譜在以下內容稱為“交錯頻譜”。在一聲道之一訊框之交錯的n個轉換,例如在頻譜之n個短轉換之n個頻譜共置頻譜線值之集合接續頻譜線之前,n個短轉換之頻譜共置頻譜線值相互跟隨。一個交錯的中間形式是可行的,以及:用於代替交錯一訊框之所有頻譜線係數,僅交錯一訊框44d之短轉換之一適當的子集合之頻譜線係數是可行的。在任何情況中,每當描述相對於頻譜圖40及42之兩個聲道之訊框之頻譜時,這些頻譜可以參考那些交錯的或非交錯的頻譜。
為了有效率地編碼頻譜線係數,此頻譜線係數係顯示頻譜圖40及42透過數據流30傳輸到解碼器10,同時被量化。為了控制量化雜訊頻譜時序,量化步驟的大小透過比例因數控制,所述之比例因數被設定於一特別的頻譜時序格。尤其是,在每個頻譜圖之每個序列之頻譜,頻譜線被分群成頻譜連續不重疊的比例因數組。圖3係顯示在頻譜圖40之上半部分之一頻譜46以及在頻譜圖42之外之一共置時序頻譜48。如圖所示,頻譜46及48係沿著頻譜軸f被細分為比例因數帶,用以將頻譜線分群成不重疊的群組。圖3係顯示使用大括號50標示之比例因數帶。為了簡化起見,係假設頻譜46及48的比例因數帶之間的邊界互相重合,但此情況並不是必須的。
也就是說,透過編碼於數據流30之方式,每一頻譜圖40及42分別被細分為一時序之頻譜,並且所述之每個頻譜皆被頻譜化細分成比例因數帶(scale factor band),並且對於每個比例因數帶,數據流30係以相對應的比例因數帶的比例因數進行編碼或傳遞資訊。落入一相對應的比例因數帶50之頻譜線係數係可以使用相對應的比例因數做量化,或是當考慮解碼器10時,可以使用相對應的比例因數帶的比例因數來反量化。
再次參閱圖1及其內的描述之前,下列敘述中我們將假設於特別處理過的聲道為頻譜圖40的傳輸聲道,亦即除了元件34以外,圖1之解碼器之特定元件都將參與解碼,正如上面所述,所述之特定元件係可以表示為左聲道或右聲道、M聲道S聲道的其中之一,M聲道或S聲道係假設被編碼成數據流30的多聲道音源訊號係一立體聲音源訊號。
當頻譜線擷取器20用以擷取頻譜線資料,亦即來自數據流30之訊框44之頻譜線係數,比例因數擷取器22用以擷取對應於比例因數之每個訊框44。為此,擷取器20及22使用熵解碼。根據一實施例,比例因數擷取器22用以連續地從使用鄰近關係適應性之熵寫碼的數據流30擷取比例因數,例如圖3之頻譜46,亦即比例因數帶50之比例因數。連續的解碼的次序可根據頻譜的次序,例如所述之頻譜次序被定義為比例因數帶從低頻率到高頻率的次序。比例因數擷取器22可以使用鄰近關係適應性之熵寫碼,並且對於取決於擷取的比例因數之每個比例因數可以用以判定每一個比例因數的鄰近關係,其取決於在目前已擷取之比例因數之一頻譜附近的已擷取的比例因數,例如取決於前一個比例因數帶之比例因數。或者,比例因數擷取器22可以從數據流30預測解碼比例因數,例如當基於任何先前已解碼的比例因數(例如前一個比例因數)來預測一目前已解碼的比例因數時,使用差分解碼(differential decoding)。值得注意的是,比例因數擷取的過程與一比例因數帶的一比例因數無關,所述之比例因數帶完全由零量化的頻譜線所填充,或是由至少有一個被量化成非零值的頻譜線所填充。屬於由零量化之頻譜線填充之一比例因數帶的比例因數,可做為後續解碼比例因數的預測基礎,此後續比例因數屬於由非零值之頻譜線填充的比例因數帶;且根據先前解碼比例因數做預測,此先前解碼比例因數可能屬於一由含有一非零值的頻譜線所填充的比例因數帶。
為了完整性的唯一目的,應該注意的是:頻譜線擷取器20擷取頻譜線係數,比例因數帶50同樣地使用頻譜線係數填充,例如熵編碼且/或預測編碼。熵編碼基於頻譜線係數可以使用鄰近關係適應性,所述之頻譜線係數係在一目前已解碼之頻譜線係數之一頻譜時序附近。同樣地,此預測可為一頻譜之預測、一時序的預測或一頻譜時序預測,其基於在頻 譜線係數之頻譜時序附近的先前已解碼之頻譜線係數,來預測一目前已解碼的頻譜線係數。為了增加編碼的效率的目的,頻譜線擷取器20可用以執行頻譜線或在元組線係數之解碼,其係沿著頻率軸之頻譜線收集或分群。
因此,頻譜線擷取器20之輸出提供頻譜線係數,例如頻譜46以頻譜為單位收集頻譜線係數,例如一相對應的訊框之所有的頻譜線係數,或是替換成收集一相對應訊框之特定短轉換之所有的頻譜線係數。接著,在比例因數擷取器22之輸出端,輸出個別頻譜之對應比例因數。
比例因數帶辨識器12以及反量化器14具有耦接頻譜線擷取器20之輸出端的頻譜線輸入端,且反量化器14及雜訊填充器16具有耦接比例因數擷取器22之輸出端的比例因數輸入端。比例因數帶辨識器12用以辨識目前的頻譜46內所謂的零量化比例因數帶,亦即在所有頻譜線內之比例因數帶被量化為零,例如圖3之比例因數帶50c,而頻譜之剩餘倍率因數頻帶內至少一頻譜線係量化成非零。尤其是,圖三之頻譜線係數使用圖3之陰影區域來標示。從頻譜46可見,除了比例因數帶50b外,其它所有比例因數帶有至少一頻譜線,並且頻譜線係數被量化成一非零值。然後將清楚地看到零量化之比例因數帶,例如50d,其形成聲道間之雜訊填充,並且於下面內容更進一步的被描述。在接續描述之前,應該注意到的是比例因數帶辨識器12之辨識可能限制於僅在比例因數帶50之一適當的子集合上的辨識,例如限制於在一特定開始頻率52上之比例因數帶。在圖3,所述之比例因數帶辨識器12將限制在比例因數帶50d、50e及50f上之辨識過程。
比例因數帶辨識器12向雜訊填充器16告知零量化的比例因數帶。反量化器14係使用與一入站頻譜46相關之比例因數,以達到根據相關的比例因數(亦即與比例因數帶50相關的比例因數)對頻譜46之頻譜線之頻譜線係數進行反量化或調整比例。特別的是,反量化器14係對落入具有倍率因數的個別比例因數帶的頻譜線係數進行反量化以及縮放。圖3係說明顯示頻譜線之反量化之結果。
雜訊填充器16獲得零量化比例因數帶上的資訊,其形成下列主要的雜訊填充,量化的頻譜及被定義為零量化比例因數帶之比例因數,以及從數據流30獲得的一訊號,其針對目先前訊框揭露聲道間之雜訊 填充是否用於目先前訊框。
下面的示例將描述聲道間的雜訊填充過程,所述之雜訊填充過程實際上參與兩個型態的雜訊填充,即涉及所有頻譜線插入一雜訊底部54,無論已被量化為零頻譜線潛在歸屬於任何零量化之比例因數帶;以及實際聲道間的雜訊填充程序。雖然下文中描述這些組合,但是應當強調根據另一實施例可省略底雜插入。此外,從數據流30取得之訊號有關於訊號框的雜訊填充之開啟及關閉,而且此訊號可能僅有關於聲道間雜訊填充,或是可以同時控制兩者雜訊之填充器之結合。
就底雜的插入而言,雜訊填充器16可以操作如下列敘述。尤其是,雜訊填充器16採用人工的雜訊產生方式,例如使用一偽隨機數字產生器或一些其他隨機性的訊號源來填充頻譜線,所述之頻譜線之頻譜線係數係為零。插入於零量化的頻譜線的雜訊底部54的水平線可根據在數據流30內應用於目前訊框或目前頻譜46的一明確的訊號來設定。例如,可使用一均方根(RMS)或能量測量器來決定雜訊底部54之“位準(level)”。
因此,雜訊底部的插入係顯示對於倍率因數頻帶的一種先前填充,所述之倍率因數頻帶係為零量化之倍率因數,例如圖3之倍率因數頻帶50d。它也會影響其它零量化之倍率因數以外的倍率因數,但是零量化之倍率因數更符合下列敘述中的聲道間之雜訊填充。如下所述,聲道間的雜訊填充的過程係填滿零量化的倍率因數頻帶來達到填滿位準,此填滿位準係透過相對應的零量化倍率因數頻帶之倍率因數來控制。零量化之倍率因數可以直接地使用此結果,因為相對應的零量化倍率因數之所有的頻譜線被量化為零。
然而,對於每個訊框或每個頻譜46,當透過雜訊填充器16使用零量化的倍率因數頻帶之倍率因數時,數據流30可包含一參數之一額外訊號化,在一相對應的填滿位準下,其普遍地應用於相對應的訊框之所有零量化倍率因數頻帶之倍率因數或頻譜46及結果,所述之填滿位準個別地應用於零量化倍率因數頻帶。
也就是說,雜訊填充器16可以使用相同方式來修改,相對於頻譜46之每個零量化的倍率因數頻帶,相對的倍率因數頻帶之倍率因數 係使用剛提到包含於數據流30之參數,應用於目前訊框之頻譜46,以取得一填滿的目標位準,將所述的目標位準應用於相對應的零量化倍率因數頻帶的測量,就能量或RMS而言,舉例來說,位準達到聲道間雜訊填充的過程,其相對應的零量化倍率因數頻帶將被填滿並具有(選擇性地)額外雜訊(除了雜訊底部54)。
尤其是,為了執行聲道間的雜訊填充56,雜訊填充器16係取得其它聲道的頻譜48之一頻譜共置部分,所述之頻譜共置部分係在已經大部分或完全被解碼的狀態下,並且複製已獲得的部分頻譜48至零量化的倍率因數頻帶,頻譜48之頻譜共置部份使用下列方法調整比例,此方法係透過對相對的倍率因數頻帶之頻譜線作積分,以得到零量化倍率因數頻帶內全部的雜訊位準,等同於前述從零量化倍率因數頻帶之倍率因數取得的填滿的目標位準。透過此方法,填充至相對的零量化倍率因數頻帶之雜訊音調相較於人工產生的雜訊,例如雜訊底部54之基底雜訊之形成,有進一步的改善,並且此方法也較一未被控制的頻譜為佳,所述之未被控制的頻譜從在相同頻譜46內之極低頻線拷貝/複製。
為精確地來說,對於一目前頻帶例如50d,雜訊填充器16設置於其它聲道之頻譜48內之一頻譜共置部分,使用剛才描述的一方法,按比例調整頻譜線,所述之頻譜線係取決於零量化倍率因數頻帶50d之倍率因數,選擇性地,對於目前訊框或頻譜46,將一些額外的補償或是雜訊因數參數被包含於數據流30,使其結果係為填滿相對應的零量化倍率因數頻帶50d至理想位準,所述之理想位準係定義為零量化倍率因數頻帶50d之倍率因數。在此實施例中,此意味著在填充是在附加的方式中相對於雜訊底部54所完成的。
根據一簡化的實施例,所得到的雜訊填充頻譜46將直接被輸入至反轉換裝置18之輸入,從而獲得一相對的聲道音源時間訊號之一時域部分,並且應用於頻譜46之頻譜線係數之每個轉換視窗,據此(未顯示於圖1)一重疊附加過程可結合所述之時域部分。也就是說,如果頻譜46係為一非交錯的頻譜,則頻譜線係數僅屬於一轉換,然後由反轉換裝置18進行此轉換並且產生一時域部分,此時域部分係由反轉換前端及尾端的反轉換 獲得,使用前端及尾端的時域部分進行一重複疊加前端及尾端的過程以便於實現,例如,時域混疊消除法。然而,如果頻譜46中有一個以上的連續轉換之交錯的頻譜線係數,則反轉換裝置18將受到相同的分離反轉換,以便於在每個反轉換獲得一時域部分,並且由此定義時域次序,所述之時域部分將受到重疊附加時域部分之過程,並且時域部分相關於其它頻譜或訊框之前端及尾端的時域部分。
然而,為了完整性,應當注意的是更進一步的過程可能被執行於雜訊填充的頻譜上。如圖1所示,反TNS濾波器可能在雜訊填充的頻譜上進行一反TNS濾波。也就是說,對於目前訊框或頻譜46,透過TNS濾波器係數控制,到目前為止所獲得的頻譜係受到沿著頻譜的方向之一線性濾波。
無論有或無反TNS濾波,複數立體聲預測器24可把頻譜當作一聲道間預測之一預測差餘。更具體地,聲道間預測器24可以使用其它聲道之一頻譜共置部分預測頻譜46,或使用至少一倍率因數頻帶50之子集合。圖3係顯示有虛線框58的複數預測過程,此複數預測過程相關於倍率因數頻帶50b。也就是說,數據流30可能包含聲道間的預測參數控制,例如,倍率因數頻帶50將作為聲道間的預測,並且將不使用此類的方法預測。更進一步,在數據流30的聲道間的預測參數可能更包含複數個聲道間預測因數,所述之預測參數由聲道間預測器24所施加,用以取得聲道間預測結果。對於每個倍率因數頻帶,上述因數可能個別地被包含於數據流30,或是替換成每組一或多個倍率因數頻帶,在數據流30中應用於啟動聲道間預測或訊號化啟動聲道間預測。
如圖3所示,聲道間預測之來源可能為其它聲道之頻譜48。更精確的來說,聲道間預測之來源可以為頻譜48之頻譜共置部分,根據聲道間預測之來源之虛部之一估計,共置於倍率因數頻帶50b以作為聲道間之預測,虛構部之估計可基於其頻譜48之頻譜共置部分60來進行,及/或可能使用先前訊框之一已經解碼的聲道之一降混,也就是說訊框緊接於目前已解碼的訊框,而頻譜46屬於目前已解碼的訊框。實際上,聲道間預測器24係加入至倍率因數頻以成為聲道間的預測,如圖3之倍率因數頻帶50b 即以剛才描述之方式來取得預測訊號。
如在前面的描述中已經指出的,屬於頻譜46的聲道可能為一MS編碼聲道,或可能為與聲道相關的一揚聲器,例如一立體聲音源訊號之一左聲道或右聲道。因此,可選擇的一MS解碼器26係控制可選擇地聲道間的預測頻譜46進行MS解碼,每個頻譜線或頻譜46使用相同的方式進行,增加或減少頻譜係相對於其它聲道對應於頻譜48之頻譜線。舉例來說,圖1雖然沒有顯示,但如圖3係顯示頻譜48已經由解碼器10之部分34取得,使用相似於上面所描述的一方式,相對於頻譜46圖所屬之聲道及MS解碼模組26,在執行MS解碼時,使頻譜46及48符合頻譜線性增加或頻譜線性減少,並且兩個頻譜圖皆在處理線內相同等級,意味著兩個頻譜圖剛從聲道間的預測獲得,例如,或者是兩個頻譜圖剛從雜訊填充或從反TNS濾波獲得。
應當注意的是,可選擇性地,MS解碼可以使用下列方法進行,此方法係全域性地涉及整個頻譜46,或是被數據流30以單位地個別地啟用MS解碼,例如倍率因數頻帶50。換句話說,在數據流30使用相對應的訊號,可能切換啟動或關閉MS解碼,例如訊框或一些較佳的時序頻譜解析度等,例如個別地應用於頻譜40及/或42之頻譜46及/或48之倍率因數頻帶,其中假設兩聲道的倍率因數頻帶之相同的邊界被定義。
如圖1所示,在任何聲道間的處理,也可以用反TNS濾波器28反TNS濾波,例如聲道間預測58或使用MS解碼器26進行MS解碼。在前面或下面的性能中,對於在數據流30的每一訊框或在在粒度之其它層面,可以透過一相對的訊號來固定或控制聲道間的處理。每當進行反TNS的濾波,對於目前的頻譜46,出現於數據流之相對之TNS濾波係數係控制一TNS濾波器,也就是說一線性預測濾波器沿著頻譜的方向進行,用以線性濾波頻譜至相對的反TNS模組28a及/或28b。
因此,頻譜46到達反轉換裝置18之輸入可能受限於剛描述的更進一步處理。再次,上述的描述不意味著以這樣的方式來理解。這些選擇性工具可能並存或不並存,這些工具可表現於部分或整體的解碼器10。
在任何情況中,在反轉換裝置的輸入產生的頻譜代表著聲道 的輸出訊號之最終重建,並且形成上述的降混應用於所提供的目前訊框,如所描述的複雜預測58,以此為基礎的潛在虛部估計被解碼應用於下一個訊框。除了在圖1中的元件34,它還可作為聲道間預測另一聲道之最終重建。
透過將所述之最終頻譜46結合相對應的頻譜48之最終版本,降混供應器31組成對應的降混。後者的實體,也就是說相對應的頻譜48之最終版本係形成複數聲道間預測的基底,所述之複數聲道間預測係在預測器24內。
在聲道間雜訊填充基底的範圍內,圖4係顯示相對於圖1的另外一種選擇,聲道間的雜訊填充係由一目前訊框之頻譜共置頻譜線之降混來表現,在使用複數聲道間預測之選擇性情況中,所述之複數聲道間預測之來源被使用兩次,作為聲道間雜訊填充之一來源,以及應用於在聲道間預測之虛部估計之一來源。圖4係顯示一解碼器10,係包含部分70以及上述之其它部分34之內部結構,所述部分70涉及頻譜46屬於第一聲道之解碼,所述部分34涉及其它聲道之解碼,包括頻譜48。在在一邊的部分70及在另一邊的部分34之內部元件係使用相同的參考符號,可以看到兩部分的結構是相同的。從第二解碼器部分34之反轉換裝置18輸出立體聲音源訊號之一聲道,接著在輸出32輸出此聲道,而此輸出以及立體聲音源訊號之其它的(輸出)聲道結果皆以參考標示74表示。
部分70及34係共用降混供應器31,降混供應器31係接收時間共置之頻譜圖40及42之頻譜48及46以形成一降混,據此從頻譜線基底透過累加一頻譜於一頻譜線,潛在地透過聲道降混的數量除以在每個頻譜線的總值形成此平均值,如第4圖之案例。先前訊框的降混經由此方法之結果係在於降混供應器31的輸出。值得注意的是,如果先前訊框包含在頻譜圖40及42之其中之一之一個以上的頻譜,則存在著不同的可能性使降混供應器31在此種情況下操作。
舉例來說,在此情況下,降混供應器31可以使用目前訊框之連續轉換之頻譜,或是可以使用一交錯結果,此結果透過交錯頻譜圖40及42之目前訊框之所有頻譜線係數產生。圖4係顯示延遲元件74連接至 降混供應器31的輸出,從而提供降混在降混供應器31的輸出,形成先前訊框之下混(分別參照圖3關於聲道間雜訊填充56及複雜預測58)。因此,延遲元件76之輸出被連接至解碼器部分34及70之聲道間預測器24之輸入,另一方面所述之延遲元件76之輸出被連接至解碼器34及70部分之雜訊填充器16之輸入。
也就是說,在圖1中,雜訊填充器16係接收其它聲道之最終重建之相同目前訊框之時序共置頻譜48,以作為聲道間雜訊填充之一基底,在圖4替代成由基於降混供應器31所供應之目前訊框之降混進行聲道間之雜訊填充,聲道間雜訊填充使用維持使用此相同的方法進行。也就是說,從目前訊框之其它聲道的頻譜之相對應的頻譜內,聲道間的雜訊填充器16抓取出一頻譜共置部分,在圖1的情況中,此頻譜共置大部分或完全地解碼,從先前訊框獲得之最終頻譜作為先前訊框之降混,在圖4的案例中,增加相同“訊號源”部分至倍率因數頻帶內之頻譜線進行雜訊的填充,例如在圖3之50d,根據一雜訊目標位準,以相對應的倍率因數頻帶之倍率因數進行按比例調整頻譜線。
總結上面實施例的描述,所述之實施例係描述在一音頻解碼器之聲道間之雜訊填充,這對於本技術領域之相關人員應當是可以明白的,在加入抓取出之頻譜或“訊號源”頻譜之時序共置部分至“目標”倍率因數頻帶之頻譜線之前,在不脫離聲道間填充之一般概念下,一特別之前處理可以被應用於“訊號源”頻譜線。尤其是,施加一濾波之操作至“訊號源”區域之頻譜線這可能是有益的,例如對所述之“訊號源”區域被添加至“目標”倍率因數頻帶進行一頻譜的平坦化或傾斜的去除,如圖3之50d,因此施加一濾波係為了增加聲道間雜訊填充過程之音源品質。同樣地,作為一大部分地(而非全部地)已解碼之頻譜之一示例,前述之“訊號源”部分可以從一頻譜獲得,其中此頻譜尚未經過一反TNS濾波器進行過濾。
因此,上述之實施例關於一聲道間雜訊填充之一概念。在下文中,一可能方式被描述,其係為聲道間雜訊填充之前述概念如何被建構至一存在的編寫碼器。尤其是,前述實施例之一較佳實施例在下文中描述, 基於音源編寫碼器使用一半向後相容的訊號方法,一立體聲填充工具被建構至一xHE-AAC。透過更進一步地描述實施例,對於特別的立體聲訊號,轉換係數之立體聲填充在一以MPEG-D xHE-AAC(USAC)為基礎之一立體聲編寫碼器內的兩個聲道中之任一個係可行的,從而增加特定音源訊號之編碼品質,尤其是在低位元率。立體聲填充工具被訊號化半向後相容,以使習知xHE-AAC解碼器可以在沒有明顯的音源錯誤或壓降情況下解析及解碼位元流。如上面已經描述的,如果一音源編碼器可以使用兩個音源聲道之先前已解碼/量化係數之結合,以重建任一個目前已解碼聲道之零量化(非轉換的)係數,一較佳的整體品質可以被實現,因此,除了頻帶複製(從低到高頻率的聲道係數)以及雜訊填充(從一不相關的偽訊號源)於音頻編碼器,也希望允許這樣的立體聲填充(從先前到目前的聲道係數),尤其是以xHE-AAC或編碼器為基礎的。
為了允許已編碼之位元流及立體聲填充被習知xHE-AAC解碼器讀取及解析,所期望的立體填充工具係使用半向後相容的方式來使用:它的存在不應該引起習知解碼器停止或者甚至無法啟動解碼之情形。透過xHE-AAC基礎結構來讀取位元流亦也可以增進市場的採用。
為達到上述將半向後相容性應用於在上下文之xHE-AAC或其衍生物之一立體聲填充工具的期望,下面的實施涉及立體聲填充之功能以及相同功能的信號,並且透過在數據流之語法上實際涉及雜訊填充。雜訊填充將符合上述而產生作用。在具有一共有視窗配置之一對聲道中,當立體聲填充工具被啟用時,一零量化比例因帶數之一係數係作為一替代(或如上述,另外加入)至雜訊填充,此係數使用先前訊框之係數之總和或差值來重建,而所述之先前訊框之係數位於兩聲道之任一個聲道,其中以右聲道為最佳。立體聲填充相似於雜訊填充進行,訊號將透過xHE-AAC之雜訊填充訊號來完成,其係以8-bit雜訊填充側資訊來進行立體聲填充,即使所施加的雜訊填充級為零,但由於MPEG-D USAC標準[4]指出所有8位元被傳送,故此方式為可實行的,而在這種情況下,雜訊填充之位元可以重新被用於立體聲填充工具。
如下面敘述可以確定,半向後相容性藉由習知xHE-AAC有 關於解碼器位元流的解析及播放。立體聲填充發出訊號係透過一零位準雜訊(即前三個雜訊填充的位元皆具有一零值),並跟隨五個非零位元,所述之五個非零位元係包含針對立體聲填充工具及缺少的雜訊位準之旁側資訊。因為習知xHE-AAC解碼器忽略5位元雜訊補償之值,如果3位元雜訊位準為零,則立體聲填充工具訊號之存在對於習知解碼器中之雜訊填充只會有一個影響:因為前三個位值為零,使得雜訊填充被關閉。尤其是,禁止使用類似雜訊填充的步驟來進行立體聲填充。因此,一習知解碼器仍提供增大的位元流30之“優雅的”解碼,因為這不需要在開啟的立體填充之一訊框上消除輸出訊號或甚至中止解碼。自然地,習知解碼器沒有辦法提供修正,意味著無法重建立體填充的線係數,如此會導致在一受到影響的訊框有惡化的品質,相較於由一適當的解碼器解碼,其能夠適當地處理新的立體填充工具。儘管如此,假設打算使用立體聲填充工具,如立體聲輸入只用在低位元率,如果受影響的訊框將因為靜音或導致其它明顯的播放錯誤而脫離,通過xHE-AAC解碼器的品質應當會更好。
在下文中詳細描述了立體聲填充工具如何內置於xHE-AAC編解碼器,即作為一擴充。
內置於標準的立體聲填充工具係描述如下。尤其是,此一立體聲填充(SF)工具將代表MPEG-H 3D音源之頻率域(FD)部分之一新工具。在上面的討論中,此一立體聲填充工具之目的在於重建低位元率之MDCT頻譜係數之參數,其已近似於如在文獻[4]之7.2節中標準之雜訊填充。然而,不同於雜訊填充,使用先前訊框之左及右MDCT頻譜之一降混,SF也將可用於重建一聯合編碼之雙聲道立體聲之右聲道之MDCT值。根據下面實施例,透過雜訊填充旁側資訊,SF被半向後相容地發出訊號,所述之旁側資訊會被一習知MPEG-D USAC解碼器正確地解析。
所述工具可以被描述如下。當SF啟用在一聯合立體聲FD訊框裡時,右(第二個)聲道之空(如完全零量化)倍率因數頻帶之MDCT係數被先前訊框(假設FD)之相對應的已解碼的左及右聲道的MDCT係數之一總額或差值所取代,例如50d。如果習知雜訊填充啟用於第二聲道,虛擬值也被加至每一個係數。每個倍率因數頻帶導出的係數接著被按比例調整, 使得每個頻帶之RMS符合經由此頻帶之倍率因數傳輸的數值。請參閱在文獻[4]之標準之第7.3節。
對於在MPEG-D USAC標準內之新SF工具的使用,可以提供一些操作上的限制。舉例來說,SF工具只可以使用於一對共同的FD聲道對之右FD聲道,也就是說,一對聲道元件在StereoCoreToolInfo( )函式傳送一參數common_window==1。除此之外,由於半向後相容的訊號,SF工具只可以當noiseFilling在語法容器UsacCoreConfig( )等於1時被使用。如果一對聲道之任一個在LPD core_mode,即使FD右聲道在FD模式,SF工具亦不可被使用。
為了更清楚地描述了標準的延伸,如文獻[4]中所描述,下列術語和定義被用於下文中。
尤其是,就資料元件而言,以下資料元件被新引入:stereo_filling 二進制標誌,指示SF是否被用於目前訊框及聲道
更進一步,新輔助元件被引入:noise_offset 雜訊填充補償以修正零量化帶之倍率因數頻帶(第7.2節)
noise_level 雜訊填充位準代表添加的頻譜雜訊之振幅(第7.2節)
downmix_prev[ ] 先前訊框的左及右聲道之降混(即總和或差)
sf_index[g][sfb] 倍率因數指數指標(即)用於視窗組g及頻帶sfb
標準之解碼過程將以下面的方式做延伸。尤其是,使用SF工具解碼之一聯合立體聲編碼FD聲道被啟用執行下面三個連續步驟:首先,stereo_filling旗標將進行解碼。
stereo_filling不代表一獨立之位元流的元件,但是可由在StereoCoreToolInfo()內之一UsacChannelPairElement()及common_window flag之雜訊填充元件noise_offset及noise_level導出。如果noiseFilling==0或common_window==0或是目前聲道為所述之雜訊填充元件元件內之左(第一)聲道,則stereo_filling為零,並且立體聲填充處理過程結束。否則,if((noiseFillinq!=0)&&(common_window!=0)&&(noise_level
換句話說,如果noise_level==0,noise_offse即包含帶有4個位元雜訊填充資料之stereo_filling flag,接著將兩者重新安排。因為此操作會改變noise_level及noise_offset的值,所以需要在部分7.2之雜訊填充過程之前進行。此外,上述之虛擬碼將不會執行於一UsacChannelPairElement( )或任何其他元件之左(第一)聲道。
然後,downmix_prev將進行計算。
downmix_prev[ ]之頻譜降混被使用於立體聲填充,相同於dmx_re_prev[ ]被使用於複數立體聲內之MDST頻譜估計(第7.7.2.3節)。這意味著:
●如果訊框及元件之任何聲道進行降混,則downmix_prev[ ]之所有係數必須為零,也就是說,訊框在目前解碼訊框之前,使用core_mode==1(LPD)或是聲道使用不相等的轉換長度(split_transform==1或區段切塊至僅一個聲道之window_sequence==EIGHT_SHORT_SEQUENCE)或是usacIndependencyFlag==1。
●在立體聲填充過程中,如果聲道的轉換長度從最後改變到目前元件內之目前訊框(即split_transform==1在split_transform==0之前,或window_sequence==1 EIGHT_SHORT_SEQUENCE在window_sequence!=EIGHT_SHORT_SEQUENCE之前,或是相對的反之亦然),所有downmix_prev[ ]係數必須為零。
●如果轉換分割被施加於先前或目前訊框之聲道,downmix_prev[ ]代表一逐線交錯的頻譜降混。詳見轉換分割工具。
●如果複雜立體聲預測不能被使用於目前訊框及元件,pred_dir等於零。
因此,先前降混只有被計算一次,對於此兩個工具可簡省複雜度。當複數立體預測目前沒有被使用時,或是當複數立體預測被使用並且使用prev_frame==0時,在7.7.2部分之downmix_prev[ ]及dmx_re_prev[ ]之間唯一不同的是兩者的計算方法。在這種情況下,即使複數立體聲預測之解碼不需dmx_re_prev[ ],依據7.7.2.3部分,downmix_prev[ ]仍被計算應用於立體聲填充之解碼,因此dmx_re_prev[ ]不被定義/零。
在下文,空倍率因數頻帶之立體聲填充將被進行。
如果stereo_filling==1,在雜訊填充的處理過程後,下面的程序被實行,即所有頻帶在所有MDCT線被量化為零,所述之雜訊填充的處理過程在所有最初的空的倍率因數頻帶sfb[ ]後,所述之sfb[ ]在max_sfb_ste之下。首先,透過線平方和,sfb[ ]之能量及downmix_prev[ ]內之相對應的線可計算得出,然後,給予具有對每一sfb[]之線的數字之sfbWidth。
對於每組視窗之頻譜。使用像是處理正常的倍率因數一樣處理空帶之倍率因數,倍率因數被施加於產生之頻譜上,例如第7.3節所述。
一種使用一固有的半向後相容之訊號以替代一xHE-AAC標準之延伸的方法。
上述之實施例係在xHE-AAC編碼框架上描述一方法,此方法採用在一位元流內之一位元,用以訊號化新立體聲填充工具之使用,並包含在stereo_filling以用於圖1之一解碼器。更確切地說,例如訊號(我們稱之為明確半向後相容的訊號)允許下列習知位元流資料被獨立使用於SF訊號,所述之位元流資料係為雜訊填充旁側資訊:在目前的實施例中,雜訊填充資料取決於立體填充資訊,並且反之亦然。舉例來說,雜訊填充資料係由皆為0的字元所組成(noise_level=noise_offset=0),並且當stereo_filling可以訊號化任何可能的值(變成二進制)時,所述之雜訊填充資料可以被傳輸。
在此情況中,係習知及本發明之位元流資料間之明確獨立性為非必須的,本發明訊號為一二進制決策,則一訊號位元的明確傳輸可以被避免,且二進制決索可以被存在或不存在之明確半向後相容的訊號訊號化。再次以上面實施例作為一個示例,透過簡單地採用新訊號,立體填充之使用可以被傳輸:在相同的時間下,如果noise_level為零並且noise_offset不為零0,則設定stereo_filling flag等於1。
如果noise_level及noise_offset兩者皆為非零值,則stereo_filling等於零。當noise_level及noise_offset皆為零時,則發生隱含式訊號依賴於習知雜訊填充的訊號。在此案例中,無法清楚地知道是否正在使用習知或新SF隱含式訊號。為了避免類似的混淆,stereo_filling之值 必須事先被定義。在本示例中,如果雜訊填充資料係由皆為0的字元所組成,定義stereo_filling=0是適當的,因為當雜訊填充沒有被施加於一訊框時,此習知編碼器沒有立體聲填充之功能訊號。
這仍然在隱含式半向後相容訊號的情況下,所需要解決的問題是半向後相容的訊號如何訊號化stereo_filling==1,並且在同一時間下沒有雜訊填充。如所說明的,雜訊填充資料一定不能皆為0的字元,且若如此一雜訊大小必須為零,noise_level(作為上述提及之(noise_offset & 14)/2)必須等於零。這使得只有一noise_offset(作為上述提及之(noise_offset & 1)*16)大於0之一解決方案。然而,當施加倍率因數時,所述之noise_offset在此立體聲填充的案例中是被考慮的,即使noise_level為零。幸運的是,透過改變受影響的倍率因數(例如在位元流上寫入的倍率因數),一零值的noise_offset可以不用被傳遞而編碼器可以補償此一事實。此允許在上述實施例中之隱含式訊號以一潛在增加之倍率因數資料速率為代價。因此,在上述描述之虛擬代碼之立體聲填充之訊號可以被改變,如下所述,使用保存SF訊號位元來傳遞noise_offset,並且以2bits(4 values)而不是1bit來傳遞:
為了完整性,圖5係根據本發明之一實施例以顯示參數音源編碼器。首先,圖5之編碼器整體使用的參考符號100標記,此編碼器包 含一轉換器102,用以進行初次的轉換,音源訊號之非失真的版本被重建於圖1之輸出32。如圖2所描述,在不同轉換長度間,一重疊轉換可以被切換使用,所述之轉換長度具有以訊框44為單位之相對應的轉換視窗。圖2係顯示以參考符號104標記不同的轉換長度及相對應的轉換視窗。在相似於圖1的方式,圖5專注於解碼器100之一部分,此部分負責編碼多聲道音源之一聲道,而另一聲道域之解碼器100之整體部分在圖5中使用參考符號106標示。
在轉換器102之輸出上,頻譜線及倍率因數皆為非量化並且基本上未發生編碼遺失。頻譜由轉換器102輸出並且進入一量化器108,所述之量化器用以量化由轉換器102輸出之頻譜之頻譜線,設定及使用初始的倍率因數頻帶之倍率因數,以使頻譜接續著頻譜。也就是說,在量化器108之輸出、初始的倍率因數及相對的頻譜線係數結果、以及一序列之雜訊填充16’、一選擇性的反轉換TNS填充器28a’、聲道間預測器24’、MS解碼器26’以及TNS填充器28b’被相繼地連接,用以提供圖5之編碼器100具有取得一重建的能力,目前頻譜之最終版本可從解碼器測、降混供應器之輸入取得(參考圖1)。在此情況中,使用先前訊框之降混形成聲道間雜訊,並且使用聲道間預測24’及/或使用聲道間雜訊填充於此版本,編碼器100更包含一降混供應器31’以及多聲道音源訊號之聲道之頻譜之最終版本,所述之降混供應器用以形成重建之一降混。當然,為了節省計算,利用最初之聲道,而非最終之聲道,之頻譜之非量化版本,係可以被用於降混供應器31以形成降混。
為了進行訊框間頻譜預測及/或為了進行比率控制,編碼器100可使用得到的重建資訊以及頻譜之最終版本。例如上述可能的版本,使用一虛擬估計進行聲道間預測,在一比率控制迴圈內,也就是說為確定可能的參數透過編碼器100最終被編碼於數據流30內,所述之參數被設置至一比率/失真之最佳化感測。
舉例來說,對於被辨識器12’所辨識的各零量化的倍率因數頻帶,設置於一預測及/或比率控制迴圈之編碼器100的參數組是單純被量化器108設置的倍率因數頻帶的倍率因數。在編碼器100之一預測及/或 比率控制迴圈,零量化倍率因數頻帶之倍率因數係被設置於一些心理聽覺上或比率/失真最佳化感測,用以決定上述目標雜訊位準,一選擇性之修正參數也透過數據流傳遞至解碼器側,並且應用於相對應的訊框。應當注意的是,所述之倍率因數只可以使用此倍率因數所屬(即如前面所述之“目標”頻譜)之頻譜及聲道之頻譜線來計算,或者可以替換地使用“目標”聲道頻譜之兩者頻譜線,除此之外,來自先前訊框之其它聲道頻譜或降混頻譜(即如前面所介紹之“訊號源”頻譜)之頻譜線從聲道降混供應器31’獲得。尤其是,為了穩定目標雜訊位準及減少時序位準變動至被施加的聲道間雜訊填充上,所述之目標雜訊位準及時序位準在已解碼的音源聲道內,目標倍率因數可以使用一關係計算,此關係為在“目標”倍率因數頻帶之頻譜線之一能量量測及在相對應的“訊號源”區域之共置頻譜線之一能量量測之間。最後地,如上面所指出,所述之“訊號源”區域可以源自於一重建訊號源、另一聲道或先前訊框之降混之最終版本,或是如果編碼器複雜度被降低,可以源自初始訊號、相同其它聲道或初始降混之未被量化的版本、先前訊框之頻譜之未被量化之版本。
依據特定實施例要求,本發明之實施例可以被實施在硬體或軟體。本實施例可以使用一數位儲存媒體來執行,例如一軟碟機、一DVD、一Blu-Ray、一CD、一PROM、一EPROM或是一FLASH memory,此數位儲存媒體具有電子可讀控制信號並且儲存於其內,所述之可讀控制信號配合一可編程計算機系統,以使相對應的方法被進行。因此,數位儲存媒體為電子計算機可讀取。
依據本發明之一些實施例係包含一資料載體,所述之資料載體具有一電子可讀控制信號,此電子可讀控制信號能夠結合一可編程計算機系統,以使本文描述之方法之一可被進行。
一般情況下,本發明之實施例係可被實施並且作為具有一程式碼之一電腦程式產品,當電腦程式產品在一電腦上執行時,程式碼可操作用於方法之一,例如程式碼可被儲存於一機器可讀載體。
另一實施例係包含電腦程式,所述之電腦程式用於執行儲存於一機器可讀載體此為本文描述之方法之一。
換句話說,本發明之一方法實施例,係一電腦程式其具有一程式碼,用於執行本文描述之方法之一。
本發明之另一方法實施例,係一資料載體(或一數位儲存介質,或是一電腦可讀之介質)其包含所述之電腦程式,此電腦程式被記錄在資料載體上並且用於執行本文描述之方法之一。所述之資料載體、數位儲存媒體或記錄媒體一般為實體及/或非實體。
本發明之另一方法之實施例,係一數據流或一序列訊號,其代表程式碼用於執行本文描述之方法之一。所述之數據流或一序列訊號可以例如被配置為經由一資料通訊連接來傳送,例如透過網際網路。
另一實施例,係包含一處理裝置,例如一電腦或一可程式邏輯裝置,所述之處理裝置係用以或適用於執行本文描述之方法之一。
另一實施例,係包含一電腦,其具有一安裝於其內之電腦程式,用以執行本文描述之方法之一。
根據本發明之另一實施例,係包含一裝置或一系統,用以傳輸(例如電子或光學方式傳輸)一計算機程式至一接收器,以執行本文描述之方法之一。所述之接收器例如可以為一電腦、一行動裝置、一記憶裝置或類似裝置。所述之裝置或系統例如包含一檔案伺服器,用以傳輸電腦程式至接收器。
在一些實施例,一可程式邏輯裝置(例如一場式可程式閘陣列元件)可以被用於執行本文所描述之一些或全部的功能。在一些實施例中,一場式可程式閘陣列元件可以結合一微處理器,為了執行本文描述之方法之一。一般而言,所述之方法最佳地透過任何硬件裝置來執行。
可以理解的是,本文所描述之配置之修正及改正以及細節對於其它本領域之技術人員將是顯而易見的。上述實施例僅用於說明本發明的原理,意圖因此係本發明應當僅由專利申請範圍之獨立權利項所限制,而不是由本文實施例之描述及說明之具體細節所限制。
參考文獻:
[1] Internet Engineering Task Force (IETF), RFC 6716, “Definition of the Opus Audio Codec,” Int. Standard, Sep. 2012. Available online at http://tools.ietf.org/html/rfc6716.
[2] International Organization for Standardization, ISO/IEC 14496-3:2009, “Information Technology - Coding of audio-visual objects - Part 3: Audio,” Geneva, Switzerland, Aug. 2009.
[3] M. Neuendorf et al., “MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types,” in Proc. 132nd AES Convention, Budapest, Hungary, Apr. 2012. Also to appear in the Journal of the AES, 2013.
[4] International Organization for Standardization, ISO/IEC 23003-3:2012, “Information Technology - MPEG audio - Part 3: Unified speech and audio coding,” Geneva, Jan. 2012.
10‧‧‧解碼器
12‧‧‧比例因數帶辨識器
14‧‧‧反量化器
16‧‧‧雜訊填充器
18‧‧‧反轉換裝置
20‧‧‧頻譜線擷取器、擷取器
22‧‧‧比例因數擷取器、擷取器
24‧‧‧複數聲道間預測器、複數立體聲預測器、聲道間預測器、預測器、複數聲道間預測
26‧‧‧MS解碼器、MS解碼模組
28‧‧‧反TNS濾波器
28a、28b‧‧‧反TNS模組
30‧‧‧數據流、降混供應器
31‧‧‧降混供應器、降混
32‧‧‧輸出
34‧‧‧元件、部分

Claims (14)

  1. 一種參數化頻率域音源解碼器,用以:識別(12)一多頻道音源訊號之一目前訊框之一第一頻道之一光譜之複數個第一倍率因數頻帶,其中所有頻譜線係量化成零,以及識別該光譜之第二倍率因數頻帶,其內至少一頻譜線係量化成非零;以使用該多頻道音源訊號之一先前訊框之頻譜線,或是該多頻道音源訊號之該目前訊框之一不同頻道所產生的雜訊,來填充(16)該第一倍率因數頻帶之一預設倍率因數頻帶內的該頻譜線,並使用該預設倍率因數頻帶之一倍率因數調整該雜訊之一位準;使用該第二倍率因數頻帶之複數個倍率因數,在該第二倍率因數頻帶內反量化(14)該頻譜線;以及對從填充該雜訊之該第一倍率因數頻帶以及從使用該第二倍率因數頻帶之該倍率因數反量化的該第二倍率因數頻帶取得的該光譜進行反轉換(18),該雜訊之位準係使用該第一倍率因數頻帶調整,藉此取得該多頻道音源訊號之該第一頻道之一時間域部分。
  2. 如申請專利範圍第1項所述之參數化頻率域音源解碼器,更用以在該填充,使用該預設倍率因數頻帶之該倍率因數調整該先前訊框之一降混之一光譜之一共置部分之一位準,以及頻譜共置至該預設倍率因數頻帶,以及增加具有調整位準的該共置部分至該預設倍率因數頻帶。
  3. 如申請專利範圍第2項所述之參數化頻率域音源解碼器,進一步從一不同頻道或是該目前訊框之降混預測該倍率因數頻帶之一子區,以取得一頻道間預測,以及使用已填充該雜訊的該預設倍率因數頻帶以及使用該第二倍率因數頻帶之該倍率因數反量化的第二倍率因數頻帶,作為該頻道間預測之一預測殘留以取得該光譜。
  4. 如申請專利範圍第3項所述之參數化頻率域音源解碼器,進一步用在預測該倍率因數頻帶之該子區時,使用該先前訊框之一降混之該光譜執行該目前訊框之該不同頻道或是降混之一虚數部分估計。
  5. 如申請專利範圍第1項所述之參數化頻率域音源解碼器,其中在該數據 流中該目前頻道以及該其他頻道係受限於MS編碼,以及該參數化頻率域音源解碼器係讓該光譜受限於該MS解碼。
  6. 如申請專利範圍第1項所述之參數化頻率域音源解碼器,進一步根據該第一倍率因數頻帶以及該第二倍率因數頻帶中的一頻譜序而頻譜設置的該倍率因數,使用鄰近關係適應性地解碼及/或使用具有頻譜預測之預測解碼,從一該數據流依序地抽取出該第一倍率因數頻帶以及該第二倍率因數頻帶之該倍率因數,其中該鄰近關係判斷或該頻譜預測係取決於一目前抽取出的倍率因數之一鄰近頻譜中已經抽取出的倍率因數。
  7. 如申請專利範圍第1項所述之參數化頻率域音源解碼器,進一步另外使用偽隨機或是任意雜訊以產生該雜訊。
  8. 如申請專利範圍第7項所述之參數化頻率域音源解碼器,進一步用以根據訊號化於該目前訊框之一數據流中的一雜訊參數,同樣地針對該第一倍率因數頻帶而調整該偽隨機或是任意雜訊之一位準。
  9. 如申請專利範圍第1項所述之參數化頻率域音源解碼器,進一步使用在該目前訊框之一數據流中訊號化的一修改的參數,相對於該第二倍率因數頻帶之該倍率因數而同樣地修改該第一倍率因數頻帶之該倍率因數。
  10. 一種參數化頻率域音源編碼器,用以:使用一光譜內之複數個倍率因數頻帶之複數個初步倍率因數,量化一多頻道音源訊號之一目前訊框之一第一頻道之該光譜之複數個頻譜線;識別所有頻譜線量化成零的該光譜內的複數個第一光譜倍率因數頻帶,以及識別至少一頻譜線量化成非零的該光譜內的第二倍率因數頻帶,在一預測及/或速率控制迴路內,使用該多頻道音源訊號之一先前訊框之頻譜線,或是該多頻道音源訊號之該目前訊框之一不同頻道所產生的雜訊,填充該第一倍率因數頻帶之一預設倍率因數頻帶內的該頻譜線,並使用該預設倍率因數頻帶之一實際倍率因數調整該雜訊之一位準;以及針對該預設倍率因數頻帶訊號化該實際倍率因數,以代替該初步倍率 因數頻帶。
  11. 如申請專利範圍第10項所述之參數化頻率域音源編碼器,進一步用以根據在該預設倍率因數頻帶內的該第一頻道之該光譜之該頻譜線之一非量化版本之一位準,以及另外根據該多頻道音源訊號之一先前訊框之該頻譜線或是之該目前訊框之一不同頻道,計算針對該預設倍率因數頻帶之該實際倍率因數。
  12. 一種參數化頻率域音源解碼方法,包含:識別一多頻道音源訊號之一目前訊框之一第一頻道之一光譜之複數個第一倍率因數頻帶,其內所有頻譜線係量化成零,以及識別該光譜之第二倍率因數頻帶,其內至少一頻譜線係量化成非零;使用該多頻道音源訊號之一先前訊框之頻譜線,或是該多頻道音源訊號之該目前訊框之一不同頻道所產生的雜訊,填充該第一倍率因數頻帶之一預設倍率因數頻帶內的該頻譜線,並使用該預設倍率因數頻帶之一倍率因數調整該雜訊之一位準;使用該第二倍率因數頻帶之複數個倍率因數,在該第二倍率因數頻帶內反量化該頻譜線;以及對從填充該雜訊之該第一倍率因數頻帶以及從使用該第二倍率因數頻帶之該倍率因數反量化的該第二倍率因數頻帶取得的該光譜進行反轉換,該雜訊之位準係使用該第一倍率因數頻帶調整,藉此取得該多頻道音源訊號之該第一頻道之一時間域部分。
  13. 一種參數化頻率域音源編碼方法,包含:使用一光譜內之複數個倍率因數頻帶之複數個初步倍率因數,量化一多頻道音源訊號之一目前訊框之一第一頻道之該光譜之複數個頻譜線;識別所有頻譜線量化成零的該光譜內的複數個第一光譜倍率因數頻帶,以及識別至少一頻譜線量化成非零的該光譜內的第二倍率因數頻帶,在一預測及/或比率控制迴路內,使用該多頻道音源訊號之一先前訊框之頻譜線,或是該多頻道音源訊 號之該目前訊框之一不同頻道所產生的雜訊,填充該第一倍率因數頻帶之一預設倍率因數頻帶內的該頻譜線,並使用該預設倍率因數頻帶之一實際倍率因數調整該雜訊之一位準;以及針對該預設倍率因數頻帶訊號化該實際倍率因數,以代替該初步倍率因數頻帶。
  14. 一種具有程式碼的電腦程式,當在一電腦上執行時係執行如申請專利範圍第12項或第13項所述之方法。
TW103124813A 2013-07-22 2014-07-18 參數化頻率域音源編解碼器及編解碼方法 TWI566238B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP13177356 2013-07-22
EP13189450.3A EP2830060A1 (en) 2013-07-22 2013-10-18 Noise filling in multichannel audio coding

Publications (2)

Publication Number Publication Date
TW201519220A true TW201519220A (zh) 2015-05-16
TWI566238B TWI566238B (zh) 2017-01-11

Family

ID=48832792

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103124813A TWI566238B (zh) 2013-07-22 2014-07-18 參數化頻率域音源編解碼器及編解碼方法

Country Status (20)

Country Link
US (6) US10255924B2 (zh)
EP (5) EP2830060A1 (zh)
JP (1) JP6248194B2 (zh)
KR (2) KR101865205B1 (zh)
CN (2) CN105706165B (zh)
AR (1) AR096994A1 (zh)
AU (1) AU2014295171B2 (zh)
BR (5) BR122022016307B1 (zh)
CA (1) CA2918256C (zh)
ES (2) ES2650549T3 (zh)
HK (1) HK1246963A1 (zh)
MX (1) MX359186B (zh)
MY (1) MY179139A (zh)
PL (2) PL3025341T3 (zh)
PT (2) PT3252761T (zh)
RU (1) RU2661776C2 (zh)
SG (1) SG11201600420YA (zh)
TW (1) TWI566238B (zh)
WO (1) WO2015011061A1 (zh)
ZA (1) ZA201601077B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
CN113242448B (zh) * 2015-06-02 2023-07-14 索尼公司 发送装置和方法、媒体处理装置和方法以及接收装置
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
US10553224B2 (en) * 2017-10-03 2020-02-04 Dolby Laboratories Licensing Corporation Method and system for inter-channel coding
WO2019081089A1 (en) * 2017-10-27 2019-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. MITIGATION OF NOISE AT THE LEVEL OF A DECODER
CN114243925B (zh) * 2021-12-21 2024-02-09 国网山东省电力公司淄博供电公司 基于智能融合终端的台区配变态势感知方法及系统
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP2002156998A (ja) 2000-11-16 2002-05-31 Toshiba Corp オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
WO2005096508A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Equipement de codage et de decodage audio ameliore, procede associe
JP4944029B2 (ja) 2005-07-15 2012-05-30 パナソニック株式会社 オーディオデコーダおよびオーディオ信号の復号方法
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR20070037771A (ko) * 2005-10-04 2007-04-09 엘지전자 주식회사 오디오 부호화 시스템
CN101310328A (zh) * 2005-10-13 2008-11-19 Lg电子株式会社 用于处理信号的方法和装置
US8460409B2 (en) 2006-05-08 2013-06-11 Ceramatec, Inc. Plasma-catalyzed fuel reformer
KR20080092823A (ko) 2007-04-13 2008-10-16 엘지전자 주식회사 부호화/복호화 장치 및 방법
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
RU2439718C1 (ru) 2007-12-31 2012-01-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки звукового сигнала
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
KR101078378B1 (ko) 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
AU2010305383B2 (en) * 2009-10-08 2013-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
JP5316896B2 (ja) * 2010-03-17 2013-10-16 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding

Also Published As

Publication number Publication date
US20240127837A1 (en) 2024-04-18
PT3252761T (pt) 2019-11-11
US11594235B2 (en) 2023-02-28
CN105706165A (zh) 2016-06-22
EP4369335A1 (en) 2024-05-15
ZA201601077B (en) 2017-11-29
US20210358508A1 (en) 2021-11-18
RU2661776C2 (ru) 2018-07-19
ES2650549T3 (es) 2018-01-19
US11887611B2 (en) 2024-01-30
AU2014295171B2 (en) 2017-09-21
KR101865205B1 (ko) 2018-06-07
US20230132885A1 (en) 2023-05-04
EP3618068A1 (en) 2020-03-04
CA2918256A1 (en) 2015-01-29
MX2016000912A (es) 2016-05-05
EP3025341B1 (en) 2017-09-06
EP2830060A1 (en) 2015-01-28
KR101981936B1 (ko) 2019-05-27
ES2746934T3 (es) 2020-03-09
PL3252761T3 (pl) 2020-02-28
EP3252761B1 (en) 2019-08-21
US10468042B2 (en) 2019-11-05
AU2014295171A1 (en) 2016-03-10
BR112016001138A2 (zh) 2017-07-25
US20200051577A1 (en) 2020-02-13
US20160140974A1 (en) 2016-05-19
CN105706165B (zh) 2020-07-14
RU2016105517A (ru) 2017-08-25
BR122022016307B1 (pt) 2023-03-07
CN112037804A (zh) 2020-12-04
HK1246963A1 (zh) 2018-09-14
KR20180018857A (ko) 2018-02-21
KR20160033770A (ko) 2016-03-28
EP3618068B1 (en) 2024-04-03
SG11201600420YA (en) 2016-02-26
BR122022016310B1 (pt) 2023-03-07
BR112016001138B1 (pt) 2023-01-17
MX359186B (es) 2018-09-19
US10978084B2 (en) 2021-04-13
BR122022016343B1 (pt) 2023-03-07
PT3025341T (pt) 2017-12-06
JP6248194B2 (ja) 2017-12-13
CA2918256C (en) 2019-08-27
AR096994A1 (es) 2016-02-10
WO2015011061A1 (en) 2015-01-29
BR122022016336B1 (pt) 2023-03-07
US10255924B2 (en) 2019-04-09
EP3252761A1 (en) 2017-12-06
MY179139A (en) 2020-10-28
TWI566238B (zh) 2017-01-11
US20190180762A1 (en) 2019-06-13
PL3025341T3 (pl) 2018-02-28
JP2016530557A (ja) 2016-09-29
EP3025341A1 (en) 2016-06-01

Similar Documents

Publication Publication Date Title
TWI566238B (zh) 參數化頻率域音源編解碼器及編解碼方法
JP6735053B2 (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
CN110739001B (zh) 支持变换长度切换的频域音频编码器、解码器、编码和解码方法
BR122022016387B1 (pt) Preenchimento de ruído na codificação de áudio multicanal