TWI566234B - 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式 - Google Patents

使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式 Download PDF

Info

Publication number
TWI566234B
TWI566234B TW103124815A TW103124815A TWI566234B TW I566234 B TWI566234 B TW I566234B TW 103124815 A TW103124815 A TW 103124815A TW 103124815 A TW103124815 A TW 103124815A TW I566234 B TWI566234 B TW I566234B
Authority
TW
Taiwan
Prior art keywords
signal
sound source
channel
residual
decorrelated
Prior art date
Application number
TW103124815A
Other languages
English (en)
Other versions
TW201519215A (zh
Inventor
薩斯洽 迪克
克利斯汀 漢姆瑞奇
強尼斯 希爾佩特
安卓斯 荷勒哲
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201519215A publication Critical patent/TW201519215A/zh
Application granted granted Critical
Publication of TWI566234B publication Critical patent/TWI566234B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Description

使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式
本發明之一實施方式係有關於一種多聲道音源解碼器,其用以在一編碼表示之基礎上提供至少二輸出音源訊號。
本發明之另一實施方式係有關於一種多聲道音源編碼器,其用以提供一多聲道音源訊號之一編碼表示。
本發明之另一个實施方式係有關於一種方法,其用以在一編碼表示之基礎上提供至少二輸出音源訊號。
本發明之另一實施方式係有關於一種方法,其用以提供一多聲道音源訊號之一編碼表示。
本發明之另一實施方式係有關於一種電腦程式,其以用執行上述方法之其中之一。
一般來說,根據本發明之部份實施方式,其係有關於結合殘餘與參數的一種編碼。
近年來,對於音源內容的儲存以及傳輸的需求已大量地增加,此外,對於音源內容的儲存以及傳輸的品質需求也大量地增加,從而,對於音源內容之編碼以及解碼之概念也已經被強化,舉例來說,所謂的"進階音源編碼"(AAC)已被發現用來在國際標準ISO/IEC 13818-7:2003裡進行描述。
此外,部份空間的延伸也已經被建立,舉例來說,所謂的 "MPEG環繞"概念,其係用來在國際標準ISO/IEC 23003-1"2007進行描述,此外,對於音源訊號之一空間資訊的編碼以及解碼的額外改進也在國際標準ISO/IEC23003-2:2010裡被描述,其係有關於所謂的空間音源物件編碼。 此外,一個靈活的(可切換的)音源編/解碼概念係提供了以一高效率編碼對一般音源訊號以及語音訊號進行編碼的可能性,也提供處理多聲道音源訊號,其如定義在國際標準ISO/IEC 23003-3:2012所描述的"統一語音及音源編碼概念"中。
然而,目前仍然期望能夠提供一種更進階的高效率編/解碼多聲道音源訊號之概念。
本發明之一實施方式係有關於產生一種多聲道音源解碼器,其用以在一編碼表示之基礎上提供至少二輸出音源訊號。此多聲道音源解碼器係用以執行一降混合訊號、一解相關訊號及一殘餘訊號之一加權組合,以取得至少二輸出音源訊號之其中之一,此多聲道音源解碼器係用以決定一權重,此權重係根據殘餘訊號以描述在加權組合裡解相關訊號之一貢獻。
本發明係基於以下之發現,如果描述解相關訊號至一降混合訊號、一解相關訊號以及一殘餘訊號之加權組合之一貢獻的權重係根據殘餘訊號而被調整,則輸出音源訊號能夠在一編碼表示的基礎上有效率地被取得。從而,藉由根據此殘餘訊號而調整描述在加權組合裡解相關訊號之貢獻的權重,其係有可能不傳送一額外控制訊號而在一參數化編碼(或一主要參數化編碼)以及一殘餘編碼(或主要殘餘編碼)間進行混合(或衰退)。此外,亦可發現的是,包含在編碼表示裡的殘餘訊號是一種針對權重的良好指示,此權重係用以描述在加權組合裡解相關訊號之貢獻,一般較佳的作法是,如果此殘餘訊號是(相對性的)微弱的(或者是對於期望能量之再建是不必須的),則在解相關訊號上置放一(相對性的)較高的權重,如果此殘餘訊號是(相對性的)強大的(或者是對於期望能量之再建是必須的),則在該解 相關訊號上去置放一(相對性的)較低權重,從而,上述提及之概念允許在一參數化編碼(舉例來說,期望的能量特徵及/或相關特徵係藉由參數訊號化以及藉由增加一解相關訊號而進行再建)以及一殘餘編碼(其中在部份案例中,殘餘訊號係用於再建輸出音源訊號,其係一降混合訊號為基礎之輸出音源訊號之波形)間之一漸近轉變。從而,其係有可能地去針對再建及此再建之品質而改編此技術,以成為沒有額外訊號化負擔的解碼訊號。
在一較佳的實施方式中,此多聲道音源解碼器係用以決定權 重,此權重係根據解相關訊號以描述在加權組合裡解相關訊號之貢獻。藉由根據殘餘訊號以及解相關訊號來決定描述在加權組合裡解相關訊號之貢獻的權重,此權重能夠良好的調整至訊號特徵,使得在此編碼表示之基礎上(特別是,以降混合訊號、解相關訊號以及殘餘訊號為基本),至少二輸出音源訊號之再建可以達到良好的品質。
在一較佳實施例中,此多聲道音源解碼器係用以取得在編碼 表示為基礎上的升混合參數,並用以決定權重,此權重係根據解相關訊號以描述在加權組合裡此升混合參數的貢獻,經由考慮此升混合參數,其係有可能再建輸出音源訊號(舉例來說,在輸出音源訊號及/或輸出音源訊號之期望能量特徵間的期望相關性)之期望特徵以得到一期望數值。
在一較佳實施例中,多聲道音源解碼器係用以決定權重,此 權重係根據解相關訊號以描述在加權組合裡解相關訊號之貢獻,使得解相關訊號之權重隨著至少一殘餘訊號之能量的增加而減少。這樣的機制係根據殘餘訊號之能量來允許在至少二輸出音源訊號裡調整再建之精準度。如果殘餘訊號之能量係相對性地高,則解相關訊號之貢獻之權重則會相對性地小,使得解相關訊號不會長久有害地影響由殘餘訊號所造成再製之一高品質,相反地,如果殘餘訊號之能量係相對性地低的,或者甚至為零,一高權重即被贈予至解相關訊號,使得解相關訊號能有效地帶領輸出音源訊號之特徵到所期望之數值。
在一較佳實施例中,多聲道音源解碼器係用以決定權重,此權重係描述在加權組合裡解相關訊號之貢獻,使得若是殘餘訊號之一能量為零,則由一解相關訊號升混合參數所決定之一最大權重關聯至解相關訊 號,且若是使用一殘餘訊號加權係數進行加權之殘餘訊號之一能量大於或等於解相關訊號之一能量,則將使得一零權重關聯至解相關訊號,其中此解相關訊號之能量係以解相關訊號升混合參數進行加權。此實施方式係基於以下發現,應該被添加入降混合訊號之期望能量係由解相關訊號之能量所決定,其中解相關訊號之能量係使用解相關訊號升混合參數以進行加權,進而,總結來說,如果使用殘餘訊號加權係數進行加權之殘餘訊號的能量大於或等於使用解相關訊號升混合參數進行加權的解相關訊號之能量,則不需要再加入此解相關訊號,換句話說,若是評斷出此殘餘訊號攜帶足夠的能量(例如,足夠到達一必須的總能量),則解相關訊號將不再用於提供給至少二輸出音源訊號。
在一較佳實施例中,多聲道音源解碼器係用以計算解相關訊 號之一加權能量數值,此加權能量數值係根據至少一解相關訊號升混合參數進行加權,並且用以計算殘餘訊號之一加權能量數值,此加權能量數值係使用至少一殘餘訊號升混合參數以進行加權(其可等同於上述所提及之殘餘訊號加權係數),以根據解相關訊號之加權能量數值以及殘餘訊號之加權能量數值來決定一因子,並且以取得一權重,此權重係在此因子的基礎上,描述解相關訊號至音源輸出訊號(至少)其中之一的貢獻。在此可發現,此程序非常適合於此描述解相關訊號至至少一輸出音源訊號之其中之一之權重的高效能計算。
在一較佳實施例中,多聲道音源解碼器係將此因子乘上一解 相關訊號升混合參數,以取得權重,此權重係描述解相關訊號至輸出音源訊號(至少)其中之一之貢獻。透過使用這樣的程序為了決定描述在加權組合裡解相關訊號之貢獻的權重,其有可能考慮至少一參數,此至少一參數係用來描述至少二輸出音源訊號(其係透過解相關訊號升混合參數以進行描述)以及在解相關訊號之能量以及殘餘訊號之能量間關係的期望訊號特徵。因此,當仍然考慮輸出音源訊號(由解相關訊號升混合參數所反映)之期望特徵時,在一參數化編碼(或者是主要的參數化編碼)以及一殘餘編碼(或者是一主要地殘餘編碼)間的混合(或者衰退)係存在其可能性。
在一較佳實施例中,多聲道音源解碼器係用以計算解相關訊 號之能量,此能量係在複數個升混合聲道以及複數個時間槽上使用解相關訊號升混合參數以進行加權,以取得解相關訊號之加權能量數值。從而,其有可能防止解相關訊號之加權能量數值之強烈變化,因此,此多聲道音源解碼器之一穩定調整目的可達成。
類似地,多聲道音源解碼器係用以計算殘餘訊號之能量,殘 餘訊號之能量係在複數個升混合聲道以及複數個時間槽上使用至少一殘餘訊號升混合參數以進行加權,以取得殘餘訊號之加權能量數值。從而,由於避免了殘餘訊號的加權能量數值的強烈變化,此多聲道音源解碼器之一穩定調整目的便可達成。然而,此被選擇的平均期間必須快到允許權重的一動態調整。
在一較佳實施例中,多聲道音源解碼器係根據在解相關訊號之加權能量數值以及在殘餘訊號之加權能量數值間之一差異以計算因子。一種計算,係"比較"解相關訊號之加權能量數值以及殘餘訊號之加權能量數值,以允許補充使用(加權版本)解相關訊號之殘餘訊號(或者是訊號訊號之加權版本),其中此權重係針對至少二音源輸出訊號之提供需求而進行調整,且此權重係描述解相關訊號之貢獻。
在一較佳實施例中,多聲道音源解碼器係根據在一差異與解相關訊號之加權能量數值間之一比例以計算因子,其中此差異係指解相關訊號之加權能量數值以及在殘餘訊號之加權能量數值間之一差異。在此可發現,此因子之計算可根據此比例帶來長久特別之良好結果。此外,值得一提的是,為了達到一良好的聽覺印象(或是等價地,當相較於不存在殘餘訊號的情況時,為了在輸出音源訊號裡具有大幅相同的訊號能量),此比例描述了解相關訊號(使用解相關訊號升混合參數進行加權)之全部能量的那一個部份在殘餘訊號之出現為必須的。
在一較佳實施例中,多聲道音源解碼器係用以決定複數個權重,此複數個權重係描述解相關訊號至至少二輸出音源訊號之複數個貢獻,在此情況中,多聲道音源解碼器係在解相關訊號以及一第一聲道解相關訊號升混合參數之加權能量數值的基礎上,決定解相關訊號至一第一輸出音源訊號之一貢獻。此外,多聲道音源解碼器係在解相關訊號以及一第 二聲道解相關聲道升混合參數之加權能量數值的基礎上,決定解相關訊號至一第二輸出音源訊號之一貢獻。於是,具有中等成就以及良好音源品質之二輸出音源訊號能夠被提供,其中二輸出音源訊號間之差異係藉由一第一聲道解相關訊號升混合參數以及一第二聲道解相關訊號升混合參數之運用而進行考慮的。
在一較佳實施例中,若是一殘餘能量超過一解相關能量(例 如,解相關訊號之一能量或是其加權之一版本),多聲道音源解碼器則關閉解相關訊號至加權組合之一貢獻。於是,若是殘餘訊號攜帶足夠的能量,或若是殘餘訊號超過解相關器能量,即有可能不需要解相關訊號之運用便可以切換一單純殘餘編碼。
在一較佳實施例中,音源解碼器係用以頻帶化地決定權重, 此權重係根據殘餘訊號之一加權能量數值之頻帶化決定以描述在加權組合裡解相關訊號之貢獻。於是,其有可能不需要額外之訊號化負擔即可彈性地決定,其ci至少二輸出音源訊號之一細化的頻率頻帶應該(或是主要地)以一參數化編碼為基礎,且其中至少二輸出音源訊號之細化的頻率頻帶應該(或是主要地)以一殘餘編碼為基礎,如此一來,可以靈活地決定頻率頻帶,當持續保持的解相關訊號係相對小時,使用殘餘編碼之一波形形狀再建(或是至少部份的波形形狀再建)即應該被執行。如此一來,便有可能藉由應用參數化編碼(其主要根據一解相關訊號之提供)以及殘餘編碼(其主要根據一殘餘訊號之提供)以取得一良好音源品質。
在一較佳實施例中,音源解碼器係用以決定權重,此權重係針對一輸出音源訊號之每一訊框以描述在加權組合裡解相關訊號之貢獻。於是,可取得一精細時間分辨率,其係用以彈性地在一參數化編碼(或主要為參數化編碼)以及隨後訊框間的殘餘編碼(或主要為殘餘編碼)間進行切換。於是,此音源解碼可利用一良好時間分辨率而被調整至音源訊號之特徵。
本發明之另一個實施方式係有關於產生一種多聲道音源解碼器,其用以在一編碼表示之基礎上提供至少二輸出音源訊號。在一降混合訊號、複數個編碼空間參數以及一殘餘訊號之一編碼表示的基礎上,多 聲道音源解碼器係用以取得輸出音源訊號之(至少)其中之一,多聲道音源解碼器係根據殘餘訊號在一參數化編碼以及殘餘編碼之間進行混合,於是,一種非常靈活的音源解碼概念係達成,其中此最佳解碼模式(參數化編碼及解碼與殘餘編碼及解碼)能夠不增加額外訊號化負擔而被選擇,此外,上述解釋之考慮也被應用。
本發明之一實施方式係有關於建立一種多聲道音源編碼 器,其用以提供一多聲道音源訊號之一編碼表示。此多聲道音源編碼器係以多聲道音源訊號為基礎,而取得一降混合訊號,而且,多聲道音源編碼器係用以提供參數以及一殘餘訊號,此參數係描述在多聲道訊號音源訊號之聲道間的相依性。此外,多聲道音源編碼器係根據該多聲道音源訊號以變化包含至編碼表示裡之一殘餘訊號之數量。透過變化被包含至編碼表示裡之殘餘訊號之數量,靈活地調整編碼程序至訊號之特徵係有可能的。舉例來說,其有可能為了期望的某部份而包含一相對而言大數量之殘餘訊號至編碼表示裡,其中此部份係保留,至少部份地,解碼音源訊號之波形。 因此,更多基於多聲道音源訊號的精確殘餘訊號,係透過此可能性而被啟用於變動包含殘餘訊號之數目至編碼表示裡。此外,值得一提的是,如上所述之結合多聲道音源解碼器,一種高效率概念係被建立,當上述多聲道音源解碼器甚至不需要額外訊號化地在一(主要地)參數化編碼以及一(主要地)殘餘編碼間進行混合。於是,在此討論的多聲道編碼器允許利用可能透過使用上述之多聲道音源編碼器之優點。
在一較佳實施例中,多聲道音源編碼器係根據多聲道音源訊 號變化殘餘訊號之一頻寬,於是,便有可能來對殘餘訊號進行調整,使得此殘餘訊號有助於再建聲學最重要的頻率頻帶或是頻率範圍。
在一較佳實施例中,多聲道音源編碼器係根據多聲道音源訊 號針對被包含在編碼表示裡之殘餘訊號而選擇複數個頻率頻帶,於是,對於必要或者是最有益的頻率頻帶,多聲道音源編碼器能決定其而包含一殘餘訊號(其中殘餘訊號一般係導致至少部份的波形再建)。舉側來說,此聲學重要的頻率頻帶能夠被考慮。此外,當一殘餘訊號代表性地協助在一音源解碼器裡改善短暫之轉譯,短暫事件的存在也可以被考慮。此外,可用的 位元速率也能被考慮到一計算裡以決定被包含至編碼表示裡的殘餘訊號數量。
在一較佳實施例中,多聲道音源編碼器係針對多聲道音源為 音調的複數個頻率頻帶,而選擇性地包含殘餘訊號至編碼表示裡,並針對多聲道音源為非音調的複數個頻率頻帶而省略殘餘訊號至編碼表示裡之其包含。此實施方式係基於考慮若是音調頻率頻帶被以特定高品質以及使用至少部份空間波形再建而重製時,在一音源解碼器端可取得之一音源品質即能夠被改善。於是,針對那些多聲道音源訊號為音調的頻率頻寬而言,當其導致在位元速率以及音源品質間的一良好妥協時,則選擇性地包含殘餘訊號至編碼表示裡將有許多益處。
在一較佳實施例中,多聲道音源編碼器係針對時間部份及/ 或頻率頻帶選擇性地包含殘餘訊號至編碼表示裡,其中降混合訊號之形成係導致多聲道音源訊號之複數個訊號元件之一取消。在此處可發現,若是存在多聲道音源訊號之複數個元件之一取消,以一降混合訊號為基礎而再建多聲道音源訊號將變得困難或者甚至是不可能的,因為甚至一解相關或者是一預測都不能復原當在形成降混合訊號時被取消的訊號元件。在這樣的案例中,一殘餘訊號的運用是一種高效率的方式來避免再建多聲道音源訊號的一重要退化,如此一來,當防止一訊號化努力時(舉例來說,當考慮到上述與音源解碼器之結合),這樣的概念即幫助改善了音源品質。
在一較佳實施例中,多聲道音源編碼器係用以偵測在該降混 合訊號裡多聲道訊號音源訊號之複數個訊號元件之一取消,且多聲道音源解碼器亦根據偵測之結果以激發殘餘訊號之一提供。於是,此處存在一高效率的方式來防止一不良的音源品質。
在一較佳實施例中,多聲道音源編碼器係用以計算殘餘訊 號,殘餘訊號係使用多聲道音源訊號之至少二聲道訊號之一線性組合並根據使用在多聲道解碼器之一端上之複數個升混合係數。所以,殘餘訊號被以一高效率的方式計算且針對一多聲道音源解碼器端上之多聲道音源訊號之一再建而進行良好的改編。
在一實施例中,多聲道音源編碼器係用以編碼升混合係數, 此升混合係數係描述多聲道音源訊號之聲道間的複數個相依性,或者是從複數個參數衍生複數個升混合係數,複數個參數係描述該多聲道音源訊號之聲道間的複數個相依性。於是,此殘餘訊號的提供能夠有效地以複數個參數為基底而執行,且其也可以被使用於一參數化編碼。
在一較佳實施例中,多聲道音源編碼器係隨時間進行變化而 決定殘餘訊號之數量,此殘餘訊號係使用一音質模型以包含至編碼表示裡。於是,針對包含一相對性地高音質關聯之多聲道音源訊號之部份(暫時部份、頻率部份或者是時間-頻率部份),一相對性高數量之殘餘訊號可以被包含,而在針對具有一相對低之音質關聯之多聲道音源訊號之暫時部份、頻率部份或是時間-頻率部份時,一(相對性的)較少數量的殘餘訊號則可以被包含。於是,在位元速率以及音源品質間的一良好平衡可以被達成。
在一較佳實施例中,多聲道音源編碼器係隨時間進行變化而 決定殘餘訊號之數量,殘餘訊號係根據一目前可使用的位元速率而包含至編碼表示裡。於是,音源品質能夠被改編至可用的位元速率,此位元速率係允許針對目前可用的位元速率而達到可能最佳的音源品質。
本發明之一實施方式係有關於建立一種方法,其用以在一編 碼表示之基礎上提供至少二輸出音源訊號。此方法係執行一降混合訊號、一解相關訊號及一殘餘訊號之一加權組合,以取得至少二輸出音源訊號之其中之一,一權重係描述在加權組合裡解相關訊號之一貢獻,且此權重係根據殘餘訊號而決定。此方法係以如上述音源解碼器之相同考慮為基礎。
本發明之另一實施方式係有關於建立一種方法,其用以在一 編碼表示之基礎上提供至少二輸出音源訊號。此方法係取得以一降混合訊號、複數個編碼空間參數之一編碼表示以及以一殘餘訊號之一編碼表示為基礎之至少二輸出音源訊號之(至少)其中之一,根據殘餘訊號以執行在參數化編碼以及一殘餘編碼間之一混合(或是衰退)。此方法係以如上所述之音源解碼器之相同考慮為基礎。
本發明之另一實施方式係有關於建立一種方法,其用以提供 一多聲道音源訊號之一編碼表示。此方法包含取得以多聲道音源訊號為基礎之一降混合訊號,並提供複數個參數以及一殘餘訊號,其中此複數個參 數係描述在多聲道音源訊號之聲道間的相依性。而被包含至編碼表示裡之殘餘訊號數量係隨多聲道音源訊號而變化。此方法係以如上所述之音源編碼器之相同考慮為基礎。
在進一步的實施方案裡,係根據本發明所建立的電腦程式而執行本文所描述的方法。
有鑑於上述課題,本發明之目的為提供一種能夠簡化組裝並避免應力不均之燃料電池模組之鎖合裝置與燃料電池裝置。
100‧‧‧多聲道音源編碼器
110‧‧‧多聲道音源訊號
112‧‧‧編碼表示
120‧‧‧處理器
122‧‧‧降混合訊號
124‧‧‧描述多聲道音源訊號聲道間相依性之複數個參數
126‧‧‧殘餘訊號
130‧‧‧變動數目(殘餘訊號處理)
200‧‧‧多聲道音源解碼器
210‧‧‧編碼表示
212‧‧‧輸出音源訊號1
214‧‧‧輸出音源訊號2
220‧‧‧加權組合
222‧‧‧降混合訊號
224‧‧‧解相關訊號
226‧‧‧殘餘訊號
230‧‧‧權重決定器
232‧‧‧權重
300‧‧‧多聲道音源解碼器
310‧‧‧編碼表示(降混合訊號,空間參數,殘餘訊號)
312、314‧‧‧輸出音源訊號
400、500、600‧‧‧流程圖
410‧‧‧在多聲道音源訊號之基礎上取得一降混合訊號
420‧‧‧提供複數個參數以描述在多聲道音源訊號之聲道間相依性
430‧‧‧提供一殘餘訊號
440‧‧‧根據多聲道音源訊號變動包含至編碼表示裡之殘餘訊號數目
510‧‧‧根據一殘餘訊號決定一權重,此權重係在一加權組合裡描述一解相關訊號之一貢獻
520‧‧‧執行一降混合訊號、一解相關訊號以及殘餘訊號之一加權組合,以取得輸出音源訊號之其中之一
610‧‧‧在一降混合訊號、複數個編碼空間參數之一編碼表示以及在一殘餘訊號之一編碼表示之基礎上取得輸出音源訊號之其中之一
620‧‧‧根據殘餘訊號在一參數化編碼以及一殘餘編碼間執行一混合
700‧‧‧解碼器
710‧‧‧位元串流
712‧‧‧輸出聲道1
714‧‧‧輸出聲道2
720‧‧‧核心解碼器
722‧‧‧降混合訊號
724‧‧‧殘餘訊號
726‧‧‧空間資料
730‧‧‧解相關器
732‧‧‧解相關訊號
740‧‧‧計算升混合係數
742‧‧‧升混合參數
750‧‧‧升混合器
752、754‧‧‧升混合版本
756、760‧‧‧第一升混合版本
758、762‧‧‧第二升混合版本
770‧‧‧權重計算器
772‧‧‧加權數值
780‧‧‧權重器
782、784、786、788‧‧‧加權版本
790‧‧‧第一增加器
792‧‧‧第二增加器
800‧‧‧混合殘餘解碼器
第1圖係根據本發明之一實施例以顯示一多聲道音源編碼器之方塊圖。
第2圖係根據本發明之一實施例以顯示一多聲道音源解碼器之方塊圖。
第3圖係根據本發明之一另一實施例以顯示一多聲道音源解碼器之方塊圖。
第4圖係根據本發明之一實施例以顯示提供一多聲道音源訊號之一編碼表示之方法流程圖。
第5圖係根據本發明之一實施例以顯示在一編碼表示之基礎上,提供至少二輸出音源訊號之一方法流程圖。
第6圖係根據本發明之另一實施例以顯示在一編碼表示之基礎上,提供至少二輸出音源訊號之一方法流程圖。
第7圖係根據本發明之一實施例以顯示一解碼器之流程圖。
第8圖係顯示一混合殘餘解碼器之語義表示。
1.根據第1圖之多聲道音源編碼器
第1圖顯示一多聲道音源編碼器100之方塊圖,此多聲道音源編碼器100係用以提供一多聲道訊號之一編碼表示。
此多聲道音源編碼器100係用以接收一多聲道音源訊號110,並以多聲道音源訊號為基礎,提供多聲道音源訊號110之一編碼表示112此多聲道音源編碼器100包含一處理器(或者是處理裝置)120,其係用以 接收多聲道音源訊號以及取得以多聲道音源訊號110為基礎之一降混合訊號122。此處理器120更可用以提供多個參數124,這些參數係用以描述多聲道音源訊號110之聲道間的相依性。而且,處理器120係用以提供一殘餘訊號126,此外,多聲道音源編碼器係包含一殘餘訊號處理130,其係根據多聲道音源訊號以變化包含至編碼表示裡之殘餘訊號110之數量。
然而,值得一提的是,此多聲道音源解碼器並非一定要包含 一單獨的處理器120以及一單獨的殘餘訊號處理130,相反地,此必要性係存在於如果多聲道音源編碼器設法執行處理器120以及殘餘訊號處理130之功能性。
對於多聲道音源編碼器100的功能性,值得一提的是,多聲 道音源訊號110之聲道訊號一般是使用一多聲道編碼而進行編碼,其中此編碼表示112通常包含(在一編碼格式裡)降混合訊號122、複數個參數124以及殘餘訊號126,其中複數個參數124係描述多聲道音源訊號110之聲道(或者是聲道訊號)間的相依性。例如,此降混合訊號122可以是基於在多聲道音源訊號之聲道訊號之一組合(如線性組合)上。然而,一降混合訊號122可以是在多聲道音源訊號之複數個聲道訊號之基礎上而被提供。然而,或者是,至少二降混合訊號可以關聯至多聲道音源訊號110之多筆聲道訊號(通常大於降混合訊號之數目)。此複數個參數124可以描述多聲道音源訊號110之聲道(或者是聲道訊號)間的相依性,此相依性可以為一相關性、一協方差、一位準關係或者是其他。於是,此複數個參數124之目的為以一音源解碼器端之降混合訊號122為基礎,衍生多聲道音源訊號110之聲道訊號之一再建版本。對於此目的,此複數個參數係描述多聲道音源訊號之聲道訊號之期望特徵(例如,個別的特徵或是相關的特徵),使得使用一參數化解碼的一音源編碼器能夠在至少一降混合訊號122的基礎上再建聲道訊號。
此外,多聲道音源解碼器100係根據多聲道音源編碼器之期 望或是評估而提供殘餘訊號126,此殘餘訊號126一般係表示訊號元件,且此訊號元件無法再由一音源解碼器(例如,透過一遵守特定處理規則的音源解碼器)以降混合訊號122以及複數個參數124為基礎而進行再建。於是,此殘餘訊號126一般能夠被考慮作為在一音源解碼器端之一精緻訊號,此 精緻訊號係允許從再建而來的一波形或是至少一局部波形。
然而,多聲道音源編碼器100係根據多聲道音源訊號110 以變化包含至編碼表示112裡之一殘餘訊號之數量。換句話說,例如,多聲道音源編碼器可以決定關於包含到編碼表示112裡之殘餘訊號126的強度(或者能量)。另外,或者是,多聲道音源編碼器100可以決定對於頻率頻帶及/或有多少的頻率頻帶及殘餘訊號被包含至編碼表示112裡,根據多聲道音源訊號(及/或根據一可用的位元速率)而變化被包含至編碼表示裡殘餘訊號126"數量",多聲道音源編碼器100能靈活地決定那些精確度,而多聲道音源訊號110之聲道訊號能夠以編碼表示112為基礎而在一音源解碼器端進行再建。因此,精確度與那些多聲道音源訊號110之聲道訊號能夠被再建、被改編至多聲道音源訊號110(例如,暫時部份、頻率部份及/或時間/頻率部份)之聲道訊號之不同訊號部份之一音質關聯如此一來,舉例來說,包含短暫事件的音調訊號部份或者是訊號部份,高音質關聯之訊號部份能夠特別與高分辨率進行編碼,其編碼係透過包含一"大量數目"殘餘訊號126至編碼表示裡。舉例來說,針對高音質關聯之訊號部份,其可以透過具有一相對性地高能量之殘餘訊號被包含至編碼表示112裡而達成。此外,若是降混合訊號122包含一"不佳品質",其可以透過在一編碼表示112裡包含高能量之一殘餘訊號而達成,例如,若是當結合多聲道音源訊號112之聲道訊號至降混合訊號122裡時,即存在訊號元件之大量取消。換句話說,多聲道音源解碼器100能針對多聲道音源訊號110之訊號部份,選擇性地嵌入"大量數目"殘餘訊號(例如,具有相對性高能量之一殘餘訊號)至編碼表示112裡,而殘餘訊號之一相對較大數目之提供係帶來再建聲道訊號(再建於一音源解碼器端)之一重要的改善。
於是,根據多聲道音源訊號110,包含在編碼表示裡殘餘訊 號之數量的變動允許改編多聲道音源訊號110之編碼表示112(例如,以一編碼形式包含至編碼表示裡的殘餘訊號126),使得在此再建多聲道音源訊號(再建於一音源解碼器端)之位元速率效率以及音源品質能達到一良好的平衡。
值得一提的是,多聲道音源編碼器100能夠選擇性地以多種 方式來進行改善。舉例來說,多聲道音源編碼器可以根據多聲道音源訊號110以變化殘餘訊號126(被包含至編碼表示裡)之一頻寬。於是,包含到編碼表示112裡的殘餘訊號數目能夠被改編至感知上最重要的頻率頻帶。
可選擇地,多聲道音源解碼器係根據多聲道音源訊號110, 針對被包含在編碼表示112裡之殘餘訊號126而選擇複數個頻率頻帶,於是,編碼表示120(精確地來說,被包含至編碼表示112裡之殘餘訊號數目)可以被改編至多聲道音源訊號,例如,多聲道音源訊號110之感知上最重要的頻率頻帶。
選擇性地,多聲道音源編碼器係針對多聲道音源為音調的複 數個頻率頻帶,而包含殘餘訊號126至編碼表示裡另外,針對那些非音調的多聲道音源訊號之頻率頻帶(除非有其他特定條件滿足在一特定頻率頻帶中引起殘餘訊號被包含至編碼表示裡),多聲道音源編碼器可以不包含殘餘訊號126至編碼表示112裡,如此一來,殘餘訊號針對感知上重要的音調頻率頻帶,可以選擇性地被包含至編碼表示裡。
選擇性地,多聲道音源編碼器係針對時間部份及/或頻率頻 帶包含殘餘訊號至編碼表示裡,其中降混合訊號之形成係導致多聲道音源訊號之複數個訊號元件之一取消。舉例來說,多聲道音源編碼器可用以偵測在降混合訊號122裡多聲道音源訊號110之訊號元件的一取消,並且可對應於偵測之結果激發殘餘訊號126(如,包含至編碼表示112裡的殘餘訊號126)的提供。於是,如果多聲道音源訊號110之聲道訊號之降混合(或是任何其他一般的線性組合)至降混合訊號122導致多聲道音源訊號112之訊號元件的一取消(例如,其可能由相位偏移180度之不同聲道訊號之訊號元件所引起),而在音源解碼器裡再建多聲道音源訊號110時,協助克服取消之有害影響之殘餘訊號126將會被包含至編碼表示112裡。例如,殘餘訊號126可以針對存在這樣的一取消之頻率頻帶,而選擇性地被包含至編碼表示112裡。
選擇性地,多聲道音源編碼器可用以計算殘餘訊號,此殘餘 訊號係使用多聲道音源訊號之至少二聲道訊號之一線性組合並根據使用在一多聲道音源解碼器之一端上之複數個升混合係數。這樣殘餘訊號的一計 算是具有高效率的,且此計算對於一音源解碼器端聲道訊號之一簡單再建是被允許的。
選擇性地,多聲道音源編碼器可用以編碼複數個升混合係 數,此複數個升混合係數係使用參數124描述多聲道音源訊號之聲道間的複數個相依性,或者是從複數個參數衍生複數個升混合係數,複數個參數係描述多聲道音源訊號之聲道間的複數個相依性。於是,此複數個參數124(可以是聲道內位準差參數、聲道內相關性參數或者是其他)可以被使用於參數化編碼(編碼或解碼)以及殘餘訊號輔助編碼(編碼或解碼)。如此一來,殘餘訊號126之運用便不會伴隨一附加的訊號化負擔。相反地,不管怎樣用於參數化編碼(編碼/解碼)的複數個參數124,其也被再次使用於殘餘編碼(編碼/解碼),如此即可達到高編碼之效率。
選擇性地,多聲道音源解碼器係隨時間進行變化而決定殘餘訊號之數量,殘餘訊號係使用一音質模型以包含至編碼表示裡。於是,編碼精準度能夠被改編至訊號之音質特徵,而導致一良好高效率之位元速率。
然而,值得一提的是,多聲道音源編碼器能選擇性地藉由任何本文描述的特徵或功能來補充(在說明書以及專利保護範圍裡)此外,多聲道音源編碼器還可以改編此處所描述的音源解碼器,以平行地與音源解碼器進行合作。
2.根據第2圖之多聲道音源解碼器
第2圖係根據本發明之一實施例以顯示一多聲道音源解碼器200之方塊圖。
多聲道音源解碼器200係用以接收一編碼表示210以及在此編碼表示之基礎上,提供至少二輸出音源訊號212,214例如,多聲道音源解碼器200可以包含一加權組合器220,其係用以執行一降混合訊號222、一解相關訊號224以及一殘餘訊號226之一加權組合,以取得輸出訊號之(至少)其中之一,舉例來說,此輸出訊號可以為第一輸出音源訊號212。在此處值得一提的是,例如,降混合訊號212、解相關訊號224以及殘餘訊號226可以從編碼表示210衍生,其中編碼表示210可以攜帶降混合訊號220 之一編碼表示以及殘餘訊號226之一編碼表示。而且,舉例來說,解相關訊號224可以從降混合訊號222所衍生,或者是包含在編碼表示210裡所使用的附加資訊所衍生。然而解相關訊號也可以從編碼表示210提供且不具任何專屬的資訊。
此多聲道音源解碼器200係用以決定一權重,此權重係根 據殘餘訊號226以描述在加權組合裡以解相關訊號224之貢獻。例如,多聲道音源解碼器200可以包含一權重決定器230,係用以決定一權重232,此權重232係在殘餘訊號之基礎上描述在加權組合裡解相關訊號224之貢獻(例如,解相關訊號224至第一輸出音源訊號212之貢獻)。
關於多聲道音源解碼器200之功能性,值得一提的是,解相 關訊號224至加權組合以及至第一輸出音源訊號212之貢獻,是根據殘餘訊號226以一靈活的方式(例如,暫時性的變數以及頻率相關)來進行調整的,而沒有額外地訊號化負擔。於是,包含至第一輸出音源訊號212之解相關訊號224之數量係根據被包含至第一輸出音源訊號212的殘餘訊號226之數量而改編的,其使得第一輸出音源訊號212達到一良好的品質。於是,在任何情況下便可能取得解相關訊號224之一適當加權且不具一額外的訊號化負擔。如此一來,使用此多聲道音源解碼器200,使用一中等的位元速率即可達到在解碼輸出音源訊號212上的一良好品質。再建之一精準度能夠被一音源編碼器靈活地調整,其中此音源編碼器能決定被包含至編碼表示212裡的殘餘訊號226數目(例如,多大的殘餘訊號226能量被包含至編碼表示210裡,或者是多少相關的頻率頻帶殘餘訊號226被包含在編碼表示210)以及此多聲道音源解碼器200能因此反應並調整解相關訊號224之權重,以適合包含在編碼表示210裡的殘餘訊號226數量。因此,如果在編碼表示210裡存在大數量之殘餘訊號226,(例如,針對一特定頻率頻帶或者是特定的暫時性部份),此加權組合220可以主要地(或是完全地)考慮殘餘訊號226而給予低權重(或不給予權重)至解相關訊號224。相反地,如果包含在編碼表示210裡的為一小數量之殘餘訊號226,此加權組合220可以主要地(或是完全地)考慮解相關訊號224,且除了降混合訊號外,其僅相對性低程度地(或是完全不)考慮殘餘訊號226。如此一來,多聲道音源解碼 器200能夠與一適當的多聲道音源編碼器靈活的合作,並且調整加權組合220在任何情況下能達到最好的可能音源品質(不考慮包含至編碼表示210裡之殘餘訊號226為一小數目或是大數目)。
值得一提的是,第二輸出音源訊號214可以以一相似的方式 而被產生,然而,相同的機制可以非必要的應用到第二輸出音源訊號214裡,舉例來說,如果存在相對於第二輸出音源訊號的不同品質要求。
在一可選擇的改進方案中,多聲道音源解碼器可用以決定權重,該權重係根據解相關訊號224以描述在加權組合裡解相關訊號224之貢獻。換句話說,權重232可以是相依於殘餘訊號226以及解相關訊號224。於是,權重232甚至可以更好的改編至一沒有額外訊號化負擔的目前解碼音源訊號。
在另一個可選擇的改進方案中,多聲道音源解碼器可用以取得在編碼表示212為基礎上的複數個升混合參數,並用以決定權重232,此權重232係根據複數個升混合參數以描述在加權組合裡解相關訊號的貢獻,於是,此權重232可以是額外相依於複數個升混合參數,使得權重232之更佳的一改編可以達成。
作為另一個可選擇的改進方案,多聲道音源解碼器可用以決定權重,此權重係描述在加權組合裡解相關訊號之貢獻,使得該解相關訊號之該權重隨著該殘餘訊號之能量增加而減少。於是,在主要基於解相關訊號224(除了一降混合訊號222)上之一解碼以及在主要基於殘餘訊號226(除了一降混合訊號222)上之一解碼之間可以執行一混合或者是一衰退。
作為另一個可選擇的改進方案,多聲道音源解碼器200可用以決定權重232,使得若是殘餘訊號226之一能量為零時,則由一解相關訊號升混合參數(其可以被包含在編碼表示210裡或是從編碼表示210衍生)所決定的最大權重相關聯至解相關訊號224,而若是用一殘餘訊號加權係數進行加權之殘餘訊號225之一能量大於或等於解相關訊號224之能量,則將使得一零權重關聯至解相關訊號224,其中此解相關訊號224之能量係以解相關訊號升混合參數進行加權。於是,其有可能在以解相關訊號224為基礎之一解碼以及以殘餘訊號226為基礎之一解碼間進行完全地混合(或者 是衰退)。如果殘餘訊號226被評斷為夠強大(例如,當加權殘餘訊號之能量等於或大於加權解相關訊號224之能量),此加權組合可以完全地依靠殘餘訊號226以精緻化降混合訊號222而不考慮剩下的解相關訊號224。在此案例中,既然解相關訊號224之考慮通常預防了一特定良好的波形形式再建,而殘餘訊號226之運用通常允許一個良好的波形形式再建,在多聲道音源解碼器200端上一特定良好的(至少部份)波形形式再建係可以被執行的。
在另一個可選擇的改進方案中,多聲道音源解碼器200係用 以計算解相關訊號之一加權能量數值,此加權能量數值係根據至少一解相關訊號升混合參數進行加權,並用以計算殘餘訊號之一加權能量數值,此加權能力數值係使用至少一殘餘訊號升混合參數進行加權。在此案例中,多聲道音源解碼器係根據在解相關訊號之加權能量數值以及在殘餘訊號之加權能量數值間之以決定一因子,並且取得一權重,此權重係以此因子為基礎而描述解相關訊號224至輸出音源訊號(例如,第一輸出音源訊號212)之其中之一的貢獻,如此一來,此權重決定器230可以提供特定良好改編的加權數值232。
在一可選擇的改進方案中,多聲道音源解碼器200(或者是 其權重決定器230)可以將此因子乘上解相關訊號升混合參數(那些被包含在編碼表示210或者是從編碼表示210所衍生的),以取得權重232(或者是加權數值),此權重232係描述解相關訊號224至輸出音源訊號(如第一輸出音源訊號212)其中之一之貢獻。
在一可選擇的改進方案中,多聲道音源解碼器(或者是其權 重決定器230)係用以計算在複數個升混合聲道以及時間槽上解相關訊號224之能量,此能量係使用解相關訊號升混合參數(那些被包含在編碼表示210或者是從編碼表示210所衍生的)以進行加權,以取得解相關訊號之加權能量數值。
作為更進一步可選擇的改進方案,多聲道音源解碼器200 係用以計算在複數個升混合聲道以及時間槽上殘餘訊號224之能量,此能量係使用殘餘訊號升混合參數(那些被包含在編碼表示210或是從編碼表示210所衍生的)以進行加權,以取得殘餘訊號之加權能量數值。
作為另一個可選擇的改進方案,多聲道音源解碼器200(或 是其權重決定器232)係根據在解相關訊號之加權能量數值以及在殘餘訊號之加權能量數值間之一差異以計算上述之因子。由此可發現,這樣的計算是一種決定加權數值232的高效率解決方式。
作為一可選擇的改進方案,多聲道音源解碼器係根據在一差 異與解相關訊號224之加權能量數值間之一比例以計算因子,其中此差異係指解相關訊號224之加權能量數值以及在殘餘訊號226之加權能量數值間之一差異。由此可發現,對於,這樣的計算對於因子而言係帶來良好的結果,以用於混合根據細化降混合訊號222的一主要解相關訊號以及根據細化降混合訊號222的一主要殘餘訊號。
作為一可選擇的改進方案,多聲道音源解碼器200係用以決 定複數個權重,此複數個權重係描述解相關訊號至至少二輸出音源訊號之複數個貢獻,舉例來說,第一輸出音源訊號212和第二輸出音源訊號214。 在此情況裡,在解相關訊號224以及一第一聲道解相關訊號升混合參數之加權能量數值的基礎上,多聲道音源解碼器係用以決定解相關訊號224至第一輸出音源訊號212之一貢獻。此外,在解相關訊號224以及一第二聲道解相關訊號升混合參數之加權能量數值的基礎上,多聲道音源解碼器係用以決定解相關訊號224至第二輸出音源訊號214之一貢獻。換句話說,相異的解相關訊號升混合參數可被用於提供第一輸出音源訊號212以及第二輸出音源訊號214。然而,解相關訊號之相同加權能量數值可被用於決定解相關訊號至第一輸出音源訊號212之貢獻,且可決定解相關訊號至第二輸出音源訊號214之貢獻。如此一來,一高效率的調整便成為可能的,其中此二輸出音源訊號212,214的不同特徵可以透過不同的解相關訊號升混合參數而被考慮。
作為一可選擇的改進方案,若是一殘餘能量(例如,殘餘訊 號226之一能量或者是殘餘訊號226之一加權版本)超過一解相關能量(例如解相關訊號224之一能量或是解相關訊號224之一加權版本),多聲道音源解碼器200係用以關閉解相關訊號至加權組合之一貢獻。
作為一更進一步可選擇的改進方案,音源解碼器可用以頻帶 化地決定權重232,此權重232係根據殘餘訊號之一加權能量數值之一頻帶化決定來描述在加權組合裡解相關訊號224之貢獻。於是,可以執行多聲道音源解碼器200到欲被執行解碼之訊號的一微調。
在另一個可選擇的改進方案中,音源解碼器係用以決定權重,此權重係針對在輸出音源訊號212,214之每一訊框以描述在加權組合裡解相關訊號之一貢獻。於是,可達成一良好暫時性的分辨率。
在一更進一步可選擇的改進方案裡,加權數值232之決定器可以根據以下提供的公式而被執行。
然而,值得一提的是,多聲道音源解碼器200可藉由任何本文所述的特徵或功能來補充,並且亦相對於其他的實施例。
3.根據第3圖之多聲道音源解碼器
第3圖係根據本發明之一實施例以顯示一多聲道音源解碼器300之方塊圖。多聲道音源解碼器300係用以接收一編碼表示310,並在此編碼表示之基礎上提供至少二輸出音源訊號312,314,例如,此編碼表示310可以為包含一降混合訊號一編碼表示,至少一空間參數之一編碼表示以及一殘餘訊號之一編碼表示。在降混合訊號之編碼表示的基礎上,多聲道音源解碼器300係用以取得輸出音源訊號之(至少)其中之一,例如,一第一輸出音源訊號312及/或一第二輸出音源訊號314。
特別是,多聲道音源解碼器300係根據殘餘訊號(所包含之殘餘訊號為在一編碼表示310裡之一編碼型式),在一參數化編碼以及一殘餘編碼間進行混合。換句話說,在一解碼模式中,在降混合訊號之基礎上,輸出音源訊號312,314之提供係被執行,並且使用空間參數來描述在輸出音源訊號312,314間之一期望關係(例如,輸出音源訊號312,314之一期望聲道間位準差或是一期望聲道間相關性),在另一解碼模式中,在降混合訊號之基礎上,輸出音源訊號312,314係使用殘餘訊號進行再建,而多聲道音源解碼器300可以在此兩種解碼模式間進行混合。如此一來,包含至編碼表示310裡之殘餘訊號的強度(例如,能量),可以決定解碼是否主要(或完全地)以空間參數(除了降混合訊號)為基礎,或解碼是否主要(或完全地) 以殘餘訊號(除了降混合訊號)為基礎,或是否以空間參數以及殘餘訊號兩者的一中間陳述來考慮影響降混合訊號之細化,進而從降混合訊號衍生出輸出音源訊號312,314。
此外,多聲道音源解碼器300藉由在參數化編碼(通常,當 提供輸出音源訊號312,314時,一相對高的權重係被給予至一解相關訊號)以及一殘餘編碼(通常,一相對低的權重係被給予至一解相關訊號)間的混合,而允許對於被良好改編至目前音源內容之一解碼,其中此解碼係不存在高訊號化之負擔。
然而,值得一提的是,多聲道音源解碼器300係基於如多聲 道音源解碼器200之相似考量,且上述關於多聲道音源解碼器200的選擇性改進方式也可以應用於多聲道音源解碼器300。
4.根據第4圖,其係為一種用以提供一多聲道音源訊號之一編碼表示之方法
第4圖係顯示一種方法400之流程圖,此方法係提供一多聲道音源訊號之一編碼表示。
此方法400包含一步驟410為取得以一多聲道音源訊號為基礎之一降混合訊號。此方法400也包含一步驟420為提供描述在多聲道音源訊號之聲道間複數個相關性之複數個參數。舉例來說,聲道間位準差參數及/或聲道間相關性參數(或者是協方差參數)可以被提供,用以描述多聲道音源訊號之聲道間之相依性。此方法400也包含一步驟430為提供一殘餘訊號。此外,此方法包含一步驟440為包含至編碼表示裡之殘餘訊號數目係隨多聲道音源訊號而變化。
值得一提的是,此方法400係基於相同考慮以根據第1圖作為音源編碼器100。此外,此方法400可藉由任何本文及有關於發明裝置所描述的特徵或功能來補充。
5.根據第5圖,其係在一編碼表示的基礎上提供至少二輸出音源訊號之一種方法
第5圖係顯示在一編碼表示之基礎上提供至少二輸出音源訊號之一方法500之流程圖。此方法500包含決定510一權重,此權重係根據一殘餘訊號以描述在加權組合裡解相關訊號之一貢獻,此方法500也包含執行520一降混合訊號、一解相關訊號及一殘餘訊號之一加權組合,以取得至少二輸出音源訊號之其中之一。
值得一提的是,此方法500可藉由任何本文及有關於此發明裝置所描述的特徵或功能來補充。
6.根據第6圖,其係為以一編碼表示為基礎而提供至少二輸出音源訊號之一種方法
第6圖係顯示在一編碼表示之基礎上提供至少二輸出音源訊號之一方法600之流程圖。此方法600係包含取得610以一降混合訊號、複數個編碼空間參數之一編碼表示以及以一殘餘訊號之一編碼表示為基礎之至少二輸出音源訊號之至少其中之一,取得610輸出音源訊號之其中之一係包含根據殘餘訊號而在一參數化編碼以及一殘餘編碼間執行620一混合。
值得一提的是,此方法600可藉由任何本文及有關於此發明裝置所描述的特徵或功能來補充。
7.進一步之實施例
在下文中,部份一般考慮以及一些進一步的實施方式將被說明。
7.1一般考慮
根據本發明之實施方式係以以下為基礎,取代使用一固定之殘餘頻寬,一解碼器(如一多聲道音源解碼器)藉由針對每一訊框(或者是一般地,至少針對複數個頻率範圍或是複數個暫時性部份)測量其能量頻帶,而偵測出傳送殘餘訊號之數目,根據所傳送之空間參數,一解相關輸出係被增加到殘餘能量的"遺失"裡,以達到輸出能量及解相關之一需要(或期望) 數量。此允許一變動的殘餘頻寬以及頻帶通過式殘餘訊號。例如,其可能只有針對音調頻帶使用殘餘編碼。為了能夠針對參數化編碼以及波形形式保留編碼(其也被指定作為殘餘編碼)而使用簡易降混合,針對簡易降混合之一殘餘訊號在此處被定義。
7.2為了簡易降混合計算殘餘訊號
在下文中,一些關於殘餘訊號之計算以及關於一多聲道音源訊號之聲道訊號之結構的考量將被描述。
在統一語音及音源編碼(USAC)裡,當所謂的"簡易降混合"被使用時,其並不存在所定義之殘餘訊號,因此,沒有部分波形保留編碼是可能的。然而,在下文中,一種為了所謂"簡易降混合"而計算一殘餘訊號之一方法將被描述。
"簡易降混合"權重d1,d2係針對每一個縮放因子頻帶被計算,而,參數化升混合係數ud1,ud2且是針對每一參數頻帶而被計算。如此一來,用以計算殘餘訊號之係數wr1,wr2便無法從空間參數直接地進行計算,(因為此案例係針對一古典的MPEG環繞),但是可以需要從降混合及升混合係數被用來決定頻帶化之縮放因子。
利用L,R作為輸入聲道,D作為降混合聲道,一殘餘訊號res應該遵守下列之特點:D=d 1 L+d 2 R (1)
L=u d,1 D+u r,1res (2)
R=u d,2 D+u r,2res (3)
藉由下式以計算此殘餘res=w r,1 L+w r,2 R (4)
使用降混合權重
由解碼器使用的殘餘升混合係數ur,1及ur,2係以一方式被選 擇以保証強健之解碼。即然此簡易降混合具有非對稱之特性(相對於具有固定權重之MPEG環繞),根據空間參數之一升混合係被應用,如使用以下的升混合係數:u r,1=max{u d.1,0.5} (7)
u r,2=-max{u d.2,0.5} (8)
另一個選擇是去定義正交於降混合訊號之升混合係數之殘餘升混合係數,使得:
換句話說,一音源解碼器可以取得使用一降混合訊號D,此降混合訊號D係使用一左聲道訊號L(第一聲道訊號)以及一右聲道訊號R(第二聲道訊號)之一線性組合。類似地,殘餘訊號res係使用左聲道L以及右聲道訊號R(或者是,在多聲道音源訊號之一第一聲道訊號以及一第二聲道訊號)而取得。
例如,從此可看出,在公式(5)及(6)裡,當簡易降混合權重d1,d2,參數化升混合係數ud,1及ud,2以及殘餘升混合係數ur,1及ur,2被決定時,用以取得殘餘訊號res之降混合權重wr,1及wr,2係能夠被取得。此外能發現的是,從ud,1及ud,2使用公式(7)及(8)或是公式(9)即能衍生出ur,1及ur,2。此簡易降混合權重d1及d2以及參數化升混合係數ud,1及ud,2能在一普通方式裡被取得。
7.3編碼處理
在下文裡,關於編碼處理的一些細節將會被描述。例如,此編碼可以是由多聲道音源編碼器100或者是其他任何適當的手段或是電腦程式所執行。
較佳地,根據音源訊號(如根據多聲道音源訊號110之聲道訊號)以及可用的位元速率,被傳送之一殘餘數量係由編碼器(如多聲道音源編碼器)之一音質模型而決定。舉例來說,此傳送之殘餘訊號能被使用於部分波形之形式保存或者是去避免由使用的降混合方法所引起的訊號取消, 例如,由上述公式(1)所描述的降混合方法。
7.3.1部分波形之形式保存
在下文裡,其將描述一部分波形之形式保存如何被達成。舉例來說,計算之殘餘(如,殘餘res係根據公式(4))是全頻帶地或有限頻帶地被傳送,並用以提供在殘餘頻寬裡部份波形之形式保存。被音質模型偵測為感知不相關的殘餘部份可以被量化成零(例如,當在殘餘訊號126之基礎上提供編碼表示112)。此即包含,在執行時間減少傳送之殘餘頻寬(這可以被認為是變動包含在編碼表示裡之殘餘訊號數量),但可不限制於此方式。此系統也可以允許殘餘訊號部份的頻帶通過式刪除,因為遺失的訊號能量將藉由解碼器而再建(例如,藉由多聲道音源解碼器200或者是多聲道音源解碼器300)。如此一來,舉例來說,殘餘編碼可以唯一應用到訊號之音調元件,保留其相位關係,而背景雜訊能夠被參數化地編碼以減少殘餘位元速率。換句話說,針對多聲道音源訊號110(或者是多聲道音源訊號110之至少一聲道訊號)被發現為音調之頻率頻帶及/或暫時性的部份,殘餘訊號126可以是被包含至編碼表示112裡(例如,藉由殘餘訊號處理130),相反的,針對多聲道音源訊號110(或者是多聲道音源訊號110之至少一聲道訊號)被識別為類似雜訊之頻率頻帶及/或暫時性部份,殘餘訊號126即可以不被包含至編碼表示112裡。如此一來,被包含至編碼表示裡之殘餘訊號之一數量係隨多聲道音源訊號而變化。
7.3.2降混合裡訊號取消之避免
在下文裡,其將描述一降混合裡訊號取消如何被避免(或者是補償)。
對於較低位元速率的應用,參數化編碼(主要地或是完全地依賴複數個參數124,其係描述多聲道音源訊號之聲道間的相依性)係取代波形形式保留編碼(例如,除了降混合訊號122外,主要是依賴殘餘訊號126)而被應用。在此處,殘餘訊號126係為了在降混合122裡之訊號取消而進行補償,以最小化殘餘之位元使用。只要在降混合122裡沒有訊號取消被 偵測到,使用解相關器(在音源解碼器端上)之系統即在一參數化模式裡運行。舉例來說,針對相位音調訊號,當訊號取消發生時,一殘餘訊號126係為了受損之訊號部份而進行傳送(如,頻率頻帶及/或暫時的部份),如此一來,訊號能量即可藉由解碼器複原。
7.4解碼處理 7.4.1概觀
在解碼器裡(如在多聲道音源解碼器200或者是多聲道音源解碼器300),傳送之降混合訊號以及殘餘訊號(如降混合訊號222或者是殘餘訊號226)係藉由一核心解碼器進行解碼,且與解碼之MPEG環繞負載一起被饋入至一MPEG環繞解碼器。用於傳統的MPS降混合之殘餘升混合係數係不改變的,且用於簡易降混合之殘餘升混合係數係定義於公式(7)及(8)及/或(9)。另外,解相關輸出以及其加權係數係被計算以用於參數化解碼,加權此殘餘訊號以及解相關輸出且混合此兩者至輸出訊號,因此,加權因子係透過測量殘餘及解相關訊號之能量而被決定的。
換句話說,殘餘升混合因子(或者是係數)可以是藉由測量殘餘及解相關訊號之能量而決定的。
例如,降混合訊號222係在編碼表示210的基礎上被提供,而解相關訊號224係從降混合訊號222衍生,或者是(或否則)在由包含在編碼表示210裡之參數的基礎上所產生。例如,根據解碼器之公式(7)及(8),此殘餘升混合係數可以從參數化升混合係數ud,1及ud,2而衍生出來,其中舉例來說,在編碼表示210之基礎上,參數化升混合係數ud,1,ud,2可以從被包含在編碼表示210裡的空間資料(如從聲道間之相關性係數、聲道間之位準差係數或者是物件間之相關性係數以及物件間之位準差)而直接地被取得。
用於解相關輸出(或輸出)之升混合係數可以被取得以作為常規的MPEG環繞解碼。然而,用於加權解相關輸出(或是解相關輸出)之加權因子可在殘餘訊號之能量的基礎上(也可能是在解相關訊號或者訊號之能量的基礎上)而被決定,使得一權重係根據殘餘訊號而被決定,而此權重 係用以描述在加權組合裡解相關訊號之一貢獻。
7.4.2範例實作
在下文中,參考第7圖之一範例實作將會被描述。然而,值得一提的是,在此處所描述的概念也能應用在第2圖及第3圖的多聲道音源解碼器200或300裡。
第7圖係顯示一解碼器(例如一多聲道音源解碼器)之一方塊圖(或流程圖)。根據第7圖,解碼器係使用700來表示其全部。解碼器700係用以接收一位元串流710,並且在其基礎上,提供一第一輸出聲道訊號712以及一第二輸出聲道訊號714,解碼器700包含一核心解碼器,用以接收位元串流710以及在其基礎上,提供一降混合訊號722、一殘餘訊號724以及一空間資料726。例如,作為降混合訊號,核心解碼器720可以提供降混合訊號之一時間域表示或是轉換域表示(如頻率域表示、MDCT域表示、QMF域表示),其中此降混合訊號係由位元串流710所表示。類似地,核心解碼器720可以提供殘餘訊號724之一時間域表示或者轉換域表示,其中此殘餘訊號724係由位元串流710所表示。此外,核心解碼器720可以提供至少一空間參數726,例如像是至少一聲道間相關性參數、聲道間位準差參數或者是其他。
此解碼器700也包含一解相關器730,係在降混合訊號722的基礎上提供一解相關訊號732。任何其他著名的解相關概念也可以被此解相關器730所使用。此外,解碼器700也包含一升混合係數計算器740,係用以接收空間資料726以及提供升混合參數(例如,升混合參數udmx,1,udmx,2,udec,1以及udec,2)。此外,解碼器700包含一升混合器750,係在空間資料726的基礎上,應用由升混合係數計算器所提供的升混合參數742(也指派作為升混合係數)。如,升混合器750可以使用兩個降混合-訊號升混合係數(如udmx,1,udmx,2)來縮放降混合訊號,以取得降混合訊號722的兩個升混合版本752,754。此外,升混合器750也應用至少一升混合參數(例如,兩個升混合參數)至由解相關器730所提供的解相關訊號732,以取得解相關訊號732之一第一升混合(縮放的)版本756以及一第二升混合(縮放的)版本 758。此外,升混合器750係用以應用至少一升混合係數(例如,二個升混合係數)至殘餘訊號724,以取得殘餘訊號724之一第一升混合(縮放的)版本760以及一第二升混合(縮放的)版本762。
此解碼器700也包含一權重計算器770,係用以測量解相關 訊號752之升混合(縮放的)版本756,758之能量以及殘餘訊號724之升混合(縮放的)版本760,762之能量而且,權重計算器770係用以提供至少一加權數值772至一權重器780。此權重器780係使用由權重計算器770所提供之至少一加權數值772,而取得解相關訊號732之一第一升混合(縮放的)以及加權版本782、解相關訊號732之一第二升混合(縮放的)以及一加權版本784、殘餘訊號724之一第一升混合(縮放的)及加權版本786以及殘餘訊號724之一第二升混合(縮放的)及加權版本788。此解碼器也包含一第一增加器790,係用以增加降混合訊號720之第一升混合(縮放的)版本752、解相關訊號732之第一升混合(縮放的)及加權版本782以及殘餘訊號724之第一升混合(縮放的)及加權版本786,以取得第一輸出聲道訊號712。此外,解碼器包含一第二增加器792,係用以增加降混合訊號720之第二升混合縮放的版本754、解相關訊號732之第二升混合(縮放的)及加權版本784以及殘餘訊號724之第二升混合(縮放的)及加權版本788,以取得第二輸出聲道訊號714。
然而,值得一提的是,權重器780並不需要加權所有的訊號 756,758,760,762。例如,在一些實施方式中,它可以僅加權訊號756,758而不影響到剩下的訊號760及762(使得,訊號760,762可以直接地被應用到增加器790,792)然而,或者是,殘餘訊號760,762之加權可以隨時間而變動。例如,殘餘訊號可以被衰退或是被淡出。例如,解相關訊號之加權(或是加權因子)可以隨時間而進行平滑,且殘餘訊號可相對地被衰退或是被淡出。
此外,值得一提的是,被權重器780執行之加權以及被升混合器750應用之升混合也可以被執行作為一結合操作,其中此權重計算可以直接地使用解相關訊號732以及殘餘訊號724來執行。
在下文裡,關於解碼器700之功能性之進一步細節將會被描 述。
例如,一結合的殘餘及參數化編碼模式可以在一半向後兼容 方式裡被訊號化,舉例來說,透過在位元串流裡訊號化一參數頻帶之一殘餘頻寬。如此一來,藉由切換至高於第一參數頻帶的參數化解碼,一個傳統解碼器將仍然可以通過並解碼位元串流。使用一殘餘頻寬為一之傳統位元串流無法包含高於第一參數頻帶的殘餘能量,這將導致在新提出的解碼器裡的一參數化解碼。
然而,在一三維音源編解碼系統裡,結合的殘餘及參數化編 碼可用於組合其他核心解碼器工具,如一四聲道元件,使解碼器明確地偵測傳統位元串流並在規律有限頻帶的殘餘編碼模式裡解碼此傳統位元串流。當一實際的殘餘頻寬在執行時間被解碼器決定時,其可以非準確的被訊號化,此升混合係數之計算係被設定至參數化模式,而非一殘餘編碼模式。加權解相關輸出Edec以及加權殘餘訊號Eres之能量係在每一混合頻帶hb隨著所有時間槽ts而計算,且針對每一訊框而升混合聲道ch:
在這裡,針對一頻率頻帶hb、一時間槽ts以及一升混合聲道ch,udec指派為一解相關訊號升混合參數,指派為升混合聲道上之一總和且指派為時間槽上之一總和。針對一頻率頻帶hb、一時間槽ts以及一聲道ch,xdec指派解相關訊號之一數值(例如,一複雜的轉換域值)。
此殘餘訊號(例如,升混合殘餘訊號760或者是升混合殘餘訊號762)以一權重為1之值而增加到輸出聲道(例如,到輸出聲道712,714)裡,此解相關訊號(例如,升混合解相關訊號756或者是升混合解相關訊號758)可以以一因子r(例如,透過權重器780)進行加權,其計算方式如下:
其中Edec(hb)表示針對一頻率頻帶hb解相關訊號xdec之一加 權能量數值,且其中Eres(hb)表示針對一頻率頻帶hb殘餘訊號xres之一加權能量數值。
如果沒有殘餘(例如,沒有殘餘訊號724)被傳送,即如果 Eres=0,r將變成1(被加權器780所應用之因子,其可以考慮被視為一加權數值772),其系等價於一單純的參數化解碼。如果殘餘能量(例如,升混合殘餘訊號760以及升混合殘餘訊號762之能量)超過解相關器之能量(例如,升混合解相關訊號756或是升混合解相關訊號758之能量),舉例來說,如果Eres>Edec,因子r可以被設定為零,以關閉解相關器且啟用部份的波形形式保留解碼。在升混合處理裡,加權解相關輸出(例如,訊號782以及784)以及殘餘訊號(例如,訊號786,788或是訊號760,762)係被加入至輸出聲道(例如,訊號712,714)。
總結來說,其將導致在矩陣形式裡的一升混合規則,
其中ch1表示一第一輸出音源訊號之至少一時間域樣本或 者是轉換域樣本,其中ch2表示一第二輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中xdmx表示一降混合訊號之至少一時間域樣本或者是轉換域樣本,其中xdec表示一解相關訊號之至少一時間域樣本或者是轉換域樣本,其中xres表示一殘餘訊號之至少一時間域樣本或者是轉換域樣本,其中udmx,1係針對第一輸出音源訊號以表示一降混合訊號升混合參數,其中udmx,2係針對第二輸出音源訊號以表示一降混合訊號升混合參數,其中udec,1係針對第一輸出音源訊號以表示一解相關訊號升混合參數,其中udec,2係針對第二輸出音源訊號以表示一解相關訊號升混合參數,其中max表示一最大操作元,以及其中r表示用來描述殘餘訊號裡解相關訊號之一權重的一因子。
升混合係數Udmx,1,Udmx,2,Udec,1,Udec,2係針對MPS2-1-2參數化模式而被計算,進一步的細節可參考上述MPEG環繞概念之標準。
綜合以上所述,根據本發明之一實施例係建立一概念,在一降混合訊號、一殘餘訊號以及一空間資料的基礎上,提供輸出聲道訊號, 其中解相關訊號之一加權係可以靈活地被調整而沒有顯著的訊號化負擔。
7.5實施方案
雖然某些方面已經在一裝置的上下文中被描述,可清楚的得知,這些方面也表示了相關方法的一描述,其中一區塊或是裝置係對應於一方法步驟或是一方法步驟之特徵。類似地,在方法步驟的上下文中也表現了一對應區塊或項目或是一對應裝置之特徵的一描述。部份方法步驟或是全部方法步驟可以藉由一硬體裝置來被執行,舉例來說,一個微處理器,一個可程式化之電腦或是一個電子電路。在部份實施方式中,一些或更多的最重要方法步驟可以透過這樣的一裝置來被執行。
本發明之編碼音源訊號能夠在一數位儲存媒介上被儲存,或是能夠在一傳輸媒介上被傳輸,這樣的傳輸媒介可以是一無線傳輸媒介或是一有線傳輸媒介,如網際網路。
根據特定實施方式的需求,本發明之實施例能在實現在硬體或是在軟體上。此實現方式可使用一數位儲存媒介來執行,舉例來說,一軟體磁碟機,一DVD,一BluRay,一CD,一ROM,一PROM,一EPROM,一EEPROM或是一個快閃記憶體,非臨時性儲存媒介具有儲存其上的可讀控制訊號,其可以與一可程式化電腦系統合作(或能與其合作),使得個別的方法可以被執行。因此,此數位儲存媒介是可以被計算機讀取的。
根據本發明包含一資料載體,其係具有電子可讀取控制訊號,部份實施方法係能夠與一可程式化電腦合作,使得在這裡描述的其中一個方法可以被執行。
一般來說,本發明之實施方式能夠以具有一程式碼之一計算機程式產品來被實現,當此計算機程式產品執行在一電腦上時,此程式碼可操作用以執行其中一方法。例如此程式碼可以被儲存在一機器可讀載體裡。
其他實施方法包含電腦程式係用以執行在此描述的其中一方法,其中此方法係儲存於一機器可讀載體上。
換句話,本發明之一實施方式是具有一程式碼的一電腦,當 在一電腦上執行此程式碼時,執行在此描述裡的其中一方法。
在此發明中之更進一步的實施方式為,一資料載體(或一數 位儲存媒介,或是一計算機可讀媒介)包含儲存的電腦程式,用以執行在此描述的其中一方法。此資料載體、數位儲存媒介或是儲存媒介,一般來說是實體的及/或非臨時性的。
在此發明中之更進一步的實施方式為,表示電腦程式的一資料串流或一訊號序列,係用以執行在此描述的其中一方法。例如,資料串流或是訊號序列可透過一資料通訊連接,例如透過網際網路,以進行傳送。
一個進一步的實施方法包含一處理手段,例如一電腦或是一可程式化邏輯裝置,用以執行或改編在此描述的其中一方法。
一個更進一步的實施方式係包含具有安裝電腦程式之電腦,用以執行在此描述的其中一方法。
根據本發明,一個更進一步的實施方式,例如包含一裝置或一系統以電子或光學傳輸一電腦程式至一接收端,此電腦程式係用以執行在此描述的其中一方法。舉例來說,此接收端可以為一電腦、一行動裝置、一記憶體裝置或是其他類似裝置。舉例來說,此裝置或系統可以包含一檔案伺服器,用以傳送電腦程式至接收端。
在一些實施方式中,舉例來說,一個可程式化邏輯裝置可為一場景邏輯閘陣列,其可用以執行在此處所描述的部份或是全部功能。在一些實施方式中,一個場景邏輯閘陣列可以與微處理器合作,以執行在此處所描述的其中一方法。一般來說,此方法較佳地可以被任何硬體裝置所執行。
上述實施例僅用於說明本發明的原理,應當理解,本文中所描述的修改和有關安排的變化和細節將顯而易見的其他領域的技術人員。因此,其意圖是由即將發生的專利權利要求範圍來限制,而不是由本文描述的實施例和解釋的方式呈現的特定細節來限制。
7.6進一步之實施方式
在下文中,根據本發明而參考第8圖之另一實施例將被描 述,其係顯示一所謂的混合殘餘解碼器之方塊圖。
第8圖之混合殘餘解碼器800係相似於第7圖之解碼器 700,使得其可參考以上的解釋。然而,在混合殘餘解碼器800裡,一附加的加權(除了升混合參數之應用)只有被應用至升混合解相關訊號(在解碼器700裡對應於訊號756,758),而沒有應用到升混合殘餘訊號裡(在解碼器700裡對應訊號760,762)。因此,在混合殘餘解碼器800裡的權重器係比解碼器700裡的權重器單純,但一致地根據公式(14)進行加權。
在下文中,結合的參數化及殘餘解碼(混合殘餘編碼)將根據第8圖進行更多細節之解釋。
然而,一概觀係首先被提供。
除了使用以解相關器為基礎之單聲道至立體聲升混合,或者是如在ISO/IEC 23002-3,第7.11.1款所描述之殘餘編碼,混合殘餘編碼允許這兩種模式的一訊號相關結合。如第8圖所示,殘餘訊號以及解相關輸出係根據訊號能量以及空間參數,而使用時間及頻率相關加權因子而混合在一起。
解碼處理將描述於下文中。
混合殘餘編碼模式係透過在Mps212Config()裡的語法元件bsResidualCoding==1以及bsResidualBands==1而指出,換句話說,混合殘餘編碼之運用能夠使用編碼表示之一位元串流元件來進行訊號化。若是bsResidualCoding==0,則將執行混合矩陣M2之計算,其係遵守在ISO/IEC23003-3第7.11.2.3款之計算,針對以部份為基礎之解相關器之矩陣係定義為
升混合處理係被分開到降混合、解相關輸出以及殘餘裡。此升混合降混合udmx係使用以下式子來計算:
升混合解相關輸出udec係使用以下式子來計算:
此升混合殘餘訊號ures係使用以下式子來計算:
升混合殘餘訊號Eres、升混合解相關輸出Edec之能量係在每 一混合頻帶被計算為在輸出聲道ch以及所有時間槽ts上一總合,此能量以及一訊框之能量係:
升混合解相關輸出係使用一加權因子rdec以進行加權,此因子rdec係針對每一訊框每一混合頻帶為:
其中ε為一極小數字以防止被零相除(例如:ε=1e-9或是0<ε<=1e-5)。然而,在一些實施方式中,ε可以被設定為零(以"E res =0"取代"E res <ε")。
所有三個升混合訊號係被加入以形成解碼輸出訊號。
8.結論
總結來說,本發明之實施方式係建立一結合殘餘與參數化之編碼。
此發明係建立一方法,其係針對聯合立體聲編碼之參數化及殘餘編碼之一訊號相關結合,且此聯合立體聲編碼係基於一USAC統一立體聲工具。取代使用一固定的殘餘頻寬,所傳送之殘餘數量係相依於一編 碼器、時間及頻率變數而決定訊號。在解碼器端上,在輸出聲道間之解相關需要數量係由混合殘餘訊號以及解相關輸出所產生。如此一來,一對應的音源編碼/解碼系統能夠在執行時間中根據編碼訊號,完全地在參數化編碼以及波形形式保留殘餘編碼間進行混合。
根據本發明的實施例,其係優於傳統的解決方案,舉例來 說,在USAC裡,一MPEG環繞2-1-2系統係用於參數化立體聲編碼或者是統一立體聲,其係針對部份波形形式保存而傳送一有限頻帶或是完整頻寬殘餘訊號。如果一有限頻帶殘餘被傳送,利用解相關器使用之參數化升混合係應用在殘餘頻寬上。此方法的缺點在於,在初始化編碼器時,此殘餘頻寬係被設定為一固定數值。
相反的,按照本發明之實施方式,其係允許針對殘餘頻寬之 一訊號相關改編或者是切換至參數化編碼。而且,如果降混合處理在參數化編碼模式裡針對不良情況的相位關係產生訊號取消,根據本發明之實施方式係允午再建遺失的訊號部份(例如,透過提供一適當的殘餘訊號)。值得一提的是,針對參數化編碼,簡易降混合方法比傳統MPS降混合產生更少的訊號取消,然而,既然殘餘訊號沒有定義在USAC裡,常規的簡易降混合不能被使用於部份波形形式保存,根據本發明之實施方式係允午一波形形式再建(例如,一選擇性部份波形形式再建的部份波形形式再建看來是重要的)。
進一步的斷定,根據本發明之實施方式係建立了一裝置、一方法或者是一電腦程式,以用於如在此處所描述之音源編碼或是解碼。
200‧‧‧多聲道音源解碼器
210‧‧‧編碼表示
212‧‧‧輸出音源訊號1
214‧‧‧輸出音源訊號2
220‧‧‧加權組合
222‧‧‧降混合訊號
224‧‧‧解相關訊號
226‧‧‧殘餘訊號
230‧‧‧權重決定器
232‧‧‧權重

Claims (38)

  1. 一種多聲道音源解碼器(200;300;700;800),係在一編碼表示(210;310;710)之基礎上提供至少二輸出音源訊號(212,214;312,314;712,714),其中該多聲道音源解碼器係用以執行一降混合訊號(222;752,754)、一解相關訊號(224;756,758)以及一殘餘訊號(226;760,762;res)之一加權組合,以取得該至少二輸出音源訊號(212,214;712,714)之其中之一,其中該多聲道音源解碼器係用以決定一權重(232;r;rdec),該權重係根據該殘餘訊號描述在該加權組合裡該解相關訊號之一貢獻,其中該多聲道音源解碼器係用以決定該權重,該權重係根據該解相關訊號以描述在該加權組合裡該解相關訊號之該貢獻。
  2. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以在該編碼表示之基礎上取得複數個升混合參數(udmx,1,udmx,2,udec,1,udec,2,ur,1,ur,2),以及用以決定該權重(232;r;rdec),該權重係根據該複數個升混合參數以描述在該加權組合裡該解相關訊號之該貢獻。
  3. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以決定該權重(232;r;rdec),該權重係描述在該加權組合裡該解相關之該貢獻,使得該解相關訊號之該權重隨著該殘餘訊號之能量增加而減少。
  4. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以決定該權重(232;r;rdec),該權重係描述該加權組合裡該解相關訊號之該貢獻,使得若是該殘餘訊號之一能量為零,則由一解關訊號升混合參數(udec,1,udec,2;udec(hb,ts,ch);udec(ch,ts)))所決定之一最大權重係關聯至該解相關訊號,並若是以一殘餘訊號加權係數(ur,1,ur,2;ures(hb,ts.ch);ures(ch,ts))進行加權之該殘餘訊號之一能量大於或等於該解相關訊號之一能量,則使得一零權重係關聯至該解相關訊號,其中該解相關訊號之該能量係以該解相關訊號升混合參數進行加權。
  5. 如申請專利範圍第1項所述之多聲道音源解碼器,其中,該多聲道音源解碼器係用以計算該解相關訊號之一加權能量數值(Edec(hb);Edec),該加權能量數值係根據至少一解相關訊號升混合參數進行加權,並用以計算該殘餘訊號之一加權能量數值(Eres(hb);Eres),該加權能力數值係使用至少一殘餘訊號升混合參數進行加權,以根據該解相關訊號之該加權能量數值以及該殘餘訊號之該加權能量數值來決定一因子(r,rdec),並且取得該權重,該權重係以該因子為基礎來描述該解相關訊號至該輸出音源訊號其中之一之該貢獻,或者是使用該因子以作為描述該解相關訊號至該輸出音源訊號其中之一之該貢獻。
  6. 如申請專利範圍第5項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以將該因素(r)乘上一解相關訊號升混合參數(udec,1,udec,2;udec(hb,ts,ch);udec(ch,ts)),以取得該權重,該權重係描述該解相關訊號至該輸出音源訊號其中之一之該貢獻。
  7. 如申請專利範圍第5項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以計算該解相關訊號之該能量,該能量係在複數個升混合聲道(ch)以及複數個時間槽(ts)上使用該至少一解相關訊號升混合參數以進行加權,以取得該解相關訊號之該加權能量數值(Edec(hb);Edec)。
  8. 如申請專利範圍第5項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以計算該殘餘訊號之該能量,該殘餘訊號之該能量係在複數個升混合聲道(ch)以及複數個時間槽(ts)上使用該至少一殘餘訊號升混合參數以進行加權,以取得該殘餘訊號之該加權能量數值(Eres(hb);Eres)。
  9. 如申請專利範圍第5項所述之多聲道音源解碼器,其中該多聲道音源解碼器係根據在該解相關訊號之該加權能量數值(Edec(hb);Edec)以及在該殘餘訊號之該加權能量數值(Eres(hb);Eres)之間之一差異以計算該因子(r;rdec)。
  10. 如申請專利範圍第9項所述之多聲道音源解碼器,其中該多聲道音源解碼器係根據一比例以計算該因子(r;rdec),該比例係介於該解相關訊號之該加權能量數值以及該殘餘訊號之該加權能量數值間之一差異,以及 該解相關訊號之該加權能量數值。
  11. 如申請專利範圍第5項所述之多聲道音源解碼器,其中該多聲道音源解碼器係用以決定複數個權重,該複數個權重係描述該解相關訊號至至少二輸出音源訊號之複數個貢獻,其中該多聲道音源解碼器,係在解相關訊號以及一第一聲道解相關訊號升混合參數(udec,1)之該加權能量數值(Edec(hb);Edec)的基礎上,決定該解相關訊號至一第一輸出音源訊號之一貢獻,以及其中該多聲道音源解碼器,係在解相關訊號以及一第二聲道解相關訊號升混合參數(udec,2)之該加權能量數值(Edec(hb);Edec)的基礎上,決定該解相關訊號至一第二輸出音源訊號之一貢獻。
  12. 如申請專利範圍第1項所述之多聲道音源解碼器,其中若是一殘餘能量(Eres(hb);Eres)超過一解相關能量(Edec(hb);Edec),該多聲道音源解碼器係用以使該解相關訊號至該加權組合之一貢獻失去功效。
  13. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該多聲道音源解碼器係根據以下式子計算二個輸出音源訊號ch1及ch2, 其中ch1表示一第一輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中ch2表示一第二輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中xdmx表示一降混合訊號之至少一時間域樣本或者是轉換域樣本;其中xdec表示一解相關訊號之至少一時間域樣本或者是轉換域樣本;其中xres表示一殘餘訊號之至少一時間域樣本或者是轉換域樣本;其中udmx,1係針對該第一輸出音源訊號以表示一降混合訊號升混合參數;其中udmx,2係針對該第二輸出音源訊號以表示一降混合訊號升混合參數;其中udec,1係針對該第一輸出音源訊號以表示一解相關訊號升混合參 數;其中udec,2係針對該第二輸出音源訊號以表示一解相關訊號升混合參數;其中max表示一最大操作元;以及其中r表示用來描述該殘餘訊號裡該解相關訊號之一權重的一因子。
  14. 如申請專利範圍第13項所述之多聲道音源解碼器,其中該多聲道音源解碼器係根據以下公式計算該因子, 或是根據 其中針對一頻率頻帶hb,Edec(hb)或Edec表示該解相關訊號xdec之一加權能量數值,以及其中針對一頻率頻帶hb,Eres(hb)或Eres表示該殘餘訊號xres之一加權能量數值。
  15. 如申請專利範圍第14項所述之多聲道音源解碼器,其中該多聲道音源解碼器根據以下公式以計算該解相關訊號之該加權能量數值, 其中針對一頻率頻帶hb、一時間槽ts以及一升混合聲道ch,udec指派一解相關訊號升混合參數,其中針對一頻率頻帶hb、一時間槽ts以及一聲道ch,xdec表示一解相關訊號之一時間域樣本或是轉換域樣本,其中指派為複數個升混合聲道ch上之一總和,以及 其中指派為複數個時間槽ts上之一總和,其中∥.∥指派為一標準操作元, 其中該多聲道音源解碼器係根據以下公式計算該殘餘訊號之該加權能量數值, 其中針對一頻率頻帶hb、一時間槽ts以及一升混合聲道ch,ures指派一殘餘訊號升混合參數,其中針對一頻率頻帶hb、一時間槽ts以及一聲道ch,xres表示一解相關訊號之一時間域樣本或是轉換域樣本。
  16. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該音源解碼器係用以頻帶化地決定該權重(232;r;rdec),該權重根據該殘餘訊號之加權能量數值之一頻帶化決定以描述在該加權組合裡該解相關訊號之一貢獻。
  17. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該音源解碼器係用以決定該權重,該權重係針對該輸出音源訊號之每一訊框以描述在該加權組合裡該解相關訊號之一貢獻。
  18. 如申請專利範圍第1項所述之多聲道音源解碼器,其中該多聲道音源解碼器係可變化地調整一權重,該權重係描述在該加權組合裡該殘餘訊號之一貢獻。
  19. 一種多聲道音源解碼器(200;300;700;800),係用在一編碼表示(210;310;710)之基礎上提供至少二輸出音源訊號(212,214;312,314;712,714),其中在一降混合訊號(222;722)、複數個編碼空間參數(726)以及一殘餘訊號(226;724)之一編碼表示的基礎上,該多聲道音源解碼器係用以取得該輸出音源訊號之其中之一,以及其中該多聲道音源解碼器係根據該殘餘訊號在一參數化編碼以及一殘餘編碼之間進行混合。
  20. 一種多聲道音源編碼器(100),係用以提供一多聲道音源訊號(110)之一編碼表示(112),其中以該多聲道音源訊號為基礎,該多聲道音源編碼器係用以取得一 降混合訊號(122),以提供複數個參數(124),該複數個參數(124)係描述在該多聲道音源訊號之該聲道間之複數個相依性,以及提供一殘餘訊號(126),其中,該多聲道音源編碼器係根據該多聲道音源訊號以變化包含至該編碼表示裡之一殘餘訊號之數量。
  21. 如申請專利範圍第20項所述之多聲道音源編碼器,其中,該多聲道音源編碼器係根據該多聲道音源訊號變化該殘餘訊號之一頻寬。
  22. 如申請專利範圍第20項所述之多聲道音源編碼器,其中該多聲道音源編碼器係根據該多聲道音源訊號針對被包含在編碼表示裡之該殘餘訊號而選擇複數個頻率頻帶。
  23. 如申請專利範圍第22項所述之多聲道音源編碼器,其中該多聲道音源編碼器係針對該多聲道音源為音調的複數個頻率頻帶,而選擇性地包含該殘餘訊號至該編碼表示裡。
  24. 如申請專利範圍第20項所述之多聲道音源編碼器,其中該多聲道音源編碼器係針對時間部份及/或頻率頻帶選擇性地包含該殘餘訊號至該編碼表示裡,其中該降混合訊號之該形成係導致該多聲道音源訊號之複數個訊號元件之一取消。
  25. 如申請專利範圍第24項所述之多聲道音源編碼器,其中該多聲道音源編碼器係用以偵測在該降混合訊號裡該多聲道訊號音源訊號之複數個訊號元件之一取消,以及其中多聲道音源編碼器係根據該偵測之該結果以激發該殘餘訊號之該提供。
  26. 如申請專利範圍第20項所述之多聲道音源編碼器,其中該多聲道音源編碼器係用以計算該殘餘訊號,該殘餘訊號係使用該多聲道音源訊號之至少二聲道訊號之一線性組合並根據使用在一多聲道解碼器之一端上之複數個升混合係數。
  27. 如申請專利範圍第26項所述之多聲道音源編碼器,其中該多聲道音源編碼器係用以決定及編碼該複數個升混合係數,或者是從複數個參數衍生該複數個升混合係數,該複數個參數係描述該多聲道音源訊號之 聲道間的複數個相依性。
  28. 如申請專利範圍第20項所述之多聲道音源編碼器,其中該多聲道音源編碼器係隨時間進行變化而決定殘餘訊號之該數量,該殘餘訊號係使用一音質模型以包含至該編碼表示裡。
  29. 如申請專利範圍第20項所述之多聲道音源編碼器,其中該多聲道音源編碼器係隨時間進行變化而決定殘餘訊號之該數量,該殘餘訊號係根據一目前可使用的位元速率而包含至該編碼表示裡。
  30. 一種以一編碼表示為基礎而提供至少二輸出音源訊號之方法,該方法包含:執行(520)一降混合訊號、一解相關訊號及一殘餘訊號之一加權組合,以取得該至少二輸出音源訊號之其中之一,其中一權重係描述在該加權組合裡該解相關訊號之一貢獻,該權重係根據該殘餘訊號與該解相關訊號而決定(510)。
  31. 一種以一編碼表示為基礎而提供至少二輸出音源訊號之方法(600),該方法包含:取得(610)以一降混合訊號、複數個編碼空間參數之一編碼表示以及以一殘餘訊號之一編碼表示為基礎之該至少二輸出音源訊號之其中之一,其中係根據該殘餘訊號執行(620)在一參數化編碼以及一殘餘編碼間之一混合。
  32. 一種用以提供一多聲道音源訊號之一編碼表示之方法,該方法包含:取得(410)以該多聲道音源訊號為基礎之一降混合訊號,提供(420)描述在該多聲道音源訊號之聲道間複數個相關性之複數個參數;以及提供(430)一殘餘訊號;其中被包含至該編碼表示之殘餘訊號之一數量係隨該多聲道音源訊號而變化(440)。
  33. 一種電腦程式,當該電腦程式運作於一電腦上,該電腦程式係用以執行如申請專利範圍第30項、第31項或第32項所述之方法。
  34. 一種多聲道音源解碼器(200;300;700;800),係在一編碼表示(210;310;710)之基礎上提供至少二輸出音源訊號(212,214;312,314;712,714),其中該多聲道音源解碼器係用以執行一降混合訊號(222;752,754)、一解相關訊號(224;756,758)以及一殘餘訊號(226;760,762;res)之一加權組合,以取得該至少二輸出音源訊號(212,214;712,714)之其中之一,其中該多聲道音源解碼器係用以決定一權重(232;r;rdec),該權重係根據該殘餘訊號描述在該加權組合裡該解相關訊號之一貢獻;其中,該多聲道音源解碼器係用以計算該解相關訊號之一加權能量數值(Edec(hb);Edec),該加權能量數值係根據至少一解相關訊號升混合參數進行加權,並用以計算該殘餘訊號之一加權能量數值(Eres(hb);Eres),該加權能量數值係使用至少一殘餘訊號升混合參數進行加權,以根據該解相關訊號之該加權能量數值以及該殘餘訊號之該加權能量數值來決定一因子(r,rdec),並且取得該權重,該權重係以該因子為基礎來描述該解相關訊號至該輸出音源訊號其中之一之該貢獻,或者是使用該因子以作為描述該解相關訊號至該輸出音源訊號其中之一之該貢獻。
  35. 一種多聲道音源解碼器(200;300;700;800),係在一編碼表示(210;310;710)之基礎上提供至少二輸出音源訊號(212,214;312,314;712,714),其中該多聲道音源解碼器係用以執行一降混合訊號(222;752,754)、一解相關訊號(224;756,758)以及一殘餘訊號(226;760,762;res)之一加權組合,以取得該至少二輸出音源訊號(212,214;712,714)之其中之一,其中該多聲道音源解碼器係用以決定一權重(232;r;rdec),該權重係根據該殘餘訊號描述在該加權組合裡該解相關訊號之一貢獻;其中該多聲道音源解碼器係根據以下式子計算二個輸出音源訊號ch1及ch2, 其中ch1表示一第一輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中ch2表示一第二輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中xdmx表示一降混合訊號之至少一時間域樣本或者是轉換域樣本;其中xdec表示一解相關訊號之至少一時間域樣本或者是轉換域樣本;其中xres表示一殘餘訊號之至少一時間域樣本或者是轉換域樣本;其中udmx,1係針對該第一輸出音源訊號以表示一降混合訊號升混合參數;其中udmx,2係針對該第二輸出音源訊號以表示一降混合訊號升混合參數;其中udec,1係針對該第一輸出音源訊號以表示一解相關訊號升混合參數;其中udec,2係針對該第二輸出音源訊號以表示一解相關訊號升混合參數;其中max表示一最大操作元;以及其中r表示用來描述該殘餘訊號裡該解相關訊號之一權重的一因子。
  36. 一種以一編碼表示為基礎而提供至少二輸出音源訊號之方法(500),該方法包含:執行(520)一降混合訊號、一解相關訊號及一殘餘訊號之一加權組合,以取得該至少二輸出音源訊號之其中之一,其中一權重係描述在該加權組合裡該解相關訊號之一貢獻,該權重係根據該殘餘訊號而決定(510);其中,該方法包含計算該解相關訊號之一加權能量數值(Edec(hb);Edec),該加權能量數值係根據至少一解相關訊號升混合參數進行加權,並計算該殘餘訊號之一加權能量數值(Eres(hb);Eres),該加權能力數值係使用至少一殘餘訊號升混合參數進行加權,以根據該解相關訊號之該加 權能量數值以及該殘餘訊號之該加權能量數值來決定一因子(r,rdec),並且取得該權重,該權重係以該因子為基礎來描述該解相關訊號至該輸出音源訊號其中之一之該貢獻,或者是使用該因子以作為描述該解相關訊號至該輸出音源訊號其中之一之該貢獻。
  37. 一種以一編碼表示為基礎而提供至少二輸出音源訊號之方法,該方法包含:執行(520)一降混合訊號、一解相關訊號及一殘餘訊號之一加權組合,以取得該至少二輸出音源訊號之其中之一,其中一權重係描述在該加權組合裡該解相關訊號之一貢獻,該權重係根據該殘餘訊號而決定(510);其中該方法包含根據以下式子計算二個輸出音源訊號ch1及ch2, 其中ch1表示一第一輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中ch2表示一第二輸出音源訊號之至少一時間域樣本或者是轉換域樣本,其中xdmx表示一降混合訊號之至少一時間域樣本或者是轉換域樣本;其中xdec表示一解相關訊號之至少一時間域樣本或者是轉換域樣本;其中xres表示一殘餘訊號之至少一時間域樣本或者是轉換域樣本;其中udmx,1係針對該第一輸出音源訊號以表示一降混合訊號升混合參數;其中udmx,2係針對該第二輸出音源訊號以表示一降混合訊號升混合參數;其中udec,1係針對該第一輸出音源訊號以表示一解相關訊號升混合參數;其中udec,2係針對該第二輸出音源訊號以表示一解相關訊號升混合參數;其中max表示一最大操作元;以及 其中r表示用來描述該殘餘訊號裡該解相關訊號之一權重的一因子。
  38. 一種電腦程式,當該電腦程式運作於一電腦上,該電腦程式係用以執行如申請專利範圍第36項或第37項所述之方法。
TW103124815A 2013-07-22 2014-07-18 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式 TWI566234B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP13177375 2013-07-22
EP13189309.1A EP2830053A1 (en) 2013-07-22 2013-10-18 Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Publications (2)

Publication Number Publication Date
TW201519215A TW201519215A (zh) 2015-05-16
TWI566234B true TWI566234B (zh) 2017-01-11

Family

ID=48808223

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103124815A TWI566234B (zh) 2013-07-22 2014-07-18 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式

Country Status (19)

Country Link
US (4) US10839812B2 (zh)
EP (4) EP2830053A1 (zh)
JP (5) JP6253776B2 (zh)
KR (2) KR101893016B1 (zh)
CN (2) CN105556596B (zh)
AR (1) AR097013A1 (zh)
AU (3) AU2014295212B2 (zh)
BR (3) BR122022015747B1 (zh)
CA (2) CA2974271C (zh)
ES (2) ES2798137T3 (zh)
MX (3) MX361809B (zh)
MY (2) MY198121A (zh)
PL (2) PL3025331T3 (zh)
PT (2) PT3425633T (zh)
RU (1) RU2676233C2 (zh)
SG (3) SG11201600403VA (zh)
TW (1) TWI566234B (zh)
WO (1) WO2015011020A1 (zh)
ZA (1) ZA201601081B (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
BR112016006832B1 (pt) * 2013-10-03 2022-05-10 Dolby Laboratories Licensing Corporation Método para derivar m sinais de áudio difusos a partir de n sinais de áudio para a apresentação de um campo sonoro difuso, aparelho e meio não transitório
RU2648947C2 (ru) * 2013-10-21 2018-03-28 Долби Интернэшнл Аб Параметрическая реконструкция аудиосигналов
US10225675B2 (en) 2015-02-17 2019-03-05 Electronics And Telecommunications Research Institute Multichannel signal processing method, and multichannel signal processing apparatus for performing the method
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
JP7161233B2 (ja) * 2017-07-28 2022-10-26 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 広帯域フィルタによって生成される補充信号を使用して、エンコードされたマルチチャネル信号をエンコードまたはデコードするための装置
CN117133297A (zh) * 2017-08-10 2023-11-28 华为技术有限公司 时域立体声参数的编码方法和相关产品
US10535357B2 (en) 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
CN110060696B (zh) * 2018-01-19 2021-06-15 腾讯科技(深圳)有限公司 混音方法及装置、终端及可读存储介质
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN110556117B (zh) * 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
BR112020026967A2 (pt) * 2018-07-04 2021-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificação de áudio de multissinal usando branqueamento de sinal como pré-processamento
KR20200073878A (ko) 2018-12-15 2020-06-24 한수영 자동 플라스틱 컵 분리기
US20220059099A1 (en) * 2018-12-20 2022-02-24 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling multichannel audio frame loss concealment
TW202322102A (zh) * 2019-06-14 2023-06-01 弗勞恩霍夫爾協會 音訊編碼器、降混訊號產生方法及非暫時性儲存單元
CN110739000B (zh) * 2019-10-14 2022-02-01 武汉大学 一种适应于个性化交互系统的音频对象编码方法
CN111081264B (zh) * 2019-12-06 2022-03-29 北京明略软件系统有限公司 一种语音信号处理方法、装置、设备及存储介质
GB2595475A (en) * 2020-05-27 2021-12-01 Nokia Technologies Oy Spatial audio representation and rendering
KR20230084244A (ko) * 2020-10-09 2023-06-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717764A (en) * 1993-11-23 1998-02-10 Lucent Technologies Inc. Global masking thresholding for use in perceptual coding
TW200643897A (en) * 2005-04-15 2006-12-16 Coding Tech Ab Adaptive residual audio coding
WO2009141775A1 (en) * 2008-05-23 2009-11-26 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3330178B2 (ja) 1993-02-26 2002-09-30 松下電器産業株式会社 音声符号化装置および音声復号化装置
US5970152A (en) 1996-04-30 1999-10-19 Srs Labs, Inc. Audio enhancement system for use in a surround sound environment
WO2004084180A2 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Voicing index controls for celp speech coding
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
BRPI0415951B1 (pt) 2003-10-30 2018-08-28 Coding Tech Ab método e codificador de áudio para codificar um sinal de áudio, e, método e decodificador de áudio para decodificar um sinal de áudio codificado
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US7646875B2 (en) * 2004-04-05 2010-01-12 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatus thereof
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7835918B2 (en) * 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4543973B2 (ja) * 2005-03-08 2010-09-15 富士電機機器制御株式会社 AS−i用スレーブの過負荷・短絡保護回路
KR101271069B1 (ko) * 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
KR100818268B1 (ko) 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
KR100636249B1 (ko) * 2005-09-28 2006-10-19 삼성전자주식회사 인핸스드 오디오 매트릭스 디코딩 방법 및 장치
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
JP2007207328A (ja) 2006-01-31 2007-08-16 Toshiba Corp 情報記憶媒体、プログラム、情報再生方法、情報再生装置、データ転送方法、及びデータ処理方法
US20080004883A1 (en) 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
DE602007008289D1 (de) 2006-10-13 2010-09-16 Galaxy Studios Nv Verfahren und codierer zum kombinieren von digitalen datensätzen, decodierungsverfahren und decodierer für solche kombinierte digitale datensätze und aufzeichnungsträger zum speichern eines solchen kombinierten digitalen datensatzes
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
KR101244515B1 (ko) 2007-10-17 2013-03-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 업믹스를 이용한 오디오 코딩
EP2624253A3 (en) 2007-10-22 2013-11-06 Electronics and Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof
US8386271B2 (en) * 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
EP2144229A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
PL2384029T3 (pl) 2008-07-31 2015-04-30 Fraunhofer Ges Forschung Generowanie sygnału dla sygnałów dwuusznych
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
EP2194526A1 (en) 2008-12-05 2010-06-09 Lg Electronics Inc. A method and apparatus for processing an audio signal
ES2519415T3 (es) * 2009-03-17 2014-11-06 Dolby International Ab Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica
CN102460573B (zh) 2009-06-24 2014-08-20 弗兰霍菲尔运输应用研究公司 音频信号译码器、对音频信号译码的方法
EP2461321B1 (en) 2009-07-31 2018-05-16 Panasonic Intellectual Property Management Co., Ltd. Coding device and decoding device
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
JP5758902B2 (ja) 2009-10-16 2015-08-05 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックス信号表現と、ダウンミックス信号表現に関係するパラメトリックサイド情報に基づくアップミックス信号表現の提供に対して、平均値を用いて、1つ以上の調整されたパラメータを提供する装置、方法およびコンピュータプログラム
KR20110049068A (ko) 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101370870B1 (ko) 2009-12-16 2014-03-07 돌비 인터네셔널 에이비 Sbr 비트스트림 파라미터 다운믹스
EP2360681A1 (en) 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
TR201901336T4 (tr) * 2010-04-09 2019-02-21 Dolby Int Ab Mdct-tabanlı karmaşık tahmin stereo kodlama.
EP3779977B1 (en) 2010-04-13 2023-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder for processing stereo audio using a variable prediction direction
CN103180898B (zh) * 2010-08-25 2015-04-08 弗兰霍菲尔运输应用研究公司 用于利用合成单元和混频器解码包括瞬时的信号的设备
KR101697550B1 (ko) 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
JP5533502B2 (ja) 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
GB2485979A (en) 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
CN102074242B (zh) * 2010-12-27 2012-03-28 武汉大学 语音音频混合分级编码中核心层残差提取系统及方法
JP5582027B2 (ja) * 2010-12-28 2014-09-03 富士通株式会社 符号器、符号化方法および符号化プログラム
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
AU2012230442B2 (en) 2011-03-18 2016-02-25 Dolby International Ab Frame element length transmission in audio coding
JP5737077B2 (ja) 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP5998467B2 (ja) * 2011-12-14 2016-09-28 富士通株式会社 復号装置、復号方法、及び復号プログラム
US9288371B2 (en) 2012-12-10 2016-03-15 Qualcomm Incorporated Image capture device in a networked environment
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717764A (en) * 1993-11-23 1998-02-10 Lucent Technologies Inc. Global masking thresholding for use in perceptual coding
TW200643897A (en) * 2005-04-15 2006-12-16 Coding Tech Ab Adaptive residual audio coding
WO2009141775A1 (en) * 2008-05-23 2009-11-26 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Also Published As

Publication number Publication date
ES2701812T3 (es) 2019-02-26
MX2023001960A (es) 2023-02-23
RU2016105647A (ru) 2017-08-25
EP3660844A1 (en) 2020-06-03
JP7156986B2 (ja) 2022-10-19
KR101893016B1 (ko) 2018-08-29
WO2015011020A1 (en) 2015-01-29
CA2974271A1 (en) 2015-01-29
US10839812B2 (en) 2020-11-17
JP2018010312A (ja) 2018-01-18
CN110895944A (zh) 2020-03-20
EP3025331B1 (en) 2018-08-15
BR122022015747A2 (zh) 2017-07-25
SG11201600403VA (en) 2016-02-26
MX2018009140A (es) 2020-09-17
BR112016001248B1 (pt) 2022-11-16
PT3425633T (pt) 2020-08-20
EP3425633A1 (en) 2019-01-09
US10755720B2 (en) 2020-08-25
CA2918864A1 (en) 2015-01-29
SG10201708211SA (en) 2017-11-29
PL3425633T3 (pl) 2020-10-19
KR20170084355A (ko) 2017-07-19
US20180040328A1 (en) 2018-02-08
JP6253776B2 (ja) 2017-12-27
AU2019202950A1 (en) 2019-05-16
AU2017216523A1 (en) 2017-08-31
BR122022015747A8 (pt) 2022-11-29
RU2676233C2 (ru) 2018-12-26
BR122022015729A8 (pt) 2022-11-29
BR122022015729B1 (pt) 2023-03-14
AU2014295212A1 (en) 2016-03-10
CA2918864C (en) 2018-07-10
JP2023103271A (ja) 2023-07-26
CN105556596B (zh) 2019-12-13
JP2021140170A (ja) 2021-09-16
US10354661B2 (en) 2019-07-16
CA2974271C (en) 2020-06-02
SG10201708209WA (en) 2017-11-29
BR112016001248A2 (zh) 2017-07-25
PL3025331T3 (pl) 2019-01-31
US20160275958A1 (en) 2016-09-22
JP7269279B2 (ja) 2023-05-08
PT3025331T (pt) 2018-11-23
JP6585128B2 (ja) 2019-10-02
KR20160033163A (ko) 2016-03-25
EP3425633B1 (en) 2020-05-13
TW201519215A (zh) 2015-05-16
KR101803212B1 (ko) 2017-12-28
AU2019202950B2 (en) 2020-11-26
CN105556596A (zh) 2016-05-04
EP3025331A1 (en) 2016-06-01
EP2830053A1 (en) 2015-01-28
JP2016531483A (ja) 2016-10-06
AR097013A1 (es) 2016-02-10
MX361809B (es) 2018-12-14
AU2014295212B2 (en) 2017-08-31
JP2019135547A (ja) 2019-08-15
ES2798137T3 (es) 2020-12-09
US20160142845A1 (en) 2016-05-19
MY198121A (en) 2023-08-04
AU2017216523B2 (en) 2019-05-16
BR122022015729A2 (zh) 2017-07-25
US20200388293A1 (en) 2020-12-10
ZA201601081B (en) 2017-11-29
MX2016000513A (es) 2016-04-07
BR122022015747B1 (pt) 2023-03-14
MY192214A (en) 2022-08-09

Similar Documents

Publication Publication Date Title
TWI566234B (zh) 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
KR101391110B1 (ko) 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림
CA2852503C (en) Apparatus for providing one or more adjusted parameters for a provision of an upmix signal representation
KR20120084314A (ko) 다운믹스 신호 표현에 기초하여 업믹스 신호 표현을 제공하기 위한 장치, 다중 채널 오디오 신호를 표현하는 비트스트림을 제공하기 위한 장치, 선형 결합 파라미터를 이용하여 다중 채널 오디오 신호를 표현하는 방법, 컴퓨터 프로그램 및 비트스트림
JP2016514858A (ja) オーディオ処理システム