TWI427621B - 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體 - Google Patents

編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體 Download PDF

Info

Publication number
TWI427621B
TWI427621B TW094141787A TW94141787A TWI427621B TW I427621 B TWI427621 B TW I427621B TW 094141787 A TW094141787 A TW 094141787A TW 94141787 A TW94141787 A TW 94141787A TW I427621 B TWI427621 B TW I427621B
Authority
TW
Taiwan
Prior art keywords
auditory
channels
sound channels
event
measurement
Prior art date
Application number
TW094141787A
Other languages
English (en)
Other versions
TW200636677A (en
Inventor
Christof Faller
Original Assignee
Agere Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agere Systems Inc filed Critical Agere Systems Inc
Publication of TW200636677A publication Critical patent/TW200636677A/zh
Application granted granted Critical
Publication of TWI427621B publication Critical patent/TWI427621B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Description

編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體
本發明係關於聲音信號編碼,以及自該經編碼聲音資料之聽覺場景的後續合成。
人聽到特定聲源產生的聲音信號(即,聲音)時,該聲音信號通常在兩個不同時間到達人的左右耳且兩個聲音(例如,分貝)位準不同,其中不同時間與位準係聲音信號分別穿過的路徑中的差異到達左右耳成函數關係。人的大腦解釋此等時間與位準差異以給人一感覺,即,所接收的聲音信號係相對於該人位於一特定位置(例如,方向與距離)處之一聲源正在產生的聲音信號。聽覺場景係人同時聽到相對於該人位於一或多個不同位置處之一或多個不同聲源所產生的聲音信號的淨效應。
此大腦處理的存在可用來合成聽覺場景,其中對來自一或多個不同聲源的聲音信號進行有目的地修改來產生左右聲音信號,該等信號給人一感覺,即該等不同的聲源係相對於聽者位於不同位置處。
圖1顯示傳統雙耳信號合成器100之高階方塊圖,該合成器將一單一聲源信號(例如,單信號)轉換成一雙耳信號的左右聲音信號,其中將雙耳信號定義成聽者耳膜處所接收的兩信號。除聲源信號之外,合成器100亦接收一組與聲源相對於聽者的所需位置對應的空間暗號。在典型的實施方案中,該組空間暗號包含一通道間位準差異(ICLD)值(其識別左右耳處所分別接收的左右聲音信號之間聲音位準之差異)及一通道間時間差異(ICTD)值(其識別左右耳處所分別接收的左右聲音信號之間到達時間之差異)。此外或替代地,某些合成技術涉及從信號來源至耳膜之聲音之方向相依的傳送函數(亦稱作頭部相關傳送函數(HRTF))之模型化。參閱,例如,1983年MIT出版社出版的J.Blauert的"人類聲音定位的心理物理學",以引用方式將該文獻之原理併入本文中。
使用圖1的雙耳信號合成器100可處理單一聲源所產生的單聲音信號,使得通過耳機收聽時可藉由應用一組適當的空間暗號(例如,ICLD、ICTD及/或HRTF)來空間放置該聲源而為每一耳朵產生聲音信號。參閱,例如,1994年馬薩諸塞州(MA)坎布裏奇(Cambridge)的學術出版社出版的D.R.Begault的"虛擬現實與多媒體的3維聲音"。
圖1的雙耳信號合成器100產生最簡單類型的聽覺場景:此等聽覺場景具有相對於聽者所定位的一單一聲源。使用一聽覺場景合成器(實質上使用多個雙耳信號合成器範例來實施該聽覺場景合成器)可產生更複雜的聽覺場景,該聽覺場景包含相對於聽者位於不同位置處之兩或更多聲源,其中每一雙耳信號合成器範例產生與一不同聲源對應之雙耳信號。由於每一不同聲源相對於聽者的位置不同,故使用一組不同的空間暗號來產生每一不同聲源之雙耳聲音信號。
依據一具體實施例,本發明係一種用於編碼聲音通道之方法、裝置及機器可讀取媒體。為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現一聽覺場景之一對應於該等聲音通道之特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置,且發送該一或多個提示碼。
依據另一具體實施例,本發明係一種用於編碼C個輸入聲音通道以產生E個經發送聲音通道之裝置。該裝置包含一代碼估計器與一降混器。該代碼估計器為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現一聽覺場景之一對應於該等聲音通道之特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置。該降混器對該等C個輸入通道進行降混處理以產生該(等)E個經發送通道,其中C>E>=1,其中該裝置發送與該等提示碼有關之資訊以致能一解碼器在該(等)E個經發送通道之解碼期間執行合成處理。
依據另一具體實施例,本發明係一種藉由編碼聲音通道而產生之位元流。為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現一聽覺場景之一對應於該等聲音通道之特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置。對應於該等兩或更多聲音通道之該等一或多個提示碼與E個經發送聲音通道(其中E>=1)係編碼到該經編碼聲音位元流中。
依據另一具體實施例,本發明係一種用於解碼E個經發送聲音通道以產生C個播放聲音通道之方法、裝置及機器可讀取媒體,其中C>E>=1。接收對應於該(等)E個經發送通道之提示碼,其中至少一提示碼係直接呈現一聽覺場景之一對應於該等聲音通道之特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置。對該(等)E個經發送通道中的一或多個進行升混處理以產生一或多個經升混通道。藉由將該等提示碼應用於該一或多個經升混通道來合成該等C個播放通道中的一或多個。
在雙耳提示碼(BCC)中,一編碼器對C個輸入聲音通道進行編碼以產生E個經發送聲音通道,其中C>E>=1。特定言之,在一頻域中提供該等C個輸入通道中的兩或更多個,且為該頻域中的該兩或更多輸入通道中的一或多個不同頻帶中的每一個產生一或多個提示碼。此外,對C個輸入通道進行降混處理以產生E個經發送通道。在某些降混實施方案中,E個經發送通道中的至少一個係基於C個輸入通道中的兩或更多個,且E個經發送通道中的至少一個係僅基於C個輸入通道中的一單一通道。
在一具體實施例中,一BCC碼器具有兩或更多濾波器組、一代碼估計器及一降混器。該等兩或更多濾波器組將C個輸入通道中的兩或更多個從時域轉換到頻域中。該代碼估計器為該等兩或更多個經轉換輸入通道中的一或多個 不同頻帶中的每一個產生一或多個提示碼。該降混器對C個輸入通道進行降混處理以產生E個經發送通道,其中C>E>=1。
在BCC解碼中,對E個經發送聲音通道進行解碼處理以產生C個播放(即,合成)聲音通道。特定言之,針對一或多個不同頻帶中的每一個,對頻域中的E個經發送通道中的一或多個進行升混處理以在該頻域中產生C個播放通道中的兩或更多個,其中C>E>=1。為該頻域中之該等兩或更多播放通道中的該一或多個不同頻帶中的每一個應用一或多個提示碼以產生兩或更多經修改通道,且將該等兩或更多經修改通道從頻域轉換到時域中。在某些升混實施方案中,C個播放通道中的至少一個係基於E個經發送通道中的至少一個與至少一提示碼,且C個播放通道中的至少一個係僅基於E個經發送通道中的一單一通道且獨立於任何提示碼。
在一具體實施例中,一BCC解碼器具有一升混器、一合成器及一或多個反向濾波器組。針對一或多個不同頻帶中的每一個,該升混器對頻域中的E個經發送通道中的一或多個進行升混處理以在該頻域中產生C個播放通道中的兩或更多個,其中C>E>=1。該合成器為頻域中之兩或更多播放通道中的該一或多個不同頻帶中的每一個應用一或多個提示碼以產生兩或更多經修改通道。一或多個反向濾波器組將兩或更多經修改通道從頻域轉換到時域中。
視特定實施方案而定,給定播放通道可基於一單一經發 送通道,而不是兩或更多經發送通道之組合。例如,當只有一經發送通道時,該等C個播放通道中的每一個係基於該一經發送通道。在此等情況下,升混對應於複製該對應的經發送通道。同樣地,對於其中只有一經發送通道之應用而言,可使用一複製器來實施該升混器,該複製器為每一播放通道複製該經發送通道。
可將BCC碼器及/或解碼器併入許多系統或應用中,該等系統或應用其包括(例如)數位錄影機/放影機、數位錄音機/聲音播放器、電腦、衛星發射器/接收器、電纜發射器/接收器、地面廣播發射器/接收器、家庭娛樂系統及電影院系統。
同屬BCC處理
圖2係包含一編碼器202與一解碼器204之一同屬雙耳提示碼(BCC)聲音處理系統200之方塊圖。編碼器202包括降混器206與BCC估計器208。
降混器206將C個輸入聲音通道xi (n)轉換成E個經發送聲音通道yi (n),其中C>E>=1。在此說明書中,使用變數n所表示的信號係時域信號,而使用變數k所表示的信號係頻域信號。視特定實施方案而定,可在時域或頻域中實施降混處理。BCC估計器208依據C個輸入聲音通道來產生BCC碼並作為頻帶中或頻帶外側資訊(與E個經發送聲音通道有關)來發送此等BCC碼。典型的BCC碼包括所估計的某些輸入通道對之間之通道間時間差異(ICTD)、通道間位準差異(ICLD)及通道間相關性(ICC)資料中的一或多個,該等資料係與頻率及時間成函數關係。該特定實施方案將規定估計哪些特定輸入通道對之間之BCC碼。
ICC資料對應於雙耳信號的連貫性,其係與所察覺到的聲源寬度有關。聲源越寬,所得雙耳信號的左右通道之間的連貫性就越低。例如,範圍遍佈禮堂舞臺的管弦樂隊所對應的雙耳信號的連貫性通常比單個小提琴獨奏所對應的雙耳信號的連貫性低。一般而言,聲音信號的連貫性較低時,通常可以在更廣的聽覺空間中察覺到該信號。同樣地,ICC資料通常係與聲源的外觀寬度及聽者環繞度有關。參閱,例如,1983年MIT出版社出版的J.Blauert的"人類聲音定位的心理物理學"。
視特定應用而定,可將E個經發送聲音通道與對應的BCC碼直接發送給解碼器204或將其儲存於合適類型的儲存器件中用於解碼器204的後續存取。視情況而定,術語"發送"可表示直接發送給解碼器,或加以儲存用於隨後提供給解碼器。在任一情形中,解碼器204皆接收經發送聲音通道與側資訊並使用BCC碼執行升混與BCC合成處理以將E個經發送聲音通道轉換成E個以上(通常但不必須為C)的播放聲音通道 i (n )用於聲音播放。視特定實施方案而定,可在時域或頻域中實施升混處理。
除圖2所示BCC處理之外,一同屬BCC聲音處理系統可包括額外的編碼與解碼級,以分別在編碼器處進一步壓縮聲音信號及接著在解碼器處解壓縮該等聲音信號。此等聲音編碼可基於傳統的聲音壓縮/解壓縮技術,例如基於脈衝編碼調變(PCM)、差分PCM(DPCM)或適應性DPCM(ADPCM)之聲音編碼。
當降混器206產生單一和信號(即,E=1)時,BCC碼能以僅稍微高於呈現一單聲音信號所需位元率之一位元率來呈現多通道聲音信號。此係由於所估計的通道對之間的ICTD、ICLD及ICC資料所包含的資訊比一聲音波形少大約兩個等級。
引人關注的不僅係BCC碼的低位元率,亦包括其退步的相容性。一單一經發送和信號對應於原始立體聲或多通道信號之一單降混。對於不支持立體聲或多通道聲音重製的接收器而言,聽經發送和信號係在低輪廓的單重製設備上呈現聲音材料的有效方法。因此,BCC碼亦可用以提高現有服務,涉及使輸送的單聲音材料接近多通道聲音。例如,若可將BCC側資訊嵌入到現有傳輸通道中,則可改善現有單聲音無線電廣播系統以進行立體聲或多通道播放。將多通道聲音降混為對應於立體聲音的兩和信號時,亦存在類似能力。
BCC採用某一時間與頻率解析度來處理聲音信號。所使用的頻率解析度在很大程度上係取決於人的聽覺系統的頻率解析度。心理聲學認為,空間感覺最可能基於所呈現的聲音輸入信號臨界頻帶。藉由使用一反向濾波器組(例如,基於一快速傅立葉變換(FFT)或一正交鏡相濾波器(QMF))來考量此頻率解析度,其中該反向濾波器組之次頻帶之頻寬係等於人的聽覺系統之臨界頻寬或與其成正比。
同屬降混
在較佳實施方案中,所發送的和信號包含輸入聲音信號之所有信號成分。目的係完全保留每一信號成分。對聲音輸入通道進行簡單求和通常會導致信號成分放大或變小。換言之,"簡單"和中之信號成分之功率通常大於或小於每一通道之對應信號成分之功率和。可使用降混技術來等化該和信號,使得和信號中信號成分的功率與所有輸入通道中的對應功率近似相同。
圖3顯示依據BCC系統200之某些實施方案、可用於圖2之降混器206之一降混器300之方塊圖。降混器300具有用於每一輸入通道xi (n)之一濾波器組(FB)302、一降混組塊304、一可選擇的縮放/延遲組塊306及用於每一經編碼通道yi (n)之一反向濾波器組(IFB)308。
每一濾波器組302將時域中一對應數位輸入通道xi (n)之每一訊框(例如,20毫秒)轉換成頻域中的一組輸入係數(k )。降混組塊304將C個對應輸入係數之每一次頻帶降混成E個經降混頻域係數之一對應次頻帶。等式(1)表示輸入係數之第k個次頻帶((k ),(k ),...,(k ))之降混處理以產生經降混係數之第k個次頻帶((k ),(k ),...,(k )),如下所示: 其中D CE 係真值C行E列降混矩陣。
可選擇縮放/延遲組塊306包含一組乘法器310,其中的每一個使一對應經降混係數(k )與一縮放因數ei (k)相乘以產生一對應的經縮放係數(k )。縮放操作的動機係等效於針對每一通道採用隨機加權因數進行降混處理之一般化等化。若輸入通道係獨立的,則由如下等式(2)給出經降混信號之每一次頻帶中之功率 其中藉由對C行E列降混矩陣D CE 中的每一矩陣元素求平方導出 CE ,而係輸入通道i之次頻帶k之功率。
若該等次頻帶並不獨立,則經降混信號之功率值比使用等式(2)所計算的功率值大或小,此係由於信號成分同相或異相時,信號分別放大或抵消。為了防止此點,在次頻帶中應用等式(1)的降混操作之後,要接著藉由乘法器310執行縮放操作。使用如下等式(3)可導出縮放因數ei (k)(1#i#E): 其中係藉由等式(2)所計算的次頻帶功率,而係對應經降混次頻帶信號(k )之功率。
除提供可選擇縮放操作之外或替代地,縮放/延遲組塊306可視需要使信號延遲。
每一反向濾波器組308將頻域中一組對應經縮放係數(k )轉換成一對應的數位經發送通道yi (n)之一訊框。
儘管圖3顯示已轉換到頻域中用於後續降混處理的所有C個輸入通道,但在替代實施方案中,C個輸入通道中的一或多個(但小於C-1)會繞過圖3所示某些或所有處理而被發送成相等數目的未修改聲音通道。視特定實施方案而定,產生所發送的BCC碼時,圖2之BCC估計器208可以使用或不使用此等未修改聲音通道。
在降混器300產生一單一和信號y(n)之實施方案中,E=1且依據如下等式(4)使每一輸入通道c之每一次頻帶之信號(k )相加並接著與一因數e(k)相乘:
由如下等式(5)給出因數e(k): 其中(k )係(k )之功率之一短時估計,其中時間指數為k,而(k )係(k )之功率之一短時估計。將經等化次頻帶發送回時域中,從而將和信號y(n)發送至BCC解碼器。
同屬BCC合成
圖4顯示依據BCC系統200之某些實施方案、可用於圖2之解碼器204之一BCC合成器400之方塊圖。BCC合成器400具有用於每一經發送通道yi (n)之一濾波器組402、一升混組塊404、延遲組塊406、乘法器408、非相關性組塊410及用於每一播放通道之一反向濾波器組412。
每一濾波器組402將時域中一對應數位經發送通道yi (n)之每一訊框轉換成頻域中的一組輸入係數(k )。升混組塊404將E個對應經發送通道係數之每一次頻帶升混成C個經升混頻域係數之一對應次頻帶。等式(4)表示經發送通道係數之第k個次頻帶((k ),(k ),...,(k ))之升混處理以產生經升混係數之第k個次頻帶((k ),(k ),...,(k )),如下所示: 其中U EC 係真值E行C列升混矩陣。在頻域中執行升混處理使得可對每一不同次頻帶個別應用升混處理。
每一延遲組塊406依據ICTD資料之一對應BCC碼而應用一延遲值di (k),以確保所需ICTD值出現在某些播放通道對之間。每一乘法器408依據ICLD資料之一對應BCC碼而應用一縮放因數ai (k),以確保所需ICLD值出現在某些播放通道對之間。非相關性組塊410依據ICC資料之對應BCC碼而執行一非相關性操作A,以確保所需ICC值出現在某些播放通道對之間。在05/24/02作為Baumgarte 2至10所申請的美國專利申請案第10/155,437號中可找到非相關性組塊410之操作的更多描述。
ICLD值之合成可能比ICTD與ICC值之合成容易,此係由於ICLD合成僅涉及對次頻帶信號進行縮放處理。由於ICLD暗號係最常使用的方向暗號,故使該等ICLD值接近原始聲音信號之ICLD值通常顯得更重要。同樣地,所有通道對之間的ICLD資料皆可進行估計。較佳地選擇每一次頻帶之縮放因數ai (k)(1#i#C),使得每一播放通道之次頻帶功率接近原始輸入聲音通道之對應功率。
一目的係在合成ICTD與ICC值時,對信號進行相對較少的修改。同樣地,BCC資料可不必包括所有通道對之ICTD與ICC值。在此情形中,BCC合成器400將僅合成某些通道對之間的ICTD與ICC值。
每一反向濾波器組412將頻域中一組對應的合成係數(k )轉換成一對應的數位播放通道 i (n )之一訊框。
儘管圖4顯示已轉換到頻域中用於後續升混與BCC處理的所有E個經發送通道,但在替代實施方案中,E個經發送通道中的一或多個(但並非全部)會繞過圖4所示某些或所有處理。例如,經發送通道中的一或多個可能為未經過任何升混處理的未修改通道。除了成為C個播放通道中的一或多個之外,此等未修改通道可能(但不必一定)進而用作參考通道,會對該等參考通道應用BCC處理以合成其他播放通道中的一或多個。在任一情形中,皆可以對此類未修改通道實施延遲處理以補償用以產生剩餘播放通道之升混及/或BCC處理中所涉及的處理時間。
應注意,儘管圖4所顯示的C個播放通道係由E個經發送通道合成,其中C亦為原始輸入通道之數目,但BCC合成不限於此數目的播放通道。一般而言,播放通道之數目可為任何數目,包括大於或小於C之數目,在某些情形中,播放通道之數目甚至可以等於或小於經發送通道之數目。
聲音通道之間"與感覺有關的差異"
假設BCC將一單一和信號合成一立體聲或多通道聲音信號,使得ICTD、ICLD及ICC接近原始聲音信號之對應暗號。下面說明ICTD、ICLD及ICC與聽覺空間影像屬性有關之角色。
與空間聽力有關的知識表明,對於一聽覺事件而言,ICTD及ICLD係與所感受的方向有關。考慮一聲源的雙耳房間脈衝回應(BRIR)時,發現聽覺事件之寬度及聽者環繞感與針對BRIR之早期及後期部分所估計的ICC資料之間存在一關係。然而,對一般信號(不僅僅為BRIR)而言,ICC與此等特性之間之關係並不明顯。
立體聲與多通道聲音信號通常包含同時作用的聲源信號之一複雜混合信號,該混合信號係疊加有反射信號成分(源於在封閉空間中進行記錄)或藉由記錄引擎加以添加以人為創造一空間效果。不同聲源信號及其反射佔據時間-頻率平面中的不同區域。與時間及頻率成函數關係而變化的ICTD、ICLD及ICC反映此點。在此情形中,瞬時ICTD、ICLD及ICC與聽覺事件之方向及空間效果之間之關係並不明顯。BCC之某些具體實施例之策略係不加區別地合成此等暗號,使其接近原始聲音信號之對應暗號。
所使用的濾波器組之次頻帶之頻寬係等於等效矩形頻寬(ERB)的兩倍。非正式傾聽顯示,選擇更高頻率解析度時,BCC之聲音品質並沒有明顯改善。需要更低頻率解析度,此係由於其導致需要發送更少的ICTD、ICLD及ICC值至解碼器,進而可採用更低位元率。
就時間解析度而言,通常按規則時間間隔來考量ICTD、ICLD及ICC。大約每4至16 ms來考量ICTD、ICLD及ICC時,可獲得高性能。應注意,若未按非常短的時間間隔來考量該等暗號,則不會直接考量居前效應。假設有一對典型的超前滯後聲音刺激對,若在超前與滯後所屬於的時間間隔中僅合成一組暗號,則超前聲音刺激之區域化優勢未加以考量。儘管如此,BCC仍可獲得MUSHRA平均分為大約87(即,"極好"的聲音品質)且某些聲音信號之MUSHRA分數幾乎為100之聲音品質。
通常所獲得的參考信號與合成信號之間感覺方面的小差異表明,與大範圍的聽覺空間影像屬性有關的暗號係藉由按規則時間間隔來合成ICTD、ICLD及ICC而隱含地加以考量。下面給出ICTD、ICLD及ICC可如何與一範圍聽覺空間影像屬性有關的某些觀點。
空間暗號之估計
下面說明如何估計ICTD、ICLD及ICC。此等(量化且經編碼)空間暗號之傳輸位元率可僅為若干kb/s,因此,採用BCC,可以接近單一聲音通道所需位元率之位元率來發送立體聲與多通道聲音信號。
圖5顯示依據本發明之一具體實施例、圖2之BCC估計器208之方塊圖。BCC估計器208包含濾波器組(FB)502,其可與圖3之濾波器組302相同,及估計組塊504,其為濾波器組502所產生的每一不同頻率次頻帶產生ICTD、ICLD及ICC空間暗號。
立體聲信號之ICTD、ICLD及ICC之估計
以下測量係用於兩(例如,立體聲)聲音通道之對應次頻帶信號(k )與(k )之ICTD、ICLD及ICC:o ICTD[取樣]: 如下等式(8)給出標準化交叉相關函數之短時估計: 其中d 1 =max{-d ,0},d 2 =max{d ,0} (9)及(d ,k )係(kd 1 )(kd 2 )之平均值之短時估計。
o ICLD[dB]:
o ICC:
應注意,使用標準化交叉相關函數之絕對值且c 1 2 (k )之範圍為[0,1]。
多通道聲音信號之ICTD、ICLD及ICC之估計
當存在兩個以上的輸入通道時,通常足以定義一參考通道(例如,通道編號1)與其他通道之間之ICTD及ICLD,如圖6所示C=5個通道之情形,其中τ1 c (k )與△L 1 c (k )分別表示參考通道1與通道c之間之ICTD與ICLD。
與ICTD及ICLD相反,ICC通常具有更多自由度。所有可能輸入通道對之間如此定義的ICC可具有不同值。對於C個通道而言,有C(C-1)/2個可能通道對;例如,對於5個通道而言,如圖7(a)所示,有10個通道對。然而,該方案要求,針對每一時間指數、每一次頻帶,估計並發送C(C-1)/2個ICC值,此導致高計算複雜性與高位元率。
或者,對於每一次頻帶而言,ICTD與ICLD決定該次頻帶中的對應信號成分之聽覺事件之呈現方向。因此,每個次頻帶中有一單一ICC參數可用以說明所有聲音通道之間之整體連貫性。可藉由僅估計並發送每一時間指數處、每一次頻帶中具有最多能量之兩通道之間之ICC暗號來獲得良好結果。圖7(b)說明此點,其中通道對(3、4)與(1、2)分別在時間瞬間k-1與k處最強。可使用試探規則來決定其他通道對之間之ICC。
空間暗號之合成
圖8顯示圖4之BCC合成器400之一實施方案之方塊圖,該BCC合成器可用於一BCC解碼器中以由一單一經發送和信號s(n)加上該等空間暗號來產生一立體聲或多通道聲音信號。將和信號s(n)分解成次頻帶,其中(k )表示一此類次頻帶。為了產生該等輸出通道中的每一個之對應次頻帶,將延遲dc 、縮放因數ac 及濾波器hc 應用於和信號之對應次頻帶。(為了簡化標記,在延遲、縮放因數及濾波器中,將時間指數k省略。)藉由施加延遲來合成ICTD、藉由縮放來合成ICLD及藉由使用非相關性濾波器來合成ICC。針對每一次頻帶,獨立地應用圖8所示處理。
ICTD合成
依據如下等式(12),由ICTD τ1 c (k )來決定延遲dc
計算參考通道之延遲d1 ,使得延遲dc 之最大幅度最小化。對次頻帶信號修改得越少,出現人工因素的危險性就越低。若次頻帶取樣率沒有為ICTD合成提供足夠高的時間解析度,則可藉由使用適合的全通濾波器來更精確地施加延遲。
ICLD合成
為了使輸出次頻帶信號之通道c與參考通道1之間具有所需ICLD △L 1 2 (k ),增益因數ac 應滿足如下等式(13):
此外,較佳地使輸出次頻帶標準化,使得所有輸出通道之功率和等於輸入和信號之功率。由於每一次頻帶中總的原始信號功率係保存於和信號中,故此標準化導致每一輸出通道之絕對次頻帶功率接近原始編碼器輸入聲音信號之對應功率。藉由此等約束,可由如下等式(14)給出縮放因數ac
ICC合成
在某些具體實施例中,ICC合成之目的係降低延遲與縮放之後之次頻帶之間之相關性,而不會影響ICTD與ICLD。此可藉由設計圖8之濾波器hc 使得ICTD與ICLD實際上係與頻率成函數關係而變化,進而使每一次頻帶(聽覺臨界頻帶)中的平均變化為零來實現。
圖9說明次頻帶內的ICTD與ICLD如何與頻率成函數關係而變化。ICTD與ICLD之變化幅度決定非相關性之程度且以與ICC成函數關係之方式來控制ICTD與ICLD之變化幅度。應注意,ICTD平滑地變化(如圖9(a)所示),而ICLD隨機地變化(如圖9(b)所示)。可使ICLD像ICTD那樣平滑地變化,但此將導致所得聲音信號具有更多賦色。
用於合成ICC,尤其適合於多通道ICC合成的另一方法已在C.Faller的"參數多通道聲音編碼:連貫性暗號的合成"(發表於2003年的IEEE Trans.on Speech and Audio Proc.)中更詳細地加以說明,以引用方式將該文章之原理併入本文中。以與時間及頻率成函數關係之方式,為輸出通道中的每一個添加特定數量的人工後期混響以獲得所需ICC。此外,可修改頻譜,使得所得信號之頻譜包絡接近原始聲音信號之頻譜包絡。
在2003年3月舉行的美國聲頻工程協會第114屆大會之預印本中、E.Schuijers、W.Oomen、B.den Brinker及J.Breebaart所著的"高品質聲音之參數編碼中的改進"與2004年5月舉行的美國聲頻工程協會第117屆大會之預印本中、J.Engdegard、H.Purnhagen、J.Roden及L.Liljeryd的"參數立體聲編碼中的合成環境"中已揭示立體聲信號(或聲音通道對)之其他有關及無關ICC合成技術,以引用方式將兩文章之原理併入本文中。
C至E BCC
如先前所述,可採用一個以上的傳輸通道來實施BCC。已說明BCC之變化形式,其表示C個聲音通道並非用作一單一(經發送)通道,而是用作E個通道,表示為C至E BCC。採用C至E BCC有(至少)兩動機:o在升級現有單系統以用於立體聲或多通道聲音播放時,採用一傳輸通道之BCC提供反向的相容路徑。經升級系統透過現有單基礎架構來發送BCC經降混和信號,同時額外地發送BCC側資訊。C至E BCC可應用於C通道聲音之E通道反向相容編碼。
o C至E BCC藉由不同程度地減少經發送通道數目而引入可縮放性。預期所發送的聲音通道越多,聲音品質就越好。
在01/20/04(Faller 13-1)所申請的美國申請案序列號碼10/762,100中已說明C至E BCC之信號處理細節,例如,如何定義ICTD、ICLD及ICC暗號。
以物件為主的BCC暗號
如上所述,在傳統C至E BCC方案中,編碼器由C個原始通道導出統計通道間差異參數(例如,ICTD、ICLD及/或ICC暗號)。如圖6及7A至B所示,此等特定BCC暗號係用以建立聽覺空間影像之揚聲器之數目與位置之函數。將此等BCC暗號稱作"非以物件為主的"BCC暗號,此係由於其並不直接呈現聽覺空間影像之感覺屬性。
除了此類非以物件為主的BCC暗號中的一或多個之外或替代地,一BCC方案可包括一或多個"以物件為主的"BCC暗號,其直接呈現多通道環繞聲音信號中固有的聽覺空間影像屬性。如此說明書中所使用,以物件為主的暗號係直接呈現聽覺場景之特徵,其中該特徵係獨立於用以建立該場景之揚聲器之數目與位置。該聽覺場景本身取決於用以建立該聽覺場景之揚聲器之數目與位置,但並非以物件為主的BCC暗號本身。
假設,例如,(1)使用揚聲器之一第一組態來產生一第一聲音場景,及(2)使用揚聲器之一第二組態(例如,揚聲器之數目及/或位置不同於該第一組態)來產生一第二聲音場景。進一步假設,該第一聲音場景係與該第二聲音場景相同(至少從特定聽者的角度而言係相同的)。在此情形中,該第一聲音場景之非以物件為主的BCC暗號(例如,ICTD、ICLDs、ICC)將不同於該第二聲音場景之非以物件為主的BCC暗號,但兩聲音場景之以物件為主的BCC暗號係相同的,因為此等暗號直接(即,獨立於揚聲器之數目與位置)呈現聲音場景之特徵。
BCC方案通常係應用於特定信號格式(例如,5通道環繞信號)之環境中,其中藉由信號格式來指定揚聲器之數目與位置。在此類應用中,任何非以物件為主的BCC暗號皆取決於該信號格式,而任何以物件為主的BCC暗號皆可被認為獨立於該信號格式,因為其獨立於該信號格式所關聯之揚聲器之數目與位置。
圖10(a)說明一聽者感受某一角度處之一單一、相對集中的聽覺事件(由陰影圓表示)。可藉由對圍繞該聽覺事件之揚聲器對(即,圖10(a)之揚聲器1與3)應用"振幅平移"來產生此聽覺事件,其中將相同,但強度可能不同的信號發送給兩揚聲器。位準差異(例如,ICLD)決定該聽覺事件發生在該揚聲器對之間什麼地方。採用此技術,可藉由恰當地選擇揚聲器對與ICLD值而朝任何方向呈現聽覺事件。
圖10(b)說明一聽者感受一單一、更擴散的聽覺事件(由陰影橢圓表示)。可使用針對圖10(a)所述相同的振幅平移技術,朝任何方向呈現該聽覺事件。此外,信號對之間之相似性已降低(例如,使用ICC連貫性參數)。當ICC=1時,聽覺事件之集中性係如圖10(a)所示,而隨著ICC減小,聽覺事件之寬度增大,如圖10(b)所示。
圖11(a)說明另一類型的感覺,通常將其稱作聽者環繞感,其中對聽者周圍的揚聲器應用獨立的聲音信號,使得聽者感覺"被包圍"在聲場中。藉由對不同揚聲器應用以不同方式非相關性之聲音信號版本來產生此效果。
圖11(b)說明聽者被包圍在聲場中,同時感受某一角度處、具有某一寬度之一聽覺事件。可藉由對圍繞該聽覺事件之揚聲器對(即,圖11(b)之揚聲器1與3)施加一信號、同時對所有揚聲器施加相同數量的獨立(即,非相關性)信號來建立此聽覺場景。
依據本發明之一具體實施例,對於諸如圖11(b)所示此等情景,將聲音信號之空間方面參數化成與頻率(例如,在次頻帶中)及時間成函數關係。與估計並發送非以物件為主的BCC暗號(例如,ICTD、ICLD及ICC暗號)不同,此特定具體實施例將以物件為主的參數(其更直接地呈現聽覺場景之空間方面)用作BCC暗號。特定言之,在每一次頻帶b中、在每一時間k處,將聽覺事件之角度α(b ,k )、聽覺事件之寬度w (b ,k )及聽覺場景之環繞度e (b ,k )作為BCC暗號加以估計並發送。
圖12(a)至(c)說明三個不同聽覺場景及其關聯的以物件為主的BCC暗號之值。在圖12(c)之聽覺場景中,不存在區域化聽覺事件。同樣地,寬度w (b ,k )為零,而角度α(b ,k )為任意的。
編碼器處理
圖10至12說明一可能的5通道環繞組態,其中由中央揚聲器(#3)向左30E定位左揚聲器(#1)、由中央揚聲器向右30E定位右揚聲器(#2)、由中央揚聲器向左110E定位左後揚聲器(#4)及由中央揚聲器向右110E定位右後揚聲器(#5)。
圖13以圖形方式將圖10至12之五個揚聲器之方位表示成單位向量s i =(cosΦ i ,sinΦ i ) T ,其中X軸表示中央揚聲器之方位、Y軸表示由中央揚聲器向左90E之方位及Φ i 係揚聲器相對於X軸之角度。
在每一時間k處、在每一BCC次頻帶b中,可依據如下等式(15)來估計環繞影像中、聽覺事件之方向: 其中α(b ,k )係聽覺事件相對於圖13之X軸之估計角度,而p i (b ,k )係環繞通道i之次頻帶b中、時間指數k處之功率或幅度。若使用幅度,則等式(15)對應於甜點中聲場之粒子速度向量。亦常使用功率,尤其在聲音強度與頭陰影扮演更重要角色之高頻率情形中。
可依據如下等式(16)來估計聽覺事件之寬度w (b ,k ):w (b ,k )=1-ICC(b ,k ), (16)其中ICC(b,k)係圍繞角度α(b ,k )所定義方向之兩揚聲器之信號之間之一連貫性估計。
聽覺場景之環繞度e (b ,k )估計來自所有揚聲器之非相關性聲音之總數量。計算此測量值時,可採用各種通道對之間之連貫性估計來代替,但要考慮使其與功率p i (b ,k )成函數關係。例如,e (b ,k )可為所獲得的不同聲音通道對之間之連貫性估計之一加權平均數,其中該加權係該等不同聲音通道對之相對功率之函數。
估計聽覺事件之方向時,另一可能方式係在每一時間k處、在每一次頻帶b中選擇兩最強通道並計算此等兩通道之間之位準差異。接著可使用一振幅平移定律來計算兩選定揚聲器之間之聽覺事件相對角度。接著可將兩揚聲器之間之相對角度轉換成絕對角度α(b ,k )。
在此替代技術中,可使用等式(16)來估計聽覺事件之寬度w (b ,k ),其中ICC(b,k)係兩最強通道之間之連貫性估計,且可使用如下等式(17)來估計聽覺場景之環繞度e (b ,k ): 其中C係通道數目,i1 與i2 係兩選定最強通道之指數。
儘管一BCC方案可發送所有三個以物件為主的參數(即,α(b ,k )、w (b ,k )及e (b ,k )),但替代BCC方案亦可發送更少的參數,例如當需要非常低的位元率時。例如,僅使用兩個參數:方向α(b ,k )與"方向性"d (b ,k )可獲得極好的結果,其中方向性參數基於w (b ,k )與e (b ,k )之間之一加權平均數而將w (b ,k )與e (b ,k )組合成一參數。
w (b ,k )與e (b ,k )之組合動機係源於聽覺事件之寬度與環繞度在某些程度上係相關感覺之事實。兩者皆由橫向獨立聲音引起。因此,w (b ,k )與e (b ,k )之組合使得在決定聽覺空間影像之屬性時,靈活性僅有少許降低。在一可能實施方案中,w (b ,k )與e (b ,k )之加權反映計算w (b ,k )與e (b ,k )時所採用信號之總信號功率。例如,可為w (b ,k )選擇權重使其與計算w (b ,k )時所選擇兩通道之功率成正比,而w (b ,k )之權重可與所有通道之功率成正比。或者,可發送α(b ,k )與w (b ,k ),其中在解碼器處以試探方式決定e (b ,k )。
解碼器處理
可藉由將以物件為主的BCC暗號轉換成非以物件為主的BCC暗號(例如,位準差異(ICLD)與連貫性值(ICC))且接著在一傳統BCC解碼器中使用此等非以物件為主的BCC暗號來實施解碼器處理。
例如,可藉由應用振幅平移定律(或其他可能頻率相依之關係),使用聽覺事件之角度α(b ,k )來決定圍繞該聽覺事件之兩揚聲器通道之間之ICLD。當應用振幅平移時,可由如下等式(18)給出的正弦立體聲定律來估計縮放因數a 1a 2 其中Φ0 係兩揚聲器之間之角度之一半之幅度、Φ係聽覺事件相對於順時針方向最靠近的揚聲器之角度之對應角度(若將該等角度定義成按反時針方向增加)及縮放因數a 1a 2 係依據如下等式(19)而與位準差異暗號ICLD有關:△L 1 2 (k )=20log1 0 (a 2 /a 1 )。 (19)
圖14說明角度Φ0 與Φ及縮放因數a 1a 2 ,其中s (n )表示基於縮放因數a 1a 2 而應用振幅平移時,角度Φ處所出現之一單信號。圖15以圖形方式顯示Φ0 =30E之一標準立體聲組態之ICLD與立體聲事件角度Φ之間之關係,其係依據等式(18)之正弦立體聲定律。
如先前所述,決定縮放因數a 1a 2 ,使其與聽覺事件之方向成函數關係。由於等式(18)僅決定比a 2 /a 1 ,故a 1a 2 之整體縮放有一自由度。此縮放亦取決於其他暗號,例如w (b ,k )與e (b ,k )。
可由寬度參數w (b ,k )來決定圍繞聽覺事件之兩揚聲器通道之間之連貫性暗號ICC,即ICC(b ,k )=1-w (b ,k )。以與環繞度參數e (b ,k )成函數關係之方式計算每一剩餘通道i之功率,其中e (b ,k )之值越大,暗示提供給剩餘通道之功率越大。由於總功率係一常數(即,總功率係等於經發送通道之總功率或與其成正比),故提供給圍繞聽覺事件方向之兩通道之功率和加上所有剩餘通道之功率和(由e (b ,k )決定)係常數。因此,環繞度e (b ,k )越高,提供給區域化聲音之功率就相對越小,即,將a 1a 2 選擇得越小(而比a 2 /a 1 係由聽覺事件之方向決定)。
一極限情形係環繞度最大之時。在此情形中,a 1a 2 較小,或a 1 =a 2 =0。另一極限情形係環繞度最小之時。在此情形中,選擇a 1a 2 ,使得所有信號功率皆提供給此等兩通道,而剩餘通道之功率為零。提供給剩餘通道之信號較佳地係一獨立(非相關性)信號,以便獲得最大聽者環繞感效應。
以物件為主的BCC暗號(例如,α (b ,k )、w (b ,k )及e (b ,k ))之一特徵為,其係獨立於揚聲器之數目與位置。同樣地,對於任何位置處的任何數目的揚聲器而言,此等以物件為主的BCC暗號可有效地用以呈現一聽覺場景。
更多替代具體實施例
儘管已在BCC碼方案(其中,採用一或多個聲音通道(即,E個經發送通道)來發送提示碼)中說明本發明,但在替代具體實施例中,亦可將該等提示碼發送至已具有該等經發送通道且亦可能具有其他BCC碼之一位置(例如,解碼器或儲存器件)。
儘管已在BCC碼方案中說明本發明,但本發明亦可實施於聲音信號非相關性之其他聲音處理系統中或需要非相關性信號之其他聲音處理中。
儘管已在實施方案(其中,編碼器接收時域中的輸入聲音信號且產生時域中的經發送聲音信號,解碼器接收時域中的經發送聲音信號且產生時域中的播放聲音信號)中說明本發明,但本發明不限於此。例如,在其他實施方案中,輸入、經發送及播放聲音信號中的任何一或多個可表示成頻域形式。
可結合或併入各種不同的應用或系統(包括電視或電子音樂發行系統、電影院系統、廣播系統、串流系統及/或接收系統)來使用BCC碼器及/或解碼器。此等系統包括用於經由(例如)地面、衛星、電纜、網際網路、企業網路或物理媒體(例如,光碟、數位多用光碟、半導體晶片、硬碟、記憶體卡及類似物理媒體)來編碼/解碼傳輸之系統。BCC碼器及/或解碼器亦可用於遊戲或遊戲系統中,其包括(例如)可與使用者互動的娛樂(活動、角色扮演、戰略、冒險、模擬、競賽、運動、騎樓、紙牌及棋盤遊戲)及/或教育性互動式軟體產品,該產品可出版以便更多機器、平臺或媒體使用。此外,可將BCC碼器及/或解碼器併入錄音機/聲音播放器或CD-ROM/DVD系統中。亦可將BCC碼器及/或解碼器併入到併入數位解碼(例如,播放器、解碼器)之PC軟體應用及併入數位編碼功能之軟體應用(例如,編碼器、ripper軟體、記錄器及jukebox軟體)中。
可作為以電路為主的程序來實施本發明,該等以電路為主的程序包括作為單一積體電路(例如,ASIC或FPGA)、多晶片模組、單一卡或多卡電路封包之可能實施方案。即如熟習本項技術之人士所顯知,各電路元件的各種功能亦可被實作為一軟體程式內的各項處理步驟。這種軟體可運用在,例如,一數位信號處理器、微控制器或通用電腦之內。
可按供以實行該等方法之各方法及裝置的形式來具體實作本發明。本發明亦可按執行於一像是軟碟、CD-ROM、硬碟或任何其他機器可讀取儲存媒體的可觸媒體內之程式碼形式而具體實作,其中該程式碼會被一像是電腦的機器所載入且執行,該機器即成為一供以實行本發明之裝置。本發明亦可按程式碼形式所具體實作,例如無論是否儲存在一儲存媒體內,被一機器載入及/或執行,或在一像是透過電子佈線或纜接、透過光纖或經由電磁輻射之傳輸媒體或載體上所傳輸皆然,其中當該程式碼被一像是電腦之機器所載入且執行時,該機器即成為一供以實行本發明之裝置。當在一通用處理器上進行實作時,各程式碼片斷可合併於該處理器以提供一可類推於各特定邏輯電路般運作之唯一性器件。
本發明亦可以使用本發明之一方法及/或一裝置所產生的一位元流或其他信號值序列(其係透過一媒體以電或光學方式加以發送、磁性記錄媒體中所儲存的磁場變化等)之形式而具體實作。
應進一步瞭解可由熟習本項技術之人士對既已描述及說明以解釋本發明本質的各項細節、材質及配置方式進行各種變化,而不致悖離如後申請專利範圍所表示之本發明範疇。
以下方法之申請專利範圍中的步驟即便係以特定順序加以引用且具有對應標籤,但如果申請專利範圍並未以其他方式暗示需要以特定順序來實施此等步驟中的某些或所有,則不必將此等步驟限制成以此特定順序進行實施。
100...雙耳信號合成器
200...聲音處理系統
202...編碼器
204...解碼器
206...降混器
208...估計器
300...降混器
302...濾波器組
304...降混組塊
306...縮放/延遲組塊
308...反向濾波器組
310...乘法器
400...合成器
402...濾波器組
404...升混組塊
406...延遲組塊
408...乘法器
410...非相關性組塊
412...反向濾波器組
502...濾波器組
504...估計組塊
從以上的詳細說明、隨附申請專利範圍及隨附圖式可更充分地明白本發明之其他方面、特徵與優點,其中相同的參考數字表示類似或相同的元件。
圖1顯示傳統雙耳信號合成器之高階方塊圖;圖2係一同屬雙耳提示碼(BCC)聲音處理系統之方塊圖;圖3顯示可用於圖2之降混器之一降混器之方塊圖;圖4顯示可用於圖2之解碼器之一BCC合成器之方塊圖;圖5依據本發明之一具體實施例顯示圖2之BCC估計器之方塊圖;圖6說明五通道聲音之ICTD與ICLD資料之產生;圖7,包含圖7(a)與7(b),說明五通道聲音之ICC資料之產生;圖8顯示圖4之BCC合成器之一實施方案之方塊圖,該BCC合成器可用於一BCC解碼器中以由一單一經發送和信號s(n)加上該等空間暗號來產生一立體聲或多通道聲音信號;圖9說明次頻帶內的ICTD與ICLD如何與頻率成函數關係而變化;圖10(a)說明一聽者感受在某一角度處之一單一、相對集中的聽覺事件(由陰影圓表示);圖10(b)說明一聽者感受一單一、更擴散的聽覺事件(由陰影橢圓表示);圖11(a)說明另一類型的感覺,通常將其稱作聽者環繞感,其中對聽者周圍的揚聲器施加獨立的聲音信號,使得聽者感覺"被包圍"在聲場中;圖11(b)說明聽者被包圍在聲場中,同時感受某一角度處、具有某一寬度之一聽覺事件;圖12(a)、12(b)及12(c)說明三個不同聽覺場景及其關聯的以物件為主的BCC暗號之值;圖13以圖形方式表示圖10至12之五個揚聲器之方位;圖14說明振幅平移之角度及縮放因數;及圖15依據正弦立體聲定律、以圖形方式表示ICLD與立體聲事件角度之間之關係。
200...聲音處理系統
202...編碼器
204...解碼器
206...降混器
208...估計器

Claims (24)

  1. 一種用於編碼聲音通道之方法,該方法包含:為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;及發送該一或多個提示碼,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量 值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度; (ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  2. 如請求項1之方法,其進一步包含發送對應於該等兩或更多聲音通道之E個經發送聲音通道,其中E>=1。
  3. 如請求項2之方法,其中:該等兩或更多聲音通道包含C個輸入聲音通道,其中C>E;及對該等C個輸入通道進行降混處理以產生該(等)E個經發送通道。
  4. 如請求項1之方法,其中發送該一或多個提示碼以致能一解碼器在E個經發送通道解碼期間、基於該至少一以物件為主的提示碼來執行合成處理,其中該(等)E個經發送聲音通道對應於該等兩或更多聲音通道,其中E>=1。
  5. 如請求項1之方法,其中在不同時間處且在不同次頻帶中估計該至少一以物件為主的提示碼。
  6. 如請求項1之方法,其中該至少一以物件為主的提示碼包含相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第一測量值。
  7. 如請求項1之方法,其中該至少一以物件為主的提示碼包含相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值。
  8. 如請求項1之方法,其中該至少一以物件為主的提示碼包含該聽覺場景中之該聽覺事件之該寬度之該第一測量 值。
  9. 如請求項1之方法,其中該至少一以物件為主的提示碼包含該聽覺場景中之該聽覺事件之該寬度之該第二測量值。
  10. 如請求項1之方法,其中該至少一以物件為主的提示碼包含該聽覺場景之該第一環繞度。
  11. 如請求項1之方法,其中該至少一以物件為主的提示碼包含該聽覺場景之該第二環繞度。
  12. 如請求項1之方法,其中該至少一以物件為主的提示碼包含該聽覺場景之該方向性。
  13. 一種用於編碼聲音通道之裝置,該裝置包含:產生構件,其用於為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;及發送構件,其用於發送該一或多個提示碼,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之 該絕對角度之第二測量值,其中估計該聽覺事件之該聽覺場景中之該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值; (5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  14. 一種用於編碼C個輸入聲音通道以產生E個經發送聲音通道之裝置,該裝置包含:一代碼估計器,其係調適以為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;及一降混器,其係調適以對該等C個輸入通道進行降混處理以產生該(等)E個經發送通道,其中C>E>=1,其中該裝置係調適以發送與該等提示碼有關之資訊以致能一解碼器在該(等)E個經發送通道之解碼期間執行合成處 理,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬 度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  15. 如請求項14之裝置,其中:該裝置係選自由一數位錄影機、一數位錄音機、一電腦、一衛星發射器、一電纜發射器、一地面廣播發射器 、一家庭娛樂系統及一電影院系統所組成之群組之一系統;及該系統包含該代碼估計器與該降混器。
  16. 一種機器可讀取媒體,其上具有經編碼程式碼,其中,當藉由一機器執行該程式碼時,該機器實施一用於編碼聲音通道之方法,該方法包含:為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;及發送該一或多個提示碼,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之 間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率 之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  17. 一種儲存藉由編碼聲音通道所產生之經編碼聲音位元流之電腦儲存媒體;其中:為兩或更多聲音通道產生一或多個提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;及將對應於該等兩或更多聲音通道之該等一或多個提示碼與E個經發送聲音通道(其中E>=1)編碼到該經編碼聲音位元流中,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之 該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係 由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  18. 一種用於解碼E個經發送聲音通道以產生C個播放聲音通道之方法,其中C>E>=1,該方法包含:接收對應於該(等)E個經發送通道之提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;對該(等)E個經發送通道中的一或多個進行升混處理以產生一或多個經升混通道;及藉由將該等提示碼應用於該一或多個經升混通道來合成該等C個播放通道中的一或多個,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之 一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉 由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  19. 如請求項18之方法,其中至少兩播放通道之合成係藉由:(i)基於用以呈現該等播放聲音通道之兩或更多揚聲器之位置而將該至少一以物件為主的提示碼轉換成至少一非以物件為主的提示碼;及(ii)將該至少一非以物件為主的提示碼應用於至少一 經升混通道以產生該至少兩播放通道。
  20. 如請求項19之方法,其中:該至少一以物件為主的提示碼包含(1)該聽覺場景中之一聽覺事件之一相對於一參考方向之絕對角度;(2)該聽覺事件之一寬度;(3)該聽覺場景之一環繞度;及(4)該聽覺場景之方向性中的一或多個;及該至少一非以物件為主的提示碼包含(1)一通道間相關性(ICC)碼、一通道間位準差異(ICLD)碼及一通道間時間差異(ICTD)碼中的一或多個。
  21. 一種用於解碼E個經發送聲音通道以產生C個播放聲音通道之裝置,其中C>E>=1,該裝置包含:接收構件,其用於接收對應於該(等)E個經發送通道之提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;升混構件,其用於對該(等)E個經發送通道中的一或多個進行升混處理以產生一或多個經升混通道;及合成構件,其用於藉由將該等提示碼應用於該一或多個經升混通道來合成該等C個播放通道中的一或多個,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由: (i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道; (ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  22. 一種用於解碼E個經發送聲音通道以產生C個播放聲音通道之裝置,其中C>E>=1,該裝置包含:一接收器,其係調適以接收對應於該(等)E個經發送通道之提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;一升混器,其係調適以對該(等)E個經發送通道中的一 或多個進行升混處理以產生一或多個經升混通道;及一合成器,其係調適以藉由將該等提示碼應用於該一或多個經升混通道來合成該等C個播放通道中的一或多個,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度; (ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
  23. 如請求項22之裝置,其中:該裝置係選自由一數位放影機、一數位聲音播放器、一電腦、一衛星接收器、一電纜接收器、一地面廣播接收器、一家庭娛樂系統及一電影院系統所組成之群組之一系統;及該系統包含該接收器、該升混器及該合成器。
  24. 一種機器可讀取媒體,其上具有經編碼程式碼,其中,當藉由一機器執行該程式碼時,該機器實施一用於解碼E個經發送聲音通道以產生C個播放聲音通道之方法,其中C>E≧1,該方法包含:接收對應於該(等)E個經發送通道之提示碼,其中至少一提示碼係直接呈現對應於該等聲音通道之一聽覺場景之一特徵之一以物件為主的提示碼,其中該特徵係獨立於用以建立該聽覺場景之揚聲器之數目與位置;對該(等)E個經發送通道中的一或多個進行升混處理以產生一或多個經升混通道;及藉由將該等提示碼應用於該一或多個經升混通道來合成該等C個播放通道中的一或多個,其中該至少一以物件為主的提示碼包含下列一或多者:(1)相對於一參考方向之一聽覺場景中之一聽覺事件之一絕對角度之第一測量值,其中估計該聽覺事件之該絕對角度之該第一測量值係藉由:(i)產生該等聲音通道之相對功率向量之一向量和;及(ii)基於該向量和相對於該參考方向之角度來決定 該聽覺事件之該絕對角度之該第一測量值;(2)相對於該參考方向之該聽覺場景中之該聽覺事件之該絕對角度之第二測量值,其中估計該聽覺事件之該絕對角度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)計算該等兩最強通道之間之一位準差異;(iii)應用一振幅平移定律以計算該等兩最強通道之間之一相對角度;及(iv)將該相對角度轉換成該聽覺事件之該絕對角度之該第二測量值;(3)該聽覺場景中之該聽覺事件之一寬度之一第一測量值,其中估計該聽覺事件之該寬度之該第一測量值係藉由:(i)估計該聽覺事件之該絕對角度;(ii)識別圍繞該絕對角度之兩聲音通道;(iii)估計該等兩經識別通道之間之連貫性;及(iv)基於該估計之連貫性來計算該聽覺事件之該寬度之該第一量測值;(4)該聽覺場景中之該聽覺事件之該寬度之一第二測量值,其中估計該聽覺事件之該寬度之該第二測量值係藉由:(i)識別該等聲音通道中的兩最強通道;(ii)估計該等兩最強通道之間之連貫性;及(iii)基於該估計之連貫性來計算該聽覺事件之該寬 度之該第二量測值;(5)該聽覺場景之一第一環繞度,其中該第一環繞度係由作為在不同聲音通道對之間之連貫性估計之一加權平均來估計,其中該加權係該等不同聲音通道對之相對功率之一函數;(6)該聽覺場景之一第二環繞度,其中該第二環繞度係由(i)除了該兩最強聲音通道之外之所有聲音通道之功率之總和及(ii)所有該等聲音通道之功率之總和之一比例來估計;及(7)該聽覺場景之該方向性,其中估計該方向性係藉由:(i)估計該聽覺場景中之一聽覺事件之一寬度;(ii)估計該聽覺場景之一環繞度;及(iii)作為該寬度與該環繞度之一加權和來計算該方向性。
TW094141787A 2004-11-30 2005-11-28 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體 TWI427621B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US63179804P 2004-11-30 2004-11-30

Publications (2)

Publication Number Publication Date
TW200636677A TW200636677A (en) 2006-10-16
TWI427621B true TWI427621B (zh) 2014-02-21

Family

ID=36087701

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094141787A TWI427621B (zh) 2004-11-30 2005-11-28 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體

Country Status (6)

Country Link
US (1) US8340306B2 (zh)
EP (1) EP1817767B1 (zh)
JP (1) JP5106115B2 (zh)
KR (1) KR101215868B1 (zh)
TW (1) TWI427621B (zh)
WO (1) WO2006060279A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591425B2 (en) 2008-05-23 2017-03-07 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
KR100682915B1 (ko) * 2005-01-13 2007-02-15 삼성전자주식회사 다채널 신호 부호화/복호화 방법 및 장치
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
EP1974345B1 (en) * 2006-01-19 2014-01-01 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007089131A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
JP2009526264A (ja) * 2006-02-07 2009-07-16 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US20070223740A1 (en) * 2006-02-14 2007-09-27 Reams Robert W Audio spatial environment engine using a single fine structure
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
WO2008039038A1 (en) 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
DE602007013415D1 (de) * 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
KR101120909B1 (ko) 2006-10-16 2012-02-27 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 멀티 채널 파라미터 변환 장치, 방법 및 컴퓨터로 판독가능한 매체
WO2008055238A2 (en) * 2006-10-31 2008-05-08 Anthony Grimani Method for performance measurement and optimization of sound systems using a sliding band integration curve
WO2008060111A1 (en) * 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
EP2102855A4 (en) 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
EP2097895A4 (en) * 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
JP2010516077A (ja) 2007-01-05 2010-05-13 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CA2645913C (en) 2007-02-14 2012-09-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US20100106271A1 (en) 2007-03-16 2010-04-29 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
CN101911181A (zh) 2008-01-01 2010-12-08 Lg电子株式会社 用于处理音频信号的方法和装置
KR101147780B1 (ko) * 2008-01-01 2012-06-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
WO2010073187A1 (en) * 2008-12-22 2010-07-01 Koninklijke Philips Electronics N.V. Generating an output signal by send effect processing
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
CA2765116C (en) * 2009-06-23 2020-06-16 Nokia Corporation Method and apparatus for processing audio signals
WO2011021110A1 (en) 2009-08-20 2011-02-24 Nds Limited Electronic book security features
WO2011064438A1 (en) * 2009-11-30 2011-06-03 Nokia Corporation Audio zooming process within an audio scene
WO2013108200A1 (en) * 2012-01-19 2013-07-25 Koninklijke Philips N.V. Spatial audio rendering and encoding
AU2013301864B2 (en) * 2012-08-10 2016-04-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and methods for adapting audio information in spatial audio object coding
WO2014161996A2 (en) 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
JP6248186B2 (ja) 2013-05-24 2017-12-13 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
JP6612753B2 (ja) * 2013-11-27 2019-11-27 ディーティーエス・インコーポレイテッド 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング
EP2879131A1 (en) * 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
CN105657633A (zh) 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据
US11128978B2 (en) * 2015-11-20 2021-09-21 Dolby Laboratories Licensing Corporation Rendering of immersive audio content
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
WO2020046349A1 (en) 2018-08-30 2020-03-05 Hewlett-Packard Development Company, L.P. Spatial characteristics of multi-channel source audio
US11019449B2 (en) 2018-10-06 2021-05-25 Qualcomm Incorporated Six degrees of freedom and three degrees of freedom backward compatibility
DE102021200553B4 (de) * 2021-01-21 2022-11-17 Kaetel Systems Gmbh Vorrichtung und Verfahren zum Ansteuern eines Schallerzeugers mit synthetischer Erzeugung des Differenzsignals

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW507194B (en) * 2000-05-24 2002-10-21 Nat Science Council Variable-rate residual-transform vocoders using auditory perception approximation
US20030007648A1 (en) * 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
TW517223B (en) * 2000-10-26 2003-01-11 Mitsubishi Electric Corp Voice coding method and device
TW544654B (en) * 2001-07-06 2003-08-01 Shyue-Yun Wan Method of eliminating noise on sound storage and regeneration system
US20030219130A1 (en) * 2002-05-24 2003-11-27 Frank Baumgarte Coherence-based audio coding and synthesis
US20050157833A1 (en) * 2003-03-03 2005-07-21 Mitsubishi Heavy Industries, Ltd Cask, composition for neutron shielding body, and method of manufactruing the neutron shielding body

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
CA1268546A (en) * 1985-08-30 1990-05-01 Shigenobu Minami Stereophonic voice signal transmission system
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
DE3912605B4 (de) * 1989-04-17 2008-09-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5703999A (en) * 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3227942B2 (ja) 1993-10-26 2001-11-12 ソニー株式会社 高能率符号化装置
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH0969783A (ja) 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5771295A (en) * 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US7012630B2 (en) 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
DE69734543T2 (de) * 1996-02-08 2006-07-20 Koninklijke Philips Electronics N.V. Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
US5825776A (en) * 1996-02-27 1998-10-20 Ericsson Inc. Circuitry and method for transmitting voice and data signals upon a wireless communication channel
US5889843A (en) * 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
KR0175515B1 (ko) * 1996-04-15 1999-04-01 김광호 테이블 조사 방식의 스테레오 구현 장치와 방법
US6987856B1 (en) * 1996-06-19 2006-01-17 Board Of Trustees Of The University Of Illinois Binaural signal processing techniques
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
SG54383A1 (en) * 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6111958A (en) * 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US6236731B1 (en) 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
US5860060A (en) * 1997-05-02 1999-01-12 Texas Instruments Incorporated Method for left/right channel self-alignment
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6108584A (en) * 1997-07-09 2000-08-22 Sony Corporation Multichannel digital audio decoding method and apparatus
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6021389A (en) * 1998-03-20 2000-02-01 Scientific Learning Corp. Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
TW444511B (en) 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000151413A (ja) 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2000152399A (ja) * 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US6408327B1 (en) 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6282631B1 (en) * 1998-12-23 2001-08-28 National Semiconductor Corporation Programmable RISC-DSP architecture
WO2000060746A2 (en) * 1999-04-07 2000-10-12 Dolby Laboratories Licensing Corporation Matrixing for losseless encoding and decoding of multichannels audio signals
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4438127B2 (ja) 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US6823018B1 (en) 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US6434191B1 (en) * 1999-09-30 2002-08-13 Telcordia Technologies, Inc. Adaptive layered coding for voice over wireless IP applications
US6614936B1 (en) * 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6498852B2 (en) * 1999-12-07 2002-12-24 Anthony Grimani Automatic LFE audio signal derivation system
US6845163B1 (en) 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
EP1208725B1 (en) * 1999-12-24 2009-06-03 Koninklijke Philips Electronics N.V. Multichannel audio signal processing device
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
JP2001339311A (ja) 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6850496B1 (en) 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
US6973184B1 (en) 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7236838B2 (en) * 2000-08-29 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus, signal processing method, program and recording medium
US6996521B2 (en) 2000-10-04 2006-02-07 The University Of Miami Auxiliary channel masking in an audio signal
TW510144B (en) 2000-12-27 2002-11-11 C Media Electronics Inc Method and structure to output four-channel analog signal using two channel audio hardware
US6885992B2 (en) * 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7668317B2 (en) * 2001-05-30 2010-02-23 Sony Corporation Audio post processing in DVD, DTV and other audio visual products
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003044096A (ja) 2001-08-03 2003-02-14 Matsushita Electric Ind Co Ltd マルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システム
KR20040029113A (ko) * 2001-08-27 2004-04-03 더 리전트 오브 더 유니버시티 오브 캘리포니아 주파수-진폭-변조-인코딩(fame) 방법들을 사용하여음향 신호들을 개선하기 위한 장치/방법, 및 인공와우이식기
AU2003201097A1 (en) 2002-02-18 2003-09-04 Koninklijke Philips Electronics N.V. Parametric audio coding
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4714415B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示
ATE426235T1 (de) 2002-04-22 2009-04-15 Koninkl Philips Electronics Nv Dekodiervorrichtung mit dekorreliereinheit
WO2003094369A2 (en) 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
US7447629B2 (en) * 2002-07-12 2008-11-04 Koninklijke Philips Electronics N.V. Audio coding
WO2004008437A2 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
RU2325046C2 (ru) 2002-07-16 2008-05-20 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
JP4751722B2 (ja) * 2002-10-14 2011-08-17 トムソン ライセンシング オーディオシーンにおける音源のワイドネスを符号化および復号化する方法
US7644001B2 (en) 2002-11-28 2010-01-05 Koninklijke Philips Electronics N.V. Differentially coding an audio signal
JP2004193877A (ja) 2002-12-10 2004-07-08 Sony Corp 音像定位信号処理装置および音像定位信号処理方法
CN1748247B (zh) 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
EP1609335A2 (en) 2003-03-24 2005-12-28 Koninklijke Philips Electronics N.V. Coding of main and side signal representing a multichannel signal
US7343291B2 (en) * 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US20050069143A1 (en) * 2003-09-30 2005-03-31 Budnikov Dmitry N. Filtering for spatial audio rendering
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7761289B2 (en) * 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW507194B (en) * 2000-05-24 2002-10-21 Nat Science Council Variable-rate residual-transform vocoders using auditory perception approximation
TW517223B (en) * 2000-10-26 2003-01-11 Mitsubishi Electric Corp Voice coding method and device
US20030007648A1 (en) * 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
TW544654B (en) * 2001-07-06 2003-08-01 Shyue-Yun Wan Method of eliminating noise on sound storage and regeneration system
US20030219130A1 (en) * 2002-05-24 2003-11-27 Frank Baumgarte Coherence-based audio coding and synthesis
US20050157833A1 (en) * 2003-03-03 2005-07-21 Mitsubishi Heavy Industries, Ltd Cask, composition for neutron shielding body, and method of manufactruing the neutron shielding body

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591425B2 (en) 2008-05-23 2017-03-07 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
US10136237B2 (en) 2008-05-23 2018-11-20 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
US11019445B2 (en) 2008-05-23 2021-05-25 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
US11871205B2 (en) 2008-05-23 2024-01-09 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Also Published As

Publication number Publication date
WO2006060279A1 (en) 2006-06-08
EP1817767A1 (en) 2007-08-15
KR20070086851A (ko) 2007-08-27
JP5106115B2 (ja) 2012-12-26
JP2008522244A (ja) 2008-06-26
TW200636677A (en) 2006-10-16
US20080130904A1 (en) 2008-06-05
US8340306B2 (en) 2012-12-25
EP1817767B1 (en) 2015-11-11
KR101215868B1 (ko) 2012-12-31

Similar Documents

Publication Publication Date Title
TWI427621B (zh) 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體
CA2593290C (en) Compact side information for parametric coding of spatial audio
JP4856653B2 (ja) 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
JP5017121B2 (ja) 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
KR100922419B1 (ko) 바이노럴 큐 코딩 방법 등을 위한 확산음 엔벌로프 정형
KR100924576B1 (ko) 바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형
BRPI0518507B1 (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees