TWI533718B

TWI533718B - 雙耳時間延遲回復系統及方法

Info

Publication number: TWI533718B
Application number: TW098128032A
Authority: TW
Inventors: 詹姆斯Ｄ強斯頓
Original assignee: Ｄｔｓ股份有限公司
Priority date: 2008-09-04
Filing date: 2009-08-20
Publication date: 2016-05-11
Also published as: US8233629B2; CN102144405B; KR20110063807A; EP2321977B1; WO2010027403A1; CN102144405A; EP2321977A4; EP2321977A1; WO2010027403A8; JP5662318B2; US20100054482A1; TW201014372A; JP2012502550A; KR101636592B1; HK1156171A1

Description

雙耳時間延遲回復系統及方法

發明領域

本發明有關於用於處理音訊資料的系統，且更特別地有關於用於回復立體聲或其他多通道音訊資料中之雙耳時間延遲的一系統及方法。

發明背景

當處理音訊資料以產生一音訊合成時，通常使用採用平移電位器的一混合器，或模擬一平移電位器之功能的其他系統或裝置來混合此音訊資料。該等平移電位器可用以將一單一輸入通道分配給二或更多個輸出通道(諸如一左及右立體聲輸出)，以諸如模擬在相對於收聽者之最左與最右位置之間的一空間位置。然而，典型地，此等平移電位器不會增加常見於一現有性能中的一雙耳時間差。

發明概要

根據本發明，基於音訊資料通道的相對振幅，而提供雙耳時間延遲回復的系統和方法，其會在二或更多個音訊資料通道之間增加一個對應於一經評估雙耳延遲的時間延遲。

根據本發明的一示範實施例，提供用於處理音訊資料的一裝置。該裝置包括一雙耳時間延遲修正因子單元，其用於接收多個音訊資料通道，且產生一雙耳時間延遲修正因子，諸如其中該等多個音訊資料通道包括不具有相關聯雙耳時間延遲的平移資料。一雙耳時間延遲修正因子插入單元以該雙耳時間延遲修正因子的函數來修改該等多個音訊資料通道，以諸如增加一經評估之雙耳時間延遲而改良音訊品質。

在該技藝中具有通常知識者將進一步理解的是本發明的優點及優越特徵，與其讀取圖式之後的詳細描述中所得到的其他重要層面。

圖式之多個視圖之簡單描述

第1圖是根據本發明之一示範實施例，雙耳時間修正之系統的一圖式；第2圖是一系統的一圖式，根據本發明之一示範實施例，用於檢測特定頻帶的左及右通道音訊資料中峰值的差；第3圖是根據本發明之一示範實施例，用於消除雙耳時間及位準差之系統的一圖式；第4圖是根據本發明之一示範實施例，用於處理音訊資料以引入一雙耳時間或位準差之方法的一圖式；第5圖是根據本發明之一示範實施例，雙耳時間延遲修正之系統的一圖式；第6圖是根據本發明之一示範實施例，用於控制與一平移控制設定相關聯之一雙耳時間延遲的方法的一流程圖。

較佳實施例之詳細描述

在下面的描述中，相似的部分分別以相同的參照數字標示於說明書及圖式通篇中。為了清晰及簡明，該等圖式未按照比例繪製，且某些元件可以廣義或示意的形式予以顯示，且藉由工業設計而獲識別。

第1圖是根據本發明之一示範實施例之雙耳時間修正的一系統100的一圖式。系統100可實施於軟體、硬體，或軟體及硬體的一適當結合中，且可是操作於一數位信號處理平臺上的一或多個軟體系統。如本文所使用，“硬體”可包括分離元件、一積體電路、一特定應用積體電路、一現場可程式閘陣列的一結合，或其他適當的硬體。如本文所使用，“軟體”可包括一或多個物體、代理器、線程、代碼行、次程式、分離軟體應用、二或更多個代碼行，或操作於二或更多個軟體應用中或二或更多個處理器上的其他適當軟體結構，或其他適當軟體結構。在一示範實施例中，軟體可包括操作於一一般用途軟體應用中(諸如一作業系統)的一或多個代碼行或其他適當的軟體結構，及操作於一特定用途軟體應用中的一或多個代碼行或其他適當的軟體結構。

系統100包括分別接收一左及右通道音訊時間信號的低延遲濾波器組102及104。在一示範實施例中，低延遲濾波器組102及104可在一取樣頻率下接收一串音訊資料取樣，且可基於一預定數量的取樣來處理該經取樣的音訊資料。低延遲濾波器組102及104可用以在一時間期間內，為多個頻帶判定峰值振幅之間的一時間延遲。在一示範實施例中，頻帶的數目與巴克、等效矩形頻帶(ERB)或其他適當的音訊資料心理聲學帶的數目相關，使得低延遲濾波器組102及104之輸出的總數目等於每一輸入取樣之bark或ERB的數目。同樣地，超取樣可用以減小音訊人工因素產生的可能性，諸如透過使用多個濾波器，每一濾波器對應於每一頻帶之多個相對應子頻帶(從而產生每一相關聯頻帶的多個子頻帶)，或以其他適當的方式。

通道延遲檢測器106接收來自低延遲濾波器組102及104的輸入，且對多個頻帶的每一頻帶判定一差值修正因子。在一示範實施例中，為了將一雙耳時間延遲插入可使用平移但不包含一相關聯時間延遲的一信號中，通道延遲檢測器106可產生一定量的相位差，使增加至頻域信號中，以產生諸如在一左與右通道之間的一時間差。在一示範實施例中，音訊資料可使用一平移電位器而予以混合，以使一輸入通道具有介於立體聲資料之最左及最右通道之間的一明顯空間位置，或是介於包括多於二個通道中的其他適當方式。儘管此平移可用以模擬空間位置、運動或其他效應，但是與現有音訊資料相關聯的雙耳時間延遲不可藉由此平移予以重建。例如，當一聲源存在於收聽者的左側時，收聽者的左耳接收到聲源之音訊信號的時間與收聽者的右耳接收到音訊信號的時間之間將具有一時間延遲。同樣地，隨著該聲源從收聽者的左側移向收聽者的右側，在聲源直接地在收聽者前方時，相關聯之時間延遲將降低至零，且接著將相對於右耳而增加。使用一簡單的平移電位器來模擬空間位置，或運動而不能產生此等相關聯時間延遲，這些相關聯時間延遲可使用通道延遲檢測器106予以模型化且插入一立體聲或其他多通道音訊信號中。

相同地，諸如當在該左及右通道之間存在一時間延遲，但不存在相關聯的振幅差時，通道延遲檢測器106也可用以修正雙耳位準差。例如，音訊處理可致使與一經平移音訊信號相關聯的位準改變，使得已由左通道與右通道之間的相關聯時間延遲予以正確記錄的一音訊信號仍然產生左及右通道聲音的位準，該等左及右通道聲音的位準不會反應現有的音訊信號。通道延遲檢測器106也可或可選擇地用以使相關聯的位準修正因子模型化且插入一立體聲或其他多通道音訊信號中。

通道延遲檢測器106輸出多個為M的修正因子，其等用以將雙耳時間差或位準差插入多個音訊資料通道中。修正因子的數目可小於低延遲濾波器組102或104輸出的數目，其中超取樣用以消除感知帶內的變化。在一示範實施例中，當感知帶以三倍的頻帶來取樣時，N將等於三倍的M。

系統100包括延遲108及110，其等接收左及右時變音訊通道信號，且將該等信號延遲一定的量，該量相對應於穿過低延遲濾波器組102與104及通道延遲檢測器106的延遲減去由補零韓恩(Hann)視窗112與114及快速傅立葉轉換器116與118所產生的延遲。

補零Hann視窗112及114將該左及右通道的時變音訊信號修改一定的量，以產生一Hann視窗式經修改信號。補零Hann視窗112及114可用以防止產生於該等經處理信號的不連續性，該等不連續性可產生會致使經處理音訊資料產生音訊人工因素的相位偏移變化。也可或可選擇地使用用以防止不連續性之其他類型的Hann視窗或其他適當的處理。

快速傅立葉轉換器116及118將時域的左及右通道音訊資料轉變為頻域資料。在一示範實施例中，快速傅立葉轉換器116及118接收一預定數量之時域信號的時間取樣(其等藉由補零Hann視窗112及114予以修改，以增加取樣數目)，且產生一相對應數量之時域信號的頻率成分。

相位偏移插入單元120從快速傅立葉轉換器116及118接收快速傅立葉轉換資料，且基於從通道延遲檢測器106所接收的修正因子來將一相位偏移插入該等信號中，諸如，透過對一個別頻率點或頻率點群組，修改該傅立葉轉換資料的實部分量及虛部分量，而不修改每一點或點之群組的相關聯振幅。在一示範實施例中，該相位偏移可與由通道延遲檢測器106所決定的電子通道之間的角度差相關，使得主通道推進二分之一角度差的相位，且輔助通道推遲二分之一角度差的相位。

反快速傅立葉轉換器122及124從相位偏移插入單元120接收相位經偏移的頻域信號，且對該等信號執行一反快速傅立葉轉換以產生一時變信號。接著，將該等左及右通道時變信號分別提供給交疊加總器126及128，該等交疊加總器126及128對信號執行一交疊加總操作，以說明藉由補零Hann視窗112及114的處理。交疊加總器126及128將一信號輸出至移位及加總暫存器130及132，該等移位及加總暫存器130及132輸出為的一經偏移的時間信號。

在操作中，為了插入一雙耳時間差，系統100允許包括平移而不具有相關聯雙耳時間差的一信號獲得補償。因而，系統100回復那些通常會產生於音訊信號中的雙耳時間差，且從而改良音訊品質。

第2圖是一系統200的一圖式，根據本發明之一示範實施例，用於對於特定的頻帶檢測左及右通道音訊資料之峰值的差值。系統200可用以對於音訊資料之分離頻帶檢測在左及右通道資料之間的峰值，且用以對於每一頻帶產生一修正因子。

系統200包括希爾伯特(Hilbert)波封單元202及204，其等接收一左及右時域信號，且對於該等信號的一預定頻帶產生一Hilbert波封。在一示範實施例中，相比於由系統100之快速傅立葉轉換器116及118所處理的時域取樣數量，Hilbert波封單元202可操作於一較少數量的時域取樣上，以允許系統200快速地產生修正因子，且避免另外由於在相關聯修正因子產生過程中將時間通道時域資料轉換至頻域而產生的額外延遲。

峰值檢測器206及208分別接收該等左及右通道Hilbert波封，且判定每一信號的一峰值振幅與該峰值振幅的一相關聯時間。接著，將該峰值及時間資料提供給那個判定該等相對應峰值振幅是否存在一時間差的振幅及時間差檢測器210。如果振幅及時間差檢測器210判定在該等峰值振幅時間之間沒有相對應的差值，那麼可使用雙耳時間差修正單元214透過將該等左及右通道峰值振幅的振幅值進行比較，來判定一修正因子角度T^COR，且將其插入頻域音訊資料中。在一示範實施例中，該修正因子角度T^COR可透過使角度atan2(左通道振幅、右通道振幅)減去45度來判定。同樣地，可使用其他適當的處理來判定修正因子角度。也可使用一適當的臨界值，諸如在該等振幅峰值之間具有一較短的時間差時，將其提供用於修正因子角度的產生。

在左及右通道資料的峰值之間存在時間差，但另外振幅相等時，可使用雙耳位準差修正單元212。在這一示範實施例中，該等振幅可藉由一修正因子L^COR予以調整，而使具有前導音訊峰值的通道調整為一較高值，且使具有拖曳音訊峰值的通道調整為一較低值。諸如，透過從滯後通道減去L^COR，透過增加0.5*L^COR到前導通道且從滯後通道中減去0.5*L^COR，或以其他適當的方式。也可將一臨界值用於雙耳位準差修正單元212中，諸如以識別一臨界時間差值和一臨界位準差值。當振幅高於此臨界時間差值時，位準修正會被使用；且當振幅低於此臨界位準差值時，位準修正不會被使用。

在操作中，系統200可用以產生左及右信號的時間及位準差修正因子，以諸如對具有左或右平移而不具有相關聯時間差的信號產生雙耳時間差修正因子，且在存在雙耳時間差但不存在相關聯平移振幅時產生信號的位準修正。

第3圖是一系統300的一圖式，根據本發明之一示範實施例，用於消除雙耳時間及位準差。系統300包括雙耳時間及位準差修正單元302至306，其等分別對於一不同的頻帶產生一雙耳時間及/或位準差修正因子。在一示範實施例中，該等頻帶可是bark、ERB或其他適當心理聲學頻帶的部分，使得該系統300可用以基於此頻帶的子分量，對於該心理聲學頻帶產生一單一修正因子。

時序消除單元308至312用以在分別來自雙耳時間或位準差修正單元302至306的輸出上執行時序消除。在一示範實施例中，時序消除單元308至312可從雙耳時間及位準差修正單元302至306接收一序列的輸出，且可儲存一預定數量的取樣的序列，用以諸如允許平均或以其他方式消除在連續取樣之間的變化。

頻帶消除單元314從雙耳時間或位準差修正單元302至306接收每一個的雙耳時間或位準差修正因子，且執行消除該等雙耳時間或位準差修正因子。在一示範實施例中，在將一bark或ERB頻帶分為三部分時，頻帶消除單元314可平均相關聯之頻帶的三個頻率修正因子，可判定一加權平均，可使用經消除時序的因子，或可執行其他適當的消除處理。頻帶消除單元314對於每一頻帶產生一單一相位修正因子。

在操作中，系統300對雙耳時間或位準差修正因子的一時間、頻率、時間及頻率，或其他適當的基底執行消除，該等雙耳時間或位準差修正因子是透過分析左及右通道音訊資料而產生，用以檢測不具有相關聯位準或時間差的平移設定。系統300從而透過確保在該等雙耳時間或位準差修正因子之間的改變不會遭到快速地改變，而幫助避免音訊人工因素的產生。

第4圖是一方法400的一圖式，根據本發明之一示範實施例，用於處理音訊資料以引入一雙耳時間或位準差。方法400開始於402，其會判定左及右振幅波封。在一示範實施例中，可使用一Hilbert波封檢測器或其他適當的系統來對一頻帶判定峰值振幅、與該峰值相關聯的時間及其他適當的資料。該方法接著進入404。

在404處，檢測在振幅波封中的峰值，還檢測該等峰值的相關聯時間。在一示範實施例中，可使用諸如一振幅檢測器的一簡單峰值檢測器來檢測峰值發生時相關聯的時間間隔。該方法進入406。

在406處，判定在左及右通道資料的峰值之間是否具有一時間差。在一示範實施例中，一時間差可包括一相關聯緩衝，使得如果峰值之間的時間小於一預定量，則判定不存在一時間差。如果判定確實存在一時間差，而使得不需要雙耳時間延遲回復，則該方法進入408，其會判定在二信號的振幅之間是否存在一位準差。如果判定存在一位準差，則該方法進入410。否則，該方法進入412，其會修正在左及右通道音訊資料之間的位準。在一示範實施例中，一前導通道振幅可不遭改變地予以保留，然而一滯後通道振幅可藉由與該等前導及滯後通道之間的差值相關的一因子(或可使用其他適當的處理)而降低。

如果判定在左及右通道振幅峰值之間不存在時間差，則該方法進入414，其會將位準差轉換為一相位修正角度。在一示範實施例中，該相位修正角度可由atan2(左通道振幅、右通道振幅)減去45度，或可使用其他適當的關係而予以判定。該方法接著進入416，其會將相位差分配給左及右通道。在一示範實施例中，可透過均等地分離該相位差來執行該分配，以將該等通道推進及推遲相同的量。同樣地，可使用適當的加權差，或可使用其他適當的處理。該方法接著進入418。

在418處，消除在左及右通道相位修正角度之間的差值。在一示範實施例中，該差值可隨著時間的推移而消除，基於相鄰通道的相位修正角度或以其他適當的方式予以消除。該方法接著進入420。

在420處，將差值修正因子用於一音訊信號中。在一示範實施例中，可使用一習知方法，諸如透過增加或減去頻域中一相關聯相位偏移而增加或減去頻域中一時間信號的時間差，來將相對應於一時間差的一相位差增加於頻域中。同樣地，可使用其他適當的處理。

在操作中，方法400允許一雙耳相位或振幅修正因子的判定，且用於多個音訊資料通道中。雖然已顯示了二個示範通道，但是也可適當地處理音訊資料的附加通道，以諸如將一雙耳相位或振幅修正因子增加於一5.1聲音系統、一7.1聲音系統或其他適當聲音系統的音訊資料中。

第5圖是一系統500的一圖式，根據本發明之一示範實施例，用以修正雙耳時間延遲。系統500允許雙耳時間延遲在混合之前獲得補償，以產生能更正確地反映與在相關聯實體位置處所產生之聲源相關聯的雙耳時間延遲的平移控制輸出。

系統500包括左通道可變延遲502、右通道可變延遲504及平移控制506，其等之每一個均可實施於硬體、軟體，或硬體及軟體的一適當結合中，且可是操作於一數位信號處理平臺上的一個或多個軟體系統。平移控制506允許使用者選擇一平移設定，用以將一時變音訊資料輸入分配給一左通道信號及一右通道信號。在一示範實施例中，平移控制506可包括多個時間延遲值，每一時間延遲值相關於一虛擬左位置與虛擬右位置之間的多個相關聯位置設定的其中一個。在這一示範實施例中，由於完全左、中間或完全右位置等的這些設定不需要延遲，所以，平移控制506可去能那個選定這些設定的可變延遲控制。對於平移控制506在完全左、中間或完全右位置之間的設定，可產生一延遲值，該延遲值相對應於位於一相關聯位置處的一聲源可能所產生的一雙耳時間延遲。

平移控制506也可包括允許使用者選擇主動平移的一主動平移特徵，諸如使用者打算從左平移至右，或從右平移至左。在這一示範實施例中，對於一完全左或完全右平移控制506設定可提供一時間延遲，以允許使用者在該平移控制506設定從完全左或完全右設定中移除時，平移該音訊輸入而不產生音訊人工因素，正如另外該時間延遲將從對於該完全左或完全右設定的一零值延遲，跳轉至相鄰於該完全左或完全右設定之平移控制506設定的最大延遲值。

左通道可變延遲502及右通道可變延遲504可使用系統100之雙耳時間延遲修正因子插入單元，或以其他適當的方式予以實施。

在操作中，當一音訊通道在二輸出通道(諸如一左通道及一右通道或其他適當的通道)之間平移時，系統500允許增加雙耳時間延遲。對於不需要一時間延遲的設定，系統500可去能該時間延遲。

第6圖是一方法600的一流程圖，根據本發明之一示範實施例，用於控制與一平移控制設定相關聯之一雙耳時間延遲。方法600開始於602，其會接收諸如對於一使用者選定通道的時域音訊通道資料。該方法接著進入604，其會檢測一平移控制設定。該平移控制可是一電位器、一虛擬平移控制或其他適當的控制。該方法接著進入606。

在606處，判定是否需要一平移延遲設定。在一示範實施例中，對於諸如一完全左、完全右或中間位置的預定平移控制位置，可去能該平移延遲。在另一示範實施例中，諸如在使用者選定一平移控制設定而允許使用者主動地在一完全左與一完全右位置之間平移時，對於完全左或完全右位置可產生平移延遲，以諸如當該平移控制從該完全右或完全左位置移除時，避免時間延遲產生過程的不連續性。如果判定不需要平移控制，則該方法進入612，否則該方法進入608。

在608處，基於該平移控制設定，計算延遲的量。在一示範實施例中，當平移控制在完全左或完全右位置中，諸如選定主動平移時，可產生一最大時間延遲。同樣地，在選定一靜態平移設定時，因為相反通道沒有產生相關聯的信號，所以一完全左或完全右設定不需要時間延遲。對於在完全右與完全左位置設定之間的平移控制設定，需計算相對應於在一中間位置處之時間延遲的一時間延遲，其中該時間延遲隨著平移控制位置接近於一中心位置而降低。該方法接著進入610。

在610處，將該經計算延遲用於一或多個可變延遲中。在一示範實施例中，可將該延遲增加至該等左或右通道之一中，或可使用其他適當的延遲設定。在另一示範實施例中，可使用系統100之雙耳時間延遲修正因子插入單元或以其他適當的方式，來增加該延遲。該方法接著進入612。

在612處，諸如透過判定附加資料取樣是否存在於一資料緩衝區中或以其他適當的方式存在，而來判定附加的音訊通道資料是否需要處理。如果需要附加資料處理，該方法返回602，否則該方法進入614且終止。

在操作中，方法600允許一雙耳時間延遲基於一平移控制設定而產生。方法600允許藉由一平移控制的使用，來模擬出聲音位置，且相較於在一左及右通道之間的簡單平移，會更接近於一真實聲源的位置，而不需時間修正。

雖然本發明之一系統及方法的示範實施例已在本文中予以詳細地描述，但是在該技藝中具有通常知識者將認識到的是，可對該等系統及方法作出各種替代及修改，而不背離附加申請專利範圍的範圍及精神。

100．．．系統

102、104．．．低延遲濾波器組

106．．．通道延遲檢測器

108、110．．．延遲

112、114．．．補零Hann視窗

116、118．．．快速傅立葉轉換器

120．．．相位偏移插入單元

122、124．．．反快速傅立葉轉換器

126、128．．．交疊加總器

130、132．．．移位及加總暫存器

200．．．系統

202、204．．．希爾伯特(Hilbert)波封單元

206、208．．．峰值檢測器

210．．．振幅及時間差檢測器

212、214．．．雙耳時間差修正單元

300．．．系統

302~306．．．雙耳時間或位準差修正單元

308~312．．．時序消除單元

314．．．頻帶消除單元

400．．．方法

402~420．．．步驟

500．．．系統

502．．．左通道可變延遲

504．．．右通道可變延遲

506．．．平移控制

600．．．方法

602~614．．．步驟

T^COR．．．修正因子角度

L^COR．．．修正因子

第1圖是根據本發明之一示範實施例，雙耳時間修正之系統的一圖式；

第2圖是一系統的一圖式，根據本發明之一示範實施例，用於檢測特定頻帶的左及右通道音訊資料中峰值的差；

第3圖是根據本發明之一示範實施例，用於消除雙耳時間及位準差之系統的一圖式；

第4圖是根據本發明之一示範實施例，用於處理音訊資料以引入一雙耳時間或位準差之方法的一圖式；

第5圖是根據本發明之一示範實施例，雙耳時間延遲修正之系統的一圖式；

第6圖是根據本發明之一示範實施例，用於控制與一平移控制設定相關聯之一雙耳時間延遲的方法的一流程圖。