TWI533718B - 雙耳時間延遲回復系統及方法 - Google Patents
雙耳時間延遲回復系統及方法 Download PDFInfo
- Publication number
- TWI533718B TWI533718B TW098128032A TW98128032A TWI533718B TW I533718 B TWI533718 B TW I533718B TW 098128032 A TW098128032 A TW 098128032A TW 98128032 A TW98128032 A TW 98128032A TW I533718 B TWI533718 B TW I533718B
- Authority
- TW
- Taiwan
- Prior art keywords
- time delay
- audio data
- binaural
- correction factor
- channels
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Description
本發明有關於用於處理音訊資料的系統,且更特別地有關於用於回復立體聲或其他多通道音訊資料中之雙耳時間延遲的一系統及方法。
當處理音訊資料以產生一音訊合成時,通常使用採用平移電位器的一混合器,或模擬一平移電位器之功能的其他系統或裝置來混合此音訊資料。該等平移電位器可用以將一單一輸入通道分配給二或更多個輸出通道(諸如一左及右立體聲輸出),以諸如模擬在相對於收聽者之最左與最右位置之間的一空間位置。然而,典型地,此等平移電位器不會增加常見於一現有性能中的一雙耳時間差。
根據本發明,基於音訊資料通道的相對振幅,而提供雙耳時間延遲回復的系統和方法,其會在二或更多個音訊資料通道之間增加一個對應於一經評估雙耳延遲的時間延遲。
根據本發明的一示範實施例,提供用於處理音訊資料的一裝置。該裝置包括一雙耳時間延遲修正因子單元,其用於接收多個音訊資料通道,且產生一雙耳時間延遲修正因子,諸如其中該等多個音訊資料通道包括不具有相關聯雙耳時間延遲的平移資料。一雙耳時間延遲修正因子插入單元以該雙耳時間延遲修正因子的函數來修改該等多個音訊資料通道,以諸如增加一經評估之雙耳時間延遲而改良音訊品質。
在該技藝中具有通常知識者將進一步理解的是本發明的優點及優越特徵,與其讀取圖式之後的詳細描述中所得到的其他重要層面。
第1圖是根據本發明之一示範實施例,雙耳時間修正之系統的一圖式;第2圖是一系統的一圖式,根據本發明之一示範實施例,用於檢測特定頻帶的左及右通道音訊資料中峰值的差;第3圖是根據本發明之一示範實施例,用於消除雙耳時間及位準差之系統的一圖式;第4圖是根據本發明之一示範實施例,用於處理音訊資料以引入一雙耳時間或位準差之方法的一圖式;第5圖是根據本發明之一示範實施例,雙耳時間延遲修正之系統的一圖式;第6圖是根據本發明之一示範實施例,用於控制與一平移控制設定相關聯之一雙耳時間延遲的方法的一流程圖。
在下面的描述中,相似的部分分別以相同的參照數字標示於說明書及圖式通篇中。為了清晰及簡明,該等圖式未按照比例繪製,且某些元件可以廣義或示意的形式予以顯示,且藉由工業設計而獲識別。
第1圖是根據本發明之一示範實施例之雙耳時間修正的一系統100的一圖式。系統100可實施於軟體、硬體,或軟體及硬體的一適當結合中,且可是操作於一數位信號處理平臺上的一或多個軟體系統。如本文所使用,“硬體”可包括分離元件、一積體電路、一特定應用積體電路、一現場可程式閘陣列的一結合,或其他適當的硬體。如本文所使用,“軟體”可包括一或多個物體、代理器、線程、代碼行、次程式、分離軟體應用、二或更多個代碼行,或操作於二或更多個軟體應用中或二或更多個處理器上的其他適當軟體結構,或其他適當軟體結構。在一示範實施例中,軟體可包括操作於一一般用途軟體應用中(諸如一作業系統)的一或多個代碼行或其他適當的軟體結構,及操作於一特定用途軟體應用中的一或多個代碼行或其他適當的軟體結構。
系統100包括分別接收一左及右通道音訊時間信號的低延遲濾波器組102及104。在一示範實施例中,低延遲濾波器組102及104可在一取樣頻率下接收一串音訊資料取樣,且可基於一預定數量的取樣來處理該經取樣的音訊資料。低延遲濾波器組102及104可用以在一時間期間內,為多個頻帶判定峰值振幅之間的一時間延遲。在一示範實施例中,頻帶的數目與巴克、等效矩形頻帶(ERB)或其他適當的音訊資料心理聲學帶的數目相關,使得低延遲濾波器組102及104之輸出的總數目等於每一輸入取樣之bark或ERB的數目。同樣地,超取樣可用以減小音訊人工因素產生的可能性,諸如透過使用多個濾波器,每一濾波器對應於每一頻帶之多個相對應子頻帶(從而產生每一相關聯頻帶的多個子頻帶),或以其他適當的方式。
通道延遲檢測器106接收來自低延遲濾波器組102及104的輸入,且對多個頻帶的每一頻帶判定一差值修正因子。在一示範實施例中,為了將一雙耳時間延遲插入可使用平移但不包含一相關聯時間延遲的一信號中,通道延遲檢測器106可產生一定量的相位差,使增加至頻域信號中,以產生諸如在一左與右通道之間的一時間差。在一示範實施例中,音訊資料可使用一平移電位器而予以混合,以使一輸入通道具有介於立體聲資料之最左及最右通道之間的一明顯空間位置,或是介於包括多於二個通道中的其他適當方式。儘管此平移可用以模擬空間位置、運動或其他效應,但是與現有音訊資料相關聯的雙耳時間延遲不可藉由此平移予以重建。例如,當一聲源存在於收聽者的左側時,收聽者的左耳接收到聲源之音訊信號的時間與收聽者的右耳接收到音訊信號的時間之間將具有一時間延遲。同樣地,隨著該聲源從收聽者的左側移向收聽者的右側,在聲源直接地在收聽者前方時,相關聯之時間延遲將降低至零,且接著將相對於右耳而增加。使用一簡單的平移電位器來模擬空間位置,或運動而不能產生此等相關聯時間延遲,這些相關聯時間延遲可使用通道延遲檢測器106予以模型化且插入一立體聲或其他多通道音訊信號中。
相同地,諸如當在該左及右通道之間存在一時間延遲,但不存在相關聯的振幅差時,通道延遲檢測器106也可用以修正雙耳位準差。例如,音訊處理可致使與一經平移音訊信號相關聯的位準改變,使得已由左通道與右通道之間的相關聯時間延遲予以正確記錄的一音訊信號仍然產生左及右通道聲音的位準,該等左及右通道聲音的位準不會反應現有的音訊信號。通道延遲檢測器106也可或可選擇地用以使相關聯的位準修正因子模型化且插入一立體聲或其他多通道音訊信號中。
通道延遲檢測器106輸出多個為M的修正因子,其等用以將雙耳時間差或位準差插入多個音訊資料通道中。修正因子的數目可小於低延遲濾波器組102或104輸出的數目,其中超取樣用以消除感知帶內的變化。在一示範實施例中,當感知帶以三倍的頻帶來取樣時,N將等於三倍的M。
系統100包括延遲108及110,其等接收左及右時變音訊通道信號,且將該等信號延遲一定的量,該量相對應於穿過低延遲濾波器組102與104及通道延遲檢測器106的延遲減去由補零韓恩(Hann)視窗112與114及快速傅立葉轉換器116與118所產生的延遲。
補零Hann視窗112及114將該左及右通道的時變音訊信號修改一定的量,以產生一Hann視窗式經修改信號。補零Hann視窗112及114可用以防止產生於該等經處理信號的不連續性,該等不連續性可產生會致使經處理音訊資料產生音訊人工因素的相位偏移變化。也可或可選擇地使用用以防止不連續性之其他類型的Hann視窗或其他適當的處理。
快速傅立葉轉換器116及118將時域的左及右通道音訊資料轉變為頻域資料。在一示範實施例中,快速傅立葉轉換器116及118接收一預定數量之時域信號的時間取樣(其等藉由補零Hann視窗112及114予以修改,以增加取樣數目),且產生一相對應數量之時域信號的頻率成分。
相位偏移插入單元120從快速傅立葉轉換器116及118接收快速傅立葉轉換資料,且基於從通道延遲檢測器106所接收的修正因子來將一相位偏移插入該等信號中,諸如,透過對一個別頻率點或頻率點群組,修改該傅立葉轉換資料的實部分量及虛部分量,而不修改每一點或點之群組的相關聯振幅。在一示範實施例中,該相位偏移可與由通道延遲檢測器106所決定的電子通道之間的角度差相關,使得主通道推進二分之一角度差的相位,且輔助通道推遲二分之一角度差的相位。
反快速傅立葉轉換器122及124從相位偏移插入單元120接收相位經偏移的頻域信號,且對該等信號執行一反快速傅立葉轉換以產生一時變信號。接著,將該等左及右通道時變信號分別提供給交疊加總器126及128,該等交疊加總器126及128對信號執行一交疊加總操作,以說明藉由補零Hann視窗112及114的處理。交疊加總器126及128將一信號輸出至移位及加總暫存器130及132,該等移位及加總暫存器130及132輸出為的一經偏移的時間信號。
在操作中,為了插入一雙耳時間差,系統100允許包括平移而不具有相關聯雙耳時間差的一信號獲得補償。因而,系統100回復那些通常會產生於音訊信號中的雙耳時間差,且從而改良音訊品質。
第2圖是一系統200的一圖式,根據本發明之一示範實施例,用於對於特定的頻帶檢測左及右通道音訊資料之峰值的差值。系統200可用以對於音訊資料之分離頻帶檢測在左及右通道資料之間的峰值,且用以對於每一頻帶產生一修正因子。
系統200包括希爾伯特(Hilbert)波封單元202及204,其等接收一左及右時域信號,且對於該等信號的一預定頻帶產生一Hilbert波封。在一示範實施例中,相比於由系統100之快速傅立葉轉換器116及118所處理的時域取樣數量,Hilbert波封單元202可操作於一較少數量的時域取樣上,以允許系統200快速地產生修正因子,且避免另外由於在相關聯修正因子產生過程中將時間通道時域資料轉換至頻域而產生的額外延遲。
峰值檢測器206及208分別接收該等左及右通道Hilbert波封,且判定每一信號的一峰值振幅與該峰值振幅的一相關聯時間。接著,將該峰值及時間資料提供給那個判定該等相對應峰值振幅是否存在一時間差的振幅及時間差檢測器210。如果振幅及時間差檢測器210判定在該等峰值振幅時間之間沒有相對應的差值,那麼可使用雙耳時間差修正單元214透過將該等左及右通道峰值振幅的振幅值進行比較,來判定一修正因子角度T COR ,且將其插入頻域音訊資料中。在一示範實施例中,該修正因子角度T COR 可透過使角度atan2(左通道振幅、右通道振幅)減去45度來判定。同樣地,可使用其他適當的處理來判定修正因子角度。也可使用一適當的臨界值,諸如在該等振幅峰值之間具有一較短的時間差時,將其提供用於修正因子角度的產生。
在左及右通道資料的峰值之間存在時間差,但另外振幅相等時,可使用雙耳位準差修正單元212。在這一示範實施例中,該等振幅可藉由一修正因子L COR 予以調整,而使具有前導音訊峰值的通道調整為一較高值,且使具有拖曳音訊峰值的通道調整為一較低值。諸如,透過從滯後通道減去L COR ,透過增加0.5*L COR 到前導通道且從滯後通道中減去0.5*L COR ,或以其他適當的方式。也可將一臨界值用於雙耳位準差修正單元212中,諸如以識別一臨界時間差值和一臨界位準差值。當振幅高於此臨界時間差值時,位準修正會被使用;且當振幅低於此臨界位準差值時,位準修正不會被使用。
在操作中,系統200可用以產生左及右信號的時間及位準差修正因子,以諸如對具有左或右平移而不具有相關聯時間差的信號產生雙耳時間差修正因子,且在存在雙耳時間差但不存在相關聯平移振幅時產生信號的位準修正。
第3圖是一系統300的一圖式,根據本發明之一示範實施例,用於消除雙耳時間及位準差。系統300包括雙耳時間及位準差修正單元302至306,其等分別對於一不同的頻帶產生一雙耳時間及/或位準差修正因子。在一示範實施例中,該等頻帶可是bark、ERB或其他適當心理聲學頻帶的部分,使得該系統300可用以基於此頻帶的子分量,對於該心理聲學頻帶產生一單一修正因子。
時序消除單元308至312用以在分別來自雙耳時間或位準差修正單元302至306的輸出上執行時序消除。在一示範實施例中,時序消除單元308至312可從雙耳時間及位準差修正單元302至306接收一序列的輸出,且可儲存一預定數量的取樣的序列,用以諸如允許平均或以其他方式消除在連續取樣之間的變化。
頻帶消除單元314從雙耳時間或位準差修正單元302至306接收每一個的雙耳時間或位準差修正因子,且執行消除該等雙耳時間或位準差修正因子。在一示範實施例中,在將一bark或ERB頻帶分為三部分時,頻帶消除單元314可平均相關聯之頻帶的三個頻率修正因子,可判定一加權平均,可使用經消除時序的因子,或可執行其他適當的消除處理。頻帶消除單元314對於每一頻帶產生一單一相位修正因子。
在操作中,系統300對雙耳時間或位準差修正因子的一時間、頻率、時間及頻率,或其他適當的基底執行消除,該等雙耳時間或位準差修正因子是透過分析左及右通道音訊資料而產生,用以檢測不具有相關聯位準或時間差的平移設定。系統300從而透過確保在該等雙耳時間或位準差修正因子之間的改變不會遭到快速地改變,而幫助避免音訊人工因素的產生。
第4圖是一方法400的一圖式,根據本發明之一示範實施例,用於處理音訊資料以引入一雙耳時間或位準差。方法400開始於402,其會判定左及右振幅波封。在一示範實施例中,可使用一Hilbert波封檢測器或其他適當的系統來對一頻帶判定峰值振幅、與該峰值相關聯的時間及其他適當的資料。該方法接著進入404。
在404處,檢測在振幅波封中的峰值,還檢測該等峰值的相關聯時間。在一示範實施例中,可使用諸如一振幅檢測器的一簡單峰值檢測器來檢測峰值發生時相關聯的時間間隔。該方法進入406。
在406處,判定在左及右通道資料的峰值之間是否具有一時間差。在一示範實施例中,一時間差可包括一相關聯緩衝,使得如果峰值之間的時間小於一預定量,則判定不存在一時間差。如果判定確實存在一時間差,而使得不需要雙耳時間延遲回復,則該方法進入408,其會判定在二信號的振幅之間是否存在一位準差。如果判定存在一位準差,則該方法進入410。否則,該方法進入412,其會修正在左及右通道音訊資料之間的位準。在一示範實施例中,一前導通道振幅可不遭改變地予以保留,然而一滯後通道振幅可藉由與該等前導及滯後通道之間的差值相關的一因子(或可使用其他適當的處理)而降低。
如果判定在左及右通道振幅峰值之間不存在時間差,則該方法進入414,其會將位準差轉換為一相位修正角度。在一示範實施例中,該相位修正角度可由atan2(左通道振幅、右通道振幅)減去45度,或可使用其他適當的關係而予以判定。該方法接著進入416,其會將相位差分配給左及右通道。在一示範實施例中,可透過均等地分離該相位差來執行該分配,以將該等通道推進及推遲相同的量。同樣地,可使用適當的加權差,或可使用其他適當的處理。該方法接著進入418。
在418處,消除在左及右通道相位修正角度之間的差值。在一示範實施例中,該差值可隨著時間的推移而消除,基於相鄰通道的相位修正角度或以其他適當的方式予以消除。該方法接著進入420。
在420處,將差值修正因子用於一音訊信號中。在一示範實施例中,可使用一習知方法,諸如透過增加或減去頻域中一相關聯相位偏移而增加或減去頻域中一時間信號的時間差,來將相對應於一時間差的一相位差增加於頻域中。同樣地,可使用其他適當的處理。
在操作中,方法400允許一雙耳相位或振幅修正因子的判定,且用於多個音訊資料通道中。雖然已顯示了二個示範通道,但是也可適當地處理音訊資料的附加通道,以諸如將一雙耳相位或振幅修正因子增加於一5.1聲音系統、一7.1聲音系統或其他適當聲音系統的音訊資料中。
第5圖是一系統500的一圖式,根據本發明之一示範實施例,用以修正雙耳時間延遲。系統500允許雙耳時間延遲在混合之前獲得補償,以產生能更正確地反映與在相關聯實體位置處所產生之聲源相關聯的雙耳時間延遲的平移控制輸出。
系統500包括左通道可變延遲502、右通道可變延遲504及平移控制506,其等之每一個均可實施於硬體、軟體,或硬體及軟體的一適當結合中,且可是操作於一數位信號處理平臺上的一個或多個軟體系統。平移控制506允許使用者選擇一平移設定,用以將一時變音訊資料輸入分配給一左通道信號及一右通道信號。在一示範實施例中,平移控制506可包括多個時間延遲值,每一時間延遲值相關於一虛擬左位置與虛擬右位置之間的多個相關聯位置設定的其中一個。在這一示範實施例中,由於完全左、中間或完全右位置等的這些設定不需要延遲,所以,平移控制506可去能那個選定這些設定的可變延遲控制。對於平移控制506在完全左、中間或完全右位置之間的設定,可產生一延遲值,該延遲值相對應於位於一相關聯位置處的一聲源可能所產生的一雙耳時間延遲。
平移控制506也可包括允許使用者選擇主動平移的一主動平移特徵,諸如使用者打算從左平移至右,或從右平移至左。在這一示範實施例中,對於一完全左或完全右平移控制506設定可提供一時間延遲,以允許使用者在該平移控制506設定從完全左或完全右設定中移除時,平移該音訊輸入而不產生音訊人工因素,正如另外該時間延遲將從對於該完全左或完全右設定的一零值延遲,跳轉至相鄰於該完全左或完全右設定之平移控制506設定的最大延遲值。
左通道可變延遲502及右通道可變延遲504可使用系統100之雙耳時間延遲修正因子插入單元,或以其他適當的方式予以實施。
在操作中,當一音訊通道在二輸出通道(諸如一左通道及一右通道或其他適當的通道)之間平移時,系統500允許增加雙耳時間延遲。對於不需要一時間延遲的設定,系統500可去能該時間延遲。
第6圖是一方法600的一流程圖,根據本發明之一示範實施例,用於控制與一平移控制設定相關聯之一雙耳時間延遲。方法600開始於602,其會接收諸如對於一使用者選定通道的時域音訊通道資料。該方法接著進入604,其會檢測一平移控制設定。該平移控制可是一電位器、一虛擬平移控制或其他適當的控制。該方法接著進入606。
在606處,判定是否需要一平移延遲設定。在一示範實施例中,對於諸如一完全左、完全右或中間位置的預定平移控制位置,可去能該平移延遲。在另一示範實施例中,諸如在使用者選定一平移控制設定而允許使用者主動地在一完全左與一完全右位置之間平移時,對於完全左或完全右位置可產生平移延遲,以諸如當該平移控制從該完全右或完全左位置移除時,避免時間延遲產生過程的不連續性。如果判定不需要平移控制,則該方法進入612,否則該方法進入608。
在608處,基於該平移控制設定,計算延遲的量。在一示範實施例中,當平移控制在完全左或完全右位置中,諸如選定主動平移時,可產生一最大時間延遲。同樣地,在選定一靜態平移設定時,因為相反通道沒有產生相關聯的信號,所以一完全左或完全右設定不需要時間延遲。對於在完全右與完全左位置設定之間的平移控制設定,需計算相對應於在一中間位置處之時間延遲的一時間延遲,其中該時間延遲隨著平移控制位置接近於一中心位置而降低。該方法接著進入610。
在610處,將該經計算延遲用於一或多個可變延遲中。在一示範實施例中,可將該延遲增加至該等左或右通道之一中,或可使用其他適當的延遲設定。在另一示範實施例中,可使用系統100之雙耳時間延遲修正因子插入單元或以其他適當的方式,來增加該延遲。該方法接著進入612。
在612處,諸如透過判定附加資料取樣是否存在於一資料緩衝區中或以其他適當的方式存在,而來判定附加的音訊通道資料是否需要處理。如果需要附加資料處理,該方法返回602,否則該方法進入614且終止。
在操作中,方法600允許一雙耳時間延遲基於一平移控制設定而產生。方法600允許藉由一平移控制的使用,來模擬出聲音位置,且相較於在一左及右通道之間的簡單平移,會更接近於一真實聲源的位置,而不需時間修正。
雖然本發明之一系統及方法的示範實施例已在本文中予以詳細地描述,但是在該技藝中具有通常知識者將認識到的是,可對該等系統及方法作出各種替代及修改,而不背離附加申請專利範圍的範圍及精神。
100...系統
102、104...低延遲濾波器組
106...通道延遲檢測器
108、110...延遲
112、114...補零Hann視窗
116、118...快速傅立葉轉換器
120...相位偏移插入單元
122、124...反快速傅立葉轉換器
126、128...交疊加總器
130、132...移位及加總暫存器
200...系統
202、204...希爾伯特(Hilbert)波封單元
206、208...峰值檢測器
210...振幅及時間差檢測器
212、214...雙耳時間差修正單元
300...系統
302~306...雙耳時間或位準差修正單元
308~312...時序消除單元
314...頻帶消除單元
400...方法
402~420...步驟
500...系統
502...左通道可變延遲
504...右通道可變延遲
506...平移控制
600...方法
602~614...步驟
T COR ...修正因子角度
L COR ...修正因子
第1圖是根據本發明之一示範實施例,雙耳時間修正之系統的一圖式;
第2圖是一系統的一圖式,根據本發明之一示範實施例,用於檢測特定頻帶的左及右通道音訊資料中峰值的差;
第3圖是根據本發明之一示範實施例,用於消除雙耳時間及位準差之系統的一圖式;
第4圖是根據本發明之一示範實施例,用於處理音訊資料以引入一雙耳時間或位準差之方法的一圖式;
第5圖是根據本發明之一示範實施例,雙耳時間延遲修正之系統的一圖式;
第6圖是根據本發明之一示範實施例,用於控制與一平移控制設定相關聯之一雙耳時間延遲的方法的一流程圖。
100...系統
102、104...低延遲濾波器組
106...通道延遲檢測器
108、110...延遲
112、114...補零Hann視窗
116、118...快速傅立葉轉換器
120...相位偏移插入單元
122、124...反快速傅立葉轉換器
126、128...交疊加總器
130、132...移位及加總暫存器
Claims (19)
- 一種用以處理音訊資料的裝置,包含:一雙耳時間延遲修正因子單元,用以:判定多個音訊資料聲道之各者的一峰值振幅;檢測與該等多個聲道之該等峰值振幅相關聯之一延遲;及若該檢測出的延遲小於一臨界值,則產生一雙耳時間延遲修正因子;以及一雙耳時間延遲修正因子插入單元,其用於作為該雙耳時間延遲修正因子的一函數來修正該等多個音訊資料聲道,其特徵在於:該雙耳時間延遲修正因子係用來基於該等音訊資料聲道之相對振幅插入一雙耳時間延遲至該等多個音訊資料聲道。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子單元包含一低延遲濾波器組,其用於接收一音訊資料聲道,且對於一預定頻帶,作為時間的一函數來產生一振幅波封。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子單元包含一峰值檢測器,其用於接收一音訊資料聲道,且對於一預定頻帶產生一峰值振幅值及相關聯時間。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延 遲修正因子單元包含一時間差檢測器,其用於對於一預定頻帶接收多個聲道中每一聲道的一峰值振幅值及相關聯時間,且產生雙耳差值修正資料。
- 如申請專利範圍第4項所述之裝置,其中該雙耳時間延遲修正因子單元包含一雙耳時間差修正單元,其用於接收該雙耳差值修正資料,且對該雙耳時間延遲修正因子插入單元產生一時間修正因子。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含一延遲單元,其用於將一音訊資料聲道延遲與該雙耳時間延遲修正因子單元之一延遲相關的一量。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含一韓恩窗段(Hann window)單元,其用於接收一音訊資料聲道,且將一Hann窗段應用於該音訊資料聲道。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含一相位偏移插入單元,其用於將一相位偏移插入多個頻域音訊聲道信號中。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含用於作為該雙耳時間延遲修正因子的函數來修正該等多個音訊資料聲道的構件。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含用於將一音訊資料聲道延遲與該雙耳時間延遲修正因子單元之一延遲相關的一量 的構件。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含用於接收一音訊資料聲道且將一Hann窗段應用於該音訊資料聲道的構件。
- 如申請專利範圍第1項所述之裝置,其中該雙耳時間延遲修正因子插入單元包含用於將一相位偏移插入多個頻域音訊聲道信號中的構件。
- 如申請專利範圍第1項所述之裝置,其中該裝置適於將該雙耳時間延遲插入包括不具有相關聯雙耳時間延遲之平移(panning)的多個音訊資料聲道。
- 一種用以處理音訊資料的方法,包含以下步驟:判定多個音訊資料聲道中每一音訊資料聲道的一峰值振幅;檢測與該等多個聲道中兩個聲道之該等峰值振幅相關聯的一延遲;以及當與該等兩個聲道之該等峰值振幅相關聯之該檢測出的延遲小於一臨界值,將一雙耳時間延遲插入該等兩個聲道之間,其特徵在於:待插入之該雙耳時間延遲係基於該等兩個聲道之該等相對峰值振幅。
- 如申請專利範圍第14項所述之方法,其中判定該等多個音訊資料聲道中每一音訊資料聲道的該峰值振幅包含以下步驟:對於一預定頻帶,判定該等多個音訊資料 聲道中每一音訊資料聲道的一振幅波封。
- 如申請專利範圍第14項所述之方法,其中判定該等多個音訊資料聲道中每一音訊資料聲道的該峰值振幅包含以下步驟:為該等多個音訊資料聲道中每一音訊資料聲道,以一希爾伯特(Hilbert)波封單元處理一預定頻帶。
- 如申請專利範圍第14項所述之方法,其中檢測與每一振幅波封之峰值相關聯的該延遲包含以下步驟:將與一聲道之一峰值振幅相關聯的一時間,相比於與一第二聲道之一峰值振幅相關聯的一時間。
- 如申請專利範圍第14項所述之方法,其中待插入的該延遲係透過判定atan2(peak1、peak2)減去45度而產生,其中atan2是一個會產生以角度為單位之輸出的二變數反正切函數,peak1是一第一峰值振幅的一值,且peak2是一第二峰值振幅的一值。
- 如申請專利範圍第14項所述之方法,其中將該雙耳時間延遲插入該等兩個聲道之間的步驟包含以下步驟:將該等兩個聲道從一時域轉換至一頻域;將待插入的該延遲轉換為一相位偏移值;將該相位偏移值的一第一部分增加到該頻域中之該等兩個聲道的一第一聲道;以及從該頻域中之該等兩個聲道的一第二聲道減去該相位偏移值的一第二部分。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/204,471 US8233629B2 (en) | 2008-09-04 | 2008-09-04 | Interaural time delay restoration system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201014372A TW201014372A (en) | 2010-04-01 |
TWI533718B true TWI533718B (zh) | 2016-05-11 |
Family
ID=41725480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098128032A TWI533718B (zh) | 2008-09-04 | 2009-08-20 | 雙耳時間延遲回復系統及方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8233629B2 (zh) |
EP (1) | EP2321977B1 (zh) |
JP (1) | JP5662318B2 (zh) |
KR (1) | KR101636592B1 (zh) |
CN (1) | CN102144405B (zh) |
HK (1) | HK1156171A1 (zh) |
TW (1) | TWI533718B (zh) |
WO (1) | WO2010027403A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8971551B2 (en) * | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
US8571232B2 (en) * | 2009-09-11 | 2013-10-29 | Barry Stephen Goldfarb | Apparatus and method for a complete audio signal |
WO2011029984A1 (en) * | 2009-09-11 | 2011-03-17 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
WO2011129655A2 (en) * | 2010-04-16 | 2011-10-20 | Jeong-Hun Seo | Method, apparatus, and program-containing medium for assessment of audio quality |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
CN103796150B (zh) * | 2012-10-30 | 2017-02-15 | 华为技术有限公司 | 音频信号的处理方法、装置及系统 |
JP6216553B2 (ja) * | 2013-06-27 | 2017-10-18 | クラリオン株式会社 | 伝搬遅延補正装置及び伝搬遅延補正方法 |
WO2015035093A1 (en) * | 2013-09-05 | 2015-03-12 | Daly George William | Systems and methods for acoustic processing of recorded sounds |
CN106999710B (zh) | 2014-12-03 | 2020-03-20 | Med-El电气医疗器械有限公司 | 基于测量的itd的ild的听力植入双侧匹配 |
CN108877815B (zh) * | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
TWI689708B (zh) * | 2018-12-24 | 2020-04-01 | 財團法人工業技術研究院 | 具監測功能的振動感測器及其振動訊號監測方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4890065A (en) | 1987-03-26 | 1989-12-26 | Howe Technologies Corporation | Relative time delay correction system utilizing window of zero correction |
US5136650A (en) * | 1991-01-09 | 1992-08-04 | Lexicon, Inc. | Sound reproduction |
JPH0522798A (ja) * | 1991-07-10 | 1993-01-29 | Toshiba Corp | 位相補正装置 |
JP2973764B2 (ja) * | 1992-04-03 | 1999-11-08 | ヤマハ株式会社 | 音像定位制御装置 |
US5652770A (en) * | 1992-09-21 | 1997-07-29 | Noise Cancellation Technologies, Inc. | Sampled-data filter with low delay |
JP2893563B2 (ja) * | 1992-12-11 | 1999-05-24 | 松下電器産業株式会社 | 音像定位係数算出装置 |
JP2900985B2 (ja) * | 1994-05-31 | 1999-06-02 | 日本ビクター株式会社 | ヘッドホン再生装置 |
JP3276528B2 (ja) * | 1994-08-24 | 2002-04-22 | シャープ株式会社 | 音像拡大装置 |
US5796844A (en) * | 1996-07-19 | 1998-08-18 | Lexicon | Multichannel active matrix sound reproduction with maximum lateral separation |
JPH10126898A (ja) * | 1996-10-22 | 1998-05-15 | Kawai Musical Instr Mfg Co Ltd | 音像定位装置及び音像定位方法 |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US7027601B1 (en) * | 1999-09-28 | 2006-04-11 | At&T Corp. | Perceptual speaker directivity |
JP4463905B2 (ja) * | 1999-09-28 | 2010-05-19 | 隆行 荒井 | 音声処理方法、装置及び拡声システム |
JP4021124B2 (ja) * | 2000-05-30 | 2007-12-12 | 株式会社リコー | デジタル音響信号符号化装置、方法及び記録媒体 |
KR101021079B1 (ko) * | 2002-04-22 | 2011-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 다채널 오디오 표현 |
DE60311794T2 (de) * | 2002-04-22 | 2007-10-31 | Koninklijke Philips Electronics N.V. | Signalsynthese |
NO318401B1 (no) * | 2003-03-10 | 2005-03-14 | Tandberg Telecom As | Et audio-ekkokanselleringssystem og en fremgangsmate for a tilveiebringe et ekkodempet utgangssignal fra et ekkotillagt signal |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
CN101093661B (zh) * | 2006-06-23 | 2011-04-13 | 凌阳科技股份有限公司 | 一种音高跟踪和播放方法及其系统 |
WO2008039043A1 (en) * | 2006-09-29 | 2008-04-03 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
-
2008
- 2008-09-04 US US12/204,471 patent/US8233629B2/en not_active Expired - Fee Related
-
2009
- 2009-08-14 JP JP2011526031A patent/JP5662318B2/ja not_active Expired - Fee Related
- 2009-08-14 KR KR1020117007537A patent/KR101636592B1/ko active IP Right Grant
- 2009-08-14 WO PCT/US2009/004673 patent/WO2010027403A1/en active Application Filing
- 2009-08-14 EP EP09811797.1A patent/EP2321977B1/en not_active Not-in-force
- 2009-08-14 CN CN200980134440.3A patent/CN102144405B/zh not_active Expired - Fee Related
- 2009-08-20 TW TW098128032A patent/TWI533718B/zh not_active IP Right Cessation
-
2011
- 2011-10-03 HK HK11110410.8A patent/HK1156171A1/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
TW201014372A (en) | 2010-04-01 |
EP2321977B1 (en) | 2017-10-04 |
CN102144405B (zh) | 2014-12-31 |
US20100054482A1 (en) | 2010-03-04 |
HK1156171A1 (zh) | 2012-06-01 |
CN102144405A (zh) | 2011-08-03 |
EP2321977A1 (en) | 2011-05-18 |
WO2010027403A1 (en) | 2010-03-11 |
JP5662318B2 (ja) | 2015-01-28 |
WO2010027403A8 (en) | 2011-01-06 |
KR101636592B1 (ko) | 2016-07-05 |
KR20110063807A (ko) | 2011-06-14 |
JP2012502550A (ja) | 2012-01-26 |
US8233629B2 (en) | 2012-07-31 |
EP2321977A4 (en) | 2013-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI533718B (zh) | 雙耳時間延遲回復系統及方法 | |
JP7161564B2 (ja) | チャネル間時間差を推定する装置及び方法 | |
KR101210797B1 (ko) | 오디오 공간 환경 엔진 | |
US20200273442A1 (en) | Single-channel, binaural and multi-channel dereverberation | |
US7853022B2 (en) | Audio spatial environment engine | |
JP6508491B2 (ja) | マルチチャネルオーディオ信号内の音声成分を強調するための信号処理装置 | |
ES2659179T3 (es) | Ajuste por segmentos de señal de audio espacial a diferente configuración de altavoces de reproducción | |
DK2265041T3 (en) | Advanced processing based on a complex exponential modulated filter bank and adaptive time signaling methods | |
TWI451772B (zh) | 中央聲道音訊呈現技術 | |
CA2566992C (en) | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing | |
KR101090565B1 (ko) | 오디오 신호로부터 주위 신호를 생성하는 장치 및 방법, 오디오 신호로부터 멀티-채널 오디오 신호를 도출하는 장치및 방법, 그리고 컴퓨터 프로그램 | |
US8885834B2 (en) | Methods and devices for reproducing surround audio signals | |
Müller et al. | Auralization based on multi-perspective ambisonic room impulse responses | |
US20130070927A1 (en) | System and method for sound processing | |
KR20220141925A (ko) | 다채널 오디오에 응답하여 적어도 하나의 피드백 지연 네트워크를 이용한 바이노럴 오디오의 생성 | |
CN106057220B (zh) | 一种音频信号的高频扩展方法和音频播放器 | |
Arend et al. | Assessing spherical harmonics interpolation of time-aligned head-related transfer functions | |
WO2007095298A2 (en) | Fading compensation of frequency-modulated transmission signals for spatial audio | |
US9913036B2 (en) | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels | |
CN113273225B (zh) | 音频处理 | |
LU100981B1 (en) | Wavefield processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |