TWI657435B

TWI657435B - 音訊處理裝置及方法

Info

Publication number: TWI657435B
Application number: TW107101184A
Authority: TW
Inventors: 巴凱艾塔; Barkai Ittai
Original assignee: 新唐科技股份有限公司; Nuvoton Technology Corporation
Priority date: 2017-09-25
Filing date: 2018-01-12
Publication date: 2019-04-21
Also published as: CN109561372B; US10491179B2; KR20190035460A; US20190097595A1; JP2019062525A; KR102122638B1; JP6698125B2; TW201916006A; CN109561372A

Abstract

一種用於音訊處理的方法，包含：經由相應的複數個音訊聲道接收平行傳送的複數個電子訊號。將相應的複數個權重分配給複數個電子訊號，其中至少兩個權重彼此不同。計算瞬時增益以施加於複數個電子訊號。瞬時增益取決於(i)複數個電子訊號的瞬時振幅，以及(ii)分配給複數個電子訊號的權重。瞬時增益被施加到複數個電子訊號，並且複數個電子訊號經由相應的複數個音訊聲道傳送。

Description

音訊處理裝置及方法

本發明一般涉及音訊處理，特別涉及動態範圍處理的方法和系統。

各種音訊訊號處理技術涉及控制音訊訊號的動態範圍。這種處理可以包含例如動態範圍壓縮、限制、擴展或其他合適的操作。用於音訊動態範圍控制的各種方案在本領域中是已知的。

在此描述的本發明的實施例提供了一種用於音訊處理的方法，包含：接收將要經由相應的複數個音訊聲道平行傳送的複數個電子訊號。將相應的複數個權重分配給該複數個電子訊號，其中至少兩個該權重彼此不同。計算瞬時增益以施加於該複數個電子訊號。該瞬時增益取決於(i)該複數個電子訊號的瞬時振幅，以及(ii)分配給該複數個電子訊號的該複數個權重。該瞬時增益被施加到該複數個電子訊號，並且該複數個電子訊號經由相應的該複數個音訊聲道傳送。

在一些實施例中，分配權重包含：設定權重以補償至少兩個音訊聲道之間的訊號傳送功能的差異。在一些實施例中，計算和施加瞬時增益包含：將複數個電子訊號的動態範圍從第一動態範圍映射到相異的第二動態範圍。

在一個實施例中，計算瞬時增益包含：(i)將權重施加於電子訊號以產生加權訊號，(ii)計算加權訊號的相應絕對值，以及(iii)基於絕對值的瞬時最大值計算瞬時增益。

在揭露的實施例中，分配權重包含：設定權重以補償至少兩個音訊聲道中的相應的諧振頻率之間的差異。在另一個實施例中，分配權重包含：設定權重以補償至少兩個音訊聲道中的對應的非線性響應範圍(non-linear response)之間的差異。

根據本發明的實施例，另外提供了一種用於包含處理電路和複數個增益級的音訊處理裝置。處理電路配置為接收將要經由相應的複數個音訊聲道平行傳送的複數個電子訊號，將相應的複數個權重分配給複數個電子訊號，其中至少兩個權重彼此不同，並且計算施加於複數個電子訊號的瞬時增益，其中，瞬時增益取決於(i)複數個電子訊號的瞬時振幅，以及(ii)分配給複數個電子訊號的權重。複數個增益級配置為將瞬時增益施加於複數個電子訊號，並且經由相應的複數個音訊聲道來傳送複數個訊號。

附圖說明將下面結合附圖及本發明的實施例的詳細描述以更全面地理解本發明，其中：

20‧‧‧非對稱多聲道動態範圍壓縮器(DRC)

24A、24B‧‧‧增益級

28A‧‧‧左揚聲器

28B‧‧‧右揚聲器

32A、32B‧‧‧加權單元

36A、36B‧‧‧絕對值計算單元

40‧‧‧最大值計算單元

44‧‧‧增益轉換單元

48‧‧‧權重控制單元

S1(t)、S2(t)‧‧‧輸入訊號

第1圖是根據本發明實施例示意性地示出非對稱多聲道動態範圍壓縮器(DRC)的方塊圖。

這裡描述的本發明的實施例提供了用於控制多聲道音訊訊號的動態範圍的改良方法和系統。為了清楚起見，下面的描述最初指的是立體聲動態範圍壓縮器(Dynamic Range Compressor，DRC)。然後將所揭露的技術的原理推廣並應用於各種其他類型的音訊裝置和使用情況。

在一個例示性實施例中，立體聲DRC接收兩個電子訊號作為輸入，該兩個電子訊號包含立體聲音訊號的對應的左和右分量。這兩個電子訊號將要通過兩個相應的音訊聲道傳送，在本實施例中為左右揚聲器。DRC配置為壓縮兩個電子訊號的動態範圍，例如用於保護揚聲器，或者作為合適的聲音設計方案的一部分。

在本實施例中，DRC藉由以下方式來壓縮動態範圍：(i)估計兩個電子訊號的瞬時振幅，(ii)基於兩個瞬時振幅聯合計算瞬時增益，以及(iii)將瞬時增益施加於兩個電子訊號。應注意的是，DRC對兩個電子訊號施加相同的瞬時增益，即使它們的瞬時振幅可能相異。例如，DRC可以基於兩個瞬時振幅的最大值來設定瞬時增益。這種聯合增益設定避免了非期望的音訊假象(audio artefact)。

在實際情況下，傳輸訊號的音訊聲道在訊號傳送功能(例如增益、相位、延遲和/或頻譜響應(spectral response))方面彼此相異。如下面將詳細描述的，術語“音訊聲道(audio channel)”是指由電子訊號和/或聲音訊號經過的整個聲道。

在本發明的一些實施例中，DRC將不同的權重分配給兩個電子訊號，並且基於電子訊號的瞬時振幅和權重來計算瞬時增益。在一個例示實施例中，DRC(i)將兩個電子訊號按照相應的權重進行縮放(scale)，然後(ii)計算縮放後的電子訊號的絕對值，然後(iii)取絕對值的最大值，並且在最後依據這個最大值設定瞬時增益。

可以使用計算瞬時增益的各種其他方法，同時對兩個電子訊號施加不同的權重。權重可以是固定的或可調適的。透過適當地分配權重，DRC能夠壓縮立體聲音訊號的動態範圍，同時補償音訊聲道之間的訊號傳送功能的差異。這種補償導致聽眾感覺到音訊品質的改善。

在替代實施例中，所揭露的技術可以在其他類型的音訊裝置中實現，並且用於補償各種其他類型的音訊聲道之間的差異。一些非限制性實施例包含使用不同大小的左右揚聲器的立體聲系統，經由行動電話的揚聲器、耳機及助聽器等傳輸立體聲音訊號，在左/右聽力不相等時進行補償等。此外，所揭露的技術可以用於兩個以上的訊號和相應的音訊聲道，例如在四聲道或其他多聲道音訊系統中。

系統描述

第1圖是根據本發明實施例示意性地示出非對稱多聲道動態範圍壓縮器20(DRC)的方塊圖。下面的描述純粹以舉例的方式解釋DRC20的結構和操作。在一替代實施例中，使用例和應用方式在下面進一步討論。

在第1圖的實施例中，DRC20接收分別傳送代表立體聲音訊號的左側分量和右側分量的兩個電子訊號S1(t)和S2(t)作為輸入。DRC20包含兩個增益級24A和24B，這兩個增益級對相應的輸入訊號施加合適的增益。在本實施例中，增益級24A和24B包含可變增益放大器(variable-gain amplifier)。或者，增益級可以使用可變衰減器(variable attenuators)來實施。DRC通常包含通常具有固定增益的附加增益級(圖中未示出)。

在增益級24A和24B的輸出處得到的電子訊號分別提供給左揚聲器28A和右揚聲器28B。揚聲器28A和28B係為將左右輸出訊號轉換成聲音訊號的聲波轉換器。聲音訊號通過空氣媒體傳播到達收聽者。

兩個輸入訊號S1(t)和S2(t)中的每一個都具有瞬時(instantaneous or momentary)振幅，其隨時間而變化，作為由訊號傳送的音訊的瞬時音量的函數。每個輸入訊號都有一定的動態範圍。動態範圍通常被定義為最大和最小絕對值訊號振幅之間的比率，並且可以以線性或對數(dB)的尺度來定義。

由於各種原因，有時期望能壓縮輸入訊號的動態範圍，即，使得輸出訊號具有比相應的輸入訊號更小的動態範圍。例如，動態範圍壓縮對於保護揚聲器28A和28B和/或適當的聲音設計是有用的。

另外，在許多實際情況下，傳輸訊號的音訊聲道在訊號傳送功能上彼此不同。在本申請的上下文和申請專利範圍中，術語“訊號傳送功能的差異(difference in transfer function)”是指在相關訊號帶寬上的增益(包含線性和/或非線性增益)、相位、延遲和/或頻譜響應的差異。

本文中的術語“差異”不一定意味著外加性差異(additive difference)，而是廣義地表明兩個訊號傳送功能不相同。音訊聲道之間的差異可以是加法的、乘法的或任何其他的。

在本專利申請的內容和權利要求書中，術語“音訊聲道(audio channel)”是指由電子訊號和/或由電子訊號產生的聲音訊號所經過的整個聲道。音訊聲道可以包含，例如處理電子訊號的電子電路(例如，在DRC之前、在DRC中或在DRC之後)，將電子訊號轉換成對應的聲音訊號的任何聲波轉換器(例如，揚聲器28)，經由傳播聲音訊號的物理媒體，可以將聲音訊號轉換回電子訊號(例如，用於記錄的麥克風)的任何聲波轉換器，甚至與聲音訊號有關的聽眾的聽力。

音訊聲道之間的訊號傳送功能的差異可能由音訊聲道的任何部件引起，也可能由幾個部件的組合引起。音訊聲道之間的訊號傳送功能的差異可能是由各種原因引起的，其中一些可能是故意的(例如，不同大小的揚聲器)，其中一些可能是無意的(例如，聽覺能力不相同、損害或者一個或複數個部件之使用年限)。音訊聲道之間的訊號傳送功能的差異可以是固定的，也可以是依時間而改變的。

在一些實施例中，DRC 20包含執行在此描述的動態範圍壓縮技術的處理電路。處理電路尤其考慮到不同音訊聲道之間的訊號傳送功能的差異。在第1圖的實施例中，處理電路包含加權單元32A和32B、絕對值計算單元(以下簡稱ABS單元)36A和36B，最大值計算單元(MAX單元)40、增益映射單元44和權重控制單元48。

在第1圖的例示實施例中，加權單元32A接收輸入訊號S1(t)並將其乘以表示為W1的權重。ABS單元36A計算加權後的輸入訊號的瞬時絕對值，即，|W1．S1(t)|。同時，加權單元32B接收輸入訊號S2(t)並將其乘以表示為W2的權重，W2通常與W1不同。兩個權重之間的差異(例如它們之間的比率)旨在補償由S1(t)和S2(t)所經過的兩個音訊聲道的訊號傳送功能之間的差異。ABS單元36B計算加權後的輸入訊號的瞬時絕對值，即，|W2．S2(t)|。

ABS單元36A和36B的輸出被提供給MAX單元40。MAX單元40連續輸出其最大的輸入，即，M(t)=Max{|W1．S1(t)|,|W2．S2(t)|}。M(t)是追蹤加權後的輸入訊號的絕對值的最大值的時變函數。

增益映射單元44連續映射M(t)成相應的增益值G(t)。該映射動作施加實際的動態範圍壓縮。映射單元44所施加的映射M(t)→G(t)可以包含何合適的映射。

考慮作為非限制性實施例的動態範圍壓縮方案，其(i)將輸入訊號的瞬時能量與預設閾值進行比較，以及(ii)如果瞬時能量高於閾值，則將輸入訊號壓縮一定比例，例如用dB表示。例如，在消費電子音訊裝置中，例如在電視機中，這種方案是有用的。在一個例示性實施例中，閾值被設定為-12dBFS(比輸入訊號的滿刻度等級(full-scale level)低12dB)。壓縮比可以設定為任何期望的值，例如2：1、4：1或10：1的比率。這個例子中的壓縮比通常應用於超過閾值的訊號部分。另外，任何其他合適的M(t)→G(t)映射也可以使用。

M(t)至G(t)的映射可以表示為一個分析函數M(t)並產生G(t)，以作為查找表、或以任何其他合適的方式。在一個例示實施例中，增益轉換單元44可用級聯(cascade)的線性到dB(linear-to-dB)轉換功能、對數動態範圍轉換功能、平滑濾波器(smoothing filter)功能和dB到線性(dB-to-linear)映射功能來實現。

由此帶來的增益G(t)是一個時變函數。DRC 20的處理電路連續地設定增益級的增益24A和24B至G(t)。從上面的描述可以看出，在對不同的輸入訊號給予不同的權重的同時，根據其音訊聲道間的訊號傳送功能差異來計算G(t)。如此，DRC20的動態範圍壓縮方案至少部分地補償音訊聲道之間的這種不平衡。

在一些實施例中，權重控制單元48指定權重W1和W2的期望值，並且設定加權單元32A和32B以施加這些權重。權重W1和W2是用於將各個輸入訊號S1(t)和S2(t)的瞬時振幅相乘(“縮放”)的數值。W1和W2可以是固定的，或者可以隨著時間可調適的改變。權重控制單元48通常估計(或提供估計的)S1(t)和S2(t)的音訊聲道之間的訊號傳送功能的差異，並且導出補償該差異的權重W1和W2的值。權重的設定可以是固定的，例如在通電時，或者可以是可調適的。在可調適的配置中，權重控制單元48可追蹤訊號傳送功能隨時間的差異，並更新權重W1和/或W2以連續補償該差異。

在一個非限制性實施例中，揚聲器28A具有諧振頻率f1，並且揚聲器28B具有相異的的諧振頻率f2。在這樣的實施例中，當輸入訊號S1(t)包含頻率在f1附近的實質能級(substantial energy level)時，權重控制單元48將W1設定為將防止由揚聲器28A的諧振而引起失真的值。類似地，當輸入訊號S2(t)包含頻率在f2附近的實質能級時，權重控制單元48將W2設定為避免失真的值。無論哪種情況，都可以防止諧振效應嚴重影響瞬時增益G(t)。

在另一個非限制性實施例中，考慮揚聲器28A和28B在從線性響應到非線性響應的轉變點中彼此不同的情況。揚聲器性能通常分為“小訊號(small-signal)”和“大訊號(large-signal)”響應。對於小訊號範圍內的訊號，可以將揚聲器響應建模(modeled)為線性響應(linear response)。對於較高能量的訊號，在大訊號範圍內，揚聲器響應不能以足夠的精度建模為線性響應。令Tls表示揚聲器在小訊號(線性)和大訊號(非線性)響應之間轉換的瞬時訊號能量等級。

令Tls(A)和Tls(B)分別表示揚聲器28A和28B的Tls。考慮一個TlsA<TlsB的例子。在這種情況下，揚聲器28A以較低的訊號等級轉換到其非線性範圍，揚聲器28B仍然在其線性範圍內。如果S1(t)>Tls(A)或S2(t)>Tls(B)，這種情況下的設計目標是降低兩個訊號(S1(t)和S2(t))的瞬時增益。此條件檢查每個輸入訊號的瞬時振幅與其相應的揚聲器的Tls，並且僅當任何揚聲器被預期轉換到其非線性範圍時才減小瞬時增益(施加到兩個訊號)。

在這樣的實施例中，當S1(t)>Tls(A)時，權重控制單元48將W1設定為將防止由揚聲器28A中的非線性而引起失真的值。類似地，當S2(t)>Tls(B)時，權重控制單元48將W2設定為將防止由揚聲器28B中的非線性而引起失真的值。在任何一種情況下，揚聲器的非線性都不會嚴重影響瞬時增益G(t)。

其他應用方式、使用範例和修改範例

第1圖中所示的DRC20的配置是純粹為了概念清楚而描繪的例示性配置。在替代實施例中，可以使用任何其他合適的配置。例如，DRC20可以基於輸入信訊號權重以任何其他合適的方式計算瞬時增益G(t)。在第1圖的例子中，透過將輸入訊號乘以相應的權重來對輸入訊號進行加權。或者，可以以任何其他方式將權重施加到輸入訊號，例如透過將其加到輸入訊號或使用任何其他合適的函數。

作為另一個例子，加權單元32A和32B可以分別設定在ABS單元36A和36B的輸出端，而不是輸入端。由於動態範圍壓縮通常不是線性操作，所以執行各種操作的順序是有意義的，而不僅僅是設計選擇。

在一些實施例中，ABS單元36A和36B中的每一個可以用計算加權後的輸入訊號的平方平均數(Root-Means-Square，RMS)的值的單元、或者在一段時間間隔內輸出加權輸入訊號的峰值的峰值檢測單元、或者鎖存(latch)於加權輸入信號的峰值直到復位的峰值保持單元取代。任何這樣的單元可能在加權後的輸入訊號和瞬時增益的施加(例如，預測限制(look-ahead limiting)或壓縮)之間引入某種程度的“預測”或延遲。

作為又一個實施例，DRC20可以包含多於兩個的聲道，例如處理攜帶四聲道音訊訊號的分量的四個相應的輸入訊號的四個聲道。在諸如實施例中，DRC通常對四個輸入訊號施加四個權重，其中至少兩個權重彼此不同。

作為例示性劃分(partitioning)，處理電路劃分成如第1圖所示的單元32A、32B、36A、36B、40、44和48。在替代實施例中，可以使用任何其他劃分。為了清楚起見，圖中省略了對理解所揭露的技術不是必要的處理電路和DRC20的元件。

在各種實施例中，可以使用，如獨立部件(discrete component)和/或在專用集成電路(Application-Specific Integrated Circuit，ASIC)或現場可編程閘陣列(Field-Programmable Gate Array，FPGA)中的任何合適的硬體或韌體來實施第1圖中所示的不同的DRC元件。可選地，DRC 20的一些元件可以用軟體或者使用軟體和硬體元件的組合來實施。

在一些實施例中，在通用可編程處理器(general-purpose programmable processor)(例如數位訊號處理器(Digital Signal Processor，DSP))中實施DRC20的一些或全部元件，此通用可編程處理器以軟體編程，以執行本文所述的功能。軟體可以例如藉由網路以電子形式下載到處理器，或者可以替代地或附加地將軟體提供和/或儲存在諸如磁性、光學或電子記憶體的非暫態有形媒體上。

以上描述主要涉及輸入訊號的動態範圍的壓縮。在替代實施例中，可以以類似的方式使用所揭露的技術來應用動態範圍的任何其它合適的修改，同時也補償音訊聲道之間的訊號傳送功能的差異。例如，所揭露的技術可以用於動態範圍的硬限制(hard-limiting)或軟限制(soft-limiting)，或者用於擴展動態範圍。作為另一個例子，所揭露的技術可以用於為動態範圍去噪(de-essing)(也稱為“除噪(desibilizing)”)。去噪是對動態範圍中的頻率選擇性(例如，濾波)操作的一個例子。另一例子中，所揭露的技術可以用於選訊(gating)動態範圍，即，如果輸入訊號低於閾值，則將輸出訊號設定為零。進一步可替代地，所揭露的技術可以用於對輸入訊號的動態範圍應用任何其他合適的操作。

以上描述主要涉及使用一對揚聲器來發出立體聲音訊訊號的應用。這個選擇純粹是為了概念的清晰。在替代實施例中，所揭露的技術可以與易於訊號傳送功能差異的各種其他類型的音訊聲道一起使用。

例如具有兩個耳機的助聽器，用戶的每個耳朵一個。在這樣的應用中，兩個音訊聲道可能在訊號傳送功能上不同，因為用戶的聽力能力可能有一邊較好。所揭露的技術可以用於這種助聽器中的動態範圍壓縮(或其它映射)，同時補償聽力的不平衡。

作為另一個例子，考慮行動通訊裝置(例如，行動電話)播放立體聲音訊號的應用。一個音訊聲道(例如左側)使用裝置的內部揚聲器作為聲波轉換器，另一個音訊聲道使用裝置的耳機作為換能器(transducer)。所揭露的技術可以用於這種裝置中的動態範圍壓縮(或其他映射)，同時補償揚聲器與耳機之間的訊號傳送功能差異。

進一步可選地，所揭露的技術可以用於具有不同訊號傳送功能的音訊聲道的任何其他合適的系統，應用或使用情況中。

儘管這裡描述的實施例主要針對用於兩個立體聲揚聲器的動態範圍處理的電子聲音性能不同的集成裝置，但是這裡描述的方法和系統還可以用於其他應用中，例如公告(Public Announcement，PA)系統、音樂會擴音器、助聽器等等。

因此將意識到，上述實施例是作為例示性實施例，並且本發明不限於上文已經特別示出和描述的內容。相反，本發明的範圍包含上文描述的各種特徵的組合和子組合，以及本領域技術人員在閱讀前述描述時將會想到的變化和修改，這些變化和修改未在現有技術中揭露。在本專利申請中透過引用併入的文件被認為是本申請的一部分，而在這些併入的文件中以與在本說明書中明確或隱含地作出的定義相衝突的方式來定義任何術語的範圍時，只應考慮本說明書中的定義。

Claims

一種音訊處理方法，包含：接收將要通過相應的複數個音訊聲道平行傳送的複數個電子訊號；分配相應的複數個權重至該複數個電子訊號，其中至少兩個該權重彼此不同；計算要施加到該複數個電子訊號的一瞬時增益，其中，該瞬時增益取決於(i)該複數個電子訊號的複數個瞬時振幅，以及(ii)分配給該複數個電子訊號的該複數個權重；以及將該瞬時增益施加於該複數個電子訊號，並經由相應的該複數個音訊聲道傳送該複數個電子訊號；其中計算該瞬時增益的步驟包含：(i)將該複數個權重施加於該複數個電子訊號以產生複數個加權訊號，(ii)計算與該複數個加權訊號相應的複數個絕對值，以及(iii)基於該複數個絕對值的一瞬時最大值計算該瞬時增益。
如申請專利範圍第1項所述之音訊處理方法，其中分配該複數個權重的步驟包含：設定該複數個權重以補償該複數個音訊聲道中的至少兩個該音訊聲道之間的訊號傳送功能的差異。
如申請專利範圍第1項所述之音訊處理方法，其中，計算並施加該瞬時增益的步驟包含：將該複數個電子訊號的一動態範圍從一第一動態範圍映射到相異的一第二動態範圍。
如申請專利範圍第1項所述之音訊處理方法，其中分配該複數個權重的步驟包含：設定該複數個權重以補償該複數個音訊聲道中的至少兩個音訊聲道中相應的複數個諧振頻率之間的差異。
如申請專利範圍第1項所述之音訊處理方法，其中分配該複數個權重的步驟包含：設定該複數個權重以補償該複數個音訊聲道中的至少兩個音訊聲道中相應的複數個非線性響應範圍之間的差異。
一種音訊處理裝置，包含：一處理電路，配置為：接收將要經由相應的複數個音訊聲道平行傳送的複數個電子訊號；分配相應的複數個權重至該複數個電子訊號，其中至少兩個該權重彼此不同；以及計算要施加於該複數個電子訊號的一瞬時增益，其中該瞬時增益取決於(i)該複數個電子訊號的複數個瞬時振幅，以及(ii)分配給該複數個電子訊號的該複數個權重；以及複數個增益級，配置為將該瞬時增益施加於該複數個電子訊號，並且經由相應的該複數個音訊聲道傳送該複數個電子訊號；其中該處理電路配置為透過以下方式來計算該瞬時增益：(i)將該複數個權重施加於該複數個電子訊號以產生複數個加權訊號，(ii)計算該複數個加權訊號相應的複數個絕對值，以及(iii)基於該複數個絕對值得一瞬時最大值來計算該瞬時增益。
如申請專利範圍第6項所述之音訊處理裝置，其中，該處理電路配置為設定該複數個權重以補償該複數個音訊聲道中的至少兩個該音訊聲道之間的訊號傳送功能的差異。
如申請專利範圍第6項所述之音訊處理裝置，其中，在計算和施加該瞬時增益時，該處理電路配置為將該複數個電子訊號的一動態範圍從一第一動態範圍映射到相異的一第二動態範圍。
如申請專利範圍第6項所述之音訊處理裝置，其中該處理電路配置為設定該複數個權重以補償該複數個音訊聲道中的至少兩個該音訊聲道中相應的複數個諧振頻率之間的差異。
如申請專利範圍第6項所述之音訊處理裝置，其中該處理電路配置為設定該複數個權重以補償該複數個音訊聲道中的至少兩個該音訊聲道中相應的複數個非線性響應範圍之間的差異。