TWI760833B - 用於進行音訊透通的音訊處理方法與相關裝置 - Google Patents
用於進行音訊透通的音訊處理方法與相關裝置 Download PDFInfo
- Publication number
- TWI760833B TWI760833B TW109129899A TW109129899A TWI760833B TW I760833 B TWI760833 B TW I760833B TW 109129899 A TW109129899 A TW 109129899A TW 109129899 A TW109129899 A TW 109129899A TW I760833 B TWI760833 B TW I760833B
- Authority
- TW
- Taiwan
- Prior art keywords
- time
- domain
- filter coefficients
- filter
- frequency
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 230000005236 sound signal Effects 0.000 claims abstract description 55
- 230000009467 reduction Effects 0.000 claims abstract description 42
- 238000001914 filtration Methods 0.000 claims abstract description 4
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
一種音訊處理方法,包含:將一時域音訊訊號轉換成一頻域音訊訊號;根據該頻域音訊訊號決定一降噪增益;根據該降噪增益,從複數組預設時域濾波器係數中選擇出至少一組時域濾波器係數;根據所選擇之該至少一組時域濾波器係數設定一時域濾波器,並且使用該時域濾波器對該時域音訊訊號進行濾波。
Description
本發明係關於音訊裝置,特指一種用於耳機系統中,實現低延遲之音訊透通技術的音訊處理方法與相關裝置。
入耳式耳機或是封閉式耳罩耳機系統,通常具有一定程度的隔音效果。如果希望讓使用者在使用這類型耳機聆聽音樂的同時,還能聽到外部環境的聲響,通常會透過麥克風來接收外界聲音,並且由耳機的揚聲單體撥放出麥克風所收到的環境聲響,而這種技術被稱作音訊透通(Audio Pass-Through,APT)。
音訊透通技術大抵追求自然的聽感。在保留環境聲響的同時,也希望能去除環境聲響中的噪音,如:冷氣機運作聲,風切聲,或是麥克風底噪聲等。然而,在降低噪音的過程,由於涉及了一些數位類比轉換、時域頻域轉換以及訊號處理的流程,因此會造成一定程度的延遲。而在音訊透通處理的過程中,使用者所能聽到的環境聲響,一部分來自於從外部環境穿透耳機隔音層的聲波,而一部分則來自於耳機的揚聲單體所播放的,透過降噪處理的麥克風錄音。因此,若降噪處理的延遲太高,會導致上述兩部分的聲音明顯不同步,讓使用者感受到回音。
請參考第1圖,該圖繪示習知技術中用於實現音訊透通技術的音訊處
理裝置架構。如圖所示,拾音裝置(如:麥克風)10所錄製的類比音訊訊號先被類比至數位轉換器11轉換成時域數位音訊訊號x[t]。之後,透過傅立葉轉換單元12,將時域數位音訊訊號x[t]轉換成頻域音訊訊號X[f,t]。並且,透過噪音基底(noise floor)估計單元13以及降噪增益計算單元14,基於頻域音訊訊號X[f,t]產生對應的降噪增益G[f,t]。降噪處理單元15根據降噪增益G[f,t],對頻域音訊訊號X[f,t]進行降噪處理,從而得到得降噪後的頻域音訊訊號Y[f,t]。透過傅立葉逆轉換單元16,將頻域音訊訊號Y[f,t]轉換回時域,得到時域音訊訊號y[t],接著透過加總單元17,與使用者所欲聆聽的音訊訊號z[t](如:音樂、語音等)進行結合,最後透過數位至類比轉換器18,轉換成類比音訊訊號,從而驅動揚聲單體,將電子訊號轉換成聲波,供使用者聆聽。
在這種架構中,假設類比至數位轉換器11的取樣頻率是fs,而傅立葉轉換單元12的尺寸為是N,則處理後的訊號相對於外部環境的原始聲響,至少會有N/fs的延遲。以常見的N=128、fs=16KHz的情形來說,將會有至少8ms的延遲,而這種程度的延遲明顯會帶給使用者不好的感受。
為了解決以上的問題,本發明之目的在提出一種用於實現音訊透通技術的音訊處理方法與裝置。在本發明所提出的音訊處理架構中,主要透過時域濾波器在時域進行降噪處理,相對習知架構來說,可以有效地減少時域與頻域間轉換所造成的延遲。再者,本發明在頻域進行噪音估計與分析後,便透過預存的時域濾波器係數來決定具體的時域濾波器設置。因此,避免使用頻域濾波器係數,從而導致頻域與時域之間轉換可能會造成的潛在延遲。總結來說,本發明的音訊處理方法與裝置,可以達到低延遲且降噪效果良好的音訊透通效
果。
本發明之一實施例提供一種音訊處理方法,該方法包含:將一時域音訊訊號轉換成一頻域音訊訊號;根據該頻域音訊訊號決定一降噪增益;根據該降噪增益,從複數組預設時域濾波器係數中選擇出至少一組時域濾波器係數;根據所選擇之該至少一組時域濾波器係數設定一時域濾波器,並且使用該時域濾波器對該時域音訊訊號進行濾波。
本發明之一實施例提供一種音訊處理裝置,該音訊處理裝置包含:一傅立葉轉換單元、一噪音分析裝置、一濾波器係數儲存單元、一濾波器係數選擇單元以及一時域濾波器。該傅立葉轉換單元用以將一時域音訊訊號轉換成一頻域音訊訊號。該噪音分析裝置耦接於該傅立葉轉換單元,並且用以根據該頻域音訊訊號決定一降噪增益。該濾波器係數儲存單元用以儲存複數組預設時域濾波器係數。該濾波器係數選擇單元耦接於該噪音分析裝置以及該濾波器係數儲存單元,用以根據該降噪增益,從該複數組預設時域濾波器係數中選擇出至少一組時域濾波器係數。該時域濾波器耦接於該濾波器係數選擇單元,受控於所選出之該至少一組時域濾波器係數,並且用以對該時域音訊訊號進行濾波。
10、105:拾音裝置
100:音訊處理裝置
11、110:類比至數位轉換器
12、16、120:傅立葉轉換單元
13、130:噪音基底估計單元
14、135:降噪增益計算單元
15:降噪處理單元
140:頻率決定單元
145:濾波器係數選擇單元
150:濾波器係數儲存單元
155:濾波器係數內插單元
160:時域濾波器
17、170:加總單元
18、180:數位至類比轉換器
19、190:揚聲單體
第1圖繪示習知音訊處理裝置的架構圖。
第2圖繪示本發明實施例之音訊處理裝置的架構圖。
第3圖繪示降噪增益的頻響曲線圖。
第4圖繪示本發明實施例之不同時域濾波器係數組所對應之濾波器頻響曲線圖。
第5圖繪示本發明實施例之音效處理方法的簡化流程圖。
在以下內文中,描述了許多具體細節以提供閱讀者對本發明實施例的透徹理解。然而,本領域的技術人士將能理解,如何在缺少一個或多個具體細節的情況下,或者利用其他方法或元件或材料等來實現本發明。在其他情況下,眾所皆知的結構、材料或操作不會被示出或詳細描述,從而避免模糊本發明的核心概念。
說明書中提到的「一實施例」意味著該實施例所描述的特定特徵、結構或特性可能被包含於本發明的至少一個實施例中。因此,本說明書中各處出現的「在一實施例中」不一定意味著同一個實施例。此外,前述的特定特徵、結構或特性可以以任何合適的形式在一個或多個實施例中結合。
請參考第2圖,該圖繪示了本發明實施例之音訊處理裝置的架構圖。如圖所示,本發明的音訊處理裝置100包含有:類比至數位轉換器(ADC)110、傅立葉轉換單元120、噪音基底估計單元130、增益計算單元135、頻率決定單元140、濾波器係數選擇單元145、濾波器係數儲存單元150、時域濾波器160、加總單元170以及數位至類比轉換器(DAC)180。
類比至數位轉換器110用以將一外部拾音裝置10(如:麥克風)基於一外部環境聲響所產生的類比音訊訊號,轉換成數位的時域音訊訊號x[t]。傅立葉轉換單元120則用以將時域音訊訊號x[t]轉換成頻域音訊訊號X[f,t]。在一實施例中,傅立葉轉換單元120透過進行短時距傅立葉轉換(Short-Time Fourier
Transform,STFT)來產生頻域音訊訊號X[f,t]。噪音基底估計單元130用以估計頻域音訊訊號X[f,t]的噪音基底,從而得到噪音基底Nf[f,t]。根據噪音基底Nf[f,t],增益計算單元135計算出消除當前噪音所需的降噪增益G[f,t]。其中,噪音基底估計單元130以及增益計算單元135可能根據各種適當的演算法來估計噪音基底Nf[f,t]以及降噪增益G[f,t]。
根據增益計算單元135所計算出的噪降增益G[f,t],頻率決定單元140將計算出一個或多個頻率參數,濾波器係數選擇單元145則據此進行濾波器係數選擇。首先,請參考第3圖,該圖代表時間點t0的降噪增益G[f,t],也就是噪降增益G[f,t0]。此時,頻率決定單元140根據噪降增益G[f,t0],找出最大頻率Fmax。最大頻率Fmax為降噪增益G[f,t0]大於一定臨界值時的頻率。以第3圖為例,當臨界值設在0.9時,那麼頻率決定單元140會判定最大頻率Fmax為3500Hz。再者,在一實施例中,最大頻率Fmax也可以透過對先前時間點所決定的最大頻率Fmax(t0-1),以及當前時間點所決定的最大頻率Fmax(t0),進行加權平均計算來調整:Fmax’(t0)=Fmax(t0-1)*K+Fmax(t0)*(1-K)
從而得到調整後的最大頻率Fmax’(t0),頻率決定單元140將以此作為最大頻率Fmax提供給濾波器係數選擇單元145。另外,在一實施例中,頻率決定單元140可能利用固定偏移量L來調整最大頻率Fmax(t0),或者是進一步調整已經調整過的最大頻率Fmax’(t0):Fmax”(t0)=Fmax’(t0)+L
或Fmax”(t0)=Fmax(t0)+L
從而得到調整後的的最大頻率Fmax”(t0),作為最大頻率Fmax,提供給濾波器係數選擇單元145。根據頻率決定單元140提供的頻率參數,濾波器係數選擇單元145從濾波器係數儲存單元150所預先儲存的多組時域濾波器係數中,選出一組適當的時域濾波器係數。其中,濾波器係數儲存單元150所預先儲存的多組濾波器係數為多種相關於濾波器特性的係數組合,涵蓋多種不同頻寬。其中,這些時域濾波器係數組所對應的截止頻率fc分布於0~fs/2之間(fs為系統的取樣頻率),例如fc=500Hz,1000Hz,...7500Hz。再者,濾波器係數選擇單元145會找到截止頻率fc最接近最大頻率Fmax的時域濾波器係數組,並且在稍後的過程中,將這組時域濾波器係數帶入至時域濾波器160。
請注意,在以上的範例中,僅僅提到了對於高頻噪音的相對應處理方式。然而,這並不是本發明的限制。在本發明的多個實施例中,可以透過對於頻率決定單元140的重新設計,以及濾波器係數儲存單元150所儲存的濾波器係數類型,從而實現對於高低頻噪音同時進行消除。舉例來說,濾波器係數儲存單元150所儲存的多組時域濾波器係數,可能包含具有低通特性的多組時域濾波器係數,其對應於截止頻率fc_low,以及具有高通特性的多組時域濾波器係數,其對應於截止頻率fc_high。
另一方面,頻率決定單元140由降噪增益G[f,t0]找出讓G[Fmax,t0]大於一定臨界值的的最大頻率Fmax(t0),以及讓G[Fmin,t0]大於一定臨界值的最小頻率Fmin(t0)。並且頻率決定單元140可以對Fmax(t0)以及Fmin(t0),透過前述的
加權平均或偏移量平移處理後,從而將調整後的最大頻率Fmax”(t0)或Fmax’(t0)以及調整後的最小頻率Fmin”(t0)或Fmin’(t0),輸出給濾波器係數選擇單元145。之後,濾波器係數選擇單元145從具有高通特性的多組時域濾波器係數中,找出其所對應的截止頻率fc_high,最接近Fmin”(t0)或Fmin’(t0)的一組時域濾波器係數組,並且從具有低通特性的多組時域濾波器係數中,找出其所對應的截止頻率fc_low,最接近Fmax”(t0)或Fmax’(t0)的一組時域濾波器係數組,從而得到可實現帶通濾波器的係數,並在後續的過程中,將其帶入於時域濾波器160。
在一實施例中,為了盡可能降低系統延遲,預存的時域濾波器係數以及時域濾波器160可實現最小相位濾波器(minimum phase filter),而在類型上可為高擱架濾波器(high-shelving filter)或者是低擱架濾波器(low-shelving filter)。另外,時域濾波器160可以是無限脈衝響應(Infinite Impulse Response)或有限脈衝響應(Finite Impulse Response)類型的濾波器。在一實施例中,每一組時域濾波器係數可能包含:截止頻率fc、取樣頻率fs、振幅A、品質因子Q。
再者,透過以下的轉換式:cos_w0=cos(2*pi*(fc/fs));sin_w0=sin(2*pi*(fc/fs));α=sin_w0/2*sqrt((A+1/A)*(1/Q-1)+2);a0=((A+1)-(A-1)*cos_w0+2*sqrt(A)*α);b0=(A*((A+1)+(A-1)*cos_w0+2*sqrt(A)*α))/a0;b1=(-2*A*((A-1)+(A+1)*cos_w0))/a0;b2=(A*((A+1)+(A-1)*cos_w0-2*sqrt(A)*α))/a0;
a1=2*((A-1)-(A+1)*cos_w0)/a0;a2=((A+1)-(A-1)*cos_w0-2*sqrt(A)*α)/a0;
可以得到時域濾波器160的轉換函數:H(z)=(b0+b1*z^-1+b2*z^-2)/(1+a1*z^-1+a2*z^-2)
第4圖繪示了當截止頻率fc=500:500:7500(Hz),以及取樣頻率fs=16000Hz、振幅A=0.5、品質因子Q=1等條件下所能實現的多種不同的濾波器頻率響應。請注意,以上所舉的時域濾波器係數:截止頻率fc、取樣頻率fs、振幅A、品質因子Q等,並非本發明所預存之濾波器係數組的限制。在本發明的不同實施例中,每一組預存的時域濾波器係數可能還包含更多不同類別的係數,從而更精細地改變與呈現時域濾波器160的特性。
時域濾波器160將根據濾波器係數選擇單元145所選出的一組時域濾波器係數,從時域上濾除時域音訊訊號x[t]中的外部環境噪音。由先前的說明可知,濾波器係數選擇單元145係參考降噪增益計算單元135所計算出的降噪增益G[f,t]來選擇時域濾波器係數。而當頻域音訊訊號X[f,t]變動時,則降噪增益G[f,t]也隨之改變。因此,濾波器係數選擇單元145會在訊號變動時,選擇不同的時域濾波器係數。而在一實施例中,為了避免切換不同的時域濾波器係數時,導致時域濾波器160的濾波器特性改變,從而造成的爆音,因此本發明的音訊處理裝置100還額外設置了一個濾波器係數內插單元155。透過濾波器係數內插單元155,可以讓時域濾波器160有更為緩和的特性轉換。其中,假定在當前時間點,濾波器係數選擇單元145選出了時域濾波器係數[B,A],而在先前時間點,濾波
器係數選擇單元145選出了時域濾波器係數[B’,A’],這意味著設置時域濾波器160的時域濾波器係數將由[B’,A’]更新為[B,A]。此時,濾波器係數內插單元155會根據時域濾波器係數[B’,A’]以及[B,A],內插出多組時域濾波器係數,來實現緩和的時域濾波器特性轉變。其中,假設濾波器係數內插單元155可以在N個時間點進行N次係數更新,且更新時間為Nk、其中k=0,1....,而在時間點N(k-1)的時域濾波器係數為[B’,A’],時間點Nk的時域濾波器係數為[B,A],那麼在時間點Nk+n,(n=0~N-1)時所使用的時域濾波器係數B_use[Nk+n]、A_use[Nk+n]可為:B_use[Nk+n]=B’+(B-B’)*(n/N) A_use[Nk+n]=A’+(A-A’)*(n/N)
請注意,以上所舉的時域濾波器係數[B,A]並非為本發明所預存之時域濾波器係數的限制,例如,本發明預存的時域濾波器係數可能包含有多於兩組係數需要透過內插處理,進行緩和的轉換。
透過上述的係數設置,時域濾波器160可將時域音訊訊號x[t]中的噪音濾除,從而將產生一濾波後時域音訊訊號y[t]。濾波後時域音訊訊號y[t]將透過加總電路170與使用者所欲聆聽的音訊訊號z[t](如:音樂、語音等)進行結合,最後透過數位至類比轉換器180,轉換成類比音訊訊號,從而驅動揚聲單體,將電子訊號轉換成聲波,供使用者聆聽。
第5圖繪示本發明實施例之音訊處理方法的簡化流程圖。該流程包含以下步驟:
步驟510:將一時域音訊訊號轉換成一頻域音訊訊號;步驟520:根據該頻域音訊訊號決定一降噪增益;步驟530:根據該降噪增益,從複數組預設時域濾波器係數中選擇出至少一組時域濾波器係數;以及步驟540:根據所選擇之該至少一組時域濾波器係數設定一時域濾波器,並使用該時域濾波器對該時域音訊訊號進行濾波。
由於上述步驟的原理以及具體細節已於先前關於時訊處理裝置100的實施例中詳細說明,故在此不做重複描述。應當注意的是,上述的流程可能還可以透過添加其他額外步驟,更好地實現本發明的音訊處理方法。
總結來說,習知技術由於涉及了多次的時域與頻域間轉換,因此導致有較長的延遲時間。而本發明則是利用了時域濾波器以及預存的時域濾波器係數,減少時域與頻域間的轉換。其中,本發明將時域音訊訊號轉換到頻域進行噪音基底估計以及降噪增益計算,繼而從預存的時域濾波器係數組中,選擇適當的組合來設置時域濾波器,並據此進行降噪處理。另外,為了避免濾波器係數改變時,帶來可能的爆音,本發明還採用了內插處理來讓濾波器特性可以緩和變化。如此一來,本發明透過降低延遲,避免回音的發生,從而保證了音訊透通技術的自然聽感,同時還提供了良好的降噪效果。
本發明之實施例可使用硬體、軟體、韌體以及其相關結合來完成。藉由適當之一指令執行系統,可使用儲存於一記憶體中之軟體或韌體來實作本發明的實施例。就硬體而言,則是可應用下列任一技術或其相關結合來完成:具有可根據資料信號執行邏輯功能之邏輯閘的一個別運算邏輯、具有合適的組
合邏輯閘之一特定應用積體電路(application specific integrated circuit,ASIC)、可程式閘陣列(programmable gate array,PGA)或一現場可程式閘陣列(field programmable gate array,FPGA)等。
說明書內的流程圖中的流程和方塊示出了基於本發明的各種實施例的系統、方法和電腦軟體產品所能實現的架構,功能和操作。在這方面,流程圖或功能方塊圖中的每個方塊可以代表程式碼的模組,區段或者是部分,其包括用於實現指定的邏輯功能的一個或多個可執行指令。另外,功能方塊圖以及/或流程圖中的每個方塊,以及方塊的組合,基本上可以由執行指定功能或動作的專用硬體系統來實現,或專用硬體和電腦程式指令的組合來實現。這些電腦程式指令還可以存儲在電腦可讀媒體中,該媒體可以使電腦或其他可編程數據處理裝置以特定方式工作,使得存儲在電腦可讀媒體中的指令,實現流程圖以及/或功能方塊圖中的方塊所指定的功能/動作。
以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
105:拾音裝置
100:音訊處理裝置
110:類比至數位轉換器
120:傅立葉轉換單元
130:噪音基底估計單元
135:降噪增益計算單元
140:頻率決定單元
145:濾波器係數選擇單元
150:濾波器係數儲存單元
155:濾波器係數內插單元
160:時域濾波器
170:加總單元
180:數位至類比轉換器
190:擴音裝置
Claims (8)
- 一種音訊處理方法,包含:將一時域音訊訊號轉換成一頻域音訊訊號;根據該頻域音訊訊號決定一降噪增益;根據該降噪增益,從複數組預設時域濾波器係數中選擇出至少一組時域濾波器係數,包含:根據該降噪增益大於一預定臨界值時對應的頻率,決定一最大頻率;以及根據該最大頻率,從該複數組預設時域濾波器係數中選擇出該至少一組時域濾波器係數;以及根據所選擇之該至少一組時域濾波器係數設定一時域濾波器,並使用該時域濾波器對該時域音訊訊號進行濾波。
- 如請求項1所述之音訊處理方法,其中根據該頻域音訊訊號決定該降噪增益的步驟包含:估計該頻域音訊訊號之一噪音基底;以及根據該噪音基底計算出該降噪增益。
- 如請求項1所述之音訊處理方法,其中將該時域音訊訊號轉換成該頻域音訊訊號的步驟包含:對該時域音訊訊號進行一短時距傅立葉轉換(short-time Fourier transform,STFT),從而得到該頻域音訊訊號。
- 如請求項1所述之音訊處理方法,其中根據該最大頻率,選擇出該至少一組時域濾波器係數的步驟包含:根據該最大頻率進行一頻率平均運算以及/或一頻率平移運算,從而得到一調整後最大頻率;以及根據該調整後最大頻率,從該複數組預設時域濾波器係數中選擇出該至少一組時域濾波器係數。
- 如請求項1所述之音訊處理方法,另包含:根據一第一時間點以及一第二時間點分別從該複數組預設時域濾波器係數中所選擇出的一第一組濾波器係數與一第二組濾波器係數,內插出一組或多組第三組濾波器係數;以及在一時間間隔內,依序根據該第一組濾波器係數、該一組或多組第三組濾波器係數以及該第二組濾波器係數設置該時域濾波器。
- 如請求項1所述之音訊處理方法,其中該複數組預設時域濾波器係數可將該時域濾波器設置為一高擱架濾波器(high-shelving filter)、一低擱架濾波器(low-shelving filter)或者是一帶通濾波器(band pass filter)。
- 一種音訊處理裝置,包含:一傅立葉轉換單元,用以將一時域音訊訊號轉換成一頻域音訊訊號;一噪音分析裝置,耦接於該傅立葉轉換單元,用以根據該頻域音訊訊號決定一降噪增益;一濾波器係數儲存單元,用以儲存複數組預設時域濾波器係數;一濾波器係數選擇單元,耦接於該噪音分析裝置以及該濾波器係數儲存單 元,用以根據該降噪增益,從該複數組預設時域濾波器係數中選擇出至少一組時域濾波器係數;一頻率決定單元,用以根據該降噪增益大於一預定臨界值時對應的頻率,決定一最大頻率,其中該濾波器係數選擇單元根據該最大頻率,從該複數組預設時域濾波器係數中選擇出該至少一組時域濾波器係數;以及一時域濾波器,耦接於該根據濾波器係數選擇單元,受控於所選出之該至少一組時域濾波器係數,並用以對該時域音訊訊號進行濾波。
- 如請求項7所述之音訊處理裝置,另包含:一濾波器係數內插單元,耦接於該濾波器係數選擇單元,用以根據該濾波器係數選擇單元在一第一時間點以及一第二時間點分別從該複數組預設時域濾波器係數中所選擇出的一第一組濾波器係數與一第二組濾波器係數,內插出一組或多組第三組濾波器係數;其中,該時域濾波器在一時間間隔內,依序根據該第一組濾波器係數、該一組或多組第三組濾波器係數以及該第二組濾波器係數而設置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109129899A TWI760833B (zh) | 2020-09-01 | 2020-09-01 | 用於進行音訊透通的音訊處理方法與相關裝置 |
US17/164,794 US11636868B2 (en) | 2020-09-01 | 2021-02-01 | Audio processing method for performing audio pass-through and related apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109129899A TWI760833B (zh) | 2020-09-01 | 2020-09-01 | 用於進行音訊透通的音訊處理方法與相關裝置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202211621A TW202211621A (zh) | 2022-03-16 |
TWI760833B true TWI760833B (zh) | 2022-04-11 |
Family
ID=80357239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109129899A TWI760833B (zh) | 2020-09-01 | 2020-09-01 | 用於進行音訊透通的音訊處理方法與相關裝置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11636868B2 (zh) |
TW (1) | TWI760833B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155869A (zh) * | 2020-09-08 | 2022-03-08 | 瑞昱半导体股份有限公司 | 用于进行音频透通的音频处理方法与相关装置 |
CN115379356A (zh) * | 2022-09-23 | 2022-11-22 | 上海艾为电子技术股份有限公司 | 一种低延时降噪电路、方法及主动降噪耳机 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5416847A (en) * | 1993-02-12 | 1995-05-16 | The Walt Disney Company | Multi-band, digital audio noise filter |
US6098038A (en) * | 1996-09-27 | 2000-08-01 | Oregon Graduate Institute Of Science & Technology | Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates |
TWI346323B (en) * | 2007-11-09 | 2011-08-01 | Univ Nat Chiao Tung | Voice enhancer for hands-free devices |
EP2048659B1 (en) * | 2007-10-08 | 2011-08-17 | Harman Becker Automotive Systems GmbH | Gain and spectral shape adjustment in audio signal processing |
US20170070840A1 (en) * | 2011-11-11 | 2017-03-09 | Dolby Laboratories Licensing Corporation | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field |
US20180277139A1 (en) * | 2014-06-13 | 2018-09-27 | Retune DSP ApS | Multi-band noise reduction system and methodology for digital audio signals |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2886076B1 (fr) * | 2005-05-23 | 2007-10-19 | Anagram Technologies Sa | Procede et dispositif de conversion de frequence d'echantillonnage d'un signal numerique |
TW200705913A (en) * | 2005-05-27 | 2007-02-01 | Mediaphy Corp | Adaptive interpolator for channel estimation |
CN103339884B (zh) * | 2011-02-02 | 2016-04-20 | 日本电气株式会社 | 光接收机和光接收方法 |
EP2880655B8 (en) * | 2012-08-01 | 2016-12-14 | Dolby Laboratories Licensing Corporation | Percentile filtering of noise reduction gains |
EP2848007B1 (en) * | 2012-10-15 | 2021-03-17 | MH Acoustics, LLC | Noise-reducing directional microphone array |
TWI497301B (zh) * | 2013-02-07 | 2015-08-21 | Phison Electronics Corp | 訊號處理方法、連接器與記憶體儲存裝置 |
US10199070B2 (en) * | 2017-04-03 | 2019-02-05 | Adobe Inc. | Digital audio data user interface customization based on user expertise, content type, or testing |
US10313820B2 (en) * | 2017-07-11 | 2019-06-04 | Boomcloud 360, Inc. | Sub-band spatial audio enhancement |
US11217222B2 (en) * | 2019-07-19 | 2022-01-04 | Cirrus Logic, Inc. | Input signal-based frequency domain adaptive filter stability control |
-
2020
- 2020-09-01 TW TW109129899A patent/TWI760833B/zh active
-
2021
- 2021-02-01 US US17/164,794 patent/US11636868B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5416847A (en) * | 1993-02-12 | 1995-05-16 | The Walt Disney Company | Multi-band, digital audio noise filter |
US6098038A (en) * | 1996-09-27 | 2000-08-01 | Oregon Graduate Institute Of Science & Technology | Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates |
EP2048659B1 (en) * | 2007-10-08 | 2011-08-17 | Harman Becker Automotive Systems GmbH | Gain and spectral shape adjustment in audio signal processing |
TWI346323B (en) * | 2007-11-09 | 2011-08-01 | Univ Nat Chiao Tung | Voice enhancer for hands-free devices |
US20170070840A1 (en) * | 2011-11-11 | 2017-03-09 | Dolby Laboratories Licensing Corporation | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field |
US20180277139A1 (en) * | 2014-06-13 | 2018-09-27 | Retune DSP ApS | Multi-band noise reduction system and methodology for digital audio signals |
Also Published As
Publication number | Publication date |
---|---|
TW202211621A (zh) | 2022-03-16 |
US11636868B2 (en) | 2023-04-25 |
US20220068291A1 (en) | 2022-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI681387B (zh) | 聲學處理網路及用於即時聲學處理之方法 | |
US8554349B2 (en) | High-frequency interpolation device and high-frequency interpolation method | |
KR100312636B1 (ko) | 보상필터 | |
CN103634726B (zh) | 一种扬声器自动均衡方法 | |
JP2008197284A (ja) | フィルタ係数算出装置、フィルタ係数算出方法、制御プログラム、コンピュータ読み取り可能な記録媒体、および、音声信号処理装置 | |
US11189261B1 (en) | Hybrid active noise control system | |
KR20080041585A (ko) | 디지털 필터 회로, 디지털 필터 프로그램 및 노이즈 캔슬링시스템 | |
JP6351538B2 (ja) | ディジタル音響信号用の多帯域信号プロセッサ | |
TWI760833B (zh) | 用於進行音訊透通的音訊處理方法與相關裝置 | |
KR20090101209A (ko) | 디지털 신호 처리 시스템 및 방법 | |
JP4886881B2 (ja) | 音響補正装置、音響出力装置、及び音響補正方法 | |
US11107453B2 (en) | Anti-noise signal generator | |
JPH11298990A (ja) | オーディオ装置 | |
JP6127579B2 (ja) | 雑音除去装置、雑音除去方法、及び雑音除去プログラム | |
US12114137B2 (en) | Filters and filter chains | |
JP4368917B2 (ja) | 音響再生装置 | |
CN114155869A (zh) | 用于进行音频透通的音频处理方法与相关装置 | |
JP4176938B2 (ja) | 遅延時間設定方式 | |
JP2000099039A (ja) | 拡声音の明瞭度改善方法及び装置 | |
JPH07143600A (ja) | 音響クロストーク制御装置 | |
CN118474607A (zh) | 主动降噪方法、装置和主动降噪耳机 | |
CN118741370A (zh) | 一种主动降噪方法和主动降噪耳机 | |
JP3390654B2 (ja) | 音場制御装置 | |
JP4617668B2 (ja) | 音声信号処理装置及び音声信号再生システム | |
JP2001236077A (ja) | 遅延時間設定方式 |