TW201222533A - Sound source separator device, sound source separator method, and program - Google Patents

Sound source separator device, sound source separator method, and program Download PDF

Info

Publication number
TW201222533A
TW201222533A TW100130572A TW100130572A TW201222533A TW 201222533 A TW201222533 A TW 201222533A TW 100130572 A TW100130572 A TW 100130572A TW 100130572 A TW100130572 A TW 100130572A TW 201222533 A TW201222533 A TW 201222533A
Authority
TW
Taiwan
Prior art keywords
sound source
unit
noise
frequency
sound
Prior art date
Application number
TW100130572A
Other languages
English (en)
Inventor
Shinya Matsui
Yoji Ishikawa
Katsumasa Nagahama
Original Assignee
Asahi Chemical Ind
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Chemical Ind filed Critical Asahi Chemical Ind
Publication of TW201222533A publication Critical patent/TW201222533A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Description

201222533 六、發明說明: 【發明所屬之技術區域】 本發明係關於一種使用複數個麥克風,自混雜有自複數 個音源發出之複數個聲音信號或各種環境雜音等複數個音 響信號之信號中,將自作為目標之音源傳來之音源信號分 離之音源分離裝置、音源分離方法及程式。 【先前技術】 在各種環境下欲收錄特定的聲音信號等之情形下,由於 在周圍環境中存在有各種雜音源,因此利用麥克風僅收錄 作為目標音之信號較困難,需要一些雜音降低處理或是音 源分離處理。 尤其必須進行該等處理之例,可舉例如汽車環境。在汽 車環境下,由於行動電話的普及,在駕駛中使用行動電話 之通話通常使用在車内分離設置之麥克風,而使通話品質 顯著劣化。又,由於在汽車環境下在駕駛中進行聲音辨識 之情形亦是在同樣的情況下發話,因此成為聲音辨識性能 劣化之原因。由於當前聲音辨識技術之進步,對於對穩定 性雜訊之聲音辨識率劣化之問題,已可使所劣化之性能中 相當大之部分恢復《但,就現狀的聲音辨識技術難以應對 之處在於,複數個發話者同時發話時之辨識性能劣化之問 題。由於以當前的聲音辨識之技術辨識同時發話之二人的 此合聲音之技術較低,因此在使用聲音辨識裝置時,备產 生發話者以外的同乘者之發話受到限制,因而限制同乘者 的行動之狀況。 ·. t · 157757.doc 201222533 又’即使疋盯動電話機或是可與行動電話機連接而進行 免提通話之耳機’右在背景雜音環境下進行通話時,亦同 樣會產生通話品質之劣化。 作為解決如上述般之問題之方法,存在有具備複數個麥 克風之音源分離方法。例如,記载於專利文獻1之音源分 離裝置係進行使自相對於連結2個麥克風之直線的垂線為 對稱方向傳來之音源信號各自衰減之波束成形處理,並基 於針對波束成形器輸出所計算之功率譜資訊彼此之差值, 而指員取目標音源的頻譜·資訊。 藉由使用記載於專利文獻1之音源分離裝置,可實現定 向特性不受到麥克風元件的感度影響之性質,且不受麥克 風元件的感度之差異影響,而可自混合有自複數個音源發 出之音源信號之混合音中將來自目標音源之音源信號分 離。 [先前技術文獻] [專利文獻] [專利文獻1]專利第4225430號公報 [非專利文獻] [非專利文獻 1] Y_ Ephraim and D. Malah, 「Speech enhancement using minimum mean-square error short-time spectral amplitude estimator」,IEEE Trans Acoust·,
Speech, Signal Processing, ASSP-32, 6, pp. 1109-1121, Dec. 1984。
[非專利文獻2] S. Gustafsson, P. Jax, and P. Vary,「A 157757.doc 201222533 novel psychoacoustically motivated audio enhancement algorithm preserving background noise characteristics」 IEEE International Conference on Acoustics, Speech and
Signal Processing, ICASSP' 98, vol. 1, ppt. 397-400 vol. 1, 12-15 May 1998。 【發明内容】 [發明所欲解決之問題] 然而,在記載於專利文獻1之音源分離裝置中,在波束 成形處理後所算出之2個功率譜資訊的差值為特定臨限值 以上之情形下,將其差值辨識為目標音而直接輸出,另一 方面,在2個功率譜資訊的差值未達特定臨限值之情形 下,將其差值辨識為雜音’而將其頻帶之輸出設為〇。因 此’例如汽車的行走雜音般’在傳來方向未定在特定方向 之擴散性雜音存在之環境下,錢專利文獻i之音源分離 裝置動作’則㈣的頻帶大幅被削除,而會有擴散性雜音 不規則地被分配在音源分離結果中而成為雜訊樂音之情 形。另’由於「雜訊樂音」是指渡除後殘留的雜訊,且係 在時間軸上及頻率軸上孤立之成分,因此聽起來是不自然 且刺耳的聲音。 然而’在分離配置 又’在專利文獻1+,揭示有藉由將㈣、波處理放在波 束成形處理的前段’而降低擴散性.雜音、穩定性雜訊等, 亚防止音源分離後之雜訊樂音的產生 =風之情形下,或於行動電話或耳機等之外殼成形有麥 K情形下’輸人至雙方之麥克風之雜音的音量差或相 I57757.doc 201222533 位差會增大。i ^ ^ ’若將由一方之麥克風所求出之增益直 接應用在另一方爽 夕見風時,則會於每個帶域過於壓制目 才示音,或雜音殘留 的產生。 °其結果便難以充分防止雜訊樂音 的在純本發月係為解決如上述般之問題而完成者,其目 板、卩在不受麥克風配置之影響之下,可充分降 低雜§fl樂音的產生之立、塔、 式。 之g源分離裝置、音源分離方法及及程 [解決問題之技術手段] 為為述問題’本發明—態樣之音源分離裝置之特徵 :將來自目:昆合有自複數個音源發出之音源信號之混合音 目標音源之音源信號分離 成形處理部,其“ , 八備.第1皮束 匕含被輸入前述混合音之2個麥 風對之各自的輪出信號,在使用彼此不同之第 係數之頻率區域進行 之線段交又之平面為只, 以與連結前述2個麥克風 之區 *..、1,使自與包含前述目標音源的方向 之區域傳來之音源信號衰減;第2波束成形产 理部,其對於來白訢.+、Λ ± 矛及果成形處 ]林克風對之各自的輪出信號,乘以 則述被此不同之裳1 & 之第2㈣ 頻率區域處於複數共輟關係 之第2係數,將獲得之結果於頻率區域進行積和運算= 前述平面為界,使自#人&、+. α 矛運异以 之音源信號衰減,·功率計算门之&域傳來 刀手„t异部,其基於利用前 成形處理部所獲得之信號計算具有每個 之束 1頻譜資訊’再者’基於利用前述第2波束成形處= 157757.doc 201222533 得之信號計算具有每個頻率的功率值之第2頻譜資訊及 加權係數算出部,其因應前述第丨頻譜資訊與前述第2頻譜 資訊之每個頻率的功率值之差值,算出用以對於前述第\ 波束成形處理部所獲得之信號相乘之每個頻率的加權係 數;且基於利用前述第1波束成形處理部所獲得之信號、 與前述加權係數算出部算出之前述加權係數之乘算結果, 自前述混合音中將來自前述目標音源之音源信號分離。 又,本發明其他態樣之音源分離方法之特徵A:其係由 包含第1波束成形處理部、第2波束成形處理部、功率計算 部及加權係數算出部之音源分離裝置所執行者,且具備·" 第1步驟,其由前述第1波束成形處理部對於來自包含被輪 入混合有自複數個音源發出之音源信號之混合音之2個^ 克風之麥克風對之各自的輸出信號,在使用彼此不同之第 1係數之頻率區域進行積和運算,以與連結前“個麥克風 之線段交叉之平面為界’使自與包含目標音源的方向之區 域相反之區域傳來之音源信號衰減;第2步盆 i ^ 八田則迹 第2波束成形處理部對於來自前述麥克風對之各自的輪出 信號,乘以前述彼此不同之第i係數與在頻率區域處:複 數共輛關係之第2係數,將獲得之結果於頻率區域進行 和運算,以前述平面為界,使自包含前述目標音源的方向 之區域傳來之音源信號衰減;第3步驟,#由前述
算部基於利用前述第丨處理步驟所獲得之信號計算具有— 個頻率的功率值之第1頻譜資訊,再者,基於利用前述第母2 處理步驟所獲得之信號計算具有每個頻率的功率值之第2 157757.doc 201222533 頻譜資訊;及第4步驟,复 述第1頻譜資訊與前述第:述加權係數算出部因應前 差值,算出用以對於前述第了身訊之每個頻率的功率值之 個頻率的力,數;且基於利:所=信號相乘之每 號與在前述第4步驟中所算j用則边第1步驟所獲得之信 果,自前㈣合音Ml “之前述加權係數之乘算結 離。 . 別述目標音源之音源信號分 又,本發明其他態樣之立 具備以下步驟:第!處理步曰驟7程式之特徵為在電腦中 合有自複數個音源發出之音計、對於來自包含被輸入混 之麥克風針H ό 日'原彳5唬之混合音之2個麥克風 之麥見風對之各自的輸出信 數之頻率區域進行積和運曾錢用彼此不同之第1係 線段交又之平面為:二’以與連結前述2個麥克風之 相反之區域傳來之音源作號▲包/ W曰源的方向之區域 來自前、,ϋ It 。』农減,第2處理步驟,其對於 之第1#激盘r、之各自的輪出信號’乘以前述彼此不同 之第1係數與在頻率區域處 p ““ 吸數共輛關係之第2係數,將 獲仵之結果於頻率區域進 蚀入a 積和運算,以前述平面為界, 使自包3則述目標音源的方向 減;第3處理步驟,兑基於利用,域傳來之音源信號衰 信號計算具有“驟所獲得之 «. 千值之第1頻譜資訊,再者, 土於利用前述第2處理步驟所與 率的功率值之第2頻譜資ΓΓ7Γ 具有每個頻 第一 ° ,及第4處理步驟,其因應前述 值了訊與前述第2頻譜資訊之每個頻率的功率值之差 值,鼻出用以對於前述第1步驟所獲得之信號相乘之每個 157757.doc 201222533 頻率的加權係數;且基於利用前述第!步驟所 與在前述第4步驟中所算出之前述加權係數之乘算ί信號 自則逑混^音中將來自前述目標音源之音源信號分離。,
寻㈣特別疋即使在擴散性雜音存 下,亦可一方面抑制雜訊樂音的產生,一方 A 複數個音源發出之音源信號之混合音中,將來“::自 之音源信號分離。 ^曰源 [發明之效果] 本發明可在維持專利文獻丨的效 訊樂音之產生。 之下充为地降低雜 【實施方式】 面參照圖面一面進行 以下,茲就本發明之實施形態, 說明》 [第1實施形態] 圖1係顯示第丨實施形態之音源分離系統的基本構成之 圖。該糸統由2個麥克風(以下稱為「麥克風」)1〇、^及音 源分離裝置1構成。以下,雖將麥克風設為2個進行實施: 態之說明,但麥克風的個數只要至少是2個以上即可,並 不限定於2個。 該音源分離裝置丨具備(但未圖示):控制整體且執行運 异處理之CPU;包含娜、RAM、硬碟裝置等記憶裝置之 硬體;及包含記憶於記憶裝置之程式、資料等之軟體。藉 由該等硬體及軟體,實現音源分離裝置k各功能方塊。 2個麥克在平面上彼此分離配置,接收自細 157757.doc 201222533 曰源R1、R2發出之信號。此時,該等2個音源^、 設為分別位在以與連結2個麥克風1〇、1^之線段交又之平 面(乂下a作刀離面)為邊界而被分割之2個區域(以下 「分離面的左右 彳^y )者彳-未必一定要存在於相對於分離 面左右對稱之位置。另,在本實施形態中,以將分離面設 為:於面内包含連結2個麥克風1〇、u之線段之平面垂直 地交叉之平面’且通過前述線段的中點之平面之例進行說 明0 又,设自音源R1產生之聲音為所要獲取之目標音,設自 曰源R2產生之聲音為所要壓制之雜音(在本說明書中皆 同)。又’雜音並不限定於Hg),亦可存在有複數個。惟, 目標音與雜音的方向不同。 由該麥克風10、u獲得之2個音源信號於頻譜分析部 20、21中分別對每個麥克風輸出進行頻率分析,於波束成 形器部3將該等經頻率分析之信號利用於分離面的左右形 成死角之波束成形器3〇、3丨進行濾波,於功率計算部4〇、 41計算其濾波器輸出的功率。另,波束成形器3〇、3ι較佳 的是於分離面的左右相對於分離面對稱地形成死角。 [波束成形器部] 首先,參照圖2,說明包含波束成形器3〇、3丨之波束成 形器。P 3的構成。將由頻譜分析部2〇、頻譜分析部21針對 每個頻率成分予以分解之信號〜(0))、Χ2(ω)作為輸入利 用乘法器100a、l00b、1〇〇c、100d分別與濾波器係數 %(ω)、Μ⑻、Wl*(Q))、〜2*(ω)(*表示複數共輛之關係)乘 157757.doc ⑧ -10 - 201222533 進行相乘。 而後,以加算器l〇〇e、l〇0f將2個乘算結果相加並作 為其輸出而輸出濾波處理結果心彳…、ά32(ω)。在將對於 目私方位0!之增益設為1,將於其他方向心形成丨個死角(增 • 益為〇)之波束成形器30的濾波器向量設為%(ω、Θ,、 • β2)=Κι(ω、θι、β2)、W2(co n2)]T,將觀測信號設為 χ h、θ2)=[χ1(ω、θ1、θ2)、Χ2(ω、θ1、β2)]τ之時,波束 成形器30之輸出dSl(G))可由下式求出。惟,τ表示倒置操 作,Η表示共軛倒置操作。 [數1] ds1(c〇)=W1(cU, 01J02)HXU>ei>02) _ ^ (1) 又,在將波束成形器3丨之濾波器向量設為w2((〇、βι、 = = [W丨,ω、θ丨、θ2)、W2*(G)、θ丨、θ2)]τ之時波束成形 器31之輸出ds2((D)可由下式求出。 [數2] (2) ds2(c〇) =ψ2(ω, 6U θ2)ΗΧ(ω> Θι> 02) 如此’波束成形器部3藉由使用複數共輛遽波器係數, 而在相對於分離面對稱之位置形成死角。此處,①表示角 頻率’相對於頻率[為①^計之關係。 [功率計算部] 接著’兹參照圖3就功率計算部4〇、41進行說明。功率 計算部40、41係利用以下之計算式,將來自波束成形器 3〇、波束成形器31之輸出峰)、牠⑷變換為功率譜資 157757.doc ..· (3) 201222533 訊 psKiO)、pS2(C0) 〇 [數3] P s I (ω) = [Re (ds ! (ω))] 2 Η- [ I m(d s i (ω))] [數4] • · · (4) PS2 (ω) = [Re (ds2 (ω〉)] 2+ [ lm(ds 2 (ω))] [加權係數算出部] 功率計算部40、41之輸出ρ3ι(ω)、pS2((〇)係使用作為加 權係數算出部50之2個輸入。加權係數算出部5〇以該2個波 束成形器30、31之輸出的功率譜資訊為輸入,而輸出每個 頻率的加權係數GBSA(co)。 加權係數GBSA(co)係基於前述功率譜資訊彼此的差值之 值,作為加權係數0Β3Α(ω)之一例,對於每個頻率計算 pSl(co)與ρ32(ω)之差值,若pSi((〇)之值大於…2^)之值顯 示以Ρδΐ(ω)的平方根除之差值的平方根所得 之值,若Ps1(co)之值為psjco)以下之值,考慮將顯示〇之值 作為定義域之單調遞增函數的輸出值。以公式表示之加權 係數GBSA(c〇)如以下所示。 [數5] • (5) max( pst (ω) ~ (〇?),0 ) PSi(e〇) 在式(5)中,max(a、b)意指返回中任一較大值之函 數。又,F⑴係在定義域中滿足dF(x)/輪〇之廣義單 157757.doc ⑧ •12- 201222533 調遞增函數,可考慮例如S型函數或2次函數等。 此處,就GBsWoOdsKco)進行考察。如式⑴所示般, dsjco)係利用對於觀測信號χ(ω、θι、θζ)之線形處理而獲 付之信號》另一方面,GBSA(03)dsl((0)係利用對於如丨(〇)之 非線形處理而獲得之信號。 圖4係顯示對於(a)麥克風的輸入信號之(b)專利文獻工之 音源分離裝置的處理結果、與⑷本實施形態之音源分離裝 置的處理結果之圖。亦即,圖4(b)及⑷係以頻譜圖顯示 hSA(a))dSl(G))之一例。在本實施形態之音源分離裝置的單 調遞增函數F⑻中應用8型函數。—般而言,s型函數係以 l/(l+exP(a-bX))表示之函數,在圖4⑷之處理結果中,應 用 a=4、b=6。 ★又’圖5係、將圖4⑷〜⑷之某個時間帶之頻错圖的一部分 (符號5)在時間軸方向上放大之放大圖^觀看專利文獻^ 的音源分離裝置對於輸入聲音(圖5⑹之處理結果(圖5⑻) 的頻譜圖’可知相較於本實施形態之音源分離裝置的處理 結果(圖5⑷),雜音成分之能量局限在時間方向、頻率方 向上’而產生雜訊樂音之情況。 音成分如輸入信號 、頻率方向上,故 另一方面,可知圖4(c)之頻譜圖的雜 般,雜音成分之能量未侷限在時間方向 雜訊樂音較少。 [雜訊樂音降低增益算出部] 、⑻叫⑻雖為來自經充分降低雜訊樂音之目枝 -P ' ..* / 之音源信號,但在擴散性雜立 π曰/'、 度雜曰寻自各個方向傳來之雜音之 157757.doc •13· 201222533 情形下’作為非線形處理之Gbsa(〇>)其值會依每個頻率點 及每個訊框值大幅變化’而有產生雜訊樂音之傾向。是 以’藉由對非線办處理後之輸出附加未產生雜訊樂音之非 線形處理前的信號來降低雜訊樂音。具體而言,計算出對 波束成形器30的輸出dSl(co)乘以輸出Gbsa(c〇)而獲得之信號 XBSA(g>)、與將波束成形器30的輸出如1((〇)以特定的比例加 總而得之信號。 又,作為其他方法,有重新算出與波束成形器3〇的輸出 dSl(a>)相乘之增益之方法。於雜訊樂音降低增益算出部 6〇重新算出對波束成形器30的輸出dsi(co)乘以加權係數 ‘出°P50的輸出而獲得之信號Xbsa(c〇)、與將波束 成形器3〇的輸出dSl⑻以特定的比例加總之增益值Gs(co)。 處對ΧΒδΑ(ω)以某種比例混合波束成形器3〇的輸出 叫⑻而传之(Xs((〇))由下式表*。l係決定混合時的比例 之權重係數,其為大於0小於1之值。 [數6]
Xs (to). • . (6) ^若將式(6則為料束成形_ 增益之形式,則如下所示。 ' [數7]
Xs (①) dsx (ω){·γδ(〇ΒδΑ(ω)-_ {(〇) G s {(ύ) (7) 亦即’雜訊樂音降低增益算出部6〇可由自GBSA⑻減去i 157757.doc ⑧ • 14- 201222533 之減算部、對其乘以權重係數仏之乘算部、及對其加上】 之力算。P構成。亦即,基於該等構成,作為與波束成形器 3〇的輸出dSl(〇))相乘之增益,而重新算出雜訊樂音經降低 之增益值Gs〇)。 基於增益值Gs(qj)與波束成形器3〇的輸出之乘算結 果而獲得之信號,成為相較於GBsA(f〇)dsi((〇)其雜訊樂音經 降低之來自目標音源之音源信號。藉由將該信號由後述之 時間波形變換部120變換為時間區域信號並輸出,亦可作 為來自目標音源之音源信號。 然而,增益值03(〇)由於相較於Gbsa((〇)必然會增大,因 此降低雜訊樂音勢必會導致增加雜音成分。是以,為壓制 殘留雜音’於雜訊樂音降低增益算出部6〇的後段設置殘留 雜音壓制增益算出部110,進而重新算出最佳之增益值。 又在對波束成形器30的輸出乘以由雜訊樂音降 低增益算出部60所算出之增益Gs⑻而得之χ《ω)的殘留雜 音中,亦包含突發性雜音。是以’為能夠推斷突發性雜 :’於殘留雜音壓制增益算出部11〇所使用之推斷雜音的 异出中’導入以下說明之阻隔矩陣部7〇與雜音均衡 100。 [雜音推斷部] 於圖6(a)〜(d)顯示雜音推斷部70的方塊圖。雜音推斷部 7 0根據自利用麥支風】〇、η從 …… 付之2個信號進行自適應遽
*自作為目標音之音源R1之信號成分 取雜音成分。 U 157757.doc :5. 201222533 此處,將來自音源R1之信號設為S(tp另,來自音源R1 之聲音相較於來自音源R2之聲音更先到達麥克風1〇。將自 除此以外之音源發出之聲音的信號設為巧⑴,並將其等作 為雜音《此時,麥克風10的輸入χ〗⑴與麥克風u的輸入 x2(t)如下所示。 [數8] 1 = hsl $( t) + 2hnil nj (t) ··.· (9 —工) 2(t) hS2s(t) + ^hn^2 xij(t) ,··(9 一 2) j=l hsi .自目標音至麥克風1〇之傳送函數 ha :自目標音至麥克風丨丨之傳送函數 hn_n:自雜音至麥克風1〇之傳送函數 」_ …,,严n工i< 得运函數 圊6所不之自適應濾波器部71係將麥克風10的輸入作號 與自適應渡波器係數重疊,而算出與利用麥克助而獲; 之以成分—致之模擬信號。其後,於減算部72,自麥克 =信號中減去模擬信號,而算出來自麥克風u所含之 音源R1之作^ X纖⑴成為雜音推斷=信:(雜音信號)。該誤差信號 曰推斷部70的輸出信號。 [數9] 再者’於自適應濾波3! π 71中麻诚f> 遽波器係數的更新 差㈣進行自制 更新。例如對於自適應渡波器的係數H⑴戈 157757.doc 201222533 更新係利用 NLMS(Normalized Least Mean Square,最小均 方標準化)。又,亦可根據外部之VAD(voice Activity Detection ’語音活動偵測)值或後述之控制部16〇的資訊控 制自適應濾波器的更新(圖6(c)、圖6(d))。具體而言,亦可 於例如臨限值比較部74,在判斷來自控制部160之控制信 號大於特定的臨限值之情形下更新自適應濾波器的係數 H(t)。另’「vaD值」是指表示目的聲音為發話狀態或非發 話狀態之值。作為值’既可是On/Off之2值變移,亦可是 顯示發話狀態的概率之具有某個範圍之概率值。 又,此時,若假定目標音與雜音係不相關者,則雜音推 斷部70的輸出xABM(t)係如以下所示般算出。 [數 10] (Π) xABM(t)=£hn)2nj(t)_HT(t>|hnjinj(t) + (hs2h:i-H(t))ThsiS(t) 此時’若可推斷出壓制 山!利目私音之傳送函數,則輸出 Χαβμ(〇如下所示。 [數 11] (假設可推斷出屋制目標音之傳送函數Η⑴外2h;;)
K wt),i2nj⑴,s2h:丨吟一⑴...⑽ 、以如上方式可某種程度推斷出除目標音方向以外之雜音 成分。特別是與Griffith-Jim 4· $ '曰 hm手法不同’由於未 波器,因此可對麥克風婵兴& * 』用U疋濾 兄U增1的差異穩固地壓 I57757.doc -17· 201222533 由改變遲延器73之濾波器 之空間範圍。因此,可因 又,如圖6(b)〜圖6⑷所示般,藉 的DELAY值,可控制判斷為雜音 應DELAY值而縮小或擴大定向性 曰另’作為自適應濾波器,除於上述所列舉者以外,只要 疋子於麥克風的增益特性差為穩固者即可。 2對於雜音推斷部7G的輪出,係於頻譜分析部80進行 '斤於雜曰功率計算部90計算每個頻率點的功率。 又’作為雜音推斷部7〇的輸人,亦可是頻譜分析後之麥克 風輸入信號。 [雜音均衡器部] H推斷部70的輸出進行頻率分析之Xabm⑷中所含 量對波束成形器3〇的輸出dsKco)乘以加權係數 BSA(CO)而獲得之信號Χβ3Α(ω)、及在將波束成形器的輪 】()ス特疋的比例加總而得之信號χ^ω)中包含之雜音 罝,其頻譜的形狀雖相似但能量有所偏差。因此,於雜音 均衡器部100,為使兩者之能量一致而進行修正。 於圖7顯示雜音均衡器部100之方塊圖。另,以下說明作 為雜3均衡器部1〇〇的輸入,使用功率計算部9〇的輸出 ρΧΑΒΜ(ω)、雜訊樂音降低增益算出部6〇的輸出Gsb)、及 波束成形器3〇的輸出dsKco)之例。 首先,乘算部1〇1進行dSl(co)與Gs(c〇)之乘算。對於其輸 出’於功率計算部102求出功率。平滑部103、104於藉由 接收外部的VAD值或來自後述之控制部160之信號而判斷 為雜音之區間’對於功率計算部9〇的輸出ρχΑΒΜ(ω)與功率 157757.doc 201222533 計算部1 02的輸出PXS(0))分別進行平滑處理。「平滑處理」 是指在連續資料中,為降低相較於其他資料大幅偏差之資 料的影響’而將資料平均化之處理。在本實施形態中,係 使用一次IIR濾波器進行平滑處理,經平滑處理之功率計 算部90的輸出ΡχιΑΒΜ(ω)與功率計算部1〇2的輸出岣係 針對目前處理訊框之功率計#部9〇的輸出ρχ續(ω)與功率 計算部102的輸出pXs(0)),使用過去的訊框之經平滑處理 之功率計算部90的輸出與功率計算部1〇2的輸出而算出。 作為平滑處理之一例,經平滑處理之功率計算部9〇的輸出 ρΧ'ΑΒΜ(ω)與功率計算部102的輸出pX,s((〇)係如下式 般算出。此處,為易於得知時間序列而設置處理訊框序號 m,並將目前處理訊框設為m,將前一個處理訊框設為 m-Ι。另,平滑部1〇3之處理亦可於臨限值比較部1〇5中, 在經判斷為來自控制部丨6〇之控制信號小於特定的臨限值 之情形下予以執行。 [數 12] PX^U,m) = a-pX^s(«,,m-l) + (i-a)ipXs(W|ta) ‘ . .(13_υ pX“m) = a.pXWU,m—1) + (1_α) ρχ删u,m) . u〉 均衡器更新部106會算出的輸出比。 亦即’均衡器更新部1 〇6的輸出如下所示。 [數 13] (14) HEQ(w,m) = pXabmXco, m) 157757.doc -19- 201222533 均衡器應用部107係基於均衡器更新部1〇6之輸出Heq((〇) 與功率計算部90的輸出ΡΧΑΒΜ(ω)而算出Xs(c〇)中所含之推 斷雜音的功率ρλ/ω)。pXd((〇)亦可基於例如以下之計算而 算出。 ° # [數 14] pAd (ω) = Heq (ω)·ρΧΑΒΜ(ω) . · . (15) [殘留雜音壓制增益算出部] 於殘留雜音壓制增益算出部11〇中,為壓制對波束成形 器30的輸出dSl(c〇)應用增益值〇8(0))之時殘留之雜音成分, 而重新算出乘以dSl(〇))之增益。亦即,於殘留雜音壓制增 益算出部11〇,相對於對dSl(C0)應用Gs((〇)之值Xs(gj),基於 殘留雜音成分的推斷值λ{1(ω),算出將Xs((〇)中所含之雜音 成分適切地除去之增益,即殘留雜音壓制增益在 增益之算出中,常利用維納濾波器或MMSE-STSA法(參照 非專利文獻1)。但,MMSE_STSA法由於係將雜音假定作 為正規分佈,因此會有突發性雜音等不適用於MMSE- STSA的假定之情形。是以,在本實施形態中,利用易於 壓制比較性突發性雜音之推斷器。惟推斷器可應用任何手 法。 殘留雜音壓制增益算出部110係以下述方式算出增益 GT(«))。首先’殘留雜音壓制增益算出部u〇算出基於事後 sisiK((s+N:)m))而導出之瞬間的事前SNR(乾淨音聲雜訊比 (S/N))。 157757.doc 201222533 [數 15]
V
ΊΧ“〇>)Ι2 S. p λ d ( ¢0 )
其後’殘留雜音壓制增益算出部lio係利用DECISI0n_ DIRECTED APPROACH算出事前SNR(乾淨音聲雜訊比 (S/N))。 [數 16] f: (,, _ a*IXs(tu,m- 1)|2 .. ) ΕΤΰϊ-+(1~α)*7(ω)…⑽ 而後’殘留雜音壓制增益算出部110基於事前SNR而算 出最佳之增益值。下式(18)之βρ(ω)係規定增益的下限值之 頻譜底層值。藉由將其設定為較大雖可抑制目標音的音質 劣化’但殘留雜音量會增加。另一方面,若設定為較小, 雖殘留雜音量會減少,但目標音的音質劣化會增大。 [數 17]
Gp (ca) =max
ξ (ω, ηι) 1 + ξ (ω, m) \ β ρ ((〇) · . · (18) 殘留雜音壓制增益算出部11 〇的輸出值係如下表示》 [數 18] χρ(ω) = Xs(c〇)GPU) ~~ d s 1 (ώ) GT (ω) · · · (19)
其中,Gt(〇)) = {ys (1-GBSA 藉此’作為與波束成形器30的輸出ds,((〇)相乘之增益, 157757.doc -21· 201222533 而重新算出雜訊樂音降低且殘留雜音亦變小之增益值 GT(a>)。又,為防止目標音的過度壓制,亦可因應外部 VAD資訊或本發明之控制部16〇的控制信號之值而調整 Xd(co)之值。 [增益乘算部] 加權係數算出部50的輸出gbsa(co)、雜訊樂音降低增益 算出部60的輸出Gs((〇)、或是殘留雜音壓制算出部11〇的輸 出GT(co)係作為增益乘算部13〇的輸入予以使用。增益乘算 部130會輸出基於波束成形器3〇的輸出dsi((〇)與加權係數
Gbsa(q>)、雜訊樂音降低增益(^(ω)、或是殘留雜音壓制增 益Gt(g>)的乘算結果之信號χΒ3Α(ω)。亦即,作為ΧΒ^(ω)之 值,只要是使用例如dSl(〇))與GBSA(〇))之乘算值、dsi(Gi)與 Gs(co)之乘算值、或是心〆…與之乘算值即可。 特別疋’自基於dSl((〇)與GT(a>)之乘算值而獲得之目標音 源之音源信號將成為雜訊樂音、雜音成分極少之信號。 [數 19] ^•bsa (co) Gt(^) dsx (a;) · · · (20) [時間波形變換部] 時間波形變換部12〇將增益乘算部130的輸出XBSA(G))f 換為時間區域信號。 [音源分離系統之其他構成例] 又’圖8係顯示本實施形態之音源分離系統的其他構成 例之圖。本構成與811所示之音源分離系統的構成之差異 157757.doc -22- 201222533 在於,相對於圖1之立、、s八& ^ g源刀離糸統中於時間區域實現 :斷部7°’在圖8之音源分離系統中則是於頻率區:: 在 =其他構成係與圖1之音源分離系統的構成 相同。在嶋之情形下’無需頻譜分析80。 [第2實施形態] 、圖9係顯示本一發明第2實施形態之音源分離系統的基本構 圖。在本貫施形態之音源分離系統中,其特徵為具有 控制部⑽之點。控制部⑽其特徵為基於全頻帶的加權係 數CW⑻’控制雜音推斷部7〇、雜音均衡器部_ 留雜音厂堅制增益算出部110之内部參數。作為内部參數之 :二::如自適應濾波器的步階值、權重係數‘·)的 頻SW底層值β、及推斷雜音的雜音量等。 控制部160具體而言係執行如下之處理。例如,算出加 權係數GBSA⑻的全頻帶之平均值。由於可判斷其平均值 愈大則聲音存在概率愈高,因此控制部⑽比較締算出之 平均值與特定的臨限值’並基於其比較結果控制而控制其 他方塊》 、 又,例如控制部160係將加權係數算出部5〇所算出之加 權係數GBSA(c〇)的直方圖在卜丨〇間針對每〇丨予以算出。 另’由於在Gbsa(co)之值較大之情形下聲音存在之概率較 高’在GBSA⑷之值較小之情形下聲音存在之概率較低, 因此會預先準備顯示其傾向之權重表。而後’對所算出之 直方圖乘以權重表而算出其等之平均值,並與臨限值比 較’基於其比較結果而控制其他方塊。 157757.doc •23· 201222533 又,例如控制部160係將加權係數Gbsa((0)的直方圖在 〇〜1.0間針對每〇」予以算出之後,例如,計算於〇 7〜丨〇之 範圍内分佈之個數,並比較其個數與臨限值,基於其比較 結果而控制其他方塊。 又,控制部160亦可接收來自2個麥克風(麥克風1〇、u) 中至少一者之輸出信號。於圖10顯示該情形之控制部160 之方塊圖。作為控制部16〇之處理的基本考量,係將基於 ds丨(ω)與GBSA(c〇)之乘算結果之信號χΒ5Α(ω)、以及利用雜 音推斷部165及頻譜分析部166進行之處理的輸出χΑΒΜ(ω) 之功率譜密度於能量比較部167加以比較。 具體而言’對於XBSA(c〇)與χΑΒΜ(ω)之功率譜密度,若分 別將取對數而經平滑者設為Xbsa((〇)i、Xabm(〇)),,則控制 部160以如下方式算出目標音的推斷snr d(cd)。 [數 20] DU)=max(XBSA’-xABM,,〇) · ·.㈣ 而後,與上述之雜音推斷部7〇及頻譜分析部8〇進行之處 理相同,藉由自D(o>)中檢測出穩定(雜音)成分,然 後自D(co)中減去DN(〇)),可檢測出D(〇))之突發雜音成分
Ds(co)。 [數 21] DSU) = DU)-DnU) . · ·⑽ 最後,比較Ds(to)與預先決定之臨限值,並根據其比較 157757.doc •24- 201222533 結果而控制其他方塊。 [第3實施形態] (第1構成) 圖11係顯示本發明之第3實施形態之音源分離系統的基 本構成之一例之圖。 圖11所不之音源分離系統之音源分離裝置1具有·頻譜 分析部20、21 ;波束成形器3〇、31 ;功率計算部4。、41 ; 加權係數算出部50 ;加權係數乘算部31〇 ;及時間波形變 換部120 *此處,關於除加權係數乘算部31〇以外之構成, 係與上述之其他實施形態之構成相同。 加權係數乘算部310係將利用波束成形器3〇而獲得之信 號dSl(co)與加權係數算出部5〇所算出之加權係數相乘。 (第2構成) 圖12係顯示本發明之第3實施形態之音源分離系統的基 本構成之其他例之圖。 顯示於圖12之音源分離系統之音源分離裝置丨具有:頻 譜分析部20、21 ;波束成形器3〇、3 1 ;功率計算部4〇、 41 ;加權係數算出部50 ;加權係數乘算部31〇 ;雜訊樂音 降低部320 ;殘留雜音壓制部33〇 ;雜音推斷部7〇 ;頻譜分 析部80 ;功率計算部90 ;雜音均衡器部100 ;及時間波形 變換部120。此處,關於除加權係數乘算部3 1〇、雜訊樂音 降低部320及殘留雜音壓制部33〇以外之構成,係與上述之 其他實施形態之構成相同。 雜訊樂音降低部320係將加權係數乘算部3 1 〇的輪出結果
157757.doc -25- 201222533 ”由波束成❿器3〇獲得之信號以特定的比例相加並輸出其 結果。 殘留雜音塵制部330係基於雜訊樂音降低部32〇的輸出結 果與雜音均衡器部100的輸出結果,壓制雜訊樂音降低部 320的輸出結果中所含之殘留雜音。 又,在圖12的構成中,雜音均衡器部1〇〇係基於雜訊樂 曰降低部320的輸出結果與雜音推斷部7〇所算出之雜音成 刀,而算出雜訊樂音降低部32〇的輸出結果中所含之雜音 成分。 此處,在將加權係數GBSA(co)乘波束成形器3〇的輸出 &〗(〇〇)而獲得之信號Xbsa((〇)、與將波束成形器3〇的輸出 ds〗(G))以特定的比例加總而得之信號又^⑷中會有因應雜 音環境而含有突發性雜音之情形《是以,為能夠亦推斷突 發性雜音,而導入以下說明之雜音推斷部7〇與雜音均衡器 部 100 〇 根據如上之構成,圖12之音源分離裝置丨基於殘留雜音 壓制部3 3 0之輸出結果而自混合音中將來自目標音源之音 源信號分離。 亦即,在圖12之音源分離裝置i中,未算出雜訊樂音降 低增益Gs((〇)、或殘留雜音壓制增益〇τ(ω)之點係與第i實 施形態及第2實施形態之音源分離裝置丨不同之點。即使是 如圖12般之構成’亦可發揮與第1實施形態之音源分離裝 置1相同之效果。 (第3構成) 157757.doc •26· 201222533 又’圖13係顯示本發明之第3實施形態之音源分離系統 的基本構成之其他例之圖。圖13所示之音源分離裝置1對 圖12之音源分離裝置1的構成中追加控制部丨6〇。控制部 160之功能與於第2實施形態所說明之功能相同。 [第4實施形態] 圖14係顯示本發明第4實施形態之音源分離系統的基本 構成之圖。在本實施形態之音源分離系統中,其特徵為具 有.定向性控制部170、目標音修正部丨8〇、及傳來方向推 斷部190之點。 疋向性控制部170係基於由傳來方向推斷部丨9〇所推斷之 目標音位置,以使所欲分離之2個音源R1、R2假設性地儘 量相對於分離面為對稱之方式,對於經頻譜分析部、2工 進行頻率分析之麥克風輸出中一方之麥克風輸出賦予延遲 刼作。亦即,假設性地使分離面旋轉,而針對此時之旋轉 角,因應頻帶而算出最佳之值。 然而,於定向性控制部丨70中縮小定向性之後、於波束 成形器4 3進行濾波處理,會有目標音的頻率特性產生若 =^真之問題。又,對波束成形器部3的輸入信號賦予遲 °會產生輸出增益變小之問題。是以,於目標音修正 部180中修正目標音輸出的頻率特性。 [定向性控制部] 盥圖:係顯示相對於2個音源R1’(目標音)、音源R2·(雜音) 二連、.、。麥克風之線段交又之原始分離面僅旋轉㊀τ之分離面 成右對私之狀況。如專利文獻!中所述,藉由對以一方 157757.doc • 27· 201222533 _克風所獲取之信號賦予一 所示之狀况同等的狀疋遲延量%,可實現與圖25 差,而調整定向特性,於P,、為操作麥克風間的相位 •Ο(ω)。另,/ ;上式(!)令乘以相位旋轉器 Χ(ω、θι、02)。"尹 W,(〇>)=W〆®、Θ,、02),X〇)= [數 22] (27-1) (27-2) dSlU)=W»D(,)xu). 〇(ω) =expCj<urd) 此處, [數 23] 遲延里Td係如以下所示般算技 τ _ dsinQr
Td--. . ·⑽ d係麥克風間距離[m],C係音速[m/s]。 而在基於相位資訊進行陣列處理之情形下,必須滿 足以下式表現之空間抽樣定理。 [數 24]. 作為用以滿足該定理所容許之遲延量的最大值τ〇,為·· [數 25] d • · · (30) 亦即,各頻率ω愈大,所容許之遲延量τ<3愈小。然而 157757.doc -28· 201222533 在專利文獻1之音源分離裝置中,由於式(27_2)所賦予之遲 延里固定,因此會於頻率區域之高頻區域中產生未滿足式 (29)之情形。結果如圖26所示,使得自所期望之音源分離 面大幅偏離之方向傳來之相反區域的高頻區域成分之聲音 被輸出。 是以,在本實施形態之音源分離裝置中,如圖15所示, 並非於定向性控制部170設置最佳遲延量算出部171.、對於 使分離面模擬地旋轉時之旋轉角“賦予固定的遲延,而是 藉由對每個頻帶算出滿足空間抽樣定理之最佳遲延量,而 解決上述問題。 定向性控制部170於最佳遲延量算出部i 7 i中,判定基於 式(28)賦予由θτ導出的遲延量時每個頻率是否滿足空間抽 樣定理,若滿足空間抽樣定理,則將對應於&之遲延量~ 應用於相位旋轉器172 ’若不滿足空間抽樣定理,則將遲 延量τ〇應用於相位旋轉器丨72。 [數 26] dsi(«〇 =W?U)DU)XU) . . · (31) 其中, D (ω) = ( di3g (θΧΡ C 3 ω τ d ] j 1} if θ. < sin-ϊ ( c π / dω - 1) ldiag(exp[ jcot〇] ; 1) else 圖16係顯示本實施形態之音源分離裝置丨的定向特性之 圖。如圖16所示,藉由應用式(31)的遲延量,可解決使自 所期望的音源分離面大幅偏離之方向傳來之相反區域的高 頻區域成分之聲音被輸出之問題。 157757.d〇c •29- 201222533 奸= 定向性控制部17G的其他構成之圖。在 該if形下,並非於最佳 笪中夕嘴 异出邛171中將基於式(31)所 『延量僅賦予一方之麥克風輸入,亦可藉由相位旋 而1、173對雙方之麥克風輸入分別各賦予一半之遲 貫現整體同量的遲延操作。㈣,並非對由一方之 麥克風所獲取之信號賦予遲 d(或是T〇),亦可藉由對 2麥克風所獲取之信號賦予遲延量⑽或是㈣, -方之麥克風所獲取之信號賦予遲延量傷戈 疋·τ0/2),而使整體的遲延差變為^(或是%)。 [目標音修正部] 作為其他問題點,可舉如藉由於定向性控制部⑺中缩 小定向性之後利用;皮束成形器3〇、^進行舰處理目於 音的頻率特性產生若干失真。又,利用式⑻之處理,: 產生導致輸出增益變小之問題。因此,為修正目標音輸出 的頻率特丨生’⑦置目標音修正部丨8G而進行頻率均衡化。 亦即’由於目標音之地點被大致固定,因此對於所推斷之 目標音位置進行修正。在本實施形態巾,係利用簡易地模 擬表示自某個點音源至各麥克風之傳播時間或衰減量之傳 送函數之物理模式。此處,將麥克風1〇的傳送函數作為基 準值,將麥克風11的傳送函數作為對於麥克風1〇之相對值 而表現。此時,自目標音位置到達至各麥克風之聲音的傳 播模式’ Xm2((〇)]係如下述般表示。Ys係麥 克風ίο與目標音之距離,es係目標音之方向。 [數 27] 157757.doc 30· ,· · (32) 201222533 ^m l ( 〇)) = 1
Xm2 (ω) = u-1 . exp{— j cutmd (u — l)/c} 其中’ u = 1+(2/rm)cos0ta+(l/r3〉 藉由利用該物理模式,可預先設想自推斷之目標音位置 所發出之聲音如何輸入至各麥克風,簡易地算出對於目標 音之失真情形。藉由使相對於上述傳播模式之加權係數成 為GBSAhlXjo))),且將該倒數保持於目標音修正部作 為句衡器,可修正目標音的頻率失真。因此,均衡器可求 出: [數 28] GB§AU|XmU))..,⑽ 根據上述,由加權係數算出部5〇所算出之加權係數
Gbsa(〇))係藉由目樟立 棺田㈢铩《修正部18〇對不式表示之Gbs 以修正。 [數 29]
Gbsa(〇,) 圖U係顯示08為〇度、 18ΠΛΛ ^ - ^為^[瓜]而設計目標音修正部 180的均衡器時之音 〇产方θ值戈立’裝置1的定向特性之圖。對於自 〇度方向傳來之音源, 真。 由圖18確認無輸出信號的頻率失
另,於雜訊樂音降低増 權係數GBSA’(C0)作為輪入。 益算出部6〇中,將該經修正之加 亦即’式(7)等之gbsa(c〇)可置換 157757.doc 201222533 為 Gbsa'(CO) 〇 又,亦可對控制部160輸入利用麥克風10、11所獲得之 信號的至少一者。 [音源分離系統之處理流程] 圖19係顯不音源分離系統之處理的一例之流程圖。 於頻4分析部2G、21中,對於麥克風1G、2G各自所獲得 之輸入彳5唬1、輸入信號2執行頻率分析(步驟S101、 S102)又,此處,亦可於傳來方向推斷部19〇進行目標音 的位置之推斷,於定向性控制部170中,基於所推斷之音 源Rl、R2的位置算出最佳遲延量,並基於該最佳遲延量 對輸入信號1乘以相位旋轉器。 其後,對於在步驟Sl〇1、Sl〇2中經頻率分析之信號 〜(〇>)、Χ2(ω) ’利用波束成形器3〇、31執行濾波處理(步驟 s 103、s 104) »又,對於該等濾波處理之輸出,利用功率 計算部40、41計算功率(步驟S1〇5、si〇6)。 於加權係數算出部5 0,基於步驟S10 5、S10 6之計算結果 算出分離增益值GBSA(co)(步驟S107)。又,此處,亦可藉由 以目標音修正部1 80重新算出加權係數值Gbsa((〇),而修正 目標音的頻率特性。 其後,於雜訊樂音降低增益算出部60,算出使雜訊樂音 降低之增益值Gs(o)(步驟S108)。又,於控制部16〇,基於 在步驟S107所算出之加權係數值Gbsa(g)),算出用以控制 雜音推斷部70、雜音均衡器部1〇〇、殘留雜音壓制增益算 出部110之控制信號(步驟S 109)。 157757.doc -32- 201222533 其後,於雜音推斷部7〇執行雜音推斷(步驟sii〇)。再 者:相對於步驟SU0之雜音推斷的結果x_(t),於頻譜分 析P 0執行頻率分析之後(步驟s i J),於功率計算部9〇計 算每個頻率點之功率(步驟SU2)e又,於雜音均衡器部 • 100’,執行於步驟S112所算出之推斷雜音的功率之修正。 . 其後,於殘留雜音壓制增益算出部1 ίο,相對於對在步 驟3所處理之波束成形器3〇的輸出值(①)應用於步驟 讓所算出之增益值Gs⑻之值,算出用以除去雜音成分 之增益0τ(ω)(步驟S114)。另,增益化⑻之算出係基於在 步驟SU2中經功率修正之雜音成分的推斷值^⑷而進 行。 而後,於增益乘算部130,對於步驟sl〇3之波束成形器 30之處理的結果,乘以於步驟sm所算出之增益(步驟 S117)。 最後,於時間波形變換部12〇,使步驟SU7之乘算結果 (目標音)變換為時間區域信號(步驟s丨丨8)。 又,如於第3實施形態所說明,亦可不進行步驟81〇8及 步驟S114之增益的算出,亦可藉由雜訊樂音降低部32〇與 殘留雑音壓制部330,自波束成形器30的輸出信號中除去 '雜音8 ' 另,圖19之流程圖所示之各處理大致分為3個處理。所 謂「3個處理」亦即來自波束成形器3〇之輸出處理(步驟 S101〜S103)、增益算出處理(步驟sl〇1~Sl〇8及步驟 S114)、及雜音推斷處理(步驟sll〇〜S113)。 &+'·' 157757.doc „ 201222533 關於增益算出處理與雜音推斷處理,係於增^算出處理 之步驟S1〇1〜S1〇7算出加權係數之後,與執行步驟S108的 處理之同時,在處理步驟sl〇9的處理與雜音推斷處理(步 驟S110〜S113)之後,於步驟8114決定與波束成形器3〇的輸 出相乘之增益。 [雜音推斷部之處理流程] 圖20係顯示圖19的步驟su〇之處理的詳細之流程圖。首 先,算出與來自音源R1的信號成分一致之模擬信號妒⑴ • x!(t)(步驟S201) »其次,於圖6之減算部72,藉由自麥克 風11的信號X2⑴中減去於步驟32〇1所算出之模擬信號,而 算出成為雜音推斷部70的輸出之誤差信號XABM(t)(步驟 S202)〇 其後,在來自控制部16〇之控制信號大於特定的臨限值 之情形下(步驟S203),於自適應濾波器部71更新自適應濾 波器的係數H(t)(步驟S204)。 [雜音均衡器部之處理流程] 圖21係顯示圖19的步驟S113之處理的詳細之流程圖。首 先’對於波束成形器30的輸出dsi(o>)乘以自雜訊樂音降低 增益算出部60輸出之增益Gs((0)而獲得輸出Xs(〇))(步驟 S301) 〇 在來自控制部1 60之控制信號小於特定的臨限值之情形 下(步驟S302),於圖7之平滑部103,執行功率計算部1〇2 的輸出ρΧ5(ω)之時間平滑處理。又’於平滑部1〇4,執行 功率计算部90的輸出ρχΑΒΜ(ω)之時間平滑處理(步驟 157757.doc •34· 201222533 S303 、 S304)。 而後,於均衡器更新部106,算出步驟S3〇3及步驟S3〇4 的處理結果之比率Heq㈤,而使均衡器值更新為h一)(步 驟S305)。最後,於均衡器應用部1〇7,算出&⑻中所含 ' 之推斷雜音λ<!(ω)(步驟S306)。 _ [殘留雜音壓制增益算出部η〇之處理流程] 圖22係顯示圖19的步驟S114之處理的詳細之流程圖。在 來自控制部160之控制信號大於特定的臨限值之情形下(步 驟S401),執行使雜音均衡器部1〇〇的輸出、且雜音成分的 推斷值即Xd(co)的值縮小至例如0.75倍等之處理(步驟 S402)。其後,算出事後SNR(步驟S4〇3)。再者,算出事前 SNR(步驟S4〇4)。最後,算出殘留雜音壓制增益〇τ(ω)(步 驟S405) 〇 [其他實施形態] 在加權係數算出部50算出增益值Gbsa((〇)時,亦可使用 特定的偏壓值γ(ω)而算出前述加權係數。例如,亦可對增 益值GBSA(0))的分母相加特定的偏壓值而算出新的增益 值。則述偏壓值之相加在麥克風的增益特性一致,且耳機 或送受話器等目標音存在於麥克風的附近之情形下,尤其 • 可期待低頻區域之SNR的改善。 圖23及圖24係顯示就波束成形器30之輸出值比較近接音 與遠距離音之情形之圖表的圖。圖23及圖24之(al)〜(a3)係 顯示關於近接音之輸出值的圖表’(bl)〜(b3)係顯示關於遠 距離音之輸出值的圖表。又,在圖23中,麥克風1〇與麥克 157757.doc -35- .'8> 201222533 風11之間隔為0·03 m,麥克風1〇與音源R1、R2之距離分別 為0.06 m(米)與1.5 m。又,在圖24中,麥克風10與麥克風 11之間隔為0.01 m,麥克風1〇與音源R1、R2之距離分別為 0.02 m(米)與 i_5 m。 例如,圖23(al)係顯示根據近接音之波束成形器3〇的輸 出值叫⑷卜丨又⑻^⑷丨之)之值的圖表,圖23(bl)係顯示 根據遠距離音之dSl(〇))之值的圖表。此處,以近接音為目 標音位置而設計目標音修正部18〇,在遠距離音之情形 下,在目標音修正部180之影響下於低頻區域中pSi(c〇)之值 變小。又,在dSl(c〇)之值較小之情形下(亦即,pSi(〇))之值 較小之情形下),γ(ω)之影響變大。亦即,由於相較於分 子刀母項變大,故Gbsa(<〇)進而減小。因此,遠距離音 的低頻區域受到壓制。 [數 30] ΓmaxCp S 1 (ω) - p s 2 (ω) , 〇> V pSi(ct>) + v(co) (35) G BSA (ω)= 又,在圖7之構成中,由上式(35)所獲得之。〜(①)係應 用於波束成形器30的輸出值dSl(co),Gbsa(c〇)與dsi(〇))之乘 算結果XBSA(co)係如以下般算出。另,在下式中作為一 例’係顯示音源分離裝置1為圖7所示之構成之情形。 [數 31]
Xbsa (ω) = Gbsa (ω) dsi (ω) * · · (36) 如上述般,圖23及圖24之(al)、(bl)係顯示波束成形器 157757.doc •36- 201222533 3〇的輸出dSl((〇)之圖表。又,各圖之㈣、⑽係顯示在未 對式(35)的分母插入γ(ω)之情形下的輸出χ驗⑷之圖表。 又’各圖之⑻)、(b3)係顯示在對式(35)的分母插入γ(ω)之 情形下的輸出XBSA(啦圖表。由各圖可知遠距離音的低 頻區域受到壓制。亦即’可期待對存在於低頻II域中心之 行走雜音等具有效果。 另’在上述說明中’波束成形器3G係構成第1波束成形 處理。P X ’波束成%器3 i係構成第2波束成形處理部。 又,增益乘算部130係構成音源分離部。 [產業上之可利用性] 本發明可利用在聲音辨識裝置、汽車自動導航、集音裝 置錄曰裝置、及藉由聲音指令所進行之機器控制等、需 要將音源高精度地分離之所有產業中。 【圖式簡單說明】 八 圖1係顯示第1實施形態之音源分離系統的構成之圖。 圖2係顯示第1實施形態之波束成形器部的構成之圖。 圖3係顯示功率計算部的構成之圖。 圖4(aHe)係顯示相對於麥克風輸人信號之專利文獻】之 '、刀離裝置與本發明第i實施形態之音源分離 理結果的圖。
圖5⑷-⑷係圖4之處理結果的—部分之放大圖。 圖6(aHd)係顯示雜音推斷部的構成之圖。 圖7係顯示雜音均衡器部的構成之圖 圖8係顯示第1實施形態之音源分離 系統的其他構成之 I57757.doc -37- 201222533 圖。 圖9係顯示第2實施形態之音源分離系統的構成之圖。 圖10係顯示控制部的構成之圖。 圖11係顯示第3實施形態之音源分離系統的構成之一例 之圖。 圖12係顯示第3實施形態之音源分離系統的構成之一例 之圖。 圖13係顯不第3實施形態之音源分離系統的構成之一例 之圖。 圖14係顯示第4實施形態之音源分離系統的構成之圖。 圖15係顯示定向性控制部的構成之圖。 圖6(a) (b)係顯示本發明音源分離裝置的定向特性之 圖0 圖17係顯示定向性控制部的其他構成之圖。 圖18(a) (b)係顯示在設置有目標音修正部之情形下之 本發明音源分離裝置的定向特性之圖。 細之流程 圖 圖19係顯示音源分離系統之處理的-例之流程圖。 圖2〇係顯示於雜音推斷部之處理的詳細之流程圖。 ==示於雜音均衡器部之處理的詳細之流程圖 圖係h於殘留雜音壓制算出部之處理的詳 圖23叫侧、叫⑽係顯示 輸出值比較近接音與遠距離音之 束成…之 間隔為3cm)。 月开乂之圖表的圖(麥克風 157757.doc 201222533 間隔為1 cm)。 圖2 5係顯示專利文獻丨之音源分 界面之圖。 圖24〇1)-〇3)、(bl)-(b3)係顯示相對於波束成形器3〇之 輸出值比較近接音與遠距離音之情形之圖表的圖(麥Μ 離裝置之音源分離的邊
圖26(a)、(b)係顯示專利 性之圖。 文獻1之音源分離裝 置的 定向特 【主要元件符號說明】 1 音源分離裝置 3 波束成形器部 10、11 麥克風 20、21 頻譜分析部 30、31 波束成形器 40、41 功率計算部 50 加權係數算出部 60 雜讯樂音降低增益算 70 雜音推斷部 71 自適應濾波器部 72 減算部 73 遲延器 74 臨限值比較部 80 頻譜分析部 90 功率計算部 100 雜音均衡器部 出部 I57757.doc •39- 201222533 101 乘算部 102 功率計算部 103 ' 104 平滑部 105 臨限值比較部 106 均衡器更新部 107 均衡器應用部 110 殘留雜音壓制增益算出部 120 時間波形變換部 130 增益乘算部 160 控制部 161A 、161B 頻譜分析部 162A 、162B 波束成形器 163A 、163B 功率計算部 164 加權係數算出部 165 雜音推斷部 166 頻譜分析部. 167 能量比較部 170 定向性控制部 171 最佳遲延量算出部 172、 173 相位旋轉器 180 目標音修正部 190 傳來方向推斷部 310 加權係數乘算部 320 雜訊樂音降低部 330 殘留雜音壓制部 •40- 157757.doc ⑧

Claims (1)

  1. 201222533 七、申請專利範圍: κ -種音源分離裝置’其特徵為:其係自混合有自複數個 音源發出之音源信號之混合音中將來自目標音源 信號分離者,且具備: ^ 第1波束成形處理部,其對於來自包含被輪入前 合音之2個麥克風之麥克風對之各自的輸出信號,錢 用彼此不同之請數之頻率區域進行積和運算,以鱼 連結前述2個麥克風之線段交又之平面為界,使自與^ 含前述目標音源的方向之區域相反之區域傳來之音源: 號衰減; 15 第2波束成形處理部,其藉由對於來自前述麥克風對 之各自的輸出信號’乘以前述彼此不同之^係數與在 頻率區域處於複數共_係之第2係數,將獲得之結果 在頻率區域進行積和運算,以前述平面為界,使自^含 前述目標音源的方向之區域傳來之音源信號衰減; ‘功率計算部’其基於利用前述第1波束成形處理部所 獲得之信號計算具有每個頻率的功率值之第1頻譜資 =,再者,基於利用前述第2波束成形處理部所獲得之 信號計算具有每個頻率的功率值之第2頻譜資訊;及 加權係數算出部’其因應前述第I頻1#資訊與前述第2 頻譜資訊之每個頻率的功率值之差值,算出用以對於前 述第1波束成形處理部所獲得之信號相乘之每個頻率的 加權係數;且包含 曰源刀離邛,其基於利用前述第丨波束成形處理部 I57757.doc 201222533 所獲得之信號、與前述加權係數算出部算出之前述加 權系數之乘算結果,自前述混合音中將來自前述目標 音源之音源信號分離。 求員1之g源分離裝置,其中進而包含加權係數乘 算部,其將利用前述第丨波束成形處理部所獲得之信 ^〜引述加權係數算出部算出之前述加權係數相乘; 别述音源分離部基於將前述加權係數乘算部的輸出結 果與自前述第W束成形處理部所獲得之信號以特定的。 比例相加之結果,自前述混合音中將來自前述目標音源 之音源信號分離。 3.如請求項2之音源分離裝置,其中包含: ::::降低部’其輪出將前述加權係數乘算部的輸 出-果與自前述第!波束成形處理部所 定的比例相加之結果; h观以特 雜音推斷部,其對於來 俨立调“ A于於來自别述麥克風對令接近前述目 、尚廄:鞠出七娩應用濾波器係數為可變的自 適應/慮波盗’而算出來自前述 標音源之麥克風之& + e $ 了遇離則述目 ,、… 出㈣—致之模擬信號,並利用爽 自退離刖述目標音源之麥 朿 號之差值而算出雜音成分 輪出㈣與前述模擬信 雜音均衡器部,龙美於兑、+.他 果與前述雜音推斷部;樂音降低部的輪㈣ 雜訊樂音降低部的輪出結果令所含之雜音成分i出則述 殘留雜音壓制部,1 ,及 “基於别述雜訊樂音降低部的輪出 157757.doc 201222533 、’、。果與雜音均衡器部的輪出結果,而壓 降=部的輪出結果中所含之殘留雜音;且,〜、訊樂音 刖:音源分離部基於前述殘留雜音壓制 離。 之目‘音源之音源信號分 4. :::们之音源分離裂置,其中包含控制部,其基於 立固頻率的加權係數’控制前述雜音推斷部、:、:、 雜-均衡器部、及前述殘留雜音抑 别、 5. 如請求们之音源分離 一者。 益算出部,並用以管“ 雜訊樂音降低增 所獲得之、二J對利用前述第1波束成形處理部 舆利用前迷第〗波束成形處理所:::=结果、 的比例相加之增益算出; -侍之曰源k唬以特定 前述音源分離部基於由 所算、,述雜訊樂音降低增益算出部 =::::用:述第1波束成形處理所獲得之音 源之音源自前—將來自前述目標音 6.如請求項5之音源分離裝置 雜音推斷部,艾锻协办 八備. 標音源之麥克風二輸出信^述麥克,對中接近前述目 適應濾波器,而算屮 二“用濾波盗係數為可變的自 標音源之麥克風之二前述麥克風對中與遠離前述目 自遠離前述目標心“虎—致之模擬信號,並利用來 號之差值而算出雜:成二克風之輪出信號與前述模擬信 157757.doc 201222533 雜音均衡器部,其基於將利用前述p波束成形處理 部所獲得之音源信號與於前述雜訊樂音降低增益算出部 所算出之增益相乘而得之乘算結果、與前述雜音推斷部 所算出之前述雜音成分,而算出利用前述第卜皮束成形 處理部所獲得之音源信號與於前述雜訊樂音降低增益算 出部中算出之增益相乘而得之乘算結果中所含之雜音: 分算出;及 殘留雜音磨制增益算出部,其基於利用前述雜訊樂音 降低增益算出部所算出之增益、與利用前述雜音均㈣ 部所算出之前述雜音成分,而算出用以對利用前述第i 波束成形處理部所獲得之音源信號相乘之增益、即用以 壓制利用前述第1 & $ a·、+ 於m Μ 部所獲得之音源信號與 、以雜δίι樂音降低增益算出部中算出之增益相乘心 之乘异結果中所含之殘留雜音之增益;JL 亏 算Γ音源分離部基於利㈣留雜音壓制增益算出部所 '與利用前述第丨波束成形處 源信號之乘算社果,έ二、^又传之音 果自别述混合音中將來自前述目椤立 源之音源信號分離。 k㈢铩曰 7·:=項6之音源分離裝置,其中具有 則述每個頻率的加權係數,控制前述雜, 雜音均衡器邱、《 a 4 、前述 、°及則述殘留雜音壓制增益算出1巾 一者。 叫卟T至少 8 ·如請求項1至7 φ 至7中任一項之音源分離裝置,其 基準遲延量篡屮泣 ^、肯· 异出心其依每個頻率算出對來自前述麥 157757.doc 201222533 克風對中至少一者之麥克風之輸出信號相乘、而使該麥 ^克風的位置假設性移動之基準遲延量;及定向性控制 部1對於來自前述麥克風對中至少—方之麥克風之輸 出^號,依每個頻帶賦予遲延量; 則述定向性控制部於基準遲延量算出部所算出之前述 :準遲延量滿足空間抽樣定理之頻帶中,將該基準遲延 ,作為前述遲延量,於前述基準遲延量未滿足空間抽樣 定理之頻帶t ’將由下述式⑽求出之最佳遲延量⑽ 為前述遲延量(惟下述式⑽中,鸱2個麥克風間距離, ^^為音速,ω為頻率), [數1] d + τ〇 · c = (30) ^ τ〇 = ~ 9· -種音源分離裝置,其特徵為:其係自混合有自複數個 音源發出之音源信號之混合音中將來自目標音源之音源 k號分離者,且具備: /1波束成形處理機構,其藉由對於來自包含被輸入 別述混合音之2個麥克風之麥克風對之各自的輸出传 5虎’乘以不同之第1係數,並將獲得之結果在頻率區域 進行積和運算,以與連結前述2個麥克風之線段交又之 平面為界,使自與包含前述目標音源的方向之區域相反 之區域傳來之音源信號衰減; 第2波束成形處理機構,其藉由對於來自前述麥克風 157757.doc 201222533 對之各自的輸出信號,乘以前述不同之第1係數與在頻 率區域處於複數共軛關係之第2係數,將獲得之結果在 頻率區域進行積和運算,以前述平面為界,使自包含前 述目標音源的方向之區域傳來之音源信號衰減; 功率計算機構,其基於利用前述第1波束成形處理機 構所獲仔之彳5號計算具有每個頻率的功率值之第1頻譜 資訊,再者,基於利用前述第2波束成形處理機構所獲 仵之4號计算具有每個頻率的功率值之第2頻譜資訊丨及 加權係數算出機構,其因應前述第丨頻譜資訊與前述 第2頻譜資訊之每個頻率的功率值之差值,算出用以對 於刖述第1波束成形處理機構所獲得之信號相乘之每個 頻率的加權係數;且包含 曰源刀離機構,其基於前述第1波束成形處理機構 所獲付之仏號、與前述加權係數算出機構算出之前述 T權係數之乘算結果,自前述混合音中將來自前述目 心曰源之音源信號分離。 ίο 如請求項9之音源分離奘罟 ^ 、置其中進而包含加權係數乘 、將利用刖述第1波束成形處理機構所獲得之 ,號'與前述加權係數算出機構算出之前述加權係數相 則返音源分離機構基於將 山u 於將則述加權係數乘算機構的車 出結果與自前述第1波凌 弟/皮束成形處理機構所獲得之信號i; 特疋的比例相加之社要 庐立1 ^ 自則述混合音中將來自前述目 k a源之音源信號分離。 157757.doc 201222533 ii. 一種音源分離方法,其特徵為: 其係由包含第m束成形處理部、第2波束成形處理 部、功率計算部、加㈣數算㈣及音源分離部之音源 分離裝置所執行者,且包含: 第1步驟,其由前述第i波束成形處理部對於來自包 2被輸人混合有自複數個音源發出之音源信號之混合 曰之2個麥克風之麥克風對之各自的輸出信號,在使 用彼此不同之第丨係數之頻率區域進行積和運算,以 與連結前述2個麥克風之線段交又之平面為界,使自 與包含目標音源的方向之區域相反之區域傳來 信號衰減; .第2步驟’其由前述第2波束成形處理部對於來自前 述麥克風對之各自的輸出信號’乘以前述彼此不同之 第1 =數與在頻率區域處於複數共輛關係之第2係數, 將獲仔之結果在頻率區域進行積和運算,以前述平面 為界,使自包含前述目標音源的方向之區域傳來之音 源信號衰減; 第3步驟,其由前述功率計算部基於利用前述第!步 ^獲传之信號計算具有每個頻率的功率值之第1頻 ’再者’基於利用前述第2步驟所獲得之信號 計,具有每個頻率的功率值之第2頻譜資訊; 僅=步驟,其由前述加權係數算出部因應前述第丄頻 : 、別述第2頻譜資訊之每個頻率的功率值之差 值’异出用以對於前述第i步驟所獲得之信號相乘之 157757.doc 201222533 每個頻率的加權係數;及 第5步驟,其由前述音源分離部基於 驟所獲得之护啼 ^ 則建第1步 之仏戒、與在前述第4步驟中所算出 加權係數之乘算結果’自前述混合音中將來=前述 標音源之音源信號分離。 將來自前述目 12· 一種在電腦中用以執行以下步驟之程式, 第1處理步驟,其對於來自包 個音源發出之…D 輸说合有自複數 S…彳。旎之混合音之2個麥克風之麥券π 對之各自的輸出信號,在使用彼此不同之^克風 一:域進仃積和運.算’以與連結前述2個麥克 父又之平面為界,使自與包含目標音源的方向之心 反之區域傳來之音源信號衰減; W域相 出Γ:理乘步驟」其對於來自前述麥克風對之各自的輸 。』乘以别述彼此不同之第1係數與在頻率 於複數共辆關係之第2係數,· π &頻Μ域處 進行積和γ 第2係數’料叙結果在頻率區域 源的方广,以前述平面為界’使自包含前述目標音 …的方向之區域傳來之音源信號衰減; 第二處理步驟’其基於利用前述第^處理步驟所獲得之 。號叶异具有每個頻率的功率值之第】頻譜資訊,再 ^ ’基於利用前述第2處理步驟所獲得之信號計算具有 母個頻率的功率值之第2頻譜資訊; ,第4處理步驟,其因應前述第1頻譜資訊與前述第2頻 :資訊之每個頻率的功率值之差值,算出用以對於前述 1步驟所獲得之信號相乘之每個頻率的加權係數;及 157757.doc 201222533
    ,··*:. 第5處理步驟,其基於利用前述第1處理步驟所獲得之 信號與在前述第4處理步驟中所算出之前述加權係數之 乘算結果,自前述混合音中將來自前述目標音源之音源 信號分離。 157757.doc
TW100130572A 2010-08-25 2011-08-25 Sound source separator device, sound source separator method, and program TW201222533A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010188737 2010-08-25

Publications (1)

Publication Number Publication Date
TW201222533A true TW201222533A (en) 2012-06-01

Family

ID=45723148

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100130572A TW201222533A (en) 2010-08-25 2011-08-25 Sound source separator device, sound source separator method, and program

Country Status (8)

Country Link
US (1) US20130142343A1 (zh)
EP (1) EP2562752A4 (zh)
JP (1) JP5444472B2 (zh)
KR (1) KR101339592B1 (zh)
CN (1) CN103098132A (zh)
BR (1) BR112012031656A2 (zh)
TW (1) TW201222533A (zh)
WO (1) WO2012026126A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113921027A (zh) * 2021-12-14 2022-01-11 北京清微智能信息技术有限公司 一种基于空间特征的语音增强方法、装置及电子设备

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5738020B2 (ja) * 2010-03-11 2015-06-17 本田技研工業株式会社 音声認識装置及び音声認識方法
CN102447993A (zh) * 2010-09-30 2012-05-09 Nxp股份有限公司 声音场景操纵
JP5566846B2 (ja) * 2010-10-15 2014-08-06 本田技研工業株式会社 ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法
JP5845760B2 (ja) * 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
US8943014B2 (en) 2011-10-13 2015-01-27 National Instruments Corporation Determination of statistical error bounds and uncertainty measures for estimates of noise power spectral density
US8712951B2 (en) * 2011-10-13 2014-04-29 National Instruments Corporation Determination of statistical upper bound for estimate of noise power spectral density
KR101987966B1 (ko) * 2012-09-03 2019-06-11 현대모비스 주식회사 차량용 어레이 마이크의 음성 인식 향상 시스템 및 그 방법
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US20160210957A1 (en) * 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
CN105229737B (zh) * 2013-03-13 2019-05-17 寇平公司 噪声消除麦克风装置
US9312826B2 (en) 2013-03-13 2016-04-12 Kopin Corporation Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
AT514412A1 (de) * 2013-03-15 2014-12-15 Commend Internat Gmbh Verfahren zur Erhöhung der Sprachverständlichkeit
JP2014219467A (ja) * 2013-05-02 2014-11-20 ソニー株式会社 音信号処理装置、および音信号処理方法、並びにプログラム
EP2819429B1 (en) * 2013-06-28 2016-06-22 GN Netcom A/S A headset having a microphone
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
US9497528B2 (en) * 2013-11-07 2016-11-15 Continental Automotive Systems, Inc. Cotalker nulling based on multi super directional beamformer
WO2015129760A1 (ja) * 2014-02-28 2015-09-03 日本電信電話株式会社 信号処理装置、方法及びプログラム
US10176823B2 (en) 2014-05-09 2019-01-08 Apple Inc. System and method for audio noise processing and noise reduction
US9990939B2 (en) * 2014-05-19 2018-06-05 Nuance Communications, Inc. Methods and apparatus for broadened beamwidth beamforming and postfiltering
CN105100338B (zh) * 2014-05-23 2018-08-10 联想(北京)有限公司 降低噪声的方法和装置
CN104134444B (zh) * 2014-07-11 2017-03-15 福建星网视易信息系统有限公司 一种基于mmse的歌曲去伴奏方法和装置
DE102015203600B4 (de) * 2014-08-22 2021-10-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. FIR-Filterkoeffizientenberechnung für Beamforming-Filter
EP3029671A1 (en) * 2014-12-04 2016-06-08 Thomson Licensing Method and apparatus for enhancing sound sources
US20170287499A1 (en) * 2014-09-05 2017-10-05 Thomson Licensing Method and apparatus for enhancing sound sources
EP3010017A1 (en) * 2014-10-14 2016-04-20 Thomson Licensing Method and apparatus for separating speech data from background data in audio communication
CN105702262A (zh) * 2014-11-28 2016-06-22 上海航空电器有限公司 一种头戴式双麦克风语音增强方法
CN105989851B (zh) * 2015-02-15 2021-05-07 杜比实验室特许公司 音频源分离
CN106157967A (zh) 2015-04-28 2016-11-23 杜比实验室特许公司 脉冲噪声抑制
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9460727B1 (en) * 2015-07-01 2016-10-04 Gopro, Inc. Audio encoder for wind and microphone noise reduction in a microphone array system
US9613628B2 (en) 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
US9401158B1 (en) * 2015-09-14 2016-07-26 Knowles Electronics, Llc Microphone signal fusion
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
US10643633B2 (en) * 2015-12-02 2020-05-05 Nippon Telegraph And Telephone Corporation Spatial correlation matrix estimation device, spatial correlation matrix estimation method, and spatial correlation matrix estimation program
EP3335217B1 (en) * 2015-12-21 2022-05-04 Huawei Technologies Co., Ltd. A signal processing apparatus and method
GB2549922A (en) 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
CN107404684A (zh) * 2016-05-19 2017-11-28 华为终端(东莞)有限公司 一种采集声音信号的方法和装置
EP3253075B1 (en) * 2016-05-30 2019-03-20 Oticon A/s A hearing aid comprising a beam former filtering unit comprising a smoothing unit
CN107507624B (zh) * 2016-06-14 2021-03-09 瑞昱半导体股份有限公司 声源分离方法与装置
JP6888627B2 (ja) * 2016-08-23 2021-06-16 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム
GB201615538D0 (en) 2016-09-13 2016-10-26 Nokia Technologies Oy A method , apparatus and computer program for processing audio signals
EP3324406A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
JP6436180B2 (ja) * 2017-03-24 2018-12-12 沖電気工業株式会社 収音装置、プログラム及び方法
US10311889B2 (en) * 2017-03-20 2019-06-04 Bose Corporation Audio signal processing for noise reduction
JP6472823B2 (ja) * 2017-03-21 2019-02-20 株式会社東芝 信号処理装置、信号処理方法および属性付与装置
CN107135443B (zh) * 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10187721B1 (en) * 2017-06-22 2019-01-22 Amazon Technologies, Inc. Weighing fixed and adaptive beamformers
JP6686977B2 (ja) * 2017-06-23 2020-04-22 カシオ計算機株式会社 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム
CN108630216B (zh) * 2018-02-15 2021-08-27 湖北工业大学 一种基于双麦克风模型的mpnlms声反馈抑制方法
US10755728B1 (en) * 2018-02-27 2020-08-25 Amazon Technologies, Inc. Multichannel noise cancellation using frequency domain spectrum masking
WO2019231632A1 (en) 2018-06-01 2019-12-05 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN110610718B (zh) * 2018-06-15 2021-10-08 炬芯科技股份有限公司 一种提取期望声源语音信号的方法及装置
CN110931028B (zh) * 2018-09-19 2024-04-26 北京搜狗科技发展有限公司 一种语音处理方法、装置和电子设备
EP3854108A1 (en) 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
CN111175727B (zh) * 2018-11-13 2022-05-03 中国科学院声学研究所 一种基于条件波数谱密度的宽带信号方位估计的方法
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
CN113841419A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、系统及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
CN110244260B (zh) * 2019-06-17 2021-06-29 杭州电子科技大学 基于声能流矢量补偿的水下目标高精度doa估计方法
JP2022545113A (ja) 2019-08-23 2022-10-25 シュアー アクイジッション ホールディングス インコーポレイテッド 指向性が改善された一次元アレイマイクロホン
WO2021070278A1 (ja) * 2019-10-09 2021-04-15 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
CN111179960B (zh) * 2020-03-06 2022-10-18 北京小米松果电子有限公司 音频信号处理方法及装置、存储介质
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
US11290814B1 (en) 2020-12-15 2022-03-29 Valeo North America, Inc. Method, apparatus, and computer-readable storage medium for modulating an audio output of a microphone array
WO2022165007A1 (en) 2021-01-28 2022-08-04 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
CN113362864B (zh) * 2021-06-16 2022-08-02 北京字节跳动网络技术有限公司 音频信号处理的方法、装置、存储介质及电子设备
CN114166334B (zh) * 2021-11-23 2023-06-27 中国直升机设计研究所 一种非消声风洞旋翼噪声测点的声衰减系数校准方法
CN114979902B (zh) * 2022-05-26 2023-01-20 珠海市华音电子科技有限公司 一种基于改进的变步长ddcs自适应算法的降噪拾音方法
TWI812276B (zh) * 2022-06-13 2023-08-11 英業達股份有限公司 振噪影響硬碟效能的測試方法與系統

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3795610B2 (ja) * 1997-01-22 2006-07-12 株式会社東芝 信号処理装置
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
JP4247037B2 (ja) 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
JP4096104B2 (ja) * 2005-11-24 2008-06-04 国立大学法人北陸先端科学技術大学院大学 雑音低減システム及び雑音低減方法
DE102006047982A1 (de) * 2006-10-10 2008-04-24 Siemens Audiologische Technik Gmbh Verfahren zum Betreiben einer Hörfilfe, sowie Hörhilfe
JP5305743B2 (ja) * 2008-06-02 2013-10-02 株式会社東芝 音響処理装置及びその方法
US8577677B2 (en) * 2008-07-21 2013-11-05 Samsung Electronics Co., Ltd. Sound source separation method and system using beamforming technique
EP2192794B1 (en) * 2008-11-26 2017-10-04 Oticon A/S Improvements in hearing aid algorithms
JP5207479B2 (ja) * 2009-05-19 2013-06-12 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
KR101761312B1 (ko) * 2010-12-23 2017-07-25 삼성전자주식회사 마이크 어레이를 이용한 방향성 음원 필터링 장치 및 그 제어방법
JP5543023B2 (ja) * 2011-05-24 2014-07-09 三菱電機株式会社 目的音強調装置およびカーナビゲーションシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113921027A (zh) * 2021-12-14 2022-01-11 北京清微智能信息技术有限公司 一种基于空间特征的语音增强方法、装置及电子设备
CN113921027B (zh) * 2021-12-14 2022-04-29 北京清微智能信息技术有限公司 一种基于空间特征的语音增强方法、装置及电子设备

Also Published As

Publication number Publication date
EP2562752A4 (en) 2013-10-30
KR20120123566A (ko) 2012-11-08
US20130142343A1 (en) 2013-06-06
KR101339592B1 (ko) 2013-12-10
JPWO2012026126A1 (ja) 2013-10-28
BR112012031656A2 (pt) 2016-11-08
WO2012026126A1 (ja) 2012-03-01
EP2562752A1 (en) 2013-02-27
JP5444472B2 (ja) 2014-03-19
CN103098132A (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
TW201222533A (en) Sound source separator device, sound source separator method, and program
JP4896449B2 (ja) 音響信号処理方法、装置及びプログラム
US9053697B2 (en) Systems, methods, devices, apparatus, and computer program products for audio equalization
US9269367B2 (en) Processing audio signals during a communication event
US8831936B2 (en) Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
JP5410603B2 (ja) マルチチャネル信号の位相ベースの処理のためのシステム、方法、装置、およびコンピュータ可読媒体
JP5038550B1 (ja) ロバストな雑音低減のためのマイクロフォンアレイサブセット選択
KR101470262B1 (ko) 다중-마이크로폰 위치 선택적 프로세싱을 위한 시스템들, 방법들, 장치, 및 컴퓨터 판독가능 매체
US7464029B2 (en) Robust separation of speech signals in a noisy environment
JP6002690B2 (ja) オーディオ入力信号処理システム
US9215527B1 (en) Multi-band integrated speech separating microphone array processor with adaptive beamforming
US8611552B1 (en) Direction-aware active noise cancellation system
US20150172807A1 (en) Apparatus And A Method For Audio Signal Processing
US20160240210A1 (en) Speech Enhancement to Improve Speech Intelligibility and Automatic Speech Recognition
JP6187626B1 (ja) 収音装置及びプログラム
US20080031469A1 (en) Multi-channel echo compensation system
US20120263317A1 (en) Systems, methods, apparatus, and computer readable media for equalization
US20140025374A1 (en) Speech enhancement to improve speech intelligibility and automatic speech recognition
US20110288860A1 (en) Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair
WO2019140755A1 (zh) 一种基于麦克风阵列的回声消除方法与系统
TW201032220A (en) Systems, methods, apparatus, and computer-readable media for coherence detection
TW201030733A (en) Systems, methods, apparatus, and computer program products for enhanced active noise cancellation
JP2013518477A (ja) レベルキューによる適応ノイズ抑制
JP2005077731A (ja) 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム
JP5034735B2 (ja) 音処理装置およびプログラム