TWI690921B - 收音處理裝置及其收音處理方法 - Google Patents

收音處理裝置及其收音處理方法 Download PDF

Info

Publication number
TWI690921B
TWI690921B TW107129575A TW107129575A TWI690921B TW I690921 B TWI690921 B TW I690921B TW 107129575 A TW107129575 A TW 107129575A TW 107129575 A TW107129575 A TW 107129575A TW I690921 B TWI690921 B TW I690921B
Authority
TW
Taiwan
Prior art keywords
radio
sound
sound source
source
weight
Prior art date
Application number
TW107129575A
Other languages
English (en)
Other versions
TW202009927A (zh
Inventor
張祉棚
高全淵
Original Assignee
緯創資通股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 緯創資通股份有限公司 filed Critical 緯創資通股份有限公司
Priority to TW107129575A priority Critical patent/TWI690921B/zh
Priority to CN201811140667.6A priority patent/CN110858943B/zh
Priority to US16/226,579 priority patent/US10873805B2/en
Publication of TW202009927A publication Critical patent/TW202009927A/zh
Application granted granted Critical
Publication of TWI690921B publication Critical patent/TWI690921B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]

Abstract

本發明提供一種收音處理裝置及其收音處理方法,其包括下列步驟。取得複數聲音訊號,而這些聲音訊號對應複數收音源。判斷聲音來源相對於那些收音源的聲音來源位置。依據此聲音來源位置改變那些收音源對應複數收音方向之間的關係,而收音方向相關於那些收音源的指向性。基於那些收音方向之間的關係輸出那複數聲音訊號。藉此,可自動調整對應於聲音來源的最佳收音方向,從而提升收音品質。

Description

收音處理裝置及其收音處理方法
本發明是有關於一種聲音訊號處理技術,且特別是有關於一種收音處理裝置及其收音處理方法。
長久以來,人們習慣使用麥克風來錄製聲音或將聲音放大輸出。雖然使用者都想讓麥克風僅針對目標聲音來源來收錄,但大部分使用者通常難以建立沒有聲音干擾源的環境。因此,傳統的麥克風可能會受外界聲音、回音等因素而影響收錄聲音的品質。而隨著科技進步,麥克風波束成形(beamforming)技術已被提出並被廣泛使用,以解決前述問題。在基於波束成形演算法所形成的波束圖形(beam pattern)內的聲音可清楚地收錄,而在波束圖形以外的聲音將大幅衰減。使用者將目標聲音來源置於波束圖形的範圍內,即能減少干擾源的收音能量,並使目標聲音是清楚且大聲的。然 而,大部分具有波束成形技術的麥克風僅能提供單一收音方向。雖然少部分麥克風能提供二個以上收音方向,但也僅限於這些特定收音方向的切換,且無法涵蓋所有方向。因此,為了使波束成形技術能發揮功效,使用者需要自行將目標聲音來源移動到特定範圍內,相當不便。
有鑑於此,本發明提供一種收音處理裝置及其收音處理方法,可自動調整對應於聲音來源的最佳收音方向,從而提升收音品質。
本發明的收音處理方法,其包括下列步驟。取得複數聲音訊號,而這些聲音訊號對應複數收音源。判斷聲音來源相對於那些收音源的聲音來源位置。依據此聲音來源位置改變那些收音源對應複數個收音方向之間的關係。而收音方向相關於那些收音源的指向性(directionality)。基於那些收音方向之間的關係輸出那複數聲音訊號。
在本發明的一實施例中,上述那些收音方向之間的關係包括那些方向的權重,而依據聲音來源位置改變那些收音源對應那些收音方向之間的關係包括下列步驟。將那複數聲音訊號形成複數組收音組合,而各收音組合包括那些收音源其中一者或一者以上,且各收音組合形成那些收音方向中的一者。依據那些收音組合的收音方向決定對應權重。
在本發明的一實施例中,上述中將那些聲音訊號形成複數組收音組合包括下列步驟。依據波束成形(beamforming)演算法決定對應收音組合的收音方向。
在本發明的一實施例中,上述的波束成形演算法是差分麥克風陣列(Differential Microphone Array,DMA)演算法,而依據波束成形演算法決定對應收音組合的收音方向包括下列步驟。利用此差分麥克風陣列演算法處理對應收音組合中的聲音訊號。
在本發明的一實施例中,上述依據那複數收音組合的收音方向決定對應權重值之前,更包括下列步驟。決定假想中心。提供以此假想中心為圓心的數個假想來源方向,而各假想來源方向具有那些收音組合對應的初估權重。
在本發明的一實施例中,上述依據那些收音組合的收音方向決定對應權重包括下列步驟。判斷此聲音來源位置相對於此假想中心的聲音來源方向。依據最接近此聲音來源方向的對應假想來源方向的初估權重來決定那些收音組合對應的權重。
在本發明的一實施例中,上述依據那些收音組合的收音方向決定對應權重包括下列步驟。判斷此聲音來源位置相對於此假想中心的聲音來源方向。選擇波束圖形(beam pattern)涵蓋此聲音來源方向的收音組合。
在本發明的一實施例中,上述基於決定的權重值輸出那些聲音訊號包括下列步驟。對那些收音組合以決定的對應權重進行加權運算。
在本發明的一實施例中,上述判斷那些聲音訊號對應的聲音來源位置包括下列步驟。基於聲源定位(Sound Source Localization,SSL)技術來決定此聲音來源方向。
本發明的收音處理裝置,其包括儲存器及處理器。儲存器儲存數個模組及複數聲音訊號。這些模組包括來源偵測模組、權重決定模組及聲音輸出模組。而這些聲音訊號對應複數個收音源。處理器耦接儲存器,並執行儲存器所儲存的那些模組。來源偵測模組判斷聲音來源相對於那些收音源對應的聲音來源位置。權重決定模組依據此聲音來源位置改變那些收音源對應複數收音方向的權重。而收音方向相關於那些收音源的指向性。聲音輸出模組基於那些收音方向之間的關係輸出那些聲音訊號。
在本發明的一實施例中,上述的那些收音方向之間的關係包括那些方向的權重,而權重決定模組將那些聲音訊號形成複數組收音組合,而各收音組合包括那些收音源其中一者或一者以上,且各收音組合形成那些收音方向中的一者。權重決定模組並依據那些收音組合的收音方向決定對應權重。
在本發明的一實施例中,上述的權重決定模組依據波束成形演算法決定對應收音組合的收音方向。
在本發明的一實施例中,上述的權重決定模組利用差分麥克風陣列演算法處理對應收音組合中的聲音訊號。
在本發明的一實施例中,上述的權重決定模組決定假想中心,並提供以此假想中心為圓心的數個假想來源方向,而各假想 來源方向具有那些收音組合對應的初估權重。
在本發明的一實施例中,上述的權重決定模組判斷此聲音來源位置相對於此假想中心的聲音來源方向,並依據最接近此聲音來源方向的假想來源方向的初估權重來決定那複數收音組合對應的權重。
在本發明的一實施例中,上述那些模組更包括輸出決定模組。權重決定模組判斷此聲音來源位置相對於此假想中心的聲音來源方向,而輸出決定模組選擇波束圖形涵蓋此聲音來源方向的那些收音組合。
在本發明的一實施例中,上述的權重決定模組對那複數收音組合以決定的對應權重進行加權運算。
在本發明的一實施例中,上述的來源偵測模組基於聲源定位技術來決定此聲音來源位置。
在本發明的一實施例中,上述的處理器更連接數台收音裝置,而各收音裝置對應於那些收音源中的一者並取得那些收音訊號中的一者。
基於上述,本發明實施例的收音處理裝置及其收音處理方法,可將數台收音裝置所取得的聲音訊號透過波束成形演算法形成多組收音波束圖形,再基於聲音來源相對於這些收音裝置的聲音來源方向,來決定這些波束圖形對應收音方向的權重。最後,即可以此權重來對聲音訊號處理,使此聲音來源能更加清楚,且大幅減少外界雜訊。此外,反應於聲音來源方向的變動,本發明實施 例亦能動態改變權重,從而隨時以最佳的收音方向來接收聲音。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
1:收音處理裝置
M0~Mn:收音裝置
130:儲存器
150:處理器
131:來源偵測模組
133:權重決定模組
135:輸出決定模組
137:聲音輸出模組
S210~S270、S510~S550:步驟
S:聲音來源
θ:夾角
δ:長度
τ1:延遲
HL:濾波係數
α1,1:係數
BP1~BP15:波束圖形
DMA_1~DMA4:訊號
圖1是依據本發明一實施例之收音處理裝置的元件方塊圖。
圖2是依據本發明一實施例之收音處理方法的流程圖。
圖3A是一範例說明收音裝置的配置位置及其波束圖形。
圖3B是差分麥克風陣列(DMA)演算法的示意圖。
圖3C是不同波束圖形的示意圖。
圖4A-4C是不同權重值所形成的最佳收音方向。
圖5A是依據本發明一實施例之收音裝置的配置位置及其波束圖形。
圖5B是依據本發明一實施例之收音處理方法的流程圖。
圖5C是一範例說明收音來源方向對應至聲音來源方向。
圖5D是不同權重值所形成的最佳收音方向。
圖1是依據本發明一實施例之收音處理裝置1的元件方塊圖。請參照圖1,收音處理裝置1包括但不僅限於數台收音裝置M0~Mn、儲存器130及處理器150。n是大於一的正整數。
收音裝置M0~Mn包括但不僅限於麥克風(例如,動圈式(dynamic)、電容式(Condenser)、駐極體電容(Electret Condenser)、微機電(Micro Electrical-Mechanical System,MEMS)等類型,並可能是全指向(Omnidirectional)或指向性(directional))或其他可接收聲波(例如,人聲、環境聲、機器運作聲等)而轉換為聲音訊號的電子元件、類比至數位轉換器、濾波器、及音訊處理器。於本實施例中,各收音裝置M0~Mn反應於聲波之接收而產生一組/一筆聲音訊號,使收音處理裝置1得到複數聲音訊號。此外,各收音裝置M0~Mn於本實施例中可作為軟韌體程式中參數或變數其中的一個收音源(即對應到一個收音源),而各收音源即是接收一組/一筆聲音訊號的代表,其可能賦予對應編號或識別碼(例如,收音裝置的編號M0~Mn等);而在其他實施例中,此收音源亦可被稱為是實體的收音裝置M0~Mn。例如,收音源可為收音處理裝置1內建之多個麥克風,或是將多個麥克風外接於收音處理裝置1。
儲存器130可以是任何型態的固定或可移動隨機存取記憶體(Radom Access Memory,RAM)、唯讀記憶體(Read Only Memory,ROM)、快閃記憶體(flash memory)、傳統硬碟(Hard Disk Drive,HDD)、固態硬碟(Solid-State Drive,SSD)或類似元件,並用以記錄程式碼、軟體模組(例如,來源偵測模組131、權重決定模組133、輸出決定模組135、聲音輸出模組137等)、聲音訊號、權重值、收音源、聲音來源、聲音來源方向、假想來源方向與初估權重值對照表、波束成形演算法及其他資料或檔案,其詳細內容待 後續實施例詳述。
處理器150耦接收音裝置M0~Mn及儲存器130,處理器150並可以是中央處理單元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processing,DSP)、可程式化控制器、特殊應用積體電路(Application-Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。在本發明實施例中,處理器150用以執行收音處理裝置1的所有作業。
需說明的是,圖1的實施例呈現收音裝置M0~Mn內建於收音處理裝置1,然於其他實施例中,收音裝置M0~Mn亦可能透過各類型數位或類比音源線而外接於收音處理裝置1,收音裝置M0~Mn甚至可以無線通訊技術(例如,藍牙、Wi-Fi等)傳送聲音訊號至處理器150。
為了方便理解本發明實施例的操作流程,以下將舉諸多實施例詳細說明本發明實施例中針對聲音訊號的處理流程。下文中,將搭配收音處理裝置1中的各項裝置、元件及模組說明本發明實施例所述之方法。本方法的各個流程可依照實施情形而隨之調整,且並不僅限於此。
圖2是依據本發明一實施例之收音處理方法的流程圖。請參照圖2,處理器150透過各收音源(各收音裝置M0~Mn)取得對應的各組聲音訊號(步驟S210)。於本實施例中,權重決定模組133將那些聲音訊號形成複數組收音組合,而各收音組合包括一組 或一組以上的聲音訊號(例如,某一收音組合包括收音裝置M0及M2的聲音訊號,而另一收音組合包括收音裝置M3、M4及M5的聲音訊號,端視應用者依據需求自行調整各收音組合所包含的聲音訊號),且各收音組合形成一個收音方向。此收音方向是指收音組合反應於特定角度的靈敏度或增益值最佳(即,相關於收音源的指向性(directionality)或是波束圖形(可能是全指向(Omnidirectional)、心形(Cardioid)、強心形(Hypercardioid)、及超心形(Supercardioid)等)),例如,收音裝置M0~Mn位置延伸至其波束圖形最外點所形成的方向。
指向的收音裝置M0~Mn已可形成特定收音方向,即一個指向的收音裝置M0~Mn可形成一組收音組合。而針對全指向的收音裝置M0~Mn,權重決定模組133可利用波束成形演算法決定對應一組收音組合的收音方向。換句而言,權重決定模組133係基於波束成形演算法將多個收音裝置M0~Mn組合成一組收音組合,並形成指向的(directional)波束圖形。
波束成形演算法有很多種。以差分麥克風陣列(DMA)演算法為例,圖3A是一範例說明收音裝置的配置位置及其波束圖形。假設收音裝置M0置於假想圓心且與收音裝置M1並排成一條假想直線(陣列)。請隨同參照圖3B所繪示差分麥克風陣列演算法的示意圖。假設聲音來源S位置至收音裝置M0,M1的假想直線與兩收音裝置M0,M1相連之假想直線形成夾角θ,而兩收音裝置M0,M1相距長度為δ。聲音來源S位置較接近於收音裝置M1, 使得聲音來源S的聲波抵達收音裝置M0的時間相較於收音裝置M1會有延遲τ1。兩收音裝置M0,M1的聲音訊號相減後會經濾波處理(濾波係數HL)。此外,請接著參照圖3C是不同波束圖形的示意圖,隨圖3B所示係數α1,1的改變,可形成如圖3C所示偶形(Dipole)(α1,1=0)、心形(α1,1=-1)、強心形(α1,1=-1/2)、及超心形(α1,1=-1/
Figure 107129575-A0305-02-0012-18
)的波束圖形。而圖3A所示波束圖形BP1即是選擇心形的對應係數α1,1。藉此,權重決定模組133可利用差分麥克風陣列演算法處理各組收音組合中的聲音訊號,使各組收音組合形成對應的指向性收音方向。
需說明的是,差分麥克風陣列演算法是將陣列(由收音裝置M0~Mn排列所形成,本發明實施例不限制各陣列包含收音裝置的數量)的聲音訊號同步相減後輸出,在其他實施例中,採用不同波束成形演算法(例如,延遲-和(delay-sum)、濾波-和(filter-sum)、最小變異無失真響應(Minimum Variance Distortionless Response,MVDR)等)亦可能是將陣列的聲音訊號同步相加後輸出。此外,本發明不加以限制波束成形演算法的類型,只要是能形成具有特定指向性收音方向的波束圖形皆能應用。
此外,應用本發明實施例者可依據需求自行調整各收音組合的收音方向。例如,若處理器150形成三組收音組合,則處理器150可將兩相鄰收音組合的收音方向間隔例如120度。而若處理器150形成四組收音組合,則處理器150可將兩相鄰收音組合的收音方向間隔例如90度。
另一方面,請回到圖2,當處理器150接收到來自收音裝置M0~Mn的聲音訊號時,來源偵測模組131亦可將判斷聲音來源相對於這些收音源對應的聲音來源位置(步驟S230)。於本實施例中,來源偵測模組131係基於聲源定位(Sound Source Localization,SSL)技術來決定此聲音來源位置。例如,如圖3B所示,來源偵測模組131可由收音裝置M0與收音裝置M1之間的延遲τ1及兩收音裝置M0,M1相距長度為δ,來推算夾角θ(τ1=δcos(θ),ε為聲波速度)。而此夾角即為聲音來源(即,目標發聲對象,例如,人聲、環境聲、音樂聲等)所處位置(即聲音來源位置)相對於圖3A所示收音裝置M0所處的假想中心的聲音來源方向。
需說明的是,聲源定位的演算法還有很多種,本發明不加以限制。此外,本發明實施例僅需要得到聲音來源相對於收音源(收音裝置M0~Mn)或收音組合的收音方向即可。
接著,權重決定模組133依據此聲音來源位置改變那些收音源對應那些收音方向之間的關係(步驟S250)。於本實施例中,那些收音方向之間的關係包括那些收音方向的權重(例如,比重/比例、多個權重值等)。而權重決定模組133依據那些收音組合的收音方向決定對應權重。具體而言,單一收音組合或單一收音裝置M0~Mn僅能形成單一收音方向,當聲音來源位置改變時,收音裝置110收錄的聲音訊號可能因聲音來源不在收音方向附近而大幅衰減,從而影響收音品質。為了解決前述問題,本發明實施例結合兩組以上的不同收音方向的收音組合,並對那些收音組合的聲音 訊號以對應的權重值進行加權運算(即,各收音組合的聲音訊號與對應權重值相乘後加總),從而得出新的收音方向。而此新的收音方向可能會不同於結合的這些收音組合的收音方向。
舉例而言,圖4A-4C是不同權重值所形成的最佳收音方向。請先參照圖4A,假設收音裝置M0,M1形成一組收音組合,若以收音裝置M0為假想圓心,則其波束圖形BP2對應的收音方向為0度。收音裝置M0,M3形成另一組收音組合,若以收音裝置M0為假想圓心,則其波束圖形BP3對應的收音方向為270度。若權重決定模組133分別對波束圖形BP2,BP3賦予1:1的權重值,則對這兩組收音組合的聲音訊號進行加權運算,即能形成波束圖形BP4,且波束圖形BP4的收音方向為315度。
請參照圖4B,假設收音裝置M0,M1的收音組合形成波束圖形BP5,而此波束圖形BP5對應的收音方向為0度。假設收音裝置M0,M3的收音組合形成波束圖形BP6,而此波束圖形BP6對應的收音方向為270度。權重決定模組133分別對波束圖形BP5,BP6賦予1:2的權重值,則形成波束圖形BP7,且波束圖形BP7的收音方向為287度。與圖4A相比,權重值的改變,將會形成不同的收音方向。
請參照圖4C,假設收音裝置M0,M2的收音組合形成波束圖形BP8,而此波束圖形BP8對應的收音方向為30度。假設收音裝置M0,M3的收音組合形成波束圖形BP9,而此波束圖形BP9對應的收音方向為270度。權重決定模組133分別對波束圖形BP8, BP9賦予1:1的權重值,則形成波束圖形BP10,且波束圖形BP10的收音方向為330度。與圖4A相比,某一組收音組合的收音方向的改變,亦會形成不同的收音方向。
需說明的是,圖4A~4C中收音裝置M0~M3的擺放位置及收音組合僅作為範例來說明,本發明不加以限制其位置或組合(例如,收音裝置M0可離開假想圓心,收音裝置M1可更加接近收音裝置M0,收音裝置M1,M3可形成一組收音組合)。又或者,同時擺設收音裝置M0~M3,以形成三組收音組合(例如,收音裝置M0與M1、收音裝置M0與M2、及收音裝置M0與M3)。應用者可依據需求增加或減少收音裝置的數量,並據以改變收音組合的數量。
基於前述發明精神,權重決定模組133可決定假想中心,並提供以此假想中心為圓心的數個假想來源方向,而各假想來源方向具有那些收音組合對應的初估權重(例如,圖4A所示收音裝置M0處於假想中心)(初估權重可能包括比重或數個初估權重值)。於一實施例中,權重決定模組133可對各收音組合賦予特定初估權重值,再將兩組以上的收音組合以對應初估權重值進行加權運算,從而得到特定假想來源方向。接著,逐步改變(例如,增加/減少特定值)各收音組合的初估加權值,或改變不同收音組合的結合,從而建立假想來源方向與初估權重對照表。於另一實施例中,權重決定模組133亦可先決定數個假想來源方向,並分別計算不同收音組合對應的初估權重值,從而建立假想來源方向與初估權重對 照表。
接著,權重決定模組133判斷來源偵測模組131所偵測的聲音來源位置相對於前述假想中心的聲音來源方向(例如,圖4A中聲音來源S的聲音來源方向為315度,圖4B中聲音來源S的聲音來源方向為287度),並依據最接近此聲音來源方向的假想來源方向的對應初估權重來決定那些收音組合對應的權重。例如,權重決定模組133依據假想來源方向與初估權重值對照表,將最接近此聲音來源方向的假想來源方向的初估權重作為那些收音組合對應的權重值。或者,權重決定模組133逐步調整接近此聲音來源方向的假想來源方向的初估權重,使新的假想來源方向更加接近或等於聲音來源方向。
需說明的是,前述實施例係採用假想來源方向與初估權重對照表來決定權重,然於其他實施例中,權重決定模組133亦可直接依據聲音來源方向來直接推算各收音組合的對應權重值。
另一方面,在一些應用情境中,聲音來源位置可能較不適合部分收音組合來收音。以圖4A為例,假設聲音來源S的聲音來源位置移動至可形成90度角度的位置,收音裝置M0,M3之收音組合的波束圖形對於90度方向的敏感度較差。因此,本發明實施例的輸出決定模組135會選擇波束圖形涵蓋此聲音來源方向的那些收音組合。也就是說,權重決定模組133只要決定輸出決定模組135所選擇的那些收音組合的權重值。
接著,權重決定模組133對那些收音組合的聲音訊號(已 基於波束成形演算法處理)以決定的對應權重進行加權運算(即,各收音組合的聲音訊號與對應權重值相乘後加總),使聲音輸出模組137基於那些收音組合之間的關係(例如,各收音組合所占比重、或權重值等)輸出那些聲音訊號(步驟S270)。這些經處理的聲音訊號可進一步儲存於儲存器130或提供給其他外部裝置(例如,揚聲器、擴大機、語音辨識引擎或雲端伺服器等)。
為了讓讀者更加理解本發明精神,以下再舉一實施例說明。需說明的是,此實施例中的擺放位置、收音組合及數量僅是用於範例說明,應用者可依據需求自行調整。
圖5A是依據本發明一實施例之收音裝置M0~M4的配置位置及其波束圖形BP11~BP14。請參照圖5A,假設收音裝置M0,M1形成第一組收音組合,收音裝置M0,M2形成第二組收音組合,收音裝置M0,M3形成第三組收音組合,收音裝置M0,M4形成第四組收音組合。請隨同參照圖5B,圖5B是依據本發明一實施例之收音處理方法的流程圖。處理器150同時透過收音裝置M0~M4取得聲音訊號。權重決定模組133將各收音組合的聲音訊號使用差分麥克風陣列演算法處理,以得出各收音組合經演算法處理的訊號DMA_1~DMA4,且各收音組合形成如圖5A所示的波束圖形BP11~BP14(其收音方向分別為0度、90度、180度及270度)。請接著參照圖5B、5C,來源偵測模組131同時可基於聲源定位技術來判斷聲音來源位置,進而得出聲音來源相對於收音裝置M0所處假想中心的聲音來源方向(步驟S510)(如圖5C所示,假設聲音 來源S的聲音來源方向為315)。
輸出決定模組135依據各波束圖形BP11~BP14的涵蓋角度,判斷這些收音組合中的何者涵蓋此聲音來源方向(如圖5C所示,由於聲音來源方向介於270度到0度之間,因此輸出決定模組135選擇波束圖形BP11,13)。權重決定模組133可依據此聲音來源方向來查詢權重對照表(1),以得出波束圖形BP11,13(即,兩組收音組合)的對應加權值(1:1)(步驟S530)。
Figure 107129575-A0305-02-0018-1
權重決定模組133選擇訊號DMA_1及DMA4對應的收音組合(即,收音裝置M0與M1的收音組合、及收音裝置M0與M3的收音組合),並將這兩個收音組合的訊號DMA_1及DMA4各自乘上1的權重值再加總,即能得出以315度為收音方向的波束圖形BP15,聲音輸出模組137並依據對應的權重值來繼續收音, 直到聲音來源位置改變(步驟S550)。
請參照圖5D所繪示不同權重值所形成的最佳收音方向。以收音裝置M0,M1及收音裝置M0,M3兩個收音組合為例,改變對應權重值再對聲音訊號進行加權運算即可得到如圖所示的不同波束圖形,從而形成不同的收音方向。其餘收音組合亦可依此類推,使得收音處理裝置1可將收音組合的收音方向對應至任何聲音來源方向。
綜上所述,本發明實施例的收音處理裝置及其收音處理方法,可基於聲音來源位置自動調整兩組以上收音組合的收音方向,改變收音方向對應的權重,使這些收音組合的聲音訊號經加權運算後得出對應於聲音來源方向的新收音方向。藉此,使用者不用再手動調整收音裝置位置或手動切換收音裝置,從而符合實際應用情境。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
S210~S270:步驟

Claims (17)

  1. 一種收音處理方法,包括:取得複數聲音訊號,其中該複數聲音訊號對應於複數收音源,其中每一該收音源對應於一收音裝置以分別接收該複數聲音訊號;判斷一聲音來源相對於該複數收音源的一聲音來源位置;依據該聲音來源位置改變該複數收音源對應複數收音方向之間的一權重關係,其中該複數收音方向相關於該複數收音源的一指向性(directionality);以及基於該複數收音方向之間的該權重關係對該複數聲音訊號進行一加權總合,且輸出經該加權總合的該複數聲音訊號,其中在依據該聲音來源位置改變該複數收音源對應該複數收音方向之間的該權重關係的步驟中,包括:將該複數聲音訊號形成複數收音組合,其中每一該收音組合包括該複數收音源其中一者或一者以上,且每一該收音組合形成該複數收音方向中的一者;以及依據該複數收音組合的收音方向決定對應權重。
  2. 如申請專利範圍第1項所述的收音處理方法,其中將該複數聲音訊號形成該複數收音組合的步驟,包括:依據一波束成形(beamforming)演算法決定對應該收音組合的該收音方向。
  3. 如申請專利範圍第2項所述的收音處理方法,其中該波束成形演算法是一差分麥克風陣列(Differential Microphone Array,DMA)演算法,而依據該波束成形演算法決定對應該收音組合的收音方向的步驟包括:利用該差分麥克風陣列演算法處理對應該收音組合中的聲音訊號。
  4. 如申請專利範圍第1項所述的收音處理方法,其中依據該複數收音組合的收音方向決定對應權重的步驟之前,更包括:決定一假想中心;以及提供以該假想中心為圓心的複數假想來源方向,其中每一該假想來源方向具有該複數收音組合對應的初估權重。
  5. 如申請專利範圍第4項所述的收音處理方法,其中依據該複數收音組合的收音方向決定對應權重的步驟,包括:判斷該聲音來源位置相對於該假想中心的該聲音來源方向;以及依據最接近該聲音來源方向的對應該假想來源方向的初估權重來決定該複數收音組合對應的權重。
  6. 如申請專利範圍第4項所述的收音處理方法,其中依據該複數收音組合的收音方向決定對應權重的步驟,包括:判斷該聲音來源位置相對於該假想中心的該聲音來源方向;以及選擇波束圖形(beam pattern)涵蓋該聲音來源方向的該複數收音組合。
  7. 如申請專利範圍第1項所述的收音處理方法,其中基於該複數收音方向之間的關係輸出該複數聲音訊號的步驟,包括:對該複數收音組合以決定的對應該權重進行加權運算。
  8. 如申請專利範圍第1項所述的收音處理方法,其中判斷該複數聲音來源相對於該複數收音源的該聲音來源位置的步驟包括:基於聲源定位(Sound Source Localization,SSL)技術來決定該聲音來源位置。
  9. 一種收音處理裝置,包括:一儲存器,儲存複數模組、以及複數聲音訊號,其中該複數模組包括一來源偵測模組、一權重決定模組及一聲音輸出模組,而該複數聲音訊號對應於複數收音源,其中每一該收音源對應於一收音裝置以分別接收該複數聲音訊號;以及一處理器,耦接該儲存器,並執行該儲存器所儲存的該複數模組,其中該來源偵測模組,判斷一聲音來源相對於該複數收音源的聲音來源位置;該權重決定模組,依據該聲音來源位置改變該複數收音源對應複數收音方向之間的一權重關係,其中該複數收音方向相關於該複數收音源的一指向性;以及該聲音輸出模組,基於該複數收音方向之間的該權重關係對該複數聲音訊號進行一加權總合,且輸出經該加權總合的該 複數聲音訊號,其中該權重決定模組將該複數聲音訊號形成複數收音組合,其中每一該收音組合包括該複數收音源其中一者或一者以上,且每一該收音組合形成該複數收音方向中的一者,該權重決定模組並依據該複數收音組合的收音方向決定對應權重。
  10. 如申請專利範圍第9項所述的收音處理裝置,其中該權重決定模組依據一波束成形演算法決定對應該收音組合的收音方向。
  11. 如申請專利範圍第10項所述的收音處理裝置,其中該權重決定模組利用一差分麥克風陣列演算法處理對應該收音組合中的聲音訊號。
  12. 如申請專利範圍第9項所述的收音處理裝置,其中該權重決定模組決定一假想中心,並提供以該假想中心為圓心的複數假想來源方向,其中每一該假想來源方向具有該複數收音組合對應的初估權重。
  13. 如申請專利範圍第12項所述的收音處理裝置,其中該權重決定模組判斷該聲音來源位置相對於該假想中心的該聲音來源方向,並依據最接近該聲音來源方向的對應該假想來源方向的初估權重來決定該複數收音組合對應的權重。
  14. 如申請專利範圍第12項所述的收音處理裝置,其中該複數模組更包括:一輸出決定模組,其中該權重決定模組判斷該聲音來源相對於該假想中心的一聲音來源方向,而該輸出決定模組選擇波束圖 形涵蓋該聲音來源方向的該複數收音組合。
  15. 如申請專利範圍第9項所述的收音處理裝置,其中該權重決定模組對複數收音組合以決定的對應該複數權重進行加權運算。
  16. 如申請專利範圍第9項所述的收音處理裝置,其中該來源偵測模組基於聲源定位技術來決定該聲音來源位置。
  17. 如申請專利範圍第9項所述的收音處理裝置,其中該處理器更連接複數該收音裝置,而每一該收音裝置對應該複數收音源中的一者並取得該複數收音訊號中的一者。
TW107129575A 2018-08-24 2018-08-24 收音處理裝置及其收音處理方法 TWI690921B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW107129575A TWI690921B (zh) 2018-08-24 2018-08-24 收音處理裝置及其收音處理方法
CN201811140667.6A CN110858943B (zh) 2018-08-24 2018-09-28 收音处理装置及其收音处理方法
US16/226,579 US10873805B2 (en) 2018-08-24 2018-12-19 Sound processing apparatus and audio signals processing method thereof based on sound source position

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107129575A TWI690921B (zh) 2018-08-24 2018-08-24 收音處理裝置及其收音處理方法

Publications (2)

Publication Number Publication Date
TW202009927A TW202009927A (zh) 2020-03-01
TWI690921B true TWI690921B (zh) 2020-04-11

Family

ID=69586831

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107129575A TWI690921B (zh) 2018-08-24 2018-08-24 收音處理裝置及其收音處理方法

Country Status (3)

Country Link
US (1) US10873805B2 (zh)
CN (1) CN110858943B (zh)
TW (1) TWI690921B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113038329A (zh) * 2021-03-22 2021-06-25 深圳市科奈信科技有限公司 一种耳机收音控制方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201234873A (en) * 2010-12-03 2012-08-16 Fraunhofer Ges Forschung Sound acquisition via the extraction of geometrical information from direction of arrival estimates
TW201334580A (zh) * 2011-12-02 2013-08-16 Fraunhofer Ges Forschung 整合幾何空間音源編碼串流之設備及方法
CN108370470A (zh) * 2015-12-04 2018-08-03 森海塞尔电子股份有限及两合公司 具有麦克风阵列系统的会议系统以及会议系统中的语音获取方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2197219B1 (en) * 2008-12-12 2012-10-24 Nuance Communications, Inc. Method for determining a time delay for time delay compensation
WO2010092568A1 (en) * 2009-02-09 2010-08-19 Waves Audio Ltd. Multiple microphone based directional sound filter
ES2607116T3 (es) 2009-04-20 2017-03-29 Doosan Fuel Cell America, Inc. Fabricación de una pila de combustible con prevención de la migración de un electrolito líquido
CN102137318B (zh) * 2010-01-22 2014-08-20 华为终端有限公司 拾音控制方法和装置
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
CN102508204A (zh) * 2011-11-24 2012-06-20 上海交通大学 基于波束形成和传递路径分析的室内噪声源定位方法
US20130315402A1 (en) * 2012-05-24 2013-11-28 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
CN106486147A (zh) * 2015-08-26 2017-03-08 华为终端(东莞)有限公司 指向性录音方法、装置及录音设备
CN106448722B (zh) * 2016-09-14 2019-01-18 讯飞智元信息科技有限公司 录音方法、装置和系统
CN107993671A (zh) * 2017-12-04 2018-05-04 南京地平线机器人技术有限公司 声音处理方法、装置和电子设备
CN108419168A (zh) * 2018-01-19 2018-08-17 广东小天才科技有限公司 拾音设备的指向性拾音方法、装置、拾音设备及存储介质
CN108091344A (zh) * 2018-02-28 2018-05-29 科大讯飞股份有限公司 一种降噪方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201234873A (en) * 2010-12-03 2012-08-16 Fraunhofer Ges Forschung Sound acquisition via the extraction of geometrical information from direction of arrival estimates
TW201334580A (zh) * 2011-12-02 2013-08-16 Fraunhofer Ges Forschung 整合幾何空間音源編碼串流之設備及方法
CN108370470A (zh) * 2015-12-04 2018-08-03 森海塞尔电子股份有限及两合公司 具有麦克风阵列系统的会议系统以及会议系统中的语音获取方法

Also Published As

Publication number Publication date
CN110858943B (zh) 2022-01-21
TW202009927A (zh) 2020-03-01
CN110858943A (zh) 2020-03-03
US20200068301A1 (en) 2020-02-27
US10873805B2 (en) 2020-12-22

Similar Documents

Publication Publication Date Title
US11381906B2 (en) Conference system with a microphone array system and a method of speech acquisition in a conference system
CN107976651B (zh) 一种基于麦克风阵列的声源定位方法及装置
US10945080B2 (en) Audio analysis and processing system
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
US9100734B2 (en) Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation
US8229129B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
WO2014161309A1 (zh) 一种移动终端实现声源定位的方法及装置
CN110830895B (zh) 麦克风装置及其指向性调整方法
JP2014502439A (ja) 方向性高感度記録制御のためのシステム、方法、装置、及びコンピュータ可読媒体
WO2013049737A1 (en) Processing signals
WO2018173267A1 (ja) 収音装置および収音方法
US20180146285A1 (en) Audio Gateway System
TWI690921B (zh) 收音處理裝置及其收音處理方法
JP6849055B2 (ja) 収音装置および収音方法
US8064618B2 (en) Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program
WO2019073234A1 (en) REPRODUCTIVE ATTACK DETECTION
TWI757763B (zh) 電子裝置及其雙聲道音場平衡方法
US11778379B2 (en) System and method for omnidirectional adaptive loudspeaker
WO2023065317A1 (zh) 会议终端及回声消除方法
CN116390005A (zh) 无线多麦助听方法、助听器以及计算机可读存储介质
TW202019194A (zh) 減少干擾音影響之方法及聲音播放裝置
CN114023307A (zh) 声音信号处理方法、语音识别方法、电子设备和存储介质
JP2019054340A (ja) 信号処理装置およびその制御方法