CN1549242A - 声音方向识别装置及方法 - Google Patents

声音方向识别装置及方法 Download PDF

Info

Publication number
CN1549242A
CN1549242A CNA031310036A CN03131003A CN1549242A CN 1549242 A CN1549242 A CN 1549242A CN A031310036 A CNA031310036 A CN A031310036A CN 03131003 A CN03131003 A CN 03131003A CN 1549242 A CN1549242 A CN 1549242A
Authority
CN
China
Prior art keywords
rightarrow
acoustic signals
mistiming
direction recognition
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA031310036A
Other languages
English (en)
Other versions
CN100489962C (zh
Inventor
罗立声
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lingtong Technology Co., Ltd.
Original Assignee
Sunplus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sunplus Technology Co Ltd filed Critical Sunplus Technology Co Ltd
Priority to CNB031310036A priority Critical patent/CN100489962C/zh
Publication of CN1549242A publication Critical patent/CN1549242A/zh
Application granted granted Critical
Publication of CN100489962C publication Critical patent/CN100489962C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明是有关于一种声音方向识别装置及方法,其利用复数音源搜寻单元接收复数声波信号,并对该等声波信号进行放大与滤波处理,以获得复数放大的声波信号,继而对该等放大的声波信号进行信号转换处理,以获得复数转换脉冲信号,并送至处理单元进行取样,以获得复数取样信号列,再通过该等取样信号列求出复数时间差,以由该等时间差以进行查表而得到该等声波信号的声音源位置。

Description

声音方向识别装置及方法
技术领域
本发明是关于声音方向识别的技术领域,尤指一种声音方向识别装置及方法。
背景技术
图1显示人体双耳接收声音的示意图,其中,音源由位置A产生,其声波将先后抵达左耳11与右耳12,因而产生一时间差,大脑则依据此时间差来识别声音的来源方向。在现实世界中,主要利用麦克风来收音,并通过二个以上麦克风来收音与识别声音方向。通常,利用二个无指向性麦克风识别音源方向有其限制,即该二个无指向性麦克风仅能识别左右两旁的音源而无法识别前后的音源,若要进行前后声音方向的识别则需要较为复杂的演算法或使用具指向性的麦克风,故通常在进行声音方向识别时大都利用三个无指向性麦克风来做360度的收音。
目前声音方向识别的技术主要有两种。第一种为波峰侦测法(PeakDetection Method),其主要对麦克风接收的声波进行放大、滤波以及积分处理,以使得声波成为类似的三角波,继而找出每一个麦克风相对应的三角波峰值(Peak),并比对该等峰值,以求出时间差,最后再利用数学运算式 ΔT = aθ + a sin θ c (中c为声速、ΔT为时间差)、以及图2所示的时间差与入射角度转换示意图,而求出声音入射角,以得到声波的音源位置。
第二种为相关值法(Cross-correlation Method),其主要将每一麦克风接收的声波经过适当的放大及滤波处理后,再通过模拟数字转换器(ADC)转换成数字资料,以供对该等不同麦克风相对应的数字资料进行相关值运算,以获得最大相关值(即时间差),并依据此最大相关值来找出声音入射角。
然而,上述两种方法都需要使用ADC,使得成本增高。另,一般的麦克风为电容式,由于每一个麦克风的等效电容值不相同,造成时间的递移(Shift)而影响方向判断,且上述相关值法需对很长的数字资料串进行统计等运算,不仅运算资料量庞大,甚至需要使用到乘法。因此,如何设计一种不受电容式麦克风差异的影响、不须使用到ADC以及不需太庞大计算的声音方向识别装置已成为一亟需解决的课题。
发明内容
本发明的主要目的在于提供一种声音方向识别装置及方法,能不需使用模拟数字转换器(ADC)、不受电容式麦克风差异的影响、不使用乘法以及不须庞大计算而来识别声音的方向。
依据本发明的一特色,所提供的声音方向识别装置包括:
复数个音源搜寻单元,每一音源搜寻单元接收一声波信号,并对该声波信号进行放大与滤波处理,以获得一放大的声波信号,继而对该放大的声波信号进行信号转换处理,以获得一转换脉冲信号;以及
一处理单元,与该等音源搜寻单元相连接,以供对该等音源搜寻单元输出的转换脉冲信号进行取样,以获得复数取样信号列,继而以一最大相似值法通过该等取样信号列来求出复数时间差,以由该等时间差进行查表而得到该等声波信号的声音源位置。
所述的声音方向识别装置,其中每一音源搜寻单元还包括一前级放大器与一信号侦测器,以供将该声波信号转换为具有高位状态与低位状态的转换脉冲信号。
所述的声音方向识别装置,其中每一音源搜寻单元还包括一收音器与一后级滤波放大器,该前级放大器分别与该收音器及该后级滤波放大器相连接,该信号侦测器分别与该后级放大器及该处理单元相连接。所述的声音方向识别装置,其中该等取样信号列以 x → 1 , x → 2 , x → 3 ∈ { 1,0 } 表示,该处理单元对该等取样信号列的取样长度为L,且该等时间差是以Δ1,Δ2,Δ3表示,当中,Δ1为 时间差,Δ2为 的时间差,Δ3为
Figure A0313100300058
的时间差。
所述的声音方向识别装置,其中该最大相似值法是依据下述函式运作:L(a|x)=f(a|x)for a in A and x in S,且若a为Δ1,则 x = x → 1 ( n ) · x → 2 ( n + Δ 1 ) , 若a为Δ2,则 x = x → 2 ( n ) · x → 3 ( n + Δ 2 ) , 若a为Δ3,则 x = x → 3 ( n ) · x → 1 ( n + Δ 3 ) , A为可能的时间差且A∈{0,Δpossible max},S∈{1,0},以供找出该等时间差,并使得相对的L(a|x)=f(x|a)最大化。
所述的声音方向识别装置,其中每一前级放大器是以一双载子晶体管作为驱动器。
所述的声音方向识别装置,其中该晶体管为NPN晶体管。
所述的声音方向识别装置,其中每一信号侦测器为零交越侦测器(ZeroCrossing Detector,ZCD)。
所述的声音方向识别装置,其中该处理单元通过一入射角对应表进行查表,该入射角对应表具有复数预设时间差与复数入射角度值,供以该等时间差比对该等预设时间差而求得对应的入射角度值,以得到该等声波信号的声音源位置。
依据本发明的另一特色,所提供的声音方向识别方法包括下述步骤:
一识别参数设定步骤,用以设定至少一取样长度参数与一识别次数参数;
一声波信号转换步骤,接收复数声波信号,并将其转换成复数转换脉冲信号;
一取样步骤,依据该取样长度参数来对该等转换脉冲信号进行取样,并通过一最大相似值法求出复数时间差;以及
一查表步骤,将该等时间差对照一入射角对应表,以获得复数声波信号入射角,供由该等声波信号入射角求出该等声波信号的音源位置。
所述的声音方向识别方法,还包括一平均步骤,以当该查表步骤获得该等声波信号入射角后,暂存该等声波信号入射角,并依据该识别次数参数进行复数次该取样步骤与该查表动作,以供获得复数组该等声波信号入射角,以进行平均处理。
所述的声音方向识别方法,进行平均处理前,先排除极大或极小入射角。
所述的声音方向识别方法,其中该最大相似值法依据下述函式运作:L(a|x)=f(a|x)for a in A and x in S,且若a为Δ1,则 x = x → 1 ( n ) · x → 2 ( n + Δ 1 ) , 若a为Δ2,则 x = x → 2 ( n ) · x → 3 ( n + Δ 2 ) , 若a为Δ3,则 x = x → 3 ( n ) · x → 1 ( n + Δ 3 ) , A为可能的时间差且A∈{0,Δpossible max},S∈{1,0},以供找出该等时间差,并使得相对的L(a|x)=f(x|a)最大化,当中, x → 1 , x → 2 , x → 3 ∈ { 1,0 } 为该等转换脉冲信号的取样信号列,L为该取样长度参数,
Figure A0313100300076
Figure A0313100300078
为该等时间差,Δ1为
Figure A0313100300079
Figure A03131003000710
的时间差,Δ2为 的时间差,Δ3为
Figure A03131003000713
的时间差。
附图说明
图1为人耳接收声音的示意图。
图2为时间差与入射角度转换示意图。
图3为本发明一较佳实施例的功能方块图。
图4为本发明一较佳实施例的音源搜寻单元的电路示意图。
图5为本发明一较佳实施例的麦克风摆设示意图。
图6为本发明一较佳实施例的动作流程图。
具体实施方式
有关本发明的较佳实施例,请参照图3显示的功能方块图,其主要由三组音源搜寻单元31,32,33与处理单元34所组成,其中,每一音源搜寻单元31,32,33分别具有麦克风311,321,331、前级放大器312,322,332、后极滤波放大器313,323,333以及信号侦测器314、324、334。
每一音源搜寻单元31,32,33的输出端皆与处理单元34的输入端相连接,供通过麦克风311,321,331接收复数声波信号,并将该等声波信号转换成复数转换脉冲信号,以输出至处理单元34进行声音方向辨识处理。麦克风311,321,331的输出端与前级放大器312,322,332的输入端相连接,前级放大器312,322,332的输出端则与后极滤波放大器313,323,333的输入端相连接,后极滤波放大器313,323,333的输出端则连接至该等信号侦测器314,324、334。
于本实施例中,前级放大器312,322,332采用双载子晶体管作为驱动器,例如为采用NPN双载子晶体管,以供利用控制电流方式来避免公知电容式麦克风所产生的时间递移(Shift)影响,且可将麦克风311,321,331收音的声波信号进行前级放大,以将声波信号的特征表现出来。于本实施例中,信号侦测器314、324、334较佳为零交越侦测器(Zero CrossingDetector,ZCD),以供对该等声波信号进行侦测而产生具有高位状态与低位状态的转换脉冲信号(即零交越信号)。
前述的音源搜寻单元31,32,33可以一般所知的电子元件所实现,图4即显示一音源搜寻单元31,32,33的一种电路示意图,另图5显示该等麦克风311,321,331的摆设位置图,其中,该等麦克风311,321,331概分别位于一正三角形的三顶点。而有关处理单元34如何对声音信号进行辨识,将于下述加以解说。
图6显示本发明的声音方向识别方法的流程图,首先,设定欲进行识别的次数(N)以及取样长度(L)(步骤S601),接著,开始通过麦克风311,321,331接收音源发出的复数声波信号,并利用前级放大器312,322,332将该等声波信号予以放大,以将声波信号的特征表现出来,并利用后极滤波放大器313,323,333对已进行前级放大的声波信号再做一次后级放大与滤波处理,以使得该等声波信号能够被信号侦测器314、324、334侦测(步骤S602),当然,滤波处理亦可利用外加的额外元件进行滤波处理。
接著,信号侦测器314、324、334对放大的声波信号进行零交越信号侦测,以产生复数个高位状态与低位状态的转换脉冲信号(步骤S603),并将该等转换脉冲信号送至处理单元34。处理单元34则依据一预设的取样频率(fs)来对该等转换脉冲信号进行取样,以获得复数组相对应的取样信号列(步骤S604),其中,预设的取样频率依照图5中该等麦克风311,321,331的间距来设定,该等取样信号列是以 x → 1 , x → 2 , x → 3 ∈ { 1,0 } 表示,该等取样信号列的取样长度为L。
当处理单元34取得每一组放大的声音信号的取样信号列后,于步骤S605中,再通过最大相似值法来由该等取样信号列求出复数组时间差,亦即,每一组时间差是由两组不同的取样信号列求出,其中,且该等时间差是以Δ1,Δ2,Δ3表示,当中,Δ1为 时间差,Δ2为
Figure A0313100300086
Figure A0313100300087
的时间差,Δ3为
Figure A0313100300089
的时间差,最大相似值法依据下述函式动作:
L(a|x)=f(a|x)for a in A and x in S,其中,若a为Δ1,则 x = x → 1 ( n ) · x → 2 ( n + Δ 1 ) , 若a为Δ2,则 x = x → 2 ( n ) · x → 3 ( n + Δ 2 ) , 若a为Δ3,则 x = x → 3 ( n ) · x → 1 ( n + Δ 3 ) , A为可能的时间差且A∈{0,Δpossible max},S∈{1,0},以供找出该等时间差,并使得相对的L(a|x)=f(x|a)最大化。由于处理单元34所处理的信号∈{0,1},故其进行运算时所利用的相关乘法运算可由AND逻辑运算取代,以降低运算量。
之后,于步骤S606中,处理单元34将该等时间差比对一入射角对应表(图未示),此入射角对应表具有复数时间差值与相对应的复数入射角度,且此入射角对应表依据麦克风311,321,331摆设的位置、图2所示的时间差与入射角度转换示意图、以及数学运算式 ΔT = aθ + a sin θ c 而预先内建完成,当然,处理单元34亦可直接使用数学运算式来求出入射角度,但这将会造成处理单元34的运算负担。
而由于麦克风311,321,331接收声音信号到取样完成的阶段可能会有稍许的误差,为了降低误差因素,运算单元34求出入射角度后可先利用通过暂存器或缓冲器暂时储存,并依据先前设定的识别次数再次重覆执行步骤S604、步骤S605以及步骤S606,以获得复数个入射角度,继而排除极大或极小的可能偏差数值(入射角)后,再对该等入射角度进行排序平均等统计上的处理,以获得一较为接近的入射角度(步骤S607),之后,再由该入射角度求出音源的位置(步骤S608)。
由以上说明可知,本发明主要利用双载子晶体管的前级放大对麦克风所接收的声音信号进行前级放大,并利用零交越侦测器来将声音信号转换为具有高位状态与低位状态的转换脉冲信号,继而利用处理单元对该等转换脉冲信号进行取样,以获得复数取样信号列,以供通过最大相似值法来对该等取样信号列求出时间差,最后再利用查表法来求出声音信号入射角度,以找出音源位置,能不需使用模拟数字转换器(ADC)、不受电容式麦克风差异的影响、不使用乘法以及不须庞大计算而来识别声音的方向。
上述实施例仅是为了方便说明而举例而已,本发明所主张的权利范围自应以申请专利范围所述为准,而非仅限于上述实施例。

Claims (13)

1、一种声音方向识别装置,包括:
复数个音源搜寻单元,每一音源搜寻单元接收一声波信号,并对该声波信号进行放大与滤波处理,以获得一放大的声波信号,继而对该放大的声波信号进行信号转换处理,以获得一转换脉冲信号;以及
一处理单元,与该等音源搜寻单元相连接,以供对该等音源搜寻单元输出的转换脉冲信号进行取样,以获得复数取样信号列,继而以一最大相似值法通过该等取样信号列来求出复数时间差,以由该等时间差进行查表而得到该等声波信号的声音源位置。
2、如权利要求1所述的声音方向识别装置,其特征在于,其中每一音源搜寻单元还包括一前级放大器与一信号侦测器,以供将该声波信号转换为具有高位状态与低位状态的转换脉冲信号。
3、如权利要求2所述的声音方向识别装置,其特征在于,其中每一音源搜寻单元还包括一收音器与一后级滤波放大器,该前级放大器分别与该收音器及该后级滤波放大器相连接,该信号侦测器分别与该后级放大器及该处理单元相连接。
4、如权利要求1所述的声音方向识别装置,其特征在于,其中该等取样信号列以 x → 1 , x → 2 , x → 3 ∈ { 1,0 } 表示,该处理单元对该等取样信号列的取样长度为L,且该等时间差是以Δ1,Δ2,Δ3表示,当中,Δ1为
Figure A031310030002C3
时间差,Δ2为
Figure A031310030002C4
的时间差,Δ3为
Figure A031310030002C6
的时间差。
5、如权利要求4所述的声音方向识别装置,其特征在于,其中该最大相似值法是依据下述函式运作:L(a|x)=f(a|x)for a in A and x in S,且若a为Δ1,则 x = x → 1 ( n ) · x → 2 ( n + Δ 1 ) , 若a为Δ2,则 X = x → 2 ( n ) · x → 3 ( n + Δ 2 ) , 若a为Δ3,则 X = x → 3 ( n ) · x → 1 ( n + Δ 3 ) , A为可能的时间差且A∈{0,Δpossible max},S∈{1,0},以供找出该等时间差,并使得相对的L(a|x)=f(x|a)最大化。
6、如权利要求2所述的声音方向识别装置,其特征在于,其中每一前级放大器是以一双载子晶体管作为驱动器。
7、如权利要求6所述的声音方向识别装置,其特征在于,其中该晶体管为NPN晶体管。
8、如权利要求2所述的声音方向识别装置,其特征在于,其中每一信号侦测器为零交越侦测器(Zero Crossing Detector,ZCD)。
9、如权利要求1所述的声音方向识别装置,其特征在于,其中该处理单元通过一入射角对应表进行查表,该入射角对应表具有复数预设时间差与复数入射角度值,供以该等时间差比对该等预设时间差而求得对应的入射角度值,以得到该等声波信号的声音源位置。
10、一种声音方向识别方法,包括下述步骤:
一识别参数设定步骤,用以设定至少一取样长度参数与一识别次数参数;
一声波信号转换步骤,接收复数声波信号,并将其转换成复数转换脉冲信号;
一取样步骤,依据该取样长度参数来对该等转换脉冲信号进行取样,并通过一最大相似值法求出复数时间差;以及
一查表步骤,将该等时间差对照一入射角对应表,以获得复数声波信号入射角,供由该等声波信号入射角求出该等声波信号的音源位置。
11、如权利要求10所述的声音方向识别方法,其特征在于,还包括一平均步骤,以当该查表步骤获得该等声波信号入射角后,暂存该等声波信号入射角,并依据该识别次数参数进行复数次该取样步骤与该查表动作,以供获得复数组该等声波信号入射角,以进行平均处理。
12、如权利要求11所述的声音方向识别方法,其特征在于,进行平均处理前,先排除极大或极小入射角。
13、如权利要求10所述的声音方向识别方法,其特征在于,其中该最大相似值法系依据下述函式运作:L(a|x)=f(a|x)for a in A and x in S,且若a为Δ1,则 x = x → 1 ( n ) · x → 2 ( n + Δ 1 ) , 若a为Δ2,则 X = x → 2 ( n ) · x → 3 ( n + Δ 2 ) , 若a为Δ3,则 X = x → 3 ( n ) · x → 1 ( n + Δ 3 ) , A为可能的时间差且A∈{0,Δpossible max},S∈{1,0},以供找出该等时间差,并使得相对的L(a|x)=f(x|a)最大化,当中, x → 1 , x → 2 , x → 3 ∈ { 1,0 } 为该等转换脉冲信号的取样信号列,L为该取样长度参数,
Figure A031310030003C5
为该等时间差,Δ1为
Figure A031310030003C6
Figure A031310030003C7
的时间差,Δ2为
Figure A031310030003C9
的时间差,Δ3为 的时间差。
CNB031310036A 2003-05-14 2003-05-14 声音方向识别装置及方法 Expired - Fee Related CN100489962C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB031310036A CN100489962C (zh) 2003-05-14 2003-05-14 声音方向识别装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031310036A CN100489962C (zh) 2003-05-14 2003-05-14 声音方向识别装置及方法

Publications (2)

Publication Number Publication Date
CN1549242A true CN1549242A (zh) 2004-11-24
CN100489962C CN100489962C (zh) 2009-05-20

Family

ID=34322755

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031310036A Expired - Fee Related CN100489962C (zh) 2003-05-14 2003-05-14 声音方向识别装置及方法

Country Status (1)

Country Link
CN (1) CN100489962C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101218853B (zh) * 2005-07-08 2010-12-22 雅马哈株式会社 音频传输系统及通信会议装置
CN104977869A (zh) * 2015-07-15 2015-10-14 成都陌云科技有限公司 一种智能声音识别机器人内专用的处理器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101218853B (zh) * 2005-07-08 2010-12-22 雅马哈株式会社 音频传输系统及通信会议装置
CN104977869A (zh) * 2015-07-15 2015-10-14 成都陌云科技有限公司 一种智能声音识别机器人内专用的处理器

Also Published As

Publication number Publication date
CN100489962C (zh) 2009-05-20

Similar Documents

Publication Publication Date Title
CN110197670B (zh) 音频降噪方法、装置及电子设备
CN107644650B (zh) 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
CN103871418B (zh) 一种扩声系统啸叫频点的检测方法及装置
CN101030383A (zh) 声源分离装置、方法和程序
TW200424547A (en) Device and method to identify the direction of sound
CN101061743A (zh) 音频信号增强的方法和设备
CN111445920A (zh) 一种多声源的语音信号实时分离方法、装置和拾音器
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN1823512A (zh) 用于粗略和精细的频率同步和时间同步的方法和装置
CN103760520B (zh) 一种基于avs和稀疏表示的单语者声源doa估计方法
CN1945689A (zh) 一种从歌曲中提取伴奏乐的方法及其装置
CN103576126A (zh) 基于神经网络的四通道阵列声源定位系统
CN1549242A (zh) 声音方向识别装置及方法
CN112017658A (zh) 一种基于智能人机交互的操作控制系统
CN108962276B (zh) 一种语音分离方法及装置
CN103000183A (zh) 语音增强方法
CN101079261A (zh) 抑制环境噪声的语音提取电路
CN1212609C (zh) 基于人耳听觉特性的语音信号时间延迟估计方法
CN108269583B (zh) 一种基于时间延迟直方图的语音分离方法
CN1317691C (zh) 一种自适应谷点降噪方法及系统
CN1295678C (zh) 子带自适应谷点降噪系统和方法
CN114267370A (zh) 一种基于频域处理的啸叫抑制方法及装置
CN113820662A (zh) 一种声源方向定位检测方法
CN112071297B (zh) 一种矢量声的自适应滤波方法
US8442825B1 (en) Biomimetic voice identifier

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LINGTONG TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: LINGYANG SCIENCE AND TECHNOLOGY CO., LTD.

Effective date: 20130124

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130124

Address after: Hsinchu, Taiwan, China Science Industry Park Road Du eight, building 3

Patentee after: Lingtong Technology Co., Ltd.

Address before: China Taiwan Hsinchu county science park innovation all the way No. 19

Patentee before: Lingyang Science and Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090520

Termination date: 20160514

CF01 Termination of patent right due to non-payment of annual fee