CN1549242A

CN1549242A - 声音方向识别装置及方法

Info

Publication number: CN1549242A
Application number: CNA031310036A
Authority: CN
Inventors: 罗立声
Original assignee: Sunplus Technology Co Ltd
Current assignee: Lingtong Technology Co., Ltd.
Priority date: 2003-05-14
Filing date: 2003-05-14
Publication date: 2004-11-24
Anticipated expiration: 2023-05-14
Also published as: CN100489962C

Abstract

本发明是有关于一种声音方向识别装置及方法，其利用复数音源搜寻单元接收复数声波信号，并对该等声波信号进行放大与滤波处理，以获得复数放大的声波信号，继而对该等放大的声波信号进行信号转换处理，以获得复数转换脉冲信号，并送至处理单元进行取样，以获得复数取样信号列，再通过该等取样信号列求出复数时间差，以由该等时间差以进行查表而得到该等声波信号的声音源位置。

Description

声音方向识别装置及方法

技术领域

本发明是关于声音方向识别的技术领域，尤指一种声音方向识别装置及方法。

背景技术

图1显示人体双耳接收声音的示意图，其中，音源由位置A产生，其声波将先后抵达左耳11与右耳12，因而产生一时间差，大脑则依据此时间差来识别声音的来源方向。在现实世界中，主要利用麦克风来收音，并通过二个以上麦克风来收音与识别声音方向。通常，利用二个无指向性麦克风识别音源方向有其限制，即该二个无指向性麦克风仅能识别左右两旁的音源而无法识别前后的音源，若要进行前后声音方向的识别则需要较为复杂的演算法或使用具指向性的麦克风，故通常在进行声音方向识别时大都利用三个无指向性麦克风来做360度的收音。

目前声音方向识别的技术主要有两种。第一种为波峰侦测法(PeakDetection Method)，其主要对麦克风接收的声波进行放大、滤波以及积分处理，以使得声波成为类似的三角波，继而找出每一个麦克风相对应的三角波峰值(Peak)，并比对该等峰值，以求出时间差，最后再利用数学运算式

ΔT = \frac{aθ + a \sin θ}{c}

(中c为声速、ΔT为时间差)、以及图2所示的时间差与入射角度转换示意图，而求出声音入射角，以得到声波的音源位置。

第二种为相关值法(Cross-correlation Method)，其主要将每一麦克风接收的声波经过适当的放大及滤波处理后，再通过模拟数字转换器(ADC)转换成数字资料，以供对该等不同麦克风相对应的数字资料进行相关值运算，以获得最大相关值(即时间差)，并依据此最大相关值来找出声音入射角。

然而，上述两种方法都需要使用ADC，使得成本增高。另，一般的麦克风为电容式，由于每一个麦克风的等效电容值不相同，造成时间的递移(Shift)而影响方向判断，且上述相关值法需对很长的数字资料串进行统计等运算，不仅运算资料量庞大，甚至需要使用到乘法。因此，如何设计一种不受电容式麦克风差异的影响、不须使用到ADC以及不需太庞大计算的声音方向识别装置已成为一亟需解决的课题。

发明内容

本发明的主要目的在于提供一种声音方向识别装置及方法，能不需使用模拟数字转换器(ADC)、不受电容式麦克风差异的影响、不使用乘法以及不须庞大计算而来识别声音的方向。

依据本发明的一特色，所提供的声音方向识别装置包括：

复数个音源搜寻单元，每一音源搜寻单元接收一声波信号，并对该声波信号进行放大与滤波处理，以获得一放大的声波信号，继而对该放大的声波信号进行信号转换处理，以获得一转换脉冲信号；以及

一处理单元，与该等音源搜寻单元相连接，以供对该等音源搜寻单元输出的转换脉冲信号进行取样，以获得复数取样信号列，继而以一最大相似值法通过该等取样信号列来求出复数时间差，以由该等时间差进行查表而得到该等声波信号的声音源位置。

所述的声音方向识别装置，其中每一音源搜寻单元还包括一前级放大器与一信号侦测器，以供将该声波信号转换为具有高位状态与低位状态的转换脉冲信号。

所述的声音方向识别装置，其中每一音源搜寻单元还包括一收音器与一后级滤波放大器，该前级放大器分别与该收音器及该后级滤波放大器相连接，该信号侦测器分别与该后级放大器及该处理单元相连接。所述的声音方向识别装置，其中该等取样信号列以

\overset{&RightArrow;}{x} 1, \overset{&RightArrow;}{x} 2, \overset{&RightArrow;}{x} 3 &Element; {1,0}

表示，该处理单元对该等取样信号列的取样长度为L，且该等时间差是以Δ1,Δ2，Δ3表示，当中，Δ1为和时间差，Δ2为和的时间差，Δ3为

和的时间差。

所述的声音方向识别装置，其中该最大相似值法是依据下述函式运作：L(a|x)＝f(a|x)for a in A and x in S，且若a为Δ1，则

x = \overset{&RightArrow;}{x} 1 (n) \cdot \overset{&RightArrow;}{x} 2 (n + Δ 1),

若a为Δ2，则

x = \overset{&RightArrow;}{x} 2 (n) \cdot \overset{&RightArrow;}{x} 3 (n + Δ 2),

若a为Δ3，则

x = \overset{&RightArrow;}{x} 3 (n) \cdot \overset{&RightArrow;}{x} 1 (n + Δ 3),

A为可能的时间差且A∈{0，Δpossible max}，S∈{1，0}，以供找出该等时间差，并使得相对的L(a|x)＝f(x|a)最大化。

所述的声音方向识别装置，其中每一前级放大器是以一双载子晶体管作为驱动器。

所述的声音方向识别装置，其中该晶体管为NPN晶体管。

所述的声音方向识别装置，其中每一信号侦测器为零交越侦测器(ZeroCrossing Detector，ZCD)。

所述的声音方向识别装置，其中该处理单元通过一入射角对应表进行查表，该入射角对应表具有复数预设时间差与复数入射角度值，供以该等时间差比对该等预设时间差而求得对应的入射角度值，以得到该等声波信号的声音源位置。

依据本发明的另一特色，所提供的声音方向识别方法包括下述步骤：

一识别参数设定步骤，用以设定至少一取样长度参数与一识别次数参数；

一声波信号转换步骤，接收复数声波信号，并将其转换成复数转换脉冲信号；

一取样步骤，依据该取样长度参数来对该等转换脉冲信号进行取样，并通过一最大相似值法求出复数时间差；以及

一查表步骤，将该等时间差对照一入射角对应表，以获得复数声波信号入射角，供由该等声波信号入射角求出该等声波信号的音源位置。

所述的声音方向识别方法，还包括一平均步骤，以当该查表步骤获得该等声波信号入射角后，暂存该等声波信号入射角，并依据该识别次数参数进行复数次该取样步骤与该查表动作，以供获得复数组该等声波信号入射角，以进行平均处理。

所述的声音方向识别方法，进行平均处理前，先排除极大或极小入射角。

所述的声音方向识别方法，其中该最大相似值法依据下述函式运作：L(a|x)＝f(a|x)for a in A and x in S，且若a为Δ1，则

x = \overset{&RightArrow;}{x} 1 (n) \cdot \overset{&RightArrow;}{x} 2 (n + Δ 1),

若a为Δ2，则

x = \overset{&RightArrow;}{x} 2 (n) \cdot \overset{&RightArrow;}{x} 3 (n + Δ 2),

若a为Δ3，则

x = \overset{&RightArrow;}{x} 3 (n) \cdot \overset{&RightArrow;}{x} 1 (n + Δ 3),

A为可能的时间差且A∈{0，Δpossible max}，S∈{1，0}，以供找出该等时间差，并使得相对的L(a|x)＝f(x|a)最大化，当中，

\overset{&RightArrow;}{x} 1, \overset{&RightArrow;}{x} 2, \overset{&RightArrow;}{x} 3 &Element; {1,0}

为该等转换脉冲信号的取样信号列，L为该取样长度参数，

为该等时间差，Δ1为

和

的时间差，Δ2为和的时间差，Δ3为

和的时间差。

附图说明

图1为人耳接收声音的示意图。

图2为时间差与入射角度转换示意图。

图3为本发明一较佳实施例的功能方块图。

图4为本发明一较佳实施例的音源搜寻单元的电路示意图。

图5为本发明一较佳实施例的麦克风摆设示意图。

图6为本发明一较佳实施例的动作流程图。

具体实施方式

有关本发明的较佳实施例，请参照图3显示的功能方块图，其主要由三组音源搜寻单元31，32，33与处理单元34所组成，其中，每一音源搜寻单元31，32，33分别具有麦克风311，321，331、前级放大器312，322，332、后极滤波放大器313，323，333以及信号侦测器314、324、334。

每一音源搜寻单元31，32，33的输出端皆与处理单元34的输入端相连接，供通过麦克风311，321，331接收复数声波信号，并将该等声波信号转换成复数转换脉冲信号，以输出至处理单元34进行声音方向辨识处理。麦克风311，321，331的输出端与前级放大器312，322，332的输入端相连接，前级放大器312，322，332的输出端则与后极滤波放大器313，323，333的输入端相连接，后极滤波放大器313，323，333的输出端则连接至该等信号侦测器314，324、334。

于本实施例中，前级放大器312，322，332采用双载子晶体管作为驱动器，例如为采用NPN双载子晶体管，以供利用控制电流方式来避免公知电容式麦克风所产生的时间递移(Shift)影响，且可将麦克风311，321，331收音的声波信号进行前级放大，以将声波信号的特征表现出来。于本实施例中，信号侦测器314、324、334较佳为零交越侦测器(Zero CrossingDetector，ZCD)，以供对该等声波信号进行侦测而产生具有高位状态与低位状态的转换脉冲信号(即零交越信号)。

前述的音源搜寻单元31，32，33可以一般所知的电子元件所实现，图4即显示一音源搜寻单元31，32，33的一种电路示意图，另图5显示该等麦克风311，321，331的摆设位置图，其中，该等麦克风311，321，331概分别位于一正三角形的三顶点。而有关处理单元34如何对声音信号进行辨识，将于下述加以解说。

图6显示本发明的声音方向识别方法的流程图，首先，设定欲进行识别的次数(N)以及取样长度(L)(步骤S601)，接著，开始通过麦克风311，321，331接收音源发出的复数声波信号，并利用前级放大器312，322，332将该等声波信号予以放大，以将声波信号的特征表现出来，并利用后极滤波放大器313，323，333对已进行前级放大的声波信号再做一次后级放大与滤波处理，以使得该等声波信号能够被信号侦测器314、324、334侦测(步骤S602)，当然，滤波处理亦可利用外加的额外元件进行滤波处理。

接著，信号侦测器314、324、334对放大的声波信号进行零交越信号侦测，以产生复数个高位状态与低位状态的转换脉冲信号(步骤S603)，并将该等转换脉冲信号送至处理单元34。处理单元34则依据一预设的取样频率(fs)来对该等转换脉冲信号进行取样，以获得复数组相对应的取样信号列(步骤S604)，其中，预设的取样频率依照图5中该等麦克风311，321，331的间距来设定，该等取样信号列是以

\overset{&RightArrow;}{x} 1, \overset{&RightArrow;}{x} 2, \overset{&RightArrow;}{x} 3 &Element; {1,0}

表示，该等取样信号列的取样长度为L。

当处理单元34取得每一组放大的声音信号的取样信号列后，于步骤S605中，再通过最大相似值法来由该等取样信号列求出复数组时间差，亦即，每一组时间差是由两组不同的取样信号列求出，其中，且该等时间差是以Δ1，Δ2，Δ3表示，当中，Δ1为和时间差，Δ2为

和

的时间差，Δ3为和

的时间差，最大相似值法依据下述函式动作：

L(a|x)＝f(a|x)for a in A and x in S，其中，若a为Δ1，则

x = \overset{&RightArrow;}{x} 1 (n) \cdot \overset{&RightArrow;}{x} 2 (n + Δ 1),

若a为Δ2，则

x = \overset{&RightArrow;}{x} 2 (n) \cdot \overset{&RightArrow;}{x} 3 (n + Δ 2),

若a为Δ3，则

x = \overset{&RightArrow;}{x} 3 (n) \cdot \overset{&RightArrow;}{x} 1 (n + Δ 3),

A为可能的时间差且A∈{0，Δpossible max}，S∈{1，0}，以供找出该等时间差，并使得相对的L(a|x)＝f(x|a)最大化。由于处理单元34所处理的信号∈{0，1}，故其进行运算时所利用的相关乘法运算可由AND逻辑运算取代，以降低运算量。

之后，于步骤S606中，处理单元34将该等时间差比对一入射角对应表(图未示)，此入射角对应表具有复数时间差值与相对应的复数入射角度，且此入射角对应表依据麦克风311，321，331摆设的位置、图2所示的时间差与入射角度转换示意图、以及数学运算式

ΔT = \frac{aθ + a \sin θ}{c}

而预先内建完成，当然，处理单元34亦可直接使用数学运算式来求出入射角度，但这将会造成处理单元34的运算负担。

而由于麦克风311，321，331接收声音信号到取样完成的阶段可能会有稍许的误差，为了降低误差因素，运算单元34求出入射角度后可先利用通过暂存器或缓冲器暂时储存，并依据先前设定的识别次数再次重覆执行步骤S604、步骤S605以及步骤S606，以获得复数个入射角度，继而排除极大或极小的可能偏差数值(入射角)后，再对该等入射角度进行排序平均等统计上的处理，以获得一较为接近的入射角度(步骤S607)，之后，再由该入射角度求出音源的位置(步骤S608)。

由以上说明可知，本发明主要利用双载子晶体管的前级放大对麦克风所接收的声音信号进行前级放大，并利用零交越侦测器来将声音信号转换为具有高位状态与低位状态的转换脉冲信号，继而利用处理单元对该等转换脉冲信号进行取样，以获得复数取样信号列，以供通过最大相似值法来对该等取样信号列求出时间差，最后再利用查表法来求出声音信号入射角度，以找出音源位置，能不需使用模拟数字转换器(ADC)、不受电容式麦克风差异的影响、不使用乘法以及不须庞大计算而来识别声音的方向。

上述实施例仅是为了方便说明而举例而已，本发明所主张的权利范围自应以申请专利范围所述为准，而非仅限于上述实施例。