CN113156373A - 声源定位方法、数字信号处理装置及音频系统 - Google Patents
声源定位方法、数字信号处理装置及音频系统 Download PDFInfo
- Publication number
- CN113156373A CN113156373A CN202110448077.5A CN202110448077A CN113156373A CN 113156373 A CN113156373 A CN 113156373A CN 202110448077 A CN202110448077 A CN 202110448077A CN 113156373 A CN113156373 A CN 113156373A
- Authority
- CN
- China
- Prior art keywords
- signal
- frame
- target
- subband
- azimuth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请提供了一种声源定位方法、数字信号处理装置及音频系统,该方法包括:在统计时间段内重复执行下列步骤,得到多个第二方位角;基于得到的所有第二方位角,计算声源方位角;下列步骤包括:获取麦克风阵列中的每一个麦克风当前接收的一帧入射信号以及参考信号;基于当前的各帧入射信号,计算第一方位角;基于任意一帧入射信号和参考信号,判断扬声器当前是否为播放状态;若确定出扬声器当前不为播放状态,则将第一方位角确定为第二方位角。本技术方案中,通过对扬声器播放状态的判断,从而对各个第一方位角进行筛选,将扬声器不为播放状态对应的第一方位角确定为第二方位角,进而基于所有的第二方位角,计算声源方位角,实现准确定位声源方位。
Description
技术领域
本申请涉及数字信号处理技术领域,尤其涉及一种声源定位方法、数字信号处理装置及音频系统。
背景技术
声源定位技术是麦克风阵列中的基本问题之一,准确的定位结果,在通信、多媒体、视频会议和人机交互等多个领域都有着重要的应用价值。
现有的声源定位技术中,在统计时间段内,基于麦克风阵列中每个麦克风所接收的每一帧入射信号,确定初始方位角,基于统计周内的所有初始方位角,确定声源方位角;所确定的声源方位角通常为波束功率最大的方位角,对于自带扬声器的音频系统,由于扬声器距离麦克风很近,在不知道扬声器播放状态的情况下,可能会将扬声器所在的方位角确定为声源方位角。
发明内容
本申请提供了一种声源定位方法、数字信号处理装置及音频系统,目的在于解决对于自带扬声器的音频系统,由于扬声器距离麦克风很近,在不知道扬声器播放状态的情况下,可能会将扬声器所在的方位角确定为声源方位角的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种声源定位方法,应用于数字信号处理装置,所述方法包括:
在统计时间段内重复执行下列步骤,得到多个第二方位角;
基于得到的所有所述第二方位角,计算声源方位角;
所述下列步骤包括:
获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;所述参考信号为扬声器当前所播放的一帧信号;
基于当前的各帧入射信号,计算第一方位角;
基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态;所述目标入射信号为任意一帧入射信号;
若确定出所述扬声器当前不为播放状态,则将所述第一方位角确定为第二方位角。
上述的方法,可选的,所述基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态,包括:
计算目标入射信号和所述参考信号之间的相关度;
判断所述相关度是否大于相关度阈值;
若所述相关度大于所述相关度阈值,则确定出所述扬声器当前为播放状态;
若所述相关度不大于所述相关度阈值,则确定出所述扬声器当前不为播放状态。
上述的方法,可选的,所述计算目标入射信号和所述参考信号之间的相关度,包括:
分别将目标入射信号和所述参考信号划分为多个子带信号,得到所述目标入射信号对应的多个目标子带信号、以及所述参考信号对应的多个参考子带信号;
确定所述目标入射信号和参考信号均对应的帧标识;
基于所述帧标识、每个所述目标子带信号、以及每个所述参考子带信号,计算目标入射信号和所述参考信号之间的相关度。
上述的方法,可选的,所述基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,计算目标入射信号和所述参考信号之间的相关度,包括:
基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,通过皮尔森系数计算公式,计算目标入射信号和所述参考信号之间的相关度;
所述皮尔森系数计算公式为:
其中,pearson(l)为目标入射信号和所述参考信号之间的相关度,所述l为所述帧标识,所述k为子带信号的子带信号标识,所述D为子带信号的数量,所述x(l,k)表示帧标识为l子带信号标识为k的目标子带信号,所述y(l,k)表示帧标识为l子带信号标识为k的参考子带信号,所述子带信号为目标子带信号或参考子带信号。
上述的方法,可选的,所述基于当前的各帧入射信号,计算第一方位角,包括:
基于当前的各帧入射信号,确定每一帧入射信号的俯仰角和方位角;
针对每一帧入射信号,计算所述入射信号的俯仰角和方位角之间的余弦值,并基于所计算得到的余弦值,计算所述入射信号对应的时延;
基于每一帧入射信号对应的时延,计算波束输出功率;
将波束功率最大值所对应的方位角确定为第一方位角。
一种数字信号处理装置,包括:
获取单元,用于在统计时间段内重复执行下列步骤,得到多个第二方位角;
计算单元,用于基于得到的所有所述第二方位角,计算声源方位角;
所述下列步骤包括:
获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;所述参考信号为扬声器当前所播放的一帧信号;
基于当前的各帧入射信号,计算第一方位角;
基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态;所述目标入射信号为任意一帧入射信号;
若确定出所述扬声器当前不为播放状态,则将所述第一方位角确定为第二方位角。
上述的装置,可选的,所述获取单元,包括:
第一计算子单元,用于计算目标入射信号和所述参考信号之间的相关度;
判断子单元,用于判断所述相关度是否大于相关度阈值;
第一确定子单元,用于若所述相关度大于所述相关度阈值,则确定出所述扬声器当前为播放状态;
第二确定自单元,用于若所述相关度不大于所述相关度阈值,则确定出所述扬声器当前不为播放状态。
上述的装置,可选的,所述第一计算子单元,包括:
划分子单元,用于分别将目标入射信号和所述参考信号划分为多个子带信号,得到所述目标入射信号对应的多个目标子带信号、以及所述参考信号对应的多个参考子带信号;
第三确定子单元,用于确定所述目标入射信号和参考信号均对应的帧标识;
第二计算子单元,用于基于所述帧标识、每个所述目标子带信号、以及每个所述参考子带信号,计算目标入射信号和所述参考信号之间的相关度。
上述的装置,可选的,所述第二计算子单元执行基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,计算目标入射信号和所述参考信号之间的相关度,用于:
基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,通过皮尔森系数计算公式,计算目标入射信号和所述参考信号之间的相关度;
所述皮尔森系数计算公式为:
其中,pearson(l)为目标入射信号和所述参考信号之间的相关度,所述l为所述帧标识,所述k为子带信号的子带信号标识,所述D为子带信号的数量,所述x(l,k)表示帧标识为l子带信号标识为k的目标子带信号,所述y(l,k)表示帧标识为l子带信号标识为k的参考子带信号,所述子带信号为目标子带信号或参考子带信号。
一种音频系统,包括:
麦克风阵列、数字信号处理装置和扬声器;
所述数字信号处理装置分别与所述麦克风阵列和所述扬声器相连,用于执行上述的声源定位方法;
所述麦克风阵列包括至少一个麦克风,每一个麦克风用于接收入射信号;
所述扬声器,用于播放信号。
一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的声源定位方法。
一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的声源定位方法。
与现有技术相比,本申请包括以下优点:
本申请提供了一种声源定位方法、数字信号处理装置及音频系统,该方法包括:在统计时间段内重复执行下列步骤,得到多个第二方位角;基于得到的所有第二方位角,计算声源方位角;下列步骤包括:获取麦克风阵列中的每一个麦克风当前接收的一帧入射信号以及参考信号;参考信号为扬声器当前所播放的一帧信号;基于当前的各帧入射信号,计算第一方位角;基于目标入射信号和所述参考信号,判断扬声器当前是否为播放状态;目标入射信号为任意一帧入射信号;若确定出扬声器当前不为播放状态,则将第一方位角确定为第二方位角。本技术方案中,通过对扬声器播放状态的判断,从而对各个第一方位角进行筛选,将扬声器不为播放状态对应的第一方位角确定为第二方位角,进而基于所有的第二方位角,计算声源方位角,实现准确定位声源方位。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种声源定位方法的方法流程图;
图2为本申请提供的一种声源定位方法的另一方法流程图;
图3为本申请提供的一种声源定位方法的又一方法流程图;
图4为本申请提供的一种数字信号处理装置的结构示意图;
图5为本申请提供的一种音频系统的结构示意图;
图6为本申请提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本申请实施例提供了一种声源定位方法,该方法可以应用于数字信号处理装置,所述声源定位方法的方法流程图如图1所示,具体包括:
S101、在统计时间段内重复执行下列步骤,得到多个第二方位角。下列步骤包括:获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;基于当前的各帧入射信号,计算第一方位角;基于目标入射信号和参考信号,判断扬声器当前是否为播放状态;若确定出扬声器当前不为播放状态,则将第一方位角确定为第二方位角。目标入射信号为任意一帧入射信号。
本申请实施例提供的方法中,获取参考信号和麦克风阵列中的每一个麦克风当前接收的一帧入射信号,需要说明的是,在统计时间段内第一次执行获取参考信号和麦克风阵列中的每一个麦克风当前接收的一帧入射信号的时间点为统计时间段的开始时间点,其中,参考信号为扬声器当前所播放的一帧信号。
本申请实施例提供的方法中,对于每次获取得到的参考信号和各帧入射信号,基于当前的各帧入射信号,计算第一方位角,也就是说,第一方位角与麦克风阵列中每一个麦克风所接收的一帧入射信号相关联。具体的,第一方位角的计算可以是基于SRP定位算法进行计算。
本申请实施例提供的方法中,将任意一帧入射信号作为目标入射信号,即目标入射信号为当前的各帧入射信号中的任意一帧入射信号;基于目标入射信号和参考信号,判断扬声器的当前是否为播放状态,具体的,可以通过计算目标入射信号和参考信号之间的相关度,基于相关度,对扬声器的播放状态进行判断,当扬声器当前不为播放状态时,将第一方位角确定为第二方位角,当扬声器当前位播放状态时,则不将第一方位确定为第二方位角,根据SRP定位的原理,波束输出功率最大的方向即为声源方向,在扬声器为播放状态时,由于扬声器距离较近,此时计算角度为扬声器声源的方位,而非说话人,或外部环境噪声角度,因此不将第一方位确定为第二方位角。实现通过扬声器播放状态,对第一方位角进行筛选,只有放扬声器不为播放状态的情况下,才将第一方位角确定为第二方位角,否则不将第一方位角确定为第二方位角。
S102、基于得到的所有第二方位角,计算声源方位角。
基于得到的统计时间段内的所有第二方位角,计算声源方位角,需要说明的是,基于得到的统计时间段内的所有第二方位角,计算声源方位角的具体计算过程请参考现有技术,可选的,基于得到的统计时间段内的所有第二方位角,计算声源方位角的可实现方式为,对各个第二方位角计算平均值,将所计算得到的平均值作为声源方位角。
需要说明的是,本申请实施例提供的声源定位方法可以适用于多个统计时间段。每一个时间段均执行如上所述的步骤。
本申请实施例提供的声源定位方法,在统计时间段内重复执行下列步骤,得到多个第二方位角;基于得到的所有第二方位角,计算声源方位角;下列步骤包括:获取麦克风阵列中的每一个麦克风当前接收的一帧入射信号以及参考信号;参考信号为扬声器当前所播放的一帧信号;基于当前的各帧入射信号,计算第一方位角;基于目标入射信号和所述参考信号,判断扬声器当前是否为播放状态;目标入射信号为任意一帧入射信号;若确定出扬声器当前不为播放状态,则将第一方位角确定为第二方位角。应用本申请所提供的声源定位方法,通过对扬声器播放状态的判断,从而对各个第一方位角进行筛选,将扬声器不为播放状态对应的第一方位角确定为第二方位角,进而基于所有的第二方位角,计算声源方位角,实现准确定位声源方位。
上述本申请实施例图1公开的步骤S101涉及到的基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态的过程,流程图如图2所示,具体包括以下步骤:
S201、计算目标入射信号和参考信号之间的相关度。
计算目标入射信号和参考信号之间的相关度,具体的,可以基于皮尔森系数计算公式,计算目标入射信号和参考信号之间的相关度,依据目标入射信号和参考信号,利用皮尔森系数计算公式,计算目标入射信号和参考信号之间的相关度。
计算目标入射信号和参考信号之间的相关度的过程,包括:
分别将目标入射信号和所述参考信号划分为多个子带信号,得到所述目标入射信号对应的多个目标子带信号、以及所述参考信号对应的多个参考子带信号;
确定所述目标入射信号和参考信号均对应的帧标识;
基于所述帧标识、每个所述目标子带信号、以及所述每个参考子带信号,计算目标入射信号和所述参考信号之间的相关度。
本申请实施例提供的方法中,将目标入射信号划分为多个子带信号,得到目标入射信号对应的多个目标子带信号,将参考信号划分为多个子带信号,得到参考信号对应的多个参考子带信号,需要说明的是,每个字带信号均对应有子带信号标识,目标子带信号的子带信号标识用于表征该目标子带信号在各个目标子带信号中的排列顺序,参考子带信号的子带信号标识用于表征该参考子带信号在各个参考子带信号中的排列顺序。
确定目标入射信号和参考信号对应的帧标识,需要说明的是,入射信号帧标识和参考信号的帧标识相同,基于帧标识、每个目标子带信号、以及每个参考子带信号,计算目标入射信号和参考信号之间的相关度。
可选的,基于帧标识、每个目标子带信号、以及每个参考子带信号,计算目标入射信号和参考信号之间的相关度的过程,包括:
基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,通过皮尔森系数计算公式,计算目标入射信号和所述参考信号之间的相关度。
其中,皮尔森系数计算公式为:
其中,pearson(l)为目标入射信号和参考信号之间的相关度,l为帧标识,k为子带信号的子带信号标识,D为子带信号的数量,x(l,k)表示帧标识为l子带信号标识为k的目标子带信号,y(l,k)表示帧标识为l子带信号标识为k的参考子带信号,子带信号为目标子带信号或参考子带信号。
皮尔森相关系数是一个线性相关的系数,反映两个量之间的线性相关程度的。计算参考信号与目标入射信号的皮尔森系数可以判定参考信号与目标入射信号的相关程度。即所计算的皮尔森相关系数表征参考信号与目标入射信号之间的相关度。
S202、判断相关度是否大于相关度阈值,若是,执行步骤S203,若否,执行步骤S204。
将目标入射信号与参考信号之间的相关度与相关度阈值进行比较,需要说明的是,相关度阈值为人为根据需求设定的数值,为0-1之间的数值,相关度阈值可以根据需求进行调整,可选的,相关度阈值可以是0.8。
S203、确定出扬声器当前为播放状态。
若相关度大于相关度阈值,说明目标入射信号与参考信号是强相关关系,则确定出扬声器当前为播放状态。
S204、确定出扬声器当前不为播放状态。
若相关度不大于相关度阈值,说明目标入射信号与参考信号不知强相关关系,则而确定出扬声器当前不为播放状态。
本申请实施例提供的声源定位方法中,利用皮尔森系数计算公式,计算目标入射信号与参考信号之间的相关度,从而基于相关度与相关度阈值之间的比较结果,判定扬声器当前是否为播放状态。
上述本申请实施例图1公开的步骤S101涉及到的基于当前的各帧入射信号,计算第一方位角的过程,流程图如图3所示,具体包括以下步骤:
S301、基于当前的各帧入射信号,确定每一帧入射信号的俯仰角和方位角。
S302、针对每一帧入射信号,计算入射信号的俯仰角和方位角之间的余弦值,并基于所计算得到的余弦值,计算入射信号对应的时延。
针对每一帧入射信号,通过余弦计算公式,计算入射信号的俯仰角和方位角之间的余弦。
S303、基于每一帧入射信号对应的时延,计算波束输出功率。
本申请实施例提供的方法中,针对每一帧入射信号,基于该帧入射信号对应的时延,计算该入射信号的延迟点数,入射信号的延迟点数为:ni(θ)=τi(θ)·fs,其中,fs为入射信号的采样频率;将该入射信号对齐原点,对齐原点后得到的结果为:yi(n,θ)=xi(n-ni(θ))。
基于对齐原点后得到的所有结果,计算波束输出功率,也就是将对齐原点后得到的所有结果进行累加,得到波速输出功率。
S304、将波束功率最大值所对应的方位角确定为第一方位角。
通过argmax()函数,确定波速功率最大值所对应的方位角,并将波速属猪功率最大值所对应的方位角确定为第一方位角。
本申请实施例提供的声源定位方法中,通过SRP定位算法,计算没第一帧入射信号对应的第一方位角。
与图1所述的方法相对应,本申请实施例还提供了一种数字信号处理装置,用于对图1中方法的具体实现,其结构示意图如图4所示,具体包括:
获取单元401,用于在统计时间段内重复执行下列步骤,得到多个第二方位角;
计算单元402,用于基于得到的所有所述第二方位角,计算声源方位角;
所述下列步骤包括:
获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;所述参考信号为扬声器当前所播放的一帧信号;
基于当前的各帧入射信号,计算第一方位角;
基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态;所述目标入射信号为任意一帧入射信号;
若确定出所述扬声器当前不为播放状态,则将所述第一方位角确定为第二方位角。
本申请实施例提供的数字信号处理装置,在统计时间段内重复执行下列步骤,得到多个第二方位角;基于得到的所有第二方位角,计算声源方位角;下列步骤包括:获取麦克风阵列中的每一个麦克风当前接收的一帧入射信号以及参考信号;参考信号为扬声器当前所播放的一帧信号;基于当前的各帧入射信号,计算第一方位角;基于目标入射信号和所述参考信号,判断扬声器当前是否为播放状态;目标入射信号为任意一帧入射信号;若确定出扬声器当前不为播放状态,则将第一方位角确定为第二方位角。应用本申请所提供的数字信号处理装置,通过对扬声器播放状态的判断,从而对各个第一方位角进行筛选,将扬声器不为播放状态对应的第一方位角确定为第二方位角,进而基于所有的第二方位角,计算声源方位角,实现准确定位声源方位。
在本申请的一个实施例中,基于前述方案,获取单元401配置为:
第一计算子单元,用于计算目标入射信号和所述参考信号之间的相关度;
判断子单元,用于判断所述相关度是否大于相关度阈值;
第一确定子单元,用于若所述相关度大于所述相关度阈值,则确定出所述扬声器当前为播放状态;
第二确定自单元,用于若所述相关度不大于所述相关度阈值,则确定出所述扬声器当前不为播放状态。
在本申请的一个实施例中,基于前述方案,第一计算子单元配置为:
划分子单元,用于分别将目标入射信号和所述参考信号划分为多个子带信号,得到所述目标入射信号对应的多个目标子带信号、以及所述参考信号对应的多个参考子带信号;
第三确定子单元,用于确定所述目标入射信号和参考信号均对应的帧标识;
第二计算子单元,用于基于所述帧标识、每个所述目标子带信号、以及每个所述参考子带信号,计算目标入射信号和所述参考信号之间的相关度。
在本申请的一个实施例中,基于前述方案,第二计算子单元执行基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,计算目标入射信号和所述参考信号之间的相关度,用于:
基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,通过皮尔森系数计算公式,计算目标入射信号和所述参考信号之间的相关度;
所述皮尔森系数计算公式为:
其中,pearson(l)为目标入射信号和所述参考信号之间的相关度,所述l为所述帧标识,所述k为子带信号的子带信号标识,所述D为子带信号的数量,所述x(l,k)表示帧标识为l子带信号标识为k的目标子带信号,所述y(l,k)表示帧标识为l子带信号标识为k的参考子带信号,所述子带信号为目标子带信号或参考子带信号。
在本申请的一个实施例中,基于前述方案,获取单元401执行基于当前的各帧入射信号,计算第一方位角,用于:
基于当前的各帧入射信号,确定每一帧入射信号的俯仰角和方位角;
针对每一帧入射信号,计算所述入射信号的俯仰角和方位角之间的余弦值,并基于所计算得到的余弦值,计算所述入射信号对应的时延;
基于每一帧入射信号对应的时延,计算波束输出功率;
将波束功率最大值所对应的方位角确定为第一方位角。
本申请实施例还提供了一种音频系统,音频系统的结构示意图如图5所示,具体包括:
麦克风阵列501、数字信号处理装置502和扬声器503;
数字信号处理装置502分别与麦克风阵列501和扬声器503相连,用于执行执行上述的声源定位方法;
麦克风阵列501包括至少一个麦克风,每一个麦克风用于接收入射信号;
扬声器503,用于播放信号。
本申请实施例提供的音频系统,麦克风阵列中的每一个麦克风接收音频信号,扬声器播放信号,数字信号处理装置在统计时间段内重复执行下列步骤,得到多个第二方位角;基于得到的所有第二方位角,计算声源方位角;下列步骤包括:获取麦克风阵列中的每一个麦克风当前接收的一帧入射信号以及参考信号;参考信号为扬声器当前所播放的一帧信号;基于当前的各帧入射信号,计算第一方位角;基于目标入射信号和所述参考信号,判断扬声器当前是否为播放状态;目标入射信号为任意一帧入射信号;若确定出扬声器当前不为播放状态,则将第一方位角确定为第二方位角。本申请实施例提供的音频系统,通过对扬声器播放状态的判断,从而对各个第一方位角进行筛选,将扬声器不为播放状态对应的第一方位角确定为第二方位角,进而基于所有的第二方位角,计算声源方位角,实现准确定位声源方位。
本申请实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的声源定位方法。
本申请实施例还提供了一种电子设备,其结构示意图如图6所示,具体包括存储器601,以及一个或者一个以上的指令602,其中一个或者一个以上指令602存储于存储器601中,且经配置以由一个或者一个以上处理器603执行所述一个或者一个以上指令602进行以下操作:
在统计时间段内重复执行下列步骤,得到多个第二方位角;
基于得到的所有所述第二方位角,计算声源方位角;
所述下列步骤包括:
获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;所述参考信号为扬声器当前所播放的一帧信号;
基于当前的各帧入射信号,计算第一方位角;
基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态;所述目标入射信号为任意一帧入射信号;
若确定出所述扬声器当前不为播放状态,则将所述第一方位角确定为第二方位角。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
以上对本申请所提供的一种声源定位方法、数字信号处理装置及音频系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种声源定位方法,其特征在于,应用于数字信号处理装置,所述方法包括:
在统计时间段内重复执行下列步骤,得到多个第二方位角;
基于得到的所有所述第二方位角,计算声源方位角;
所述下列步骤包括:
获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;所述参考信号为扬声器当前所播放的一帧信号;
基于当前的各帧入射信号,计算第一方位角;
基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态;所述目标入射信号为任意一帧入射信号;
若确定出所述扬声器当前不为播放状态,则将所述第一方位角确定为第二方位角。
2.根据权利要求1所述的方法,其特征在于,所述基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态,包括:
计算目标入射信号和所述参考信号之间的相关度;
判断所述相关度是否大于相关度阈值;
若所述相关度大于所述相关度阈值,则确定出所述扬声器当前为播放状态;
若所述相关度不大于所述相关度阈值,则确定出所述扬声器当前不为播放状态。
3.根据权利要求2所述的方法,其特征在于,所述计算目标入射信号和所述参考信号之间的相关度,包括:
分别将目标入射信号和所述参考信号划分为多个子带信号,得到所述目标入射信号对应的多个目标子带信号、以及所述参考信号对应的多个参考子带信号;
确定所述目标入射信号和参考信号均对应的帧标识;
基于所述帧标识、每个所述目标子带信号、以及每个所述参考子带信号,计算目标入射信号和所述参考信号之间的相关度。
4.根据权利要求3所述的方法,其特征在于,所述基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,计算目标入射信号和所述参考信号之间的相关度,包括:
基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,通过皮尔森系数计算公式,计算目标入射信号和所述参考信号之间的相关度;
所述皮尔森系数计算公式为:
其中,pearson(l)为目标入射信号和所述参考信号之间的相关度,所述l为所述帧标识,所述k为子带信号的子带信号标识,所述D为子带信号的数量,所述x(l,k)表示帧标识为l子带信号标识为k的目标子带信号,所述y(l,k)表示帧标识为l子带信号标识为k的参考子带信号,所述子带信号为目标子带信号或参考子带信号。
5.根据权利要求1所述的方法,其特征在于,所述基于当前的各帧入射信号,计算第一方位角,包括:
基于当前的各帧入射信号,确定每一帧入射信号的俯仰角和方位角;
针对每一帧入射信号,计算所述入射信号的俯仰角和方位角之间的余弦值,并基于所计算得到的余弦值,计算所述入射信号对应的时延;
基于每一帧入射信号对应的时延,计算波束输出功率;
将波束功率最大值所对应的方位角确定为第一方位角。
6.一种数字信号处理装置,其特征在于,包括:
获取单元,用于在统计时间段内重复执行下列步骤,得到多个第二方位角;
计算单元,用于基于得到的所有所述第二方位角,计算声源方位角;
所述下列步骤包括:
获取参考信号以及麦克风阵列中的每一个麦克风当前接收的一帧入射信号;所述参考信号为扬声器当前所播放的一帧信号;
基于当前的各帧入射信号,计算第一方位角;
基于目标入射信号和所述参考信号,判断所述扬声器当前是否为播放状态;所述目标入射信号为任意一帧入射信号;
若确定出所述扬声器当前不为播放状态,则将所述第一方位角确定为第二方位角。
7.根据权利要求6所述的装置,其特征在于,所述获取单元,包括:
第一计算子单元,用于计算目标入射信号和所述参考信号之间的相关度;
判断子单元,用于判断所述相关度是否大于相关度阈值;
第一确定子单元,用于若所述相关度大于所述相关度阈值,则确定出所述扬声器当前为播放状态;
第二确定自单元,用于若所述相关度不大于所述相关度阈值,则确定出所述扬声器当前不为播放状态。
8.根据权利要求7所述的装置,其特征在于,所述第一计算子单元,包括:
划分子单元,用于分别将目标入射信号和所述参考信号划分为多个子带信号,得到所述目标入射信号对应的多个目标子带信号、以及所述参考信号对应的多个参考子带信号;
第三确定子单元,用于确定所述目标入射信号和参考信号均对应的帧标识;
第二计算子单元,用于基于所述帧标识、每个所述目标子带信号、以及每个所述参考子带信号,计算目标入射信号和所述参考信号之间的相关度。
9.根据权利要求8所述的装置,其特征在于,所述第二计算子单元执行基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,计算目标入射信号和所述参考信号之间的相关度,用于:
基于所述帧标识、每个所述目标子带信号、以及每个参考子带信号,通过皮尔森系数计算公式,计算目标入射信号和所述参考信号之间的相关度;
所述皮尔森系数计算公式为:
其中,pearson(l)为目标入射信号和所述参考信号之间的相关度,所述l为所述帧标识,所述k为子带信号的子带信号标识,所述D为子带信号的数量,所述x(l,k)表示帧标识为l子带信号标识为k的目标子带信号,所述y(l,k)表示帧标识为l子带信号标识为k的参考子带信号,所述子带信号为目标子带信号或参考子带信号。
10.一种音频系统,其特征在于,包括:
麦克风阵列、数字信号处理装置和扬声器;
所述数字信号处理装置分别与所述麦克风阵列和所述扬声器相连,用于执行如权利要求1-5任意一项所述声源定位方法;
所述麦克风阵列包括至少一个麦克风,每一个麦克风用于接收入射信号;
所述扬声器,用于播放信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110448077.5A CN113156373B (zh) | 2021-04-25 | 2021-04-25 | 声源定位方法、数字信号处理装置及音频系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110448077.5A CN113156373B (zh) | 2021-04-25 | 2021-04-25 | 声源定位方法、数字信号处理装置及音频系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113156373A true CN113156373A (zh) | 2021-07-23 |
CN113156373B CN113156373B (zh) | 2023-06-02 |
Family
ID=76870231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110448077.5A Active CN113156373B (zh) | 2021-04-25 | 2021-04-25 | 声源定位方法、数字信号处理装置及音频系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113156373B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002039851A (ja) * | 2000-07-27 | 2002-02-06 | Ibuki Kogyo Kk | 音源方向確認方法及び装置 |
JP2009021859A (ja) * | 2007-07-12 | 2009-01-29 | Yamaha Corp | 通話状態判定装置および該通話状態判定装置を備えたエコーキャンセラ |
CN106506872A (zh) * | 2016-11-02 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 通话状态检测方法及装置 |
CN106847267A (zh) * | 2015-12-04 | 2017-06-13 | 中国科学院声学研究所 | 一种连续语音流中的叠音检测方法 |
CN107144819A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种声源定位方法、装置及电子设备 |
CN107976651A (zh) * | 2016-10-21 | 2018-05-01 | 杭州海康威视数字技术股份有限公司 | 一种基于麦克风阵列的声源定位方法及装置 |
CN110456309A (zh) * | 2019-02-28 | 2019-11-15 | 深圳壹秘科技有限公司 | 声源定位方法、装置及计算机可读存储介质 |
CN111060875A (zh) * | 2019-12-12 | 2020-04-24 | 北京声智科技有限公司 | 设备相对位置信息获取方法、装置及存储介质 |
-
2021
- 2021-04-25 CN CN202110448077.5A patent/CN113156373B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002039851A (ja) * | 2000-07-27 | 2002-02-06 | Ibuki Kogyo Kk | 音源方向確認方法及び装置 |
JP2009021859A (ja) * | 2007-07-12 | 2009-01-29 | Yamaha Corp | 通話状態判定装置および該通話状態判定装置を備えたエコーキャンセラ |
CN106847267A (zh) * | 2015-12-04 | 2017-06-13 | 中国科学院声学研究所 | 一种连续语音流中的叠音检测方法 |
CN107976651A (zh) * | 2016-10-21 | 2018-05-01 | 杭州海康威视数字技术股份有限公司 | 一种基于麦克风阵列的声源定位方法及装置 |
CN106506872A (zh) * | 2016-11-02 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 通话状态检测方法及装置 |
CN107144819A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种声源定位方法、装置及电子设备 |
CN110456309A (zh) * | 2019-02-28 | 2019-11-15 | 深圳壹秘科技有限公司 | 声源定位方法、装置及计算机可读存储介质 |
CN111060875A (zh) * | 2019-12-12 | 2020-04-24 | 北京声智科技有限公司 | 设备相对位置信息获取方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113156373B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10469967B2 (en) | Utilizing digital microphones for low power keyword detection and noise suppression | |
CN110288997B (zh) | 用于声学组网的设备唤醒方法及系统 | |
CN109670074B (zh) | 一种节奏点识别方法、装置、电子设备及存储介质 | |
EP3836136B1 (en) | Azimuth estimation method, device, and storage medium | |
US8849432B2 (en) | Acoustic pattern identification using spectral characteristics to synchronize audio and/or video | |
US8996367B2 (en) | Sound processing apparatus, sound processing method and program | |
US11114104B2 (en) | Preventing adversarial audio attacks on digital assistants | |
KR101562904B1 (ko) | 도래각 측정 장치 및 방법 | |
CN110610718B (zh) | 一种提取期望声源语音信号的方法及装置 | |
CN108877779B (zh) | 用于检测语音尾点的方法和装置 | |
CN112992190B (zh) | 音频信号的处理方法、装置、电子设备和存储介质 | |
US20130246061A1 (en) | Automatic realtime speech impairment correction | |
US11282514B2 (en) | Method and apparatus for recognizing voice | |
CN113010139B (zh) | 一种投屏方法、装置及电子设备 | |
WO2016119388A1 (zh) | 一种基于语音信号构造聚焦协方差矩阵的方法及装置 | |
CN110169082B (zh) | 用于组合音频信号输出的方法和装置、及计算机可读介质 | |
CN108829370B (zh) | 有声资源播放方法、装置、计算机设备及存储介质 | |
CN111383629B (zh) | 语音处理方法和装置、电子设备以及存储介质 | |
CN113156373B (zh) | 声源定位方法、数字信号处理装置及音频系统 | |
CN114464184B (zh) | 语音识别的方法、设备和存储介质 | |
CN110335623B (zh) | 音频数据处理方法及装置 | |
US10825469B2 (en) | System and method for voice activity detection and generation of characteristics respective thereof | |
CN113593619B (zh) | 用于录制音频的方法、装置、设备和介质 | |
CN115394298B (zh) | 语音识别文本标点预测模型训练方法和预测方法 | |
CN111951829B (zh) | 基于时域单元的声源定位方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |