CN117768816A - 一种基于小尺寸pcba实现声音采集方法及装置 - Google Patents
一种基于小尺寸pcba实现声音采集方法及装置 Download PDFInfo
- Publication number
- CN117768816A CN117768816A CN202311530337.9A CN202311530337A CN117768816A CN 117768816 A CN117768816 A CN 117768816A CN 202311530337 A CN202311530337 A CN 202311530337A CN 117768816 A CN117768816 A CN 117768816A
- Authority
- CN
- China
- Prior art keywords
- microphone
- sound
- microphones
- sound signal
- pitch angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- RVCKCEDKBVEEHL-UHFFFAOYSA-N 2,3,4,5,6-pentachlorobenzyl alcohol Chemical compound OCC1=C(Cl)C(Cl)=C(Cl)C(Cl)=C1Cl RVCKCEDKBVEEHL-UHFFFAOYSA-N 0.000 title claims abstract description 41
- 230000005236 sound signal Effects 0.000 claims abstract description 220
- 238000007781 pre-processing Methods 0.000 claims description 17
- 238000005314 correlation function Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 13
- 238000003062 neural network model Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000009432 framing Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 230000037433 frameshift Effects 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及声音采集技术领域,公开了一种基于小尺寸PCBA实现声音采集方法及装置,包括:接收声音采集指令,基于所述声音采集指令确认声音采集环境,确认麦克风与声音发生器之间的距离满足预设的距离条件后,根据声音采集环境获取第一声音信号,基于第一声音信号获取时延估计值集,所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算多个用于确定声音发生器位置的参数得到第一俯仰角及第一方位角,确认基于第一俯仰角及第一方位角优化四元十字型麦克风阵列。本发明还提出一种基于小尺寸PCBA实现声音采集装置、电子设备以及计算机可读存储介质。本发明可以解决对声音信号采集不准确的问题。
Description
技术领域
本发明涉及声音采集技术领域,尤其涉及一种基于小尺寸PCBA实现声音采集方法及装置。
背景技术
随着社会的发展,视频会议及多媒体教室等场景的应用,进一步的,能够对声音进行准确的采集尤为重要。
目前,对于声音采集的方法为:利用麦克风采集声音采集环境中的声音,并对所采集的声音进行降噪,实现对声音的采集。
虽然上述方法能够实现对声音的采集,但是,存在声音信号采集不准确的问题。
发明内容
本发明提供一种基于小尺寸PCBA实现声音采集方法、装置及计算机可读存储介质,其主要目的在于解决对声音信号采集不准确的问题。
为实现上述目的,本发明提供的一种基于小尺寸PCBA实现声音采集方法及装置,包括:
接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:
利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:
基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;
汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
可选地,所述确认麦克风与声音发生器之间的距离满足预设的距离条件,包括:
获取声音发生器的参考频率范围,根据参考频率范围计算判断距离,其中,计算关系式如下所示:
其中,r为判断距离,d表示四元十字型麦克风阵列中相邻两个麦克风之间的距离,v为声音发生器所发出的声音在声音采集环境中的传播速度,fmax表示所述参考频率范围中参考频率的最大值;
从所述麦克风阵列中依次提取麦克风,并对所提取的麦克风均执行如下操作:
获取所提取的麦克风与声音发生器之间的距离,得到目标距离;
比较目标距离与判断距离;
若目标距离大于等于所述判断距离,则确认所提取的麦克风与声音发生器之间的距离满足预设的距离条件,否则,提示调整所提取的麦克风与声音发生器的距离,直至目标距离大于等于判断距离。
可选地,所述基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,包括:
基于所述四个麦克风获取参考圆,取参考圆的圆心作为参考坐标原点,基于所述参考坐标原点构建参考坐标系,根据参考坐标系获取四个麦克风的编号,其中,位于x轴正方向上、x轴负方向上的麦克风分别为第一麦克风、第三麦克风,位于y轴正方向上、y轴负方向上的麦克风分别为第二麦克风、第四麦克风;
所述第一麦克风、第二麦克风、第三麦克风和第四麦克风组成所述编码麦克风集。
可选地,所述预处理所述初始声音信号,得到目标声音信号,包括:
利用预构建的带通滤波器及所述参考频率范围过滤初始声音信号,得到降噪声音信号;
对降噪声音信号执行分帧及加窗,得到目标声音信号,其中,分帧时的帧长为30ms,帧移为10ms,加窗时的函数为汉明窗。
可选地,所述基于麦克风组合中的两个不同的一帧声音信号获取时延估计值,包括:
基于麦克风组合中的两个不同的一帧声音信号构建广义互相关函数,利用广义互相关函数获取时延估计值。
可选地,所述广义互相关函数,如下所示:
其中,x1为第一麦克风的一帧声音信号,xa为麦克风组合中第a麦克风的一帧声音信号,且a的取值为2,3,4,表示第一麦克风及第a麦克风在同一时间的一帧声音信号之间的广义互相关函数,/>表示第一麦克风及第a麦克风在同一时间的一帧声音信号之间的互功率谱,/>分别为第一麦克风、第a麦克风的一帧声音信号与其自身的互功率谱,x1(ω)表示第一麦克风的一帧声音信号,x’a(ω)表示对第a麦克风的一帧声音信号取复共轭,e为自然底数,ω表示频率,j表示虚数单位,t表示一帧声音信号相对于另一个一帧声音信号的时间延迟。
可选地,所述解析方程组如下所示:
其中,(x0,y0,z0)表示声音发生器在参考坐标系中的坐标,(x1,y1,z1)表示第一麦克风在参考坐标系中的坐标,(x2,y2,z2)表示第二麦克风在参考坐标系中的坐标,(x3,y3,z3)表示第三麦克风在参考坐标系中的坐标,(x4,y4,z4)表示第四麦克风在参考坐标系中的坐标,h0、h1、h2、h3、h4分别表示声音发生器与所述参考坐标原点、第一麦克风、第二麦克风、第三麦克风及第四麦克风之间的距离,t21、t31及t41分别表示第二麦克风、第三麦克风及第四麦克风与第一麦克风在接收信号时的时延估计值,s表示麦克风与坐标原点之间的距离。
可选地,所述基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,包括:
根据初始俯仰角、初始方位角、第一俯仰角及第一方位角获取参考俯仰角及参考方位角,其中,参考俯仰角为初始俯仰角及第一俯仰角之间的绝对差值,参考方位角为初始方位角与第一方位角之间的绝对差值;
分别比较参考俯仰角与预设的俯仰角阈值及参考方位角与预设的方位角阈值;
若参考俯仰角大于所述俯仰角阈值,则取参考俯仰角为优化俯仰角,否则取优化俯仰角为0;
若参考方位角大于所述方位角阈值,则取参考方位角为优化方位角,否则取优化方位角为0。
可选地,所述神经网络模型为卷积循环神经网络。
为了解决上述问题,本发明还提供一种基于小尺寸PCBA实现声音采集装置,所述装置包括:
声音采集环境确认模块,用于接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
距离条件确认模块,用于确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
预处理模块,用于基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:
利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
位置参数计算模块,用于从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:
基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;
汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
声音采集及处理模块,用于获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的基于小尺寸PCBA实现声音采集方法及装置。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于小尺寸PCBA实现声音采集方法及装置。
相比于背景技术所述问题,本发明实施例通过确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号,进一步地,满足距离条件,使得第一声音信号传播至麦克风时为平面波,排除了因声波传播形式而导致获取时延估计值不准确的问题,为增加声音信号采集的准确性奠定了基础。利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号,可见本发明实施例通过对预处理初始声音信号,且对目标声音信号进行分帧,通过规律且平稳的一帧声音信号获取时延估计值,进一步地提高了对于声音发生器定位的准确性,从而提高对声音信号采集的准确性,进一步地,汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算多个用于确定声音发生器的位置参数,得到第一俯仰角及第一方位角,获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集,可见本发明实施例在每一帧声音信号中均计算了俯仰角及方位角,并通过迭代的方式判断是否优化四元十字型麦克风阵列,且在优化之前还计算了优化俯仰角及优化方位角,进一步地,通过优化俯仰角及优化方位角解决了因误差造成频繁对四元十字型麦克风阵列进行优化的问题,从而保证了本发明实施例的可行性,且对声音信号进行优化时,采用神经网络的形式,从而提高了对声音信号采集的准确性。因此本发明提出的基于小尺寸PCBA实现声音采集方法及装置,可以解决对声音信号采集不准确的问题。
附图说明
图1为本发明一实施例提供的基于小尺寸PCBA实现声音采集方法及装置的流程示意图;
图2为图1中其中一个步骤的详细实施流程示意图;
图3为图1中另一个步骤的详细实施流程示意图;
图4为本发明一实施例提供的基于小尺寸PCBA实现声音采集装置的功能模块图;
图5为本发明一实施例提供的实现所述基于小尺寸PCBA实现声音采集方法及装置的电子设备的结构示意图。
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于小尺寸PCBA实现声音采集方法及装置。所述基于小尺寸PCBA实现声音采集方法及装置的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于小尺寸PCBA实现声音采集方法及装置可以由安装在终端设备或服务端设备的软件或硬件来执行。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
实施例1:
参照图1所示,为本发明一实施例提供的基于小尺寸PCBA实现声音采集方法及装置的流程示意图。在本实施例中,所述基于小尺寸PCBA实现声音采集方法及装置包括:
S1、接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上。
应明白的是,PCBA是Printed Circuit Board+Assembly的简称,是指印刷电路板装配或印刷电路板组装。
可理解的是,声音采集指令为声音接收人员为了接收声音而发出的指令,声音采集环境为采集声音时的必要环境,声音发生器是指在声音采集环境中需要被采集声音的对象,例如:在进行会议时,主持会议的主持人,麦克风阵列是指由一定数目的麦克风按照预设的位置排列组成的麦克风组。相比于现有技术,本发明实施例在于解决对声音采集不准确的问题。例如:麦克风阵列适用于发言人不移动的情况,若发言人在发言时并移动,则采用人为调整麦克风阵列的位置,利用调整后的麦克风阵列进行声音的采集。人为调整存在误差,因此会导致对声音采集不准确的问题。
进一步地,利用四元十字型麦克风阵列采集声音信号的同时也会采集到声音采集环境中的噪音,一般情况下,四元十字型麦克风阵列不一定需要满足四个麦克风的位置位于同一个圆内,在本发明中所拟定的四元十字型麦克风阵列是指四个麦克风按照十字型排列,麦克风阵列的布局会以一个中心点为基准,四个麦克风则位于以中心点为起点的四个方向上,且四个方向所构成的图形为十字型,且四元十字型麦克风阵列中的四个麦克风位于同一圆上,且本发明实施例所选用的麦克风为具有指向性的麦克风,四个麦克风位于同一圆上降低基于四个麦克风求解时延估计值所需的时间及资源,能够在更短的时间内判断出声音发生器的方向,并通过调整四元十字形麦克风阵列的位置,同时利用指向性麦克风的特性,在采集声音信号同时过滤掉指定方向的环境噪声,从而提高对声音信号采集的准确性。可选的,基于心形指向的麦克风构建四元十字形麦克风阵列。需解释的是,基于所述声音采集指令确认声音采集环境,包括:解析所述声音采集指令,得到多个用于确认声音采集环境的指令,该指令包括声音发生器启动指令及麦克风阵列启动指令,分别利用声音发生器启动指令及麦克风阵列启动指令启动声音发生器及四元十字型麦克风阵列。
示例性的,小张作为某场演讲的声音接收人员,为了接收演讲家在舞台上的演讲,由小张发出声音采集指令。
S2、确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号。
应明白的是,第一声音信号为输入预设的声音信号至声音发生器后声音发生器所产生的声音信号。另外的,所述预设的声音信号应与实际所要运用的声音信号的频率范围一致,例如:声音采集环境为将要举行的某场会议,且会议发言人为男性,则需要获取男性的声音信号的频率范围,根据所述男性的声音信号的频率范围选取用于测试声音采集器是否正常工作的声音信号,且声音信号的频率与所述男性的声音信号的频率范围一致。
可理解的是,参阅图2所示,所述确认麦克风与声音发生器之间的距离满足预设的距离条件,包括:
S21、获取声音发生器的参考频率范围,根据参考频率范围计算判断距离,其中,计算关系式如下所示:
其中,r为判断距离,d表示四元十字型麦克风阵列中相邻两个麦克风之间的距离,v为声音发生器所发出的声音在声音采集环境中的传播速度,fmax表示所述参考频率范围中参考频率的最大值;
S22、从所述麦克风阵列中依次提取麦克风,并对所提取的麦克风均执行如下操作:
获取所提取的麦克风与声音发生器之间的距离,得到目标距离;
S23、比较目标距离与判断距离;
若目标距离大于等于所述判断距离,则确认所提取的麦克风与声音发生器之间的距离满足预设的距离条件,否则,提示调整所提取的麦克风与声音发生器的距离,直至目标距离大于等于判断距离。
示例性的,四元十字型麦克风阵列中的四个麦克风位于同一圆上,且四个麦克风与坐标原点的距离均为1,则四元十字型麦克风阵列中相邻两个麦克风之间的距离为。
应明白的是,确认麦克风与声音发生器之间的距离满足预设的距离条件的目的是保证第一声音信号传播至四元十字型麦克风阵列中的麦克风时,波形为平面波,且四元十字型麦克风阵列中的麦克风间接收信号仅存在相位延迟,否则,声音发生器与四元十字型麦克风阵列中各个麦克风的距离差不可以忽略不记,进而导致声音发生器不与四元十字型麦克风阵列的中心正对时,四元十字型麦克风阵列中的麦克风在接收声音信号会因声音信号的传播方式为球面波而延迟,进而无法准确调整四元十字型麦克风阵列的位置。
S3、基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合。
可理解的是,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应,多个麦克风组合为:第一麦克风与第二麦克风的组合、第一麦克风与第三麦克风的组合、第一麦克风与第四麦克风的组合。
应明白的是,所述基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,包括:
基于所述四个麦克风获取参考圆,取参考圆的圆心作为参考坐标原点,基于所述参考坐标原点构建参考坐标系,根据参考坐标系获取四个麦克风的编号,其中,位于x轴正方向上、x轴负方向上的麦克风分别为第一麦克风、第三麦克风,位于y轴正方向上、y轴负方向上的麦克风分别为第二麦克风、第四麦克风;
所述第一麦克风、第二麦克风、第三麦克风和第四麦克风组成所述编码麦克风集。
进一步地,编码麦克风坐标集为对四元十字型麦克风阵列中的麦克风进行标识后的麦克风所对应的坐标的集合。
可理解的是,参考圆是指四个麦克风同时位于同一圆上的圆,参考坐标系为用于确定麦克风坐标位置及声音发生器相对于四元十字型麦克风阵列的空间坐标系,可选的,选取笛卡尔坐标系为参考坐标系。另外的,对麦克风执行标识操作的目的是:方便从四个麦克风中选取作为基准的第一麦克风,并基于所述第一麦克风求解用于判断声音发生器在当前时刻所处位置的参数。
示例性的,选取笛卡尔坐标系为参考坐标系,以参考圆的圆心为原点构建坐标系,使得四个麦克风分别位于参考坐标系的x轴及y轴上,并对所述四个麦克风执行标识,使得定位于x轴正方向、x轴负方向上的麦克风分别为第一麦克风、第三麦克风,位于y轴正方向上、y轴负方向上的麦克风分别为第二麦克风、第四麦克风。
S4、从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号。
应明白的是,声音采集环境中存在环境噪声,利用四元十字型麦克风采集第一声音信号时也会采集到环境噪声,因此,需要对初始声音信号执行降噪,得到降噪声音信号,降噪声音信号为通过带通滤波器对初始声音信号进行降噪后的信号,且降噪声音信号为非平稳信号,但是在短时间内降噪声音信号表现出稳定性及规律性,因此,需要对降噪声音信号进行分帧及加窗,使得目标声音信号中的每一帧声音信号具有稳定性及规律性,从而通过对每一帧声音信号的分析得出时延估计值,并根据时延估计值获取多个用于确定声音发生器位置的参数,通过所述参数调整四元十字麦克风阵列,使利用四元十字型麦克风阵列所采集的声音更准确。若不进行分帧及加窗,降噪声音信号是不平稳的,且无法通过降噪信号得出时延估计值。
进一步地,所述预处理所述初始声音信号,得到目标声音信号,包括:
利用预构建的带通滤波器及所述参考频率范围过滤初始声音信号,得到降噪声音信号;
对降噪声音信号执行分帧及加窗,得到目标声音信号,其中,分帧时的帧长为30ms,帧移为10ms,加窗时的函数为汉明窗。
应明白的是,设定带通滤波器的范围为参考频率范围,并基于带通滤波器过滤初始声音信号,其中,通过带通滤波器过滤初始声音信号的技术为现有技术,在此不再赘述。
S5、从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角。
应明白的是,所述基于麦克风组合中的两个不同的一帧声音信号获取时延估计值,包括:
基于麦克风组合中的两个不同的一帧声音信号构建广义互相关函数,利用广义互相关函数获取时延估计值。
需解释的是,所述广义互相关函数,如下所示:
其中,x1为第一麦克风的一帧声音信号,xa为麦克风组合中第a麦克风的一帧声音信号,且a的取值为2,3,4,表示第一麦克风及第a麦克风在同一时间的一帧声音信号之间的广义互相关函数,/>表示第一麦克风及第a麦克风在同一时间的一帧声音信号之间的互功率谱,/>分别为第一麦克风、第a麦克风的一帧声音信号与其自身的互功率谱,x1(ω)表示第一麦克风的一帧声音信号,x, a(ω)表示对第a麦克风的一帧声音信号取复共轭,e为自然底数,ω表示频率,j表示虚数单位,t表示一帧声音信号相对于另一个一帧声音信号的时间延迟;
可理解的是,一帧声音信号相对于另一个一帧声音信号的区别在于由不同的麦克风接收到的第一声音信号,由于麦克风的位置不同,其接收到声音采集环境中由声音发生器所产生的第一声音信号也不同。
基于广义互相关函数获取时延估计值,获取方式为:
其中,ta1为第一麦克风与第a麦克风在声音采集环境中分别获取的一帧声音信号的时延估计值。
需解释的是,所述解析方程组如下所示:
其中,(x0,y0,z0)表示声音发生器在参考坐标系中的坐标,(x1,y1,z1)表示第一麦克风在参考坐标系中的坐标,(x2,y2,z2)表示第二麦克风在参考坐标系中的坐标,(x3,y3,z3)表示第三麦克风在参考坐标系中的坐标,(x4,y4,z4)表示第四麦克风在参考坐标系中的坐标,h0、h1、h2、h3、h4分别表示声音发生器与所述参考坐标原点、第一麦克风、第二麦克风、第三麦克风及第四麦克风之间的距离,t21、t31及t41分别表示第二麦克风、第三麦克风及第四麦克风与第一麦克风在接收信号时的时延估计值,s表示麦克风与坐标原点之间的距离。
进一步地,所述俯仰角及方位角为:
其中,α表示声音发生器与所述坐标原点的俯仰角,θ为声音发生器与所述坐标原点的方位角。
需解释的是,所述俯仰角是指由坐标原点指向声音发生器时,坐标原点与声音发生器所在的直线与所构建的参考坐标系中xoy面的夹角,方位角是指将声音发生器投影至xoy面后的坐标与坐标原点所构成的直线与x轴的夹角。
示例性的,声音发生器在参考坐标系中的空间坐标为(1,1,1),则俯仰角为45度,方位角为45度。
S6、获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
需解释的是,在未对四元十字型麦克风阵列进行角度优化之前,需确保四元十字型麦克风阵列正对于声音发生器,并取所述初始俯仰角及初始方位角均为0,且在返回所述从所述四个麦克风中依次提取麦克风的步骤之后,取上一步骤所求解的第一俯仰角作为初始俯仰角,取上一步骤所求解的第一方位角作为初始方位角。另外的,基于优化俯仰角及优化方位角调整四元十字型麦克风阵列的过程为:利用优化俯仰角及优化方位角调整四元十字型麦克风阵列,使得四元十字型麦克风阵列的声音采集区域正对声音发生器,且四元十字型麦克风阵列中的每一个麦克风与声音发生器之间的距离均相等。
可理解的是,在实际运用中四元十字型麦克风阵列不一定会正对移动中的声音发生器。若四元十字型麦克风阵列所正对的位置为声音发生器所在位置后,基于四元十字型麦克风阵列所接收到的第一声音信号更准确。例如:小王作为演讲家在舞台上进行演讲,在演讲中的小王无法保证嘴部的位置固定不变,因此,需要通过调整四元十字型麦克风阵列的位置,实现对声音信号的精准采集。
需解释的是,参阅图3所示,所述基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,包括:
S61、根据初始俯仰角、初始方位角、第一俯仰角及第一方位角获取参考俯仰角及参考方位角,其中,参考俯仰角为初始俯仰角及第一俯仰角之间的绝对差值,参考方位角为初始方位角与第一方位角之间的绝对差值;
S62、分别比较参考俯仰角与预设的俯仰角阈值及参考方位角与预设的方位角阈值;
S63、若参考俯仰角大于所述俯仰角阈值,则取参考俯仰角为优化俯仰角,否则取优化俯仰角为0;
若参考方位角大于所述方位角阈值,则取参考方位角为优化方位角,否则取优化方位角为0。
应明白的是,所述神经网络模型为卷积循环神经网络。
可理解的是,所述基于卷积循环神经网络对声音信号进行增强的技术为现有技术,在此不再赘述。
相比于背景技术所述问题,本发明实施例通过确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号,进一步地,满足距离条件,使得第一声音信号传播至麦克风时为平面波,排除了因声波传播形式而导致获取时延估计值不准确的问题,为增加声音信号采集的准确性奠定了基础。利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号,可见本发明实施例通过对预处理初始声音信号,且对目标声音信号进行分帧,通过规律且平稳的一帧声音信号获取时延估计值,进一步地提高了对于声音发生器定位的准确性,从而提高对声音信号采集的准确性,进一步地,汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算多个用于确定声音发生器的位置参数,得到第一俯仰角及第一方位角,获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集,可见本发明实施例在每一帧声音信号中均计算了俯仰角及方位角,并通过迭代的方式判断是否优化四元十字型麦克风阵列,且在优化之前还计算了优化俯仰角及优化方位角,进一步地,通过优化俯仰角及优化方位角解决了因误差造成频繁对四元十字型麦克风阵列进行优化的问题,从而保证了本发明实施例的可行性,且对声音信号进行优化时,采用神经网络的形式,从而提高了对声音信号采集的准确性。因此本发明提出的基于小尺寸PCBA实现声音采集方法及装置,可以解决对声音信号采集不准确的问题。
实施例2:
如图4所示,是本发明一实施例提供的基于小尺寸PCBA实现声音采集装置的功能模块图。
本发明所述基于小尺寸PCBA实现声音采集装置100可以安装于电子设备中。根据实现的功能,所述基于小尺寸PCBA实现声音采集装置100可以包括声音采集环境确认模块101、距离条件确认模块102、预处理模块103、位置参数计算模块104及声音采集及处理模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
所述声音采集环境确认模块101,用于接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
所述距离条件确认模块102,用于确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
所述预处理模块103,用于基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:
利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
所述位置参数计算模块104,用于从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:
基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;
汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
所述声音采集及处理模块105,用于获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
详细地,本发明实施例中所述基于小尺寸PCBA实现声音采集装置100中的所述各模块在使用时采用与上述的图1中所述的基于小尺寸PCBA实现声音采集方法及装置一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
实施例3:
如图5所示,是本发明一实施例提供的实现基于小尺寸PCBA实现声音采集方法及装置的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、总线12和通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于小尺寸PCBA实现声音采集程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于小尺寸PCBA实现声音采集程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于小尺寸PCBA实现声音采集程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于小尺寸PCBA实现声音采集程序是多个指令的组合,在所述处理器10中运行时,可以实现:
接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:
利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:
基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;
汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
具体地,所述处理器10对上述指令的具体实现方法可参考图1至图4对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:
利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:
基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;
汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
在本发明所提供的几个实施例中,应该理解到,所公开的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述方法包括:
接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
2.如权利要求1所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述确认麦克风与声音发生器之间的距离满足预设的距离条件,包括:
获取声音发生器的参考频率范围,根据参考频率范围计算判断距离,其中,计算关系式如下所示:
其中,r为判断距离,d表示四元十字型麦克风阵列中相邻两个麦克风之间的距离,v为声音发生器所发出的声音在声音采集环境中的传播速度,fmax表示所述参考频率范围中参考频率的最大值;
从所述麦克风阵列中依次提取麦克风,并对所提取的麦克风均执行如下操作:
获取所提取的麦克风与声音发生器之间的距离,得到目标距离;
比较目标距离与判断距离;
若目标距离大于等于所述判断距离,则确认所提取的麦克风与声音发生器之间的距离满足预设的距离条件,否则,提示调整所提取的麦克风与声音发生器的距离,直至目标距离大于等于判断距离。
3.如权利要求1所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,包括:
基于所述四个麦克风获取参考圆,取参考圆的圆心作为参考坐标原点,基于所述参考坐标原点构建参考坐标系,根据参考坐标系获取四个麦克风的编号,其中,位于x轴正方向上、x轴负方向上的麦克风分别为第一麦克风、第三麦克风,位于y轴正方向上、y轴负方向上的麦克风分别为第二麦克风、第四麦克风;
所述第一麦克风、第二麦克风、第三麦克风和第四麦克风组成所述编码麦克风集。
4.如权利要求2所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述预处理所述初始声音信号,得到目标声音信号,包括:
利用预构建的带通滤波器及所述参考频率范围过滤初始声音信号,得到降噪声音信号;
对降噪声音信号执行分帧及加窗,得到目标声音信号,其中,分帧时的帧长为30ms,帧移为10ms,加窗时的函数为汉明窗。
5.如权利要求1所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述基于麦克风组合中的两个不同的一帧声音信号获取时延估计值,包括:
基于麦克风组合中的两个不同的一帧声音信号构建广义互相关函数,利用广义互相关函数获取时延估计值。
6.如权利要求5所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述广义互相关函数如下所示:
其中,x1为第一麦克风的一帧声音信号,xa为麦克风组合中第a麦克风的一帧声音信号,且a的取值为2,3,4,表示第一麦克风及第a麦克风在同一时间的一帧声音信号之间的广义互相关函数,/>表示第一麦克风及第a麦克风在同一时间的一帧声音信号之间的互功率谱,/>分别为第一麦克风、第a麦克风的一帧声音信号与其自身的互功率谱,x1(ω)表示第一麦克风的一帧声音信号,x’a(ω)表示对第a麦克风的一帧声音信号取复共轭,e为自然底数,ω表示频率,j表示虚数单位,t表示一帧声音信号相对于另一个一帧声音信号的时间延迟。
7.如权利要求2所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述解析方程组如下所示:
其中,(x0,y0,z0)表示声音发生器在参考坐标系中的坐标,(x1,y1,z1)表示第一麦克风在参考坐标系中的坐标,(x2,y2,z2)表示第二麦克风在参考坐标系中的坐标,(x3,y3,z3)表示第三麦克风在参考坐标系中的坐标,(x4,y4,z4)表示第四麦克风在参考坐标系中的坐标,h0、h1、h2、h3、h4分别表示声音发生器与所述参考坐标原点、第一麦克风、第二麦克风、第三麦克风及第四麦克风之间的距离,t21、t31及t41分别表示第二麦克风、第三麦克风及第四麦克风与第一麦克风在接收信号时的时延估计值,s表示麦克风与坐标原点之间的距离。
8.如权利要求1所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,包括:
根据初始俯仰角、初始方位角、第一俯仰角及第一方位角获取参考俯仰角及参考方位角,其中,参考俯仰角为初始俯仰角及第一俯仰角之间的绝对差值,参考方位角为初始方位角与第一方位角之间的绝对差值;
分别比较参考俯仰角与预设的俯仰角阈值及参考方位角与预设的方位角阈值;
若参考俯仰角大于所述俯仰角阈值,则取参考俯仰角为优化俯仰角,否则取优化俯仰角为0;
若参考方位角大于所述方位角阈值,则取参考方位角为优化方位角,否则取优化方位角为0。
9.如权利要求1所述的基于小尺寸PCBA实现声音采集方法及装置,其特征在于,所述神经网络模型为卷积循环神经网络。
10.一种基于小尺寸PCBA实现声音采集装置,其特征在于,所述装置包括:
声音采集环境确认模块,用于接收声音采集指令,基于所述声音采集指令确认声音采集环境,其中,声音采集环境包括:用于采集声音的四元十字型麦克风阵列及声音发生器,且四元十字型麦克风阵列中的四个麦克风位于同一圆上;
距离条件确认模块,用于确认麦克风与声音发生器之间的距离满足预设的距离条件后,利用声音发生器产生声音信号,得到第一声音信号;
预处理模块,用于基于所述四元十字型麦克风阵列获取参考坐标原点,利用参考坐标原点构建参考坐标系,基于所述参考坐标系对四个麦克风执行标识操作,得到编码麦克风集,获取编码麦克风集中每一个麦克风的坐标,得到编码麦克风坐标集,其中,编码麦克风坐标集中的编码麦克风坐标与所述编码麦克风集中编码后的麦克风一一对应;
基于所述编码麦克风集获取第一麦克风与其他麦克风的组合,得到多个麦克风组合,从所述四个麦克风中依次提取麦克风,并对所提取的麦克风均执行如下操作:
利用所提取的麦克风接收在声音采集环境中的第一声音信号,得到初始声音信号,预处理所述初始声音信号,得到目标声音信号,确认目标声音信号的帧数为预设的帧长后,得到一帧声音信号;
位置参数计算模块,用于从所述多个麦克风组合中依次提取麦克风组合,并对所提取的麦克风组合均执行如下操作:
基于麦克风组合中的两个不同的一帧声音信号获取时延估计值;
汇总所述时延估计值,得到时延估计值集,基于所述时延估计值集及编码麦克风坐标集构建解析方程组,根据解析方程组计算得到多个用于确定声音发生器位置的参数,该参数包括第一俯仰角及第一方位角;
声音采集及处理模块,用于获取所述四元十字型麦克风阵列的初始俯仰角及初始方位角,基于初始俯仰角、初始方位角、第一俯仰角及第一方位角获取优化俯仰角及优化方位角,基于所述优化俯仰角及优化方位角调整所述四元十字型麦克风阵列后,得到优化四元十字型麦克风阵列,并返回所述从所述四个麦克风中依次提取麦克风的步骤,且基于预构建的神经网络模型优化所述一帧声音信号,得到优化声音信号,实现对声音的采集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311530337.9A CN117768816A (zh) | 2023-11-15 | 2023-11-15 | 一种基于小尺寸pcba实现声音采集方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311530337.9A CN117768816A (zh) | 2023-11-15 | 2023-11-15 | 一种基于小尺寸pcba实现声音采集方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117768816A true CN117768816A (zh) | 2024-03-26 |
Family
ID=90320887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311530337.9A Pending CN117768816A (zh) | 2023-11-15 | 2023-11-15 | 一种基于小尺寸pcba实现声音采集方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117768816A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015184893A1 (zh) * | 2014-11-21 | 2015-12-10 | 中兴通讯股份有限公司 | 移动终端通话语音降噪方法及装置 |
WO2016183791A1 (zh) * | 2015-05-19 | 2016-11-24 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
CN108231085A (zh) * | 2016-12-14 | 2018-06-29 | 杭州海康威视数字技术股份有限公司 | 一种声源定位方法及装置 |
WO2018228060A1 (zh) * | 2017-06-12 | 2018-12-20 | 华为技术有限公司 | 一种声音处理方法和装置 |
CN110099330A (zh) * | 2019-06-03 | 2019-08-06 | 广州由我科技股份有限公司 | 一种耳机、耳机系统及耳机充电系统 |
CN110691314A (zh) * | 2019-10-22 | 2020-01-14 | 苏州思必驰信息科技有限公司 | 线性麦克风阵列性能测试方法及夹具 |
CN113702909A (zh) * | 2021-08-30 | 2021-11-26 | 浙江大学 | 一种基于声音信号到达时间差的声源定位解析解计算方法及装置 |
CN114236469A (zh) * | 2021-11-17 | 2022-03-25 | 乐山师范学院 | 一种机器人语音识别定位方法及系统 |
CN114882899A (zh) * | 2022-04-14 | 2022-08-09 | 兴科迪科技(泰州)有限公司 | 一种车载智能麦克风多源语音拾取分离系统及方法 |
CN116705046A (zh) * | 2022-02-25 | 2023-09-05 | 北京中创视讯科技有限公司 | 拾音方法、装置、非易失性存储介质及终端设备 |
-
2023
- 2023-11-15 CN CN202311530337.9A patent/CN117768816A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015184893A1 (zh) * | 2014-11-21 | 2015-12-10 | 中兴通讯股份有限公司 | 移动终端通话语音降噪方法及装置 |
WO2016183791A1 (zh) * | 2015-05-19 | 2016-11-24 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
CN108231085A (zh) * | 2016-12-14 | 2018-06-29 | 杭州海康威视数字技术股份有限公司 | 一种声源定位方法及装置 |
WO2018228060A1 (zh) * | 2017-06-12 | 2018-12-20 | 华为技术有限公司 | 一种声音处理方法和装置 |
CN110099330A (zh) * | 2019-06-03 | 2019-08-06 | 广州由我科技股份有限公司 | 一种耳机、耳机系统及耳机充电系统 |
CN110691314A (zh) * | 2019-10-22 | 2020-01-14 | 苏州思必驰信息科技有限公司 | 线性麦克风阵列性能测试方法及夹具 |
CN113702909A (zh) * | 2021-08-30 | 2021-11-26 | 浙江大学 | 一种基于声音信号到达时间差的声源定位解析解计算方法及装置 |
CN114236469A (zh) * | 2021-11-17 | 2022-03-25 | 乐山师范学院 | 一种机器人语音识别定位方法及系统 |
CN116705046A (zh) * | 2022-02-25 | 2023-09-05 | 北京中创视讯科技有限公司 | 拾音方法、装置、非易失性存储介质及终端设备 |
CN114882899A (zh) * | 2022-04-14 | 2022-08-09 | 兴科迪科技(泰州)有限公司 | 一种车载智能麦克风多源语音拾取分离系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110992974B (zh) | 语音识别方法、装置、设备以及计算机可读存储介质 | |
EP3001414A1 (en) | Method and apparatus for executing voice command in electronic device | |
CN108140398B (zh) | 用于基于多个音频馈源来标识来自兴趣源的声音的方法和系统 | |
US8400877B2 (en) | Method and apparatus for measuring position of the object using microphone | |
CN112673264A (zh) | 包括电磁传感器模块的电子装置及其控制方法 | |
CN108986833A (zh) | 基于麦克风阵列的拾音方法、系统、电子设备及存储介质 | |
CN103578468A (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
US20210027162A1 (en) | Neural Network Model, Data Processing Method, and Processing Apparatus | |
CN108416744A (zh) | 图像处理方法、装置、设备及计算机可读存储介质 | |
CN111060874B (zh) | 一种声源定位方法、装置、存储介质及终端设备 | |
CN108877787A (zh) | 语音识别方法、装置、服务器及存储介质 | |
CN114333881B (zh) | 基于环境自适应的音频传输降噪方法、设备及介质 | |
CN112492207B (zh) | 一种基于声源定位控制摄像头转动的方法和装置 | |
CN112420073A (zh) | 语音信号处理方法、装置、电子设备和存储介质 | |
CN113053368A (zh) | 语音增强方法、电子设备和存储介质 | |
CN111768759A (zh) | 用于生成信息的方法和装置 | |
US20240119943A1 (en) | Apparatus for implementing speaker diarization model, method of speaker diarization, and portable terminal including the apparatus | |
CN109345567A (zh) | 物体运动轨迹识别方法、装置、设备和存储介质 | |
CN117768816A (zh) | 一种基于小尺寸pcba实现声音采集方法及装置 | |
CN108900959A (zh) | 测试语音交互设备的方法、装置、设备和计算机可读介质 | |
CN117593493A (zh) | 三维脸部拟合方法、装置、电子设备及存储介质 | |
CN115134523B (zh) | 远程控制方法、装置、操作终端、控制设备和存储介质 | |
CN116943216A (zh) | 一种贴合关系检测方法、装置、设备及存储介质 | |
CN115220699A (zh) | 一种基于模型开发的软件架构生成方法、装置、终端及存储介质 | |
CN114333017A (zh) | 一种动态拾音方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |