CN115460529A - 麦克风阵列的一致性检测方法、装置、设备及存储介质 - Google Patents

麦克风阵列的一致性检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115460529A
CN115460529A CN202211067433.XA CN202211067433A CN115460529A CN 115460529 A CN115460529 A CN 115460529A CN 202211067433 A CN202211067433 A CN 202211067433A CN 115460529 A CN115460529 A CN 115460529A
Authority
CN
China
Prior art keywords
microphone
sub
microphone array
determining
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211067433.XA
Other languages
English (en)
Inventor
李良斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202211067433.XA priority Critical patent/CN115460529A/zh
Publication of CN115460529A publication Critical patent/CN115460529A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请提供了一种麦克风阵列的一致性检测方法、装置、设备及存储介质,属于麦克风技术领域。方法包括:通过麦克风阵列中的多个麦克风进行声音采集,以获取多个麦克风的音频信号;对于每个麦克风,确定麦克风的音频信号中目标频段的频谱;将目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段;对于多个麦克风中除第一麦克风以外的每个第二麦克风,基于第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异度,确定第二麦克风与第一麦克风之间的一致性检测结果;在每个第二麦克风与第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定麦克风阵列符合一致性,提高了对麦克风阵列进行一致性检测的准确性。

Description

麦克风阵列的一致性检测方法、装置、设备及存储介质
技术领域
本申请涉及麦克风技术领域,特别涉及一种麦克风阵列的一致性检测方法、装置、设备及存储介质。
背景技术
麦克风阵列是由多个麦克风按照一定的拓扑结构组成的、用于采集音频信号的音频采集设备。而为了保证麦克风阵列采集音频信号的准确性,需要对麦克风阵列中多个麦克风采集音频信号的一致性进行检测。
相关技术中,在对麦克风阵列进行一致性检测时,一般是将麦克风阵列中多个麦克风之间的平均统计特性(如谱熵、幅值等)作为标准,将单个麦克风的音频统计特性与该标准对比,以判断单个麦克风是否符合一致性,进而确定该麦克风阵列是否符合一致性。然而,若麦克风阵列中存在异常的麦克风,则会导致该平均统计特性不准确,进而使得一致性检测结果并不准确。
发明内容
本申请实施例提供了一种麦克风阵列的一致性检测方法、装置、设备及存储介质,能够提高对麦克风阵列进行一致性检测的准确性。所述技术方案如下:
一方面,提供了一种麦克风阵列的一致性检测方法,所述方法包括:
通过麦克风阵列中的多个麦克风进行声音采集,以获取所述多个麦克风的音频信号;
对于每个麦克风,确定所述麦克风的音频信号中目标频段的频谱;
将所述目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段;
对于所述多个麦克风中除第一麦克风以外的每个第二麦克风,基于所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异度,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果,所述差异度表示第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异;
在每个第二麦克风与所述第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定所述麦克风阵列符合一致性。
在一些实施例中,所述方法还包括:
确定所述第一麦克风的多个子频谱各自的能量值以及确定所述第二麦克风的多个子频谱各自的能量值;
对于第一麦克风和第二麦克风中对应同一子频段的两个子频谱,确定所述两个子频谱的能量值之间的能量差值;
将多个子频段对应的所述能量差值的绝对值超过第一阈值的子频段的数目,作为所述差异度。
在一些实施例中,所述基于所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异度,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果,包括:
在所述差异度不超过第二阈值的情况下,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果为符合一致性。
在一些实施例中,所述通过麦克风阵列进行声音采集,包括:
通过目标播放设备在目标场景下播放高斯白噪声;
通过所述麦克风阵列在所述目标场景下进行声音采集。
在一些实施例中,所述方法还包括:
基于所述麦克风阵列的阵列孔径和所述高斯白噪声的最小波长,确定参考距离;
基于所述参考距离,确定水平距离,所述水平距离大于或等于所述参考距离;
基于所述目标播放设备的第一位置和所述水平距离,确定第二位置,所述麦克风阵列用于在所述第二位置进行声音采集。
在一些实施例中,在确定所述麦克风阵列符合一致性之后,所述方法还包括:
基于所述多个麦克风的音频信号,对所述目标播放设备进行定位,以得到所述目标播放设备相对于所述麦克风阵列的估计方向;
在所述目标播放设备相对于所述麦克风阵列的真实方向与所述估计方向相匹配的情况下,确定所述麦克风阵列满足使用要求。
在一些实施例中,所述方法还包括:
基于所述麦克风阵列中各个麦克风的位置,确定中心位置;
将所述中心位置的麦克风作为所述第一麦克风。
在一些实施例中,所述麦克风阵列中的多个麦克风分别标注有不同的序号,所述方法还包括:
在至少一个第二麦克风与所述第一麦克风之间的一致性检测结果为不符合一致性的情况下,输出所述至少一个第二麦克风的序号。
在一些实施例中,所述方法还包括:
在所述至少一个第二麦克风的数量不超过第三阈值的情况下,输出所述至少一个第二麦克风的序号。
在一些实施例中,所述方法还包括:
在所述至少一个第二麦克风的数量超过第三阈值的情况下,从多个第二麦克风中重新确定第一麦克风,基于重新确定的第一麦克风的多个子频谱,对所述麦克风阵列进行一致性检测。
在一些实施例中,所述方法还包括:
在所述麦克风阵列用于语音检测场景中的情况下,将所述音频信号中自然语音频率所在频段作为所述目标频段;
在所述麦克风阵列用于异常事件检测场景中的情况下,将所述音频信号的频段均作为所述目标频段。
另一方面,提供了一种麦克风阵列的一致性检测装置,所述装置包括:
采集模块,用于通过麦克风阵列中的多个麦克风进行声音采集,以获取所述多个麦克风的音频信号;
第一确定模块,用于对于每个麦克风,确定所述麦克风的音频信号中目标频段的频谱;
划分模块,用于将所述目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段;
第二确定模块,用于对于所述多个麦克风中除第一麦克风以外的每个第二麦克风,基于所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异度,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果,所述差异度表示第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异;
第三确定模块,用于在每个第二麦克风与所述第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定所述麦克风阵列符合一致性。
在一些实施例中,所述装置还包括:
第四确定模块,用于确定所述第一麦克风的多个子频谱各自的能量值以及确定所述第二麦克风的多个子频谱各自的能量值;
第五确定模块,用于对于第一麦克风和第二麦克风中对应同一子频段的两个子频谱,确定所述两个子频谱的能量值之间的能量差值;
第六确定模块,用于将多个子频段对应的所述能量差值的绝对值超过第一阈值的子频段的数目,作为所述差异度。
在一些实施例中,所述第二确定模块,用于:
在所述差异度不超过第二阈值的情况下,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果为符合一致性。
在一些实施例中,所述采集模块,用于:
通过目标播放设备在目标场景下播放高斯白噪声;
通过所述麦克风阵列在所述目标场景下进行声音采集。
在一些实施例中,所述装置还包括:
第七确定模块,用于基于所述麦克风阵列的阵列孔径和所述高斯白噪声的最小波长,确定参考距离;
第八确定模块,用于基于所述参考距离,确定水平距离,所述水平距离大于或等于所述参考距离;
第九确定模块,用于基于所述目标播放设备的第一位置和所述水平距离,确定第二位置,所述麦克风阵列用于在所述第二位置进行声音采集。
在一些实施例中,在确定所述麦克风阵列符合一致性之后,所述装置还包括:
定位模块,用于基于所述多个麦克风的音频信号,对所述目标播放设备进行定位,以得到所述目标播放设备相对于所述麦克风阵列的估计方向;
第十确定模块,用于在所述目标播放设备相对于所述麦克风阵列的真实方向与所述估计方向相匹配的情况下,确定所述麦克风阵列满足使用要求。
在一些实施例中,所述装置还包括:
第十一确定模块,用于基于所述麦克风阵列中各个麦克风的位置,确定中心位置;
第十二确定模块,用于将所述中心位置的麦克风作为所述第一麦克风。
在一些实施例中,所述麦克风阵列中的多个麦克风分别标注有不同的序号,所述装置还包括:
输出模块,用于在至少一个第二麦克风与所述第一麦克风之间的一致性检测结果为不符合一致性的情况下,输出所述至少一个第二麦克风的序号。
在一些实施例中,所述输出模块还用于:
在所述至少一个第二麦克风的数量不超过第三阈值的情况下,输出所述至少一个第二麦克风的序号。
在一些实施例中,所述装置还包括:
第十三确定模块,用于在所述至少一个第二麦克风的数量超过第三阈值的情况下,从多个第二麦克风中重新确定第一麦克风,基于重新确定的第一麦克风的多个子频谱,对所述麦克风阵列进行一致性检测。
在一些实施例中,所述第一确定模块,用于:
在所述麦克风阵列用于语音检测场景中的情况下,将所述音频信号中自然语音频率所在频段作为所述目标频段;
在所述麦克风阵列用于异常事件检测场景中的情况下,将所述音频信号的频段均作为所述目标频段。
另一方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行,以实现上述任一实现方式所述的麦克风阵列的一致性检测方法。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一实现方式所述的麦克风阵列的一致性检测方法。
另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序代码,所述处理器执行所述计算机程序代码,使得所述计算机设备执行上述任一实现方式所述的麦克风阵列的一致性检测方法。
在本申请实施例中,通过将每个麦克风的音频信号中目标频段的频谱进行划分,来得到多个子频谱,由于每个子频谱均能够代表音频信号的一个细节特征,这样基于两个麦克风各自的多个子频谱之间的差异度,来确定两个麦克风之间的一致性检测结果,能够提高检测的精度;且由于符合一致性的麦克风阵列的两个麦克风之间应该符合一致性,这样以多个麦克风中的第一麦克风为参考标准,对第一麦克风与多个第二麦克风之间的一致性分别进行检测,在每个第二麦克风与第一麦克风之间均符合一致性的情况下,就能够说明该麦克风阵列符合一致性,提高了对麦克风阵列进行一致性检测的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种麦克风阵列的一致性检测方法的流程图;
图3是本申请实施例提供的另一种麦克风阵列的一致性检测方法的流程图;
图4是本申请实施例提供的另一种麦克风阵列的一致性检测方法的流程图;
图5是本申请实施例提供的一种麦克风阵列的一致性检测装置的框图;
图6是本申请实施例提供的一种控制设备的框图;
图7是本申请实施例提供的一种服务器的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任意变形,意图在于覆盖不排他的包括。例如包括了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的样本数据对都是在充分授权的情况下获取的。
本申请实施例提供的麦克风阵列的一致性检测方法,能够由计算机设备执行,在本申请实施例中,计算机设备能够被配置为控制设备或者服务器,当计算机设备被配置为控制设备时,可以由控制设备作为执行主体来实施本申请实施例提供的技术方案,当计算机设备被配置为服务器时,可以由服务器作为执行主体来实施本申请实施例提供的技术方案,也可以通过控制设备和服务器之间的交互来实施本申请提供的技术方案,本申请实施例对此不作限定。下面以计算机设备为服务器为例,介绍一种本申请实施例提供的麦克风阵列的一致性检测方法的实施环境示意图。
参见图1,该实施环境包括麦克风阵列10和服务器20,麦克风阵列10用于在会议系统中进行声音采集,将采集到的声音数据传输给服务器20,服务器20用于将该声音数据传输给参与会议的远端设备;可选地,在本地还可以设置有控制设备30,控制设备30可以控制麦克风阵列10进行声音采集,且控制设备30还可以将麦克风阵列10采集的声音数据进行处理后,再通过服务器20传输给远端设备。在本申请实施例中,可以由本地的控制设备30对传输来的声音数据进行检测;也可以通过控制设备30将麦克风阵列10采集到的声音数据传输到服务器20,由服务器20进行检测;也可以在未设置控制设备30的情况下,直接由服务器20对传输来的声音数据进行检测,本申请对此不作具体限制。麦克风阵列10、服务器20和控制设备30之间能够通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
图2是本申请实施例提供的一种麦克风阵列的一致性检测方法的流程图,以计算机设备为执行主体执行该方法,该方法包括:
201、计算机设备通过麦克风阵列中的多个麦克风进行声音采集,以获取多个麦克风的音频信号。
在本申请实施例中,多个麦克风按照预设的形状排列,以形成具有拓扑结构的麦克风阵列,该拓扑结构可以为线性阵列、十字阵列、平面阵列或螺旋阵列等。
202、计算机设备对于每个麦克风,确定麦克风的音频信号中目标频段的频谱。
在本申请实施例中,每个麦克风的目标频段均相同,目标频段的频谱为频域信号,该频谱的横坐标为频率,纵坐标为幅值,幅值表示音频信号的强度。目标频段可以为麦克风阵列在应用时的待检测频段,如可以是自然语音频率对应的频段,以保证基于该目标频段的频谱对该麦克风阵列进行一致性检测的有效性。
203、计算机设备将目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段。
在本申请实施例中,每个麦克风的子频段也均相同。由于该多个子频谱能够代表音频信号的细节特征,进而后续基于划分得到的多个子频谱进行一致性检测,能够提高检测的精度。
204、计算机设备对于多个麦克风中除第一麦克风以外的每个第二麦克风,基于第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异度,确定第二麦克风与第一麦克风之间的一致性检测结果,差异度表示第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异。
在本申请实施例中,一致性检测结果为符合一致性或不符合一致性。在本申请实施例中,由于麦克风阵列中符合一致性的两个麦克风的音频信号之间的差异应该较小,这样基于两个麦克风的音频信号中的子频谱之间的差异,来对两个麦克风之间的一致性进行检测,保证了检测的准确性。
205、计算机设备在每个第二麦克风与第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定麦克风阵列符合一致性。
在本申请实施例中,计算机设备在任一第二麦克风与第一麦克风之间的一致性检测结果为不符合一致性的情况下,确定该麦克风阵列不符合一致性。
在本申请实施例中,通过将每个麦克风的音频信号中目标频段的频谱进行划分,来得到多个子频谱,由于每个子频谱均能够代表音频信号的一个细节特征,这样基于两个麦克风各自的多个子频谱之间的差异度,来确定两个麦克风之间的一致性检测结果,能够提高检测的精度;且由于符合一致性的麦克风阵列的两个麦克风之间应该符合一致性,这样以多个麦克风中的第一麦克风为参考标准,对第一麦克风与多个第二麦克风之间的一致性分别进行检测,在每个第二麦克风与第一麦克风之间均符合一致性的情况下,就能够说明该麦克风阵列符合一致性,提高了对麦克风阵列进行一致性检测的准确性。
图3是本申请实施例提供的一种麦克风阵列的一致性检测方法的流程图,以服务器为执行主体执行该方法,该方法包括:
301、服务器通过麦克风阵列中的多个麦克风进行声音采集,以获取多个麦克风的音频信号。
在本申请实施例中,为了保证多个麦克风采集音频信号的稳定性,以高斯白噪声作为声源。相应地,上述服务器通过麦克风阵列中的多个麦克风进行声音采集的过程包括以下步骤:服务器通过目标播放设备在目标场景下播放高斯白噪声;服务器通过麦克风阵列在目标场景下进行声音采集。
在本申请实施例中,由于高斯白噪声的能量在时间维度和频域维度都分布均匀,进而使得多个麦克风在任一时间和任一频率下采集的音频信号都是相对稳定的,保证了声源的稳定性,进而就可以避免由声源误差带来的检测误差。
需要说明的是,声音传播包括近场传播和远场传播,近场传播时,声音在空间中传播的波形为球面波,则会对多个麦克风所采集的音频信号造成幅值上的差异。而远场传播时,声音在空间中传播的波形为平面波,无需考虑幅度上的差异。因此为了避免幅值差异带来的影响,可以通过控制目标播放设备与麦克风阵列之间的距离来实现远场传播,相应地,服务器在已知目标播放设备的位置的情况下,通过以下步骤来确定麦克风阵列进行声音采集的位置。
服务器基于麦克风阵列的阵列孔径和高斯白噪声的最小波长,确定参考距离;服务器基于参考距离,确定水平距离,水平距离大于或等于参考距离;服务器基于目标播放设备的第一位置和水平距离,确定第二位置,麦克风阵列用于在第二位置进行声音采集。
在本申请实施例中,参考距离为近场传播和远场传播的分界点,若目标播放设备与麦克风阵列之间的距离小于参考距离,则属于近场传播,若目标播放设备与麦克风阵列之间的距离大于或等于该参考距离,则属于远场传播。水平距离指目标采集设备与麦克风阵列的中心位置在同一个水平线上的距离,即第二位置指麦克风阵列的中心位置,第一位置与第二位置位于同一水平线上。
服务器通过下述公式(1),得到水平距离。
Figure BDA0003828367460000101
在本申请实施例中,r代表水平距离,D代表麦克风阵列的阵列孔径,λ代表高斯白噪声的最小波长。
在该实现方式中,通过控制目标采集设备与麦克风阵列之间的距离,使得声音在目标采集设备和麦克风阵列之间实现了远场传播,进而避免了幅值差异带来的影响,降低了多个麦克风之间的差异,从而降低了检测误差。
在本申请实施例中,目标场景可以为普通的室内场景,该室内场景无明显的干扰和杂音即可,进而降低了对检测的场景的要求,实现了在相对宽松的场景下对麦克风阵列进行检测,降低了检测条件,提高了检测的普适性。
302、服务器对于每个麦克风,确定麦克风的音频信号中目标频段的频谱。
需要说明的是,麦克风阵列采集的音频信号一般为时域的音频信号,因此服务器在执行步骤302之前,需要对音频线号进行快速傅里叶变换(Fast Fourier Transform,FFT),以将时域的音频信号转换为频域的音频信号,进而确定该频域的音频信号中目标频段的频谱。在本申请实施例中,时域的音频信号的横坐标为时间,纵坐标为幅值,频域的音频信号的横坐标为频率,纵坐标为幅值。
由于麦克风阵列在不同的应用场景下,对音频信号中不同频段的响应要求不同,因此服务器可以基于麦克风阵列的应用场景,确定目标频段。相应地,服务器确定目标频段的过程,包括以下实现方式:服务器在麦克风阵列用于语音检测场景中的情况下,将音频信号中自然语音频率所在频段作为目标频段;服务器在麦克风阵列用于异常事件检测场景中的情况下,将音频信号的频段均作为目标频段。在该实现方式中,通过在麦克风阵列用于语音检测场景中的情况下,将音频信号中自然语音频率所在频段作为目标频段,避免了噪音频段等无效频段的干扰。且由于异常事件的音频信号可能属于任一频段,这样将音频信号的频段均作为目标频段,使得麦克风阵列可以获取到音频信号中任一频段的音频信号,进而可以基于任一频段的音频信号进行异常事件的检测,保证了检测的全面性。
在本申请实施例中,麦克风阵列的多种应用场景与该多种应用场景各自对应的频段一一对应存储在频段库中,且麦克风阵列标注有应用场景标识。则相应地,服务器在确定目标频段时,首先获取麦克风阵列的应用场景标识,以确定麦克风阵列的应用场景,再将频段库中该应用场景对应的频段作为目标频段,进而提高了确定目标频段的效率。
在本申请实施例中,基于麦克风阵列的应用场景来确定目标频段,保证了目标频段与应用场景之间的匹配度,避免了无效频段对检测的干扰,进而后续再基于该目标频段的频谱来对麦克风阵列进行一致性检测,保证了检测的有效性。
在另一种实现方式中,服务器确定目标频段的过程,还包括以下实现方式:服务器将全频段的音频信号进行划分,得到多个频段的频谱;服务器将多个频段中幅值之和最大的频段作为目标频段或者将能量值最大的频段作为目标频段。在该实现方式中,由于幅值之和最大的频段或能量值最大的频段能够有效代表该麦克风的音频信号的频率响应特征,进而这样来确定目标频段,保证了确定目标频段的合理性,这样再基于该目标频段的频谱对麦克风阵列进行一致性检测时,能够保证检测的有效性。
在本申请实施例中,由于各个麦克风的幅值之和最大的频段可能不同,则计算机设备对于每个频段,确定多个麦克风在该频段的幅值之和之间的均值,将均值最大的频段作为目标频段;同理,计算机设备对于每个频段,确定多个麦克风在该频段的能量值之间的第二均值,将均值最大的频段作为目标频段。
303、服务器将目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段。
在本申请实施例中,多个子频谱的数量可以根据需要进行设定并更改,在本申请实施例中,对此不作具体限定。例如,多个子频谱的数量可以为10个或20个等。多个子频谱的信号长度相同,即每个子频段的频段长度相同。每个子频谱的分辨率可以根据需要进行设定并更改,分辨率基于子频谱中的频点数目确定,频点数目越多,分辨率越高,该子频谱的精度越高。
304、对于多个麦克风中除第一麦克风以外的每个第二麦克风,服务器确定第一麦克风的多个子频谱各自的能量值以及确定第二麦克风的多个子频谱各自的能量值。
在本申请实施例中,子频谱的横坐标为频率,纵坐标为幅值。服务器对于任一子频谱,将子频谱中幅度平方的积分作为该子频谱的能量值。
在本申请实施例中,由于第一麦克风为多个麦克风中的麦克风,进而后续再以该第一麦克风为参考标准,与每个第二麦克风之间进行一致性检测,提高了获取参考标准的效率和便捷性。在本申请实施例中,服务器确定第一麦克风的过程包括以下步骤。
服务器基于麦克风阵列中各个麦克风的位置,确定中心位置;服务器将中心位置的麦克风作为第一麦克风。例如,麦克风阵列包括按直线排列的5个麦克风,则服务器将中心位置的第3个麦克风作为第一麦克风。在本申请实施例中,通过将中心位置的麦克风作为第一麦克风,由于中心位置的麦克风与其他麦克风之间的位置距离相对较均衡,进而降低了多个第二麦克风与第一麦克风之间的位置差异。
需要说明的是,在本申请实施例中,多个麦克风的中心位置并无麦克风,则可以选取距离中心位置最近的麦克风或选取多个麦克风中的任一麦克风作为第一麦克风。如麦克风阵列包括按直线排列的4个麦克风,则服务器可以将距离中心位置最近的第2个麦克风或第3个麦克风作为第一麦克风。再如,麦克风阵列包括按圆形排列的多个麦克风,则服务器可以选取多个麦克风中的任一麦克风作为第一麦克风。
305、服务器对于第一麦克风和第二麦克风中对应同一子频段的两个子频谱,确定两个子频谱的能量值之间的能量差值。
在本申请实施例中,子频谱的能量值能够有效代表该子频谱的特征,进而确定两个麦克风中对应同一子频段的两个子频谱的能量值之间的能量差值,该差值能够有效代表该两个子频谱之间的差异。
306、服务器将多个子频段对应的能量差值的绝对值超过第一阈值的子频段的数目,作为差异度。
在本申请实施例中,第一阈值可以根据需要进行设定并更改,如第一阈值可以为3dB(分贝)。在本申请实施例中,将能量差值的绝对值超过第一阈值的子频段称为异常子频段,则能量差值的绝对值超过3dB的子频段即为异常子频段。
需要说明的是,两个麦克风之间由于位置不同或噪声干扰,导致采集的音频信号会产生一些不可避免的误差,而在本申请实施例中,通过将多个子频段对应的能量差值的绝对值超过第一阈值的子频段的数目作为差异度,允许了误差的存在,进而保证了确定差异度的合理性;且基于多个子频段各自的差值来确定的差异度,提高了确定差异度的精度,进而保证了所确定的差异度的准确性。
307、服务器基于第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异度,确定第二麦克风与第一麦克风之间的一致性检测结果,差异度表示第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异。
需要说明的是,两个麦克风之间由于位置不同或噪声干扰,所采集的音频信号会产生一些不可避免的误差,因此需要允许误差的存在。相应地,在本申请实施例中,服务器在差异度不超过第二阈值的情况下,确定第二麦克风与第一麦克风之间的一致性检测结果为符合一致性。服务器在差异度超过第二阈值的情况下,确定第二麦克风与第一麦克风之间的一致性检测结果为不符合一致性。
在本申请实施例的一种实现方式中,第二阈值与子频谱的数目正相关,即子频谱的数目越多,则第二阈值越大。例如,子频谱的数目为10,则第二阈值为3;子频谱的数目为20,则第二阈值为6;这样使得第二阈值与子频谱的数目相匹配,保证了第二阈值的合理性。在本申请实施例的另一种实现方式中,第二阈值与麦克风阵列的一致性的精度要求负相关,即精度要求越高,第二阈值越小,这样基于麦克风阵列的精度要求来确定第二阈值,提高了确定第二阈值的灵活性。
在本申请实施例中,通过在差异度不超过第二阈值的情况下,确定第二麦克风与第一麦克风之间的一致性检测结果为符合一致性,允许了误差的存在,进而保证了所确定的一致性检测结果的合理性。
308、服务器在每个第二麦克风与第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定麦克风阵列符合一致性。
在本申请实施例中,基于上述步骤301-308检测到麦克风阵列是否符合一致性后,基于检测结果就可以判断麦克风阵列是否能够正常采集音频信号以及判断各个麦克风之间的误差是否满足要求。在本申请实施例中,若麦克风阵列符合一致性,则可以确定麦克风阵列能够正常采集音频信号以及确定各个麦克风之间的误差满足要求。而在本申请实施例中,对于符合一致性的麦克风阵列,还可以通过进一步确定麦克风阵列中各个麦克风的位置是否符合设计要求,来确定该麦克风阵列是否满足使用要求。
在本申请实施例中,服务器通过以下方式确定各个麦克风的位置是否满足要求,进而确定麦克风阵列是否满足使用要求:服务器基于多个麦克风的音频信号,对目标播放设备进行定位,以得到目标播放设备相对于麦克风阵列的估计方向;服务器在目标播放设备相对于麦克风阵列的真实方向与估计方向相匹配的情况下,确定麦克风阵列满足使用要求。
在上述采集音频信号的过程中,服务器确定了目标播放设备与麦克风阵列之间通过远场传播声音的相对位置,而目标采集设备相对于麦克风阵列的空间位置可以通过建立相应的坐标系来确定。在本申请实施例中,服务器将麦克风阵列的中心位置作为原点,水平方向上从左到右的方向即为0到180度的方向,则目标播放设备相对于麦克风阵列的真实方向即为90度方向,服务器采用声源定位算法对多个麦克风的音频信号进行处理,得到目标播放设备相对于麦克风阵列的估计方向。声波定位算法包括波束形成算法、时间到达差算法和声全息算法等中的至少一项。
在本申请实施例中,真实方向与估计方向相匹配指真实方向与估计方向之间的角度差在预设范围内。若真实方向与估计方向相匹配,则说明麦克风阵列中各个麦克风的位置与实际位置设计基本吻合,即符合设计要求,进而可以确定该麦克风阵列满足使用要求。若真实方向与估计方向不匹配,即估计方向与真实方向之间的角度差较大,超过预设范围,则说明麦克风阵列中各个麦克风的位置并不全部符合设计要求,存在较为明显的工艺误差,进而可以确定该麦克风阵列不满足使用要求。
在本申请实施例中,麦克风阵列中的多个麦克风分别标注有不同的序号,相应地,服务器在至少一个第二麦克风与第一麦克风之间的一致性检测结果为不符合一致性的情况下,输出该至少一个第二麦克风的序号。这样通过输出第二麦克风的序号,进而便于维修人员对不符合一致性的第二麦克风进行维修。
在本申请实施例中,服务器还对于输出序号的每个第二麦克风,输出其多个子频段对应的能量差值的绝对值超过第一阈值的子频段的频段信息,进而便于维修人员基于该频段信息对该第二麦克风维修。
在本申请实施例中,由于第一麦克风为麦克风阵列中的一个麦克风,则该第一麦克风可能为不符合一致性的麦克风,因此,需要在确定该第一麦克风符合一致性的情况下,才输出该至少一个第二麦克风的序号。相应地,在本申请实施例中,服务器在至少一个第二麦克风的数量不超过第三阈值的情况下,输出该至少一个第二麦克风的序号。
在本申请实施例中,该至少一个第二麦克风的数量不超过第三阈值,则说明该作为参考标准的第一麦克风有较大的概率为符合一致性的麦克风,进而基于该第一麦克风所确定的不符合一致性的至少一个第二麦克风准确性高。
在本申请实施例中,该第三阈值与麦克风阵列中麦克风的数量正相关,即麦克风的数量越多,第三阈值越大。例如,麦克风的数量为10个,该第三阈值可以为4个,麦克风的数量为20个,该第三阈值可以为7个,在此不作具体限制。
在本申请实施例中,在该第一麦克风为不符合一致性的麦克风的情况下,需要重新确定第一麦克风,以对麦克风阵列重新进行一致性检测。相应地,服务器在上述至少一个第二麦克风的数量超过第三阈值的情况下,从多个第二麦克风中重新确定第一麦克风,基于重新确定的第一麦克风的多个子频谱,对麦克风阵列进行一致性检测。
需要说明的是,若该至少一个第二麦克风的数量过大,说明与第一麦克风之间不符合一致性的第二麦克风过多,则该作为参考标准的第一麦克风有较大的概率为不符合一致性的麦克风,即此时确定该第一麦克风为不符合一致性的麦克风的准确性高;进而再基于重新确定的第一麦克风对麦克风阵列重新进行一致性检测,保证了检测的准确性。
在本申请实施例中,服务器可以将多个第二麦克风中距中心位置最近的麦克风确定为新的第一麦克风,或将第二麦克风中的任意一个麦克风确定为新的第一麦克风,在此不作具体限定。在本申请实施例中,服务器重新确定第一麦克风后,还需基于重新确定的第一麦克风,输出至少一个第二麦克风的序号,该至少一个第二麦克风是指与重新确定的第一麦克风之间的一致性检测结果为不符合一致性的麦克风。
在本申请实施例中,通过基于麦克风阵列中第一麦克风的多个子频谱,对麦克风阵列进行一致性检测,降低了检测的条件,进而能够实现快速检测,提高了检测的效率,且提高了检测的准确性。参见图4,图4为本申请实施例提供的一种麦克风阵列一致性的检测方法的流程图。在本申请实施例中,服务器通过麦克风阵列采集音频信号。然后将采集的音频信号经FFT变换,以得到频域的音频信号,再将音频信号中目标频段的频谱划分为多个子频谱后,确定多个子频谱的能量值。然后基于第一阈值和两个麦克风的多个子频谱的能量值之间的差值,得到差异度,进而基于该差异度确定两个麦克风之间是否符合一致性。然后判断每个第二麦克风与第一麦克风之间是否都符合一致性。在至少一个第二麦克风与第一麦克风之间不符合一致性的情况下,确定该麦克风阵列不符合一致性,即不合格,进而输出该至少一个第二麦克风的序号,即输出不符合一致性的麦克风的序号。在每个第二麦克风与第一麦克风之间都符合一致性的情况下,则采用声源定位算法判断该麦克风阵列是否满足位置的误差要求,在满足的情况下,则确定该麦克风阵列合格,即满足使用要求;在不满足的情况下,则确定该麦克风阵列不合格,即麦克风阵列不满足使用要求。
在本申请实施例中,通过将每个麦克风的音频信号中目标频段的频谱进行划分,来得到多个子频谱,由于每个子频谱均能够代表音频信号的一个细节特征,这样基于两个麦克风各自的多个子频谱之间的差异度,来确定两个麦克风之间的一致性检测结果,能够提高检测的精度;且以多个麦克风中的第一麦克风为参考标准,对第一麦克风与多个第二麦克风之间的一致性分别进行检测,这样在检测到任一第二麦克风与第一麦克风之间不符合一致性的情况下,就说明该麦克风阵列中存在不符合一致性的麦克风,进而就能够确定该麦克风阵列不符合一致性,提高了对麦克风阵列进行一致性检测的准确性。
本申请实施例还提供了一种麦克风阵列的一致性检测装置,参见图5,装置包括:
采集模块501,用于通过麦克风阵列中的多个麦克风进行声音采集,以获取多个麦克风的音频信号;
第一确定模块502,用于对于每个麦克风,确定麦克风的音频信号中目标频段的频谱;
划分模块503,用于将目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段;
第二确定模块504,用于对于多个麦克风中除第一麦克风以外的每个第二麦克风,基于第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异度,确定第二麦克风与第一麦克风之间的一致性检测结果,差异度表示第二麦克风的多个子频谱与第一麦克风的多个子频谱之间的差异;
第三确定模块505,用于在每个第二麦克风与第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定麦克风阵列符合一致性。
在一些实施例中,装置还包括:
第四确定模块,用于确定第一麦克风的多个子频谱各自的能量值以及确定第二麦克风的多个子频谱各自的能量值;
第五确定模块,用于对于第一麦克风和第二麦克风中对应同一子频段的两个子频谱,确定两个子频谱的能量值之间的能量差值;
第六确定模块,用于将多个子频段对应的能量差值的绝对值超过第一阈值的子频段的数目,作为差异度。
在一些实施例中,第二确定模块504,用于:
在差异度不超过第二阈值的情况下,确定第二麦克风与第一麦克风之间的一致性检测结果为符合一致性。
在一些实施例中,采集模块501,用于:
通过目标播放设备在目标场景下播放高斯白噪声;
通过麦克风阵列在目标场景下进行声音采集。
在一些实施例中,装置还包括:
第七确定模块,用于基于麦克风阵列的阵列孔径和高斯白噪声的最小波长,确定参考距离;
第八确定模块,用于基于参考距离,确定水平距离,水平距离大于或等于参考距离;
第九确定模块,用于基于目标播放设备的第一位置和水平距离,确定第二位置,麦克风阵列用于在第二位置进行声音采集。
在一些实施例中,在确定麦克风阵列符合一致性之后,装置还包括:
定位模块,用于基于多个麦克风的音频信号,对目标播放设备进行定位,以得到目标播放设备相对于麦克风阵列的估计方向;
第十确定模块,用于在目标播放设备相对于麦克风阵列的真实方向与估计方向相匹配的情况下,确定麦克风阵列满足使用要求。
在一些实施例中,装置还包括:
第十一确定模块,用于基于麦克风阵列中各个麦克风的位置,确定中心位置;
第十二确定模块,用于将中心位置的麦克风作为第一麦克风。
在一些实施例中,麦克风阵列中的多个麦克风分别标注有不同的序号,装置还包括:
输出模块,用于在至少一个第二麦克风与第一麦克风之间的一致性检测结果为不符合一致性的情况下,输出至少一个第二麦克风的序号。
在一些实施例中,输出模块还用于:
在至少一个第二麦克风的数量不超过第三阈值的情况下,输出至少一个第二麦克风的序号。
在一些实施例中,装置还包括:
第十三确定模块,用于在至少一个第二麦克风的数量超过第三阈值的情况下,从多个第二麦克风中重新确定第一麦克风,基于重新确定的第一麦克风的多个子频谱,对麦克风阵列进行一致性检测。
在一些实施例中,第一确定模块502,用于:
在麦克风阵列用于语音检测场景中的情况下,将音频信号中自然语音频率所在频段作为目标频段;
在麦克风阵列用于异常事件检测场景中的情况下,将音频信号的频段均作为目标频段。
在本申请实施例中,通过将每个麦克风的音频信号中目标频段的频谱进行划分,来得到多个子频谱,由于每个子频谱均能够代表音频信号的一个细节特征,这样基于两个麦克风各自的多个子频谱之间的差异度,来确定两个麦克风之间的一致性检测结果,能够提高检测的精度;且由于符合一致性的麦克风阵列的两个麦克风之间应该符合一致性,这样以多个麦克风中的第一麦克风为参考标准,对第一麦克风与多个第二麦克风之间的一致性分别进行检测,在每个第二麦克风与第一麦克风之间均符合一致性的情况下,就能够说明该麦克风阵列符合一致性,提高了对麦克风阵列进行一致性检测的准确性。
需要说明的是:上述实施例提供的麦克风阵列的一致性检测装置仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将控制设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的麦克风阵列的一致性检测装置与麦克风阵列的一致性检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在一些实施例中,计算机设备提供为控制设备。图6示出了本申请一个示例性实施例提供的控制设备600的结构框图。该控制设备600可以是便携式移动控制设备,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。控制设备600还可能被称为用户设备、便携式控制设备、膝上型控制设备、台式控制设备等其他名称。
通常,控制设备600包括有:处理器601和存储器602。
处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个程序代码,该至少一个程序代码用于被处理器601所执行以实现本申请中方法实施例提供的麦克风阵列的一致性检测方法。
在一些实施例中,控制设备600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、显示屏605、摄像头组件606、音频电路607和电源608中的至少一种。
外围设备接口603可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它控制设备进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏605用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置在控制设备600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在控制设备600的不同表面或呈折叠设计;在另一些实施例中,显示屏605可以是柔性显示屏,设置在控制设备600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。通常,前置摄像头设置在控制设备的前面板,后置摄像头设置在控制设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在控制设备600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
电源608用于为控制设备600中的各个组件进行供电。电源608可以是交流电、直流电、一次性电池或可充电电池。当电源608包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,控制设备600还包括有一个或多个传感器609。该一个或多个传感器609包括但不限于:加速度传感器610、陀螺仪传感器611、压力传感器612、光学传感器613以及接近传感器614。
加速度传感器610可以检测以控制设备600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器610可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器610采集的重力加速度信号,控制显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器610还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器611可以检测控制设备600的机体方向及转动角度,陀螺仪传感器611可以与加速度传感器610协同采集用户对控制设备600的3D动作。处理器601根据陀螺仪传感器611采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器612可以设置在控制设备600的侧边框和/或显示屏605的下层。当压力传感器612设置在控制设备600的侧边框时,可以检测用户对控制设备600的握持信号,由处理器601根据压力传感器612采集的握持信号进行左右手识别或快捷操作。当压力传感器612设置在显示屏605的下层时,由处理器601根据用户对显示屏605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
光学传感器613用于采集环境光强度。在一个实施例中,处理器601可以根据光学传感器613采集的环境光强度,控制显示屏605的显示亮度。具体地,当环境光强度较高时,调高显示屏605的显示亮度;当环境光强度较低时,调低显示屏605的显示亮度。在另一个实施例中,处理器601还可以根据光学传感器613采集的环境光强度,动态调整摄像头组件606的拍摄参数。
接近传感器614,也称距离传感器,通常设置在控制设备600的前面板。接近传感器614用于采集用户与控制设备600的正面之间的距离。在一个实施例中,当接近传感器614检测到用户与控制设备600的正面之间的距离逐渐变小时,由处理器601控制显示屏605从亮屏状态切换为息屏状态;当接近传感器614检测到用户与控制设备600的正面之间的距离逐渐变大时,由处理器601控制显示屏605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图6中示出的结构并不构成对控制设备600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在一些实施例中,计算机设备提供为服务器,图7是本申请实施例提供的一种服务器的框图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)701和一个或一个以上的存储器702,其中,存储器702用于存储可执行程序代码,处理器701被配置为执行上述可执行程序代码,以实现上述各个方法实施例提供的麦克风阵列的一致性检测方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种包括程序代码的存储介质,例如包括程序代码的存储器702,上述程序代码可由服务器700的处理器701执行以完成上述麦克风阵列的一致性检测方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM(Read-Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,只读光盘)、磁带、软盘和光数据存储设备等。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有至少一条程序代码,至少一条程序代码由处理器加载并执行,以实现上述任一实现方式的麦克风阵列的一致性检测方法。
本申请实施例还提供了一种计算机程序产品,计算机程序产品包括计算机程序代码,计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机程序代码,处理器执行计算机程序代码,使得计算机设备执行上述任一实现方式的麦克风阵列的一致性检测方法。
在一些实施例中,本申请实施例所涉及的计算机程序产品可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
以上仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本申请的保护范围之内。

Claims (15)

1.一种麦克风阵列的一致性检测方法,其特征在于,所述方法包括:
通过麦克风阵列中的多个麦克风进行声音采集,以获取所述多个麦克风的音频信号;
对于每个麦克风,确定所述麦克风的音频信号中目标频段的频谱;
将所述目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段;
对于所述多个麦克风中除第一麦克风以外的每个第二麦克风,基于所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异度,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果,所述差异度表示所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异;
在每个第二麦克风与所述第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定所述麦克风阵列符合一致性。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述第一麦克风的多个子频谱各自的能量值以及确定所述第二麦克风的多个子频谱各自的能量值;
对于所述第一麦克风和所述第二麦克风中对应同一子频段的两个子频谱,确定所述两个子频谱的能量值之间的能量差值;
将多个子频段对应的所述能量差值的绝对值超过第一阈值的子频段的数目,作为所述差异度。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异度,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果,包括:
在所述差异度不超过第二阈值的情况下,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果为符合一致性。
4.根据权利要求1所述的方法,其特征在于,所述通过麦克风阵列进行声音采集,包括:
通过目标播放设备在目标场景下播放高斯白噪声;
通过所述麦克风阵列在所述目标场景下进行声音采集。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
基于所述麦克风阵列的阵列孔径和所述高斯白噪声的最小波长,确定参考距离;
基于所述参考距离,确定水平距离,所述水平距离大于或等于所述参考距离;
基于所述目标播放设备的第一位置和所述水平距离,确定第二位置,所述麦克风阵列用于在所述第二位置进行声音采集。
6.根据权利要求4所述的方法,其特征在于,在确定所述麦克风阵列符合一致性之后,所述方法还包括:
基于所述多个麦克风的音频信号,对所述目标播放设备进行定位,以得到所述目标播放设备相对于所述麦克风阵列的估计方向;
在所述目标播放设备相对于所述麦克风阵列的真实方向与所述估计方向相匹配的情况下,确定所述麦克风阵列满足使用要求。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述麦克风阵列中各个麦克风的位置,确定中心位置;
将所述中心位置的麦克风作为所述第一麦克风。
8.根据权利要求1所述的方法,其特征在于,所述麦克风阵列中的多个麦克风分别标注有不同的序号,所述方法还包括:
在至少一个第二麦克风与所述第一麦克风之间的一致性检测结果为不符合一致性的情况下,输出所述至少一个第二麦克风的序号。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述至少一个第二麦克风的数量不超过第三阈值的情况下,输出所述至少一个第二麦克风的序号。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述至少一个第二麦克风的数量超过第三阈值的情况下,从多个第二麦克风中重新确定第一麦克风,基于重新确定的第一麦克风的多个子频谱,对所述麦克风阵列进行一致性检测。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述麦克风阵列用于语音检测场景中的情况下,将所述音频信号中自然语音频率所在频段作为所述目标频段;
在所述麦克风阵列用于异常事件检测场景中的情况下,将所述音频信号的频段均作为所述目标频段。
12.一种麦克风阵列的一致性检测装置,其特征在于,所述装置包括:
采集模块,用于通过麦克风阵列中的多个麦克风进行声音采集,以获取所述多个麦克风的音频信号;
第一确定模块,用于对于每个麦克风,确定所述麦克风的音频信号中目标频段的频谱;
划分模块,用于将所述目标频段的频谱进行划分,以得到多个子频谱,一个子频谱对应一个子频段;
第二确定模块,用于对于所述多个麦克风中除第一麦克风以外的每个第二麦克风,基于所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异度,确定所述第二麦克风与所述第一麦克风之间的一致性检测结果,所述差异度表示所述第二麦克风的多个子频谱与所述第一麦克风的多个子频谱之间的差异;
第三确定模块,用于在每个第二麦克风与所述第一麦克风之间的一致性检测结果均为符合一致性的情况下,确定所述麦克风阵列符合一致性。
13.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行,以实现如权利要求1至权利要求11任一项所述的麦克风阵列的一致性检测方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至权利要求11任一项所述的麦克风阵列的一致性检测方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序代码,所述处理器执行所述计算机程序代码,使得所述计算机设备执行如权利要求1至权利要求11任一项所述的麦克风阵列的一致性检测方法。
CN202211067433.XA 2022-09-01 2022-09-01 麦克风阵列的一致性检测方法、装置、设备及存储介质 Pending CN115460529A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211067433.XA CN115460529A (zh) 2022-09-01 2022-09-01 麦克风阵列的一致性检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211067433.XA CN115460529A (zh) 2022-09-01 2022-09-01 麦克风阵列的一致性检测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115460529A true CN115460529A (zh) 2022-12-09

Family

ID=84301248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211067433.XA Pending CN115460529A (zh) 2022-09-01 2022-09-01 麦克风阵列的一致性检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115460529A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117459888A (zh) * 2023-12-22 2024-01-26 地球山(苏州)微电子科技有限公司 一种数字发声芯片的一致性检测方法、装置以及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117459888A (zh) * 2023-12-22 2024-01-26 地球山(苏州)微电子科技有限公司 一种数字发声芯片的一致性检测方法、装置以及系统
CN117459888B (zh) * 2023-12-22 2024-03-12 地球山(苏州)微电子科技有限公司 一种数字发声芯片的一致性检测方法、装置以及系统

Similar Documents

Publication Publication Date Title
CN111402913B (zh) 降噪方法、装置、设备和存储介质
US11315582B2 (en) Method for recovering audio signals, terminal and storage medium
CN108335703B (zh) 确定音频数据的重音位置的方法和装置
CN109887494B (zh) 重构语音信号的方法和装置
CN107862093B (zh) 文件属性识别方法及装置
CN111128232B (zh) 音乐的小节信息确定方法、装置、存储介质及设备
CN110401898B (zh) 输出音频数据的方法、装置、设备和存储介质
CN109192223B (zh) 音频对齐的方法和装置
CN109102811B (zh) 音频指纹的生成方法、装置及存储介质
CN110688082A (zh) 确定音量的调节比例信息的方法、装置、设备及存储介质
CN112233689B (zh) 音频降噪方法、装置、设备及介质
CN110797042B (zh) 音频处理方法、装置及存储介质
CN109003621B (zh) 一种音频处理方法、装置及存储介质
CN111696570A (zh) 语音信号处理方法、装置、设备及存储介质
CN111613213A (zh) 音频分类的方法、装置、设备以及存储介质
CN115460529A (zh) 麦克风阵列的一致性检测方法、装置、设备及存储介质
CN111984222A (zh) 调节音量的方法、装置、电子设备及可读存储介质
CN109036463B (zh) 获取歌曲的难度信息的方法、装置及存储介质
CN113192531B (zh) 检测音频是否是纯音乐音频方法、终端及存储介质
CN111193604A (zh) 虚拟网络功能链的部署方法、装置、设备及存储介质
CN115331689A (zh) 语音降噪模型的训练方法、装置、设备、存储介质及产品
CN111402873B (zh) 语音信号处理方法、装置、设备及存储介质
CN114550717A (zh) 语音音区切换方法、装置、设备及存储介质
CN113724739A (zh) 检索音频和训练声学模型的方法、终端及存储介质
CN112365088A (zh) 行程关键点的确定方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination