CN112261528B

CN112261528B - 一种多路定向拾音的音频输出方法及系统

Info

Publication number: CN112261528B
Application number: CN202011146185.9A
Authority: CN
Inventors: 汪洲华
Original assignee: Individual
Current assignee: Individual
Priority date: 2020-10-23
Filing date: 2020-10-23
Publication date: 2022-08-26
Anticipated expiration: 2040-10-23
Also published as: CN112261528A

Abstract

本发明公开了一种多路定向拾音的音频输出方法和系统，所述方法包括如下步骤：水平布置多个麦克风，形成水平排列麦克风阵列；预设至少一个目标声源位置，计算每个目标声源位置的音频在不同麦克风获取的时间差；采集声源音频信号，并通过计算所述时间差识别相同目标声源音频信号；根据所述时间差对每一麦克风获取的目标声源音频信号进行叠加，以获取放大的目标音频信号；输出目标音频信息，通过多个麦克风采集声源音频信号，并将同一声源音频信号根据音频信号的振幅和频率进行平移叠加，从而获取同一声源加强的音频信号，可提高同一声源的音频的清晰度。

Description

一种多路定向拾音的音频输出方法及系统

技术领域

本发明涉及一种音频采集输出领域，特别涉及一种多路定向拾音的音频输出方法及系统。

背景技术

现有技术中现有音频监控系统采用二种拾音方案：一种是全向拾音器，通过降噪技术，可以获取现场清晰的声源信号，如果只存在一个声源点在一定范围内可以听清内容，然而这种方案不能对现场多声源的信号进行分离，如果存在多声源则无法辨识指定声源的内容。另一种是采用定向拾音器，但这种装置及方法同一时间只能拾取一个较窄扇面方向的声源，存在音频的监控盲区。如果要实现全方位覆盖拾音时，需要布置多套定向拾音装置，成本非常高。在人员聚集的复杂场景，同时存在多个不固定声源，极易相互干扰，现有的拾音装置难以分辨指定位置声源的内容。

发明内容

本发明其中一个发明目的在于提供一种多路定向拾音的音频输出方法和系统，所述方法和系统通过设置麦克风阵列，通过多个麦克风采集声源音频信号，并将同一声源音频信号根据音频信号的振幅和频率进行平移叠加，从而获取同一声源加强的音频信号，可提高同一声源的音频的清晰度。

本发明其中一个发明目的在于提供一种多路定向拾音的音频输出方法和系统，所述方法和系统通过在所述麦克风阵列和声源之间形成一定的距离差，当声源音频信号被不同的麦克风阵列获取时，可产生一定的时间差，因此在信号上产生一定的时间差，通过计算时间差，将多个麦克风的信号进行叠加，从而可以获取放大的声源音频信号。

本发明其中一个发明目的在于提供一种多路定向拾音的音频输出方法和系统，所述方法和系统可采集不同声源音频信号，通过设置采集时差，可定位采集多个具体位置或多个具体区域的声源音频信号，并对多个声源音频信号进行叠加，可以输出多个定向并放大的声源音频信号。

本发明其中一个发明目的在于提供一种多路定向拾音的音频输出方法和系统，所述麦克风阵列在采集定向的声源信号后，进一步采用信号放大电路、带通滤波电路和D/滤波电路进行预处理，从而可以获取更清晰的定向声源音频信息。

为了实现至少一个上述发明目的，本发明进一步提供一种多路定向拾音的音频输出方法，所述方法包括如下步骤：

水平布置多个麦克风，形成水平排列麦克风阵列；

预设至少一个目标声源位置，计算每个目标声源位置的音频在不同麦克风获取的时间差；

采集声源音频信号，并通过计算所述时间差识别相同目标声源音频信号；

根据所述时间差对每一麦克风获取的目标声源音频信号进行叠加，以获取放大的目标音频信号；

输出目标音频信息。

根据本发明其中一个较佳实施例，所述麦克风被设置为3个，并形成三角麦克风阵列，其中所述三角麦克风阵列具有3个阵点，每个阵点具有一个麦克风，3个阵点分别设于所述三角麦克风阵列的3个端点，其中相邻两个阵点之间的距离相等。

根据本发明其中一个较佳实施例，预设3个阵点的位置，并获取相邻阵点之间的距离，根据三角麦克风阵点位置计算所述三角麦克风阵列中心点位置，并计算所述目标声源到所述三角麦克风阵列中心点水平投影的距离。

根据本发明其中一个较佳实施例，所述布置多个麦克风步骤包括：设定目标声源的高度，其中所述目标声源高度包括人体站姿高度和人体坐姿高度，所述人体站姿高度预设为150cm，人体坐姿高度预设为90cm，根据目标声源高度预设所述三角麦克风阵列中心点相对所述目标声源高度，使得所述三角麦克风阵列中心点高于所述目标声源高度。

根据本发明其中一个较佳实施例，计算所述三角麦克风阵列中心点和所述目标声源之间的水平投影距离，并计算所述三角麦克风阵列中心点和所述目标声源之间的水平投影距离之间的高度差，进一步计算目标声源和所述三角麦克风阵列中心点之间的水平夹角，根据平面几何关系在所述三角麦克风阵列中获取目标声源角β。

根据本发明其中一个较佳实施例，根据所述声源角β、三角麦克风阵列中心点和所述目标声源之间的水平投影距离之间的高度差、目标声源到所述三角麦克风阵列中心点的距离计算每一边的距离计算所述目标声源和所有阵点之间的距离，用于标声源位置的音频在不同麦克风获取的时间差。

根据本发明其中一个较佳实施例，根据时间差识别每一目标声源相同的音频信号，将被识别为相同的目标声源音频信号根据时间差对不同的麦克风信号进行平移叠加后，将相同声源音频信号的波峰相互叠加，相同声源音频信号波谷相互叠加，将非相同时间差的干扰声源音频信号波峰波谷相互叠加，用于抑制干扰声源音频信号并加强目标声源音频信号。

根据本发明其中一个较佳实施例，获取目标声源音频信息后，进一步对所述目标声源音频信息进行预处理，所述预处理的方法包括：对所述目标声源音频信息进行信号放大、音频去噪、语音频段带通滤波，并进一步将目标音频信息转换为。

根据本发明其中一个较佳实施例，所述麦克风采集声源位置的音频信号，并将目标声源位置音频信号转化数字信号，进一步输入DSP分析波峰波谷和幅值。

为了实现至少一个上述实施例，本发明进一步提供一种多路定向拾音的音频输出系统，包括：

至少一个三角麦克风阵列，所述三角麦克风阵列水平排列设置，并且所述三角麦克风阵列高于声源位置，用于获取声源位置的音频信息；

预处理模块，用于将所述声源位置的音频信息进行信号放大、音频去噪、语音频段带通滤波并转换为数字信号；

识别处理模块，用于识别至少每一麦克风获取声源位置的目标声源，并将相同声源音频信号的波峰相互叠加，相同声源音频信号波谷相互叠加，将非相同时间差的干扰声源音频信号波峰波谷相互叠加，用于抑制干扰声源音频信号并加强目标声源音频信号；

输出模块，用于输出目标音频信息。

所述至少一个三角麦克风阵列获取目标声源位置的音频信息，将目标声源位置的音频信息输入所述预处理模块，获取预处理后的目标声源位置的音频信息，通过所述识别模块识别目标声源音频信息，并进一步通过所述输出模块输出目标音频信息。

附图说明

图1显示的本发明一个较佳实施例的一种多路定向拾音的音频输出方法流程示意图。

图2显示的本发明一个较佳实施例的麦克风安装俯视示意图。

图3显示的本发明一个较佳实施例的麦克风安装侧方示意图。

图4显示的本发明一个较佳实施例的不同麦克风音频波形未叠加状态的电平-时间坐标示意图。

图5显示的本发明一个较佳实施例的不同麦克风音频波形未叠加状态的电平-时间坐标示意图。

图6显示的本发明一个较佳实施例中音频信号传输流程示意图。

图7显示的本发明一个较佳实施例的一种多路定向拾音的音频输出系统的模块示意图。

图8显示的本发明一个较佳实施例中DPS电路示意图。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。

本领域技术人员应理解的是，在本发明的揭露中，术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系是基于附图所示的方位或位置关系，其仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此上述术语不能理解为对本发明的限制。

可以理解的是，术语“一”应理解为“至少一”或“一个或多个”，即在一个实施例中，一个元件的数量可以为一个，而在另外的实施例中，该元件的数量可以为多个，术语“一”不能理解为对数量的限制。

请参考图1-8，本发明公开了一种一种多路定向拾音的音频输出方法和系统，其中所述音频输出方法包括如下步骤：

水平布置多个麦克风，形成水平排列麦克风阵列；

输出目标音频信息。

需要说明的是，所述麦克风阵列将根据目标声源位置确定具体的安装高度，所述麦克风阵列高于所述目标声源位置进行水平安装，在本发明一个较佳实施例中，优选设置3个麦克风形成三角麦克风阵列，请具体参考图2，所述三角麦克风阵列具有3个阵点a、b、c，每个阵点内设有一个麦克风，并且相邻阵点之间的距离相等.也就是说，a、b、c三个阵点构成水平设置的等边三角形，假设设声源为o点，其中声源o的距离地面的高度为D，测量等边三角形△abc中心点d水平投影点d₁和声源o点之间的距离，进一步根据三角形△abc中心点d投影点d₁和声源o点之间的距离L计算目标声源位置和所述三角形△abc中心点的水平夹角α，具体地，本发明以db边为水平初始边，则目标声源位置和所述三角形△abc中心水平夹角为od₁边和对应的ob边之间的锐角夹角，根据平面几何关系可得知，声源角为β＝360°-α。获取所述等边三角形△abc边长A，其中所述边长A可以根据场景需求预先设置，进一步测量并获取目标声源垂直高度D和三角形△abc中心点d的垂直高度D。

进一步的，根据等边三角形△abc边长A、声源角β,三角形△abc中心点d的水平投影点d₁和声源o点之间的距离L、目标声源垂直高度B和三角形△abc中心点d的垂直高度D，计算目标声源o和a、b、c三个阵点的距离，其中计算公式如下：

值得一提的是，a、b、c阵点分别设有对应的麦克风，用于采集所述目标声源o的音频信息，每个麦克风计算获取目标声源的时刻，并计算相邻麦克风之间的时间差，根据声音在常温(25摄氏度)下传播速率V₀＝346m/s,由此可计算出目标声源音频分别到a、b、c阵点的时间，其中声源到a阵点的时间为ta＝oa/V₀，tb＝ob/V₀,tc＝oc/V₀，进一步计算ta、tb、tc之间的时间差为Δt，即Δtac＝ta-tc,Δtab＝ta-tb，Δtbc＝tb-tc，需要说明的是该时间差Δt可根据多个目标声源的位置或区域预先设置，也就是说，所述时间差Δt可以为根据上述的计算公式获取的集合。

为了更好地说明本发明的技术方案，本发明定义a阵点内设有第一麦克风，b阵点内设有第二麦克风，c阵点内设有第三麦克风，所述第一麦克风、第二麦克风和第三麦克风可通过吊装的方式安装于对应的阵点，并且第一麦克风、第二麦克风和第三麦克风处于同一水平面。所述第一麦克风、第二麦克风和第三麦克风分别获取声源o的音频，其中所述声源o被设置于第一麦克风的左侧。根据RTK实时时钟确定所述麦克风获取目标声源的时间t,其中定义第一麦克风获取目标声源o的音频的时间为t₁,定义第二麦克风获取目标声源o的音频时间为t₂,第三麦克风获取声源o音频的时间为t₃。由于三个麦克风和所述目标声源o存在一定的距离差，因此时间并不相同，根据空间关系计算第一麦克风和第二麦克风之间的时间差Δt₁，计算第二麦克风和第三麦克风之间的时间差Δt₂，进一步将Δt₁和Δt₂保存，用于波形平移叠加的时间依据。

其中每一个麦克风在接收的目标声源的音频后转化形成模拟信号，该模拟信号以波的形式存在。请具体参考图4，图4显示的是转化后目标声源的电平-时间坐标图，该坐标图的横坐标为时间，单位为ms，纵坐标为模拟信号的电平值,单位为mV。目标声源在该坐标系内存在如第一波形、第二波形和第三波形，其中根据RTK实时时钟对第一麦克风、第二麦克风和第三麦克风获取目标声源音频进行时间标记，并将标记后的目标音频信号保存，根据标记的时间识别所述第一波形、第二波形和第三波形对应的麦克风，在本发明图4所示的实施例中，第一波形对应第一麦克风，第二波形对应第二麦克风，第三波形对应第三麦克风，第一麦克风和第二麦克风，并将三个波形放置于同一电平-时间坐标图中，以所述第二麦克风对应的时间标记为基准，可从判断第一麦克风接收目标声源音频时间晚于于所述第二麦克风接收目标声源音频时间，第三波形早于所述第二麦克风，即t1-t2＜0、t3-t2＞0，进一步将第一波形向右移动预设的时间差Δt₁，并将第三波形向左移动预设的时间差Δt₂，以形成如图5显示的叠加状态波形示意图，在该叠加状态下第一波形、第二波形和第三波形的波峰和波谷相互叠加，形成加强的波峰和波谷信号，从而可以有效地放大目标声源的音频信号。

值得一提的是，在本发明另一较佳实施例中，根据第一麦克风、第二麦克风和第三麦克风根据时间差识别干扰声源音频信号，若第一波形、第二波形和第三波形以第二波形的时间差不满足预设的时间差Δt₁和Δt₂，则判定对应声源为干扰声源，并进一步将干扰声源的第一波形、第二波形和第三波形根据半个时间差进行错峰位移，从而使得所述干扰声源的波峰和波谷进行叠加，从而可以有效地抑制干扰声源信号强度。因此本发明可加强目标声源信号的同时抑制干扰信号的信号强度，从而使得目标目标声源的信号将更加清晰。

请结合图6-8，本发明进一步公开了一种多路定向拾音的音频输出系统以及系统内部的模块装置示意图，所述系统包括：

输出模块，用于输出目标音频信息。

其中麦克风阵列将采集到的目标声源音频信号分别或依次输入放大电路、带通滤波电路和A/D转换电路，对采集到的所述目标声源音频信号进行预处理，以获取清晰度高、信号强度好的目标声源音频数字信号。具体的，所述识别处理模块包括DPS处理芯片、RTC模块，通过RTC模块标记每一路麦克风接收目标声源音频时间，将目标声源音频数字信号输入到DPS处理芯片，对目标声源数字信号进行平移处理，并且所述识别模块还包括电源、晶振、存储器，分别连接所述DPS处理芯片。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域的技术人员应理解，上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明，本发明的目的已经完整并有效地实现，本发明的功能及结构原理已在实施例中展示和说明，在没有背离所述原理下，本发明的实施方式可以有任何变形或修改。

Claims

1.一种多路定向拾音的音频输出方法，其特征在于，所述方法包括如下步骤：

水平布置多个麦克风，形成水平排列麦克风阵列；

输出目标音频信息；

所述麦克风被设置为3个，并形成三角麦克风阵列，其中所述三角麦克风阵列具有3个阵点，每个阵点具有一个麦克风，3个阵点分别设于所述三角麦克风阵列的3个端点，其中相邻两个阵点之间的距离相等；

计算所述三角麦克风阵列中心点和所述目标声源之间的水平投影距离，并计算所述三角麦克风阵列中心点和所述目标声源之间的水平投影距离之间的高度差，进一步计算目标声源和所述三角麦克风阵列中心点之间的水平夹角，根据平面几何关系获取目标声源角β；

根据所述声源角β、三角麦克风阵列中心点和所述目标声源之间的水平投影距离之间的高度差、目标声源到所述三角麦克风阵列中心点的距离计算每一边的距离计算所述目标声源和所有阵点之间的距离，用于目标声源位置的音频在不同麦克风获取的时间差；

根据时间差识别每一目标声源相同的音频信号，将被识别为相同的目标声源音频信号根据时间差对不同的麦克风信号进行平移叠加后，将相同声源音频信号的波峰相互叠加，相同声源音频信号波谷相互叠加，将非相同时间差的干扰声源音频信号波峰波谷相互叠加，用于抑制干扰声源音频信号并加强目标声源音频信号。

2.根据权利要求1所述的一种多路定向拾音的音频输出方法，其特征在于，预设3个阵点的位置，并获取相邻阵点之间的距离，根据三角麦克风阵点位置计算所述三角麦克风阵列中心点位置，并计算所述目标声源到所述三角麦克风阵列中心点的距离。

3.根据权利要求1所述的一种多路定向拾音的音频输出方法，其特征在于，所述布置多个麦克风步骤包括：设定目标声源的高度，其中所述目标声源高度包括人体站姿高度和人体坐姿高度，所述人体站姿高度预设为150cm，人体坐姿高度预设为90cm，根据目标声源高度预设所述三角麦克风阵列中心点相对所述目标声源高度，使得所述三角麦克风阵列中心点高于所述目标声源高度。

4.根据权利要求1所述的一种多路定向拾音的音频输出方法，其特征在于，获取目标声源音频信息后，进一步对所述目标声源音频信息进行预处理，所述预处理的方法包括：对所述目标声源音频信息进行信号放大、音频去噪、语音频段带通滤波，并进一步将目标音频信息转换为。

5.根据权利要求1所述的一种多路定向拾音的音频输出方法，其特征在于，所述麦克风采集声源位置的音频信号，并将目标声源位置音频信号转化数字信号，进一步输入DSP分析波峰波谷和幅值。

6.一种多路定向拾音的音频输出系统，其特征在于，包括：

输出模块，用于输出目标音频信息；

所述至少一个三角麦克风阵列获取目标声源位置的音频信息，将目标声源位置的音频信息输入所述预处理模块，获取预处理后的目标声源位置的音频信息，通过所述识别处理模块识别目标声源音频信息，并进一步通过所述输出模块输出目标音频信息。