CN112601153B

CN112601153B - 一种声音自动采集与传输装置及其使用方法

Info

Publication number: CN112601153B
Application number: CN202110223490.1A
Authority: CN
Inventors: 陈鹏; 赵启军; 侯蓉; 汤茂林; 闫蔚然; 郭龙银; 张艳秋; 刘鹏; 吴永胜
Original assignee: CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING; Sichuan University
Current assignee: CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING; Sichuan University
Priority date: 2021-03-01
Filing date: 2021-03-01
Publication date: 2021-05-07
Anticipated expiration: 2041-03-01
Also published as: CN112601153A

Abstract

本发明涉及声音信号处理领域，具体涉及一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置及其使用方法。中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块；音频数据处理模块与存储模块连接。本发明通过中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合，能够实现自动录音功能、自动存储处理功能以及自动发送功能，减小了人力物力的投入，提高了声音数据采集的效率，保证了数据的有效性和实时性，同时减小了存储空间的占用；在存储空间足够的情况下，该装置可以长时间不间断工作，提高数据采集效率，保证了数据的可靠性。

Description

一种声音自动采集与传输装置及其使用方法

技术领域

本发明涉及声音信号处理领域，具体涉及一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置及其使用方法。

背景技术

野生动物的栖息地多为人迹罕至的地方，这些地方通常难以到达。在研究野生动物的时候，现有采集数据方法一般为视频画面采集，需要工作人员手工回收采集数据，这种工作方式风险大，工作人员甚至可能遭受野兽袭击；同时，由于人工费用的不断上涨，这种方式的成本也越来越高；人工回收数据有时间间隔性，如果数据不及时，无法准确、实时的进行相关研究；对于这种采集设备，设备无法自动剔除无用信息，占用存储空间大，一旦存储空间占用满，就无法记录新鲜数据；无用信息不仅对后续实验占用过多存储空间，还会导致实验结果不准确，影响工作人员的判断，影响后续安排。

声音信号所占存储空间远远低于视频信号，且目前动物声音信号研究发展迅速，能获得的信息也非常丰富。然而目前对于动物语音的获取都是被动获取，即录音设备开启录音，把除了野生动物声音之外的其他杂音或者静音都录入，会占用较大的存储空间。录音需要传输到平台然后再进行处理、分析，时效性较差。

发明内容

针对现有技术中的缺陷，本发明提供一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置。

本发明解决上述问题所采取的方案是：一种声音自动采集与传输装置，包括中央处理器，该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块；所述的音频数据处理模块与所述的存储模块连接；

所述的麦克风阵列，采集音频信号并传送到中央处理器；

所述的中央处理器，获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中；

所述的音频数据处理模块，与中央处理器配合，并从存储模块中调取音频数据进行加工处理，然后返回存储模块；

所述的网络模块，将中央处理器与外部控制系统连接，进行数据交换。

本发明提供一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置的使用方法：

包括以下步骤：

a、启动录音模块，让麦克风阵列开始录音，并保存录音至存储模块；

b、剪切录音中的静音片段，并判断非静音片段间隔是否满足合并要求，若满足合并要求，则合并非静音片段，保存至存储模块；若不满足合并要求，则保持非静音片段原样保存至存储模块中；

c、判断网络模块是否联网，若联网，则将压缩存储模块中的音频文件，并发送至服务器；若未联网则保持音频文件存储在存储模块中；

d、结束。

优选的，在所述的步骤b中，剪切静音片段时，首先启动中央处理器中的静音检测程序自动检测录音中的静音部分；对于非静音片段的音频，判断相邻两个音频的间隔是否满足提前设置好的阈值，若满足则将相邻音频合并成一个片段保存，若不满足则不合并。

优选的，在所述的步骤b中，剪切静音片段时，保留非静音片段附近的音频，保证录音的连续性。

优选的，在剪切静音片段时：

保持最低静音长度

不长于切分音频的长度，设置好静音阈值

:

为音频采样值，

为音频的最高振幅；

检查连续的声音是否静音，以步长

为单位，遍历长度为

，其中audio为音频，

为检测的音频长度；

从音频的起点开始遍历并保存超过步长的声音段的起始位置

。

优选的，合并非静音片段时，以

为一个静音范围长度，遍历所有标注的

时刻，并合并一个静音块长度内重合的起始点，保证每一个静音范围都是原音频中且不重叠的；

返回保存的静音片段集合

，

表示第i个静音片段开始时间，

表示第i个静音片段结束时间,

表示静音片段的个数。

优选的，合并非静音片段时：

调用检测静音函数获取静音范围，判断是否存在静音范围，如果不存在直接返回无静音范围

,

为音频长度；

若存在静音范围，判断是否整个音频为静音，如果判断出整个音频都为静音，则返回空值；

如果不是整个音频为静音,获取每个静音范围的开始时间点

和结束时间点

，通过遍历得出每个非静音段

，若

为空，则丢弃，若

为空，则丢弃；

得到非静音片段集合

；其中，

表示第j个非静音片段的开始时间，

表示第j个非静音片段的结束时间,

表示非静音片段的个数；

返回非静音片段集合

。

优选的，为了使得相邻两个非静音片段合并得到一个更加连贯的片段，遍历非静音片段集合

，设置非静音片段最短时间间隔

,若两个相邻的非静音片段

和

之间的时间间隔

小于

，则合并两个非静音片段为

，最后得到合并后的非静音片段集合

，

表示合并后第k个非静音片段的开始时间，

表示合并后第k个非静音片段的结束时间,

表示合并后的非静音片段个数。

优选的，为了让非静音片段开始和结尾部分声音更加平滑，遍历合并后的非静音片段集合

，设置保留静音时长参数

，得到输出目标范围集合

；

返回保存的输出目标范围集合

。

本发明的有益效果体现在：本发明的一种声音自动采集与传输装置及其使用方法，通过中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合，能够实现自动录音功能、自动存储处理功能以及自动发送功能，减小了人力物力的投入，提高了声音数据采集的效率，保证了数据的有效性和实时性，同时减小了存储空间的占用，提高了一种声音自动采集与传输装置的工作时间；在存储空间足够的情况下，该装置可以长时间不间断工作，提高数据采集效率，保证了数据的可靠性。采用本发明装置，可以实现声音的自动采集与静音片段的自动裁剪，在存储容量小、计算能力有限的设备上实现长时间的录音与存储。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1为本发明的一种声音自动采集与传输装置的一种结构框图；

图2为本发明的一种声音自动采集与传输装置录音时的一种流程框图；

图3为本发明的一种声音自动采集与传输装置静音检测时的一种结构框图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只作为示例，而不能以此来限制本发明的保护范围。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

实施例1：

如图1至图3所示，本发明的一种声音自动采集与传输装置，包括中央处理器，该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块；所述的音频数据处理模块与所述的存储模块连接；

所述的麦克风阵列，采集音频信号并传送到中央处理器；

所述的网络模块，将中央处理器的与外部控制系统连接，进行数据交换。

本发明的一种声音自动采集与传输装置，通过中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合，能够实现自动录音功能、自动存储处理功能以及自动发送功能，减小了人力物力的投入，提高了声音数据采集的效率，保证了数据的有效性和实时性，同时减小了存储空间的占用，提高了一种声音自动采集与传输装置的工作时间；在存储空间足够的情况下，该装置可以长时间不间断工作，提高数据采集效率，保证了数据的可靠性。采用本发明装置，可以实现声音的自动采集与静音片段的自动裁剪，在存储容量小、计算能力有限的设备上实现长时间的录音与存储。

包括以下步骤：

d、结束。这样进行以后，在一边录音存储的时候，一边也可以同时进行录音的处理，剪切静音片段，合并非静音片段，减少占用的存储空间；再配合判断网络是否接通，接通时则及时压缩并传输音频文件至服务器。作为优选的，在所述的步骤b中，剪切静音片段时，首先启动中央处理器中的静音检测程序自动检测录音中的静音部分；对于非静音片段的音频，判断相邻两个音频的间隔是否满足提前设置好的阈值，若满足则将相邻音频合并成一个片段保存，若不满足则不合并。在所述的步骤b中，剪切静音片段时，保留非静音片段附近的音频，保证录音的连续性。

作为优选的，在剪切静音片段时：保持最低静音长度

不长于切分音频的长度，设置好静音阈值

:

为音频采样值，

为音频的最高振幅；

检查连续的声音是否静音，以步长

为单位，遍历长度为

，其中audio为音频，

为检测的音频长度；

从音频的起点开始遍历并保存超过步长的声音段的起始位置

。

作为优选的，合并非静音片段时，以

为一个静音范围长度，遍历所有标注的

返回保存的静音片段集合

，

表示第i个静音片段开始时间，

表示第i个静音片段结束时间,

表示静音片段的个数。

作为优选的，合并非静音片段时：

,

为音频长度；

如果不是整个音频为静音,获取每个静音范围的开始时间点

和结束时间点

，通过遍历得出每个非静音段

，若

为空，则丢弃，若

为空，则丢弃；

得到非静音片段集合

；其中，

表示第j个非静音片段的开始时间，

表示第j个非静音片段的结束时间,

表示非静音片段的个数；

返回非静音片段集合

。

作为优选的，为了使得相邻两个非静音片段合并得到一个更加连贯的片段，遍历非静音片段集合

，设置非静音片段最短时间间隔

,若两个相邻的非静音片段

和

之间的时间间隔

小于

，则合并两个非静音片段为

，最后得到合并后的非静音片段集合

，

表示合并后第k个非静音片段的开始时间，

表示合并后第k个非静音片段的结束时间,

表示合并后的非静音片段个数。

作为优选的，为了让非静音片段开始和结尾部分声音更加平滑，遍历合并后的非静音片段集合

，设置保留静音时长参数

，得到输出目标范围集合

；

返回保存的输出目标范围集合

。

作为一种优选的实施方式，

步骤1.一种声音自动采集与传输装置采用嵌入式设备，并安装Linux操作系统，同时安装麦克风阵列驱动程序，将麦克风阵列与嵌入式设备连接。

步骤2.启动嵌入式设备并启动程序，启动程序时可通过Linux操作系统设置开机自启动，也可以通过局域网或互联网启动程序。

步骤3.启动录音进程，麦克风阵列开始录音，每隔一分钟保存一次音频并存储至SD卡当中的固定文件夹里，并以时间作为音频的文件名。为了让录制的音频数据在后续实验中有可用性，以及处理的方便，选择一分钟保存一次音频，保存的音频为录制的原始音频，不经过任何处理。保存在固定文件夹中，方便日后的操作，不至于混淆音频。

步骤4.启动静音检测进程，静音检测程序自动剪切静音片段。为防止出现声音不连贯的情况，对剪切完成后的相邻非静音片段进行时间间隔判断，若低于提前设置好的阈值，则合并为一个片段保存至SD卡中；若不低于阈值，则将剪切完成后的音频分开保存至SD卡中。音频是具有非常强烈的时序特征的信号，若将音频静音部分直接剪切，则极有可能导致音频前后时域上的特征不连续情况，同时直接剪切音频也非常有可能剪切掉原始音频的部分特征，使得后续实验结果不可靠，所以在剪切静音片段的时候需要注意音频前后的连续性，在本实施例中，在检测完静音之后，保留原始音频前后100毫秒的长度，尽可能保证音频信息不被裁剪掉。

步骤5.每隔一段时间将保存在SD卡中的非静音片段压缩并删除原音频。步骤4中设置了相邻两个非静音片段之间的最小时间间隔，若剪切完静音片段之后，相邻两个音频的时间间隔小于设定好的阈值，则将两个音频合并。为了一种声音自动采集与传输装置的正常运行，以及本着节约存储空间的理念，对于已经压缩完成的音频，将会删掉保存在SD卡中的原始音频，以释放存储空间，减少空间的占用。

步骤6.检测是否连接了局域网或互联网，若连接了网络则自动将压缩包发送至服务器端。对音频进行压缩操作后，判断嵌入式设备是否已经联网，如果联网，则向服务器发送压缩包，发送成功后则将保存在SD卡中的压缩包删除，以释放存储空间。若嵌入式设备没有联网，则工作人员需要及时前往一种声音自动采集与传输装置处，人工取出SD卡，以免发生存储空间被占用完，装置无法正常工作的情况。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。