CN113448514B

CN113448514B - 一种多源语音数据的自动处理系统

Info

Publication number: CN113448514B
Application number: CN202110614847.9A
Authority: CN
Inventors: 李天洋; 胡环环; 刘明皓
Original assignee: Hefei Qunyin Information Service Co ltd
Current assignee: Hefei Qunyin Information Service Co ltd
Priority date: 2021-06-02
Filing date: 2021-06-02
Publication date: 2022-03-15
Anticipated expiration: 2041-06-02
Also published as: CN113448514A

Abstract

本发明公开了一种多源语音数据的自动处理系统，涉及多源语音数据处理技术领域，包括质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块；质量检测模块接收到质量检测指令后对多源语音数据进行质量检测，能够有效保证采集的语音数据的清晰和准确，提高语音通信质量；存储分析模块用于采集存储区块的剩余内存并进行存储预测，生成清理信号，以及时对存储的语音数据进行清理，减轻存储区块的存储压力；云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台，同时能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储，提高数据处理效率。

Description

一种多源语音数据的自动处理系统

技术领域

本发明涉及多源语音数据处理技术领域，具体是一种多源语音数据的自动处理系统。

背景技术

近年来，随着互联网和信息技术的高速发展，以及服务器与互联网的结合，如何对网络协议进行优化，在有限的网络带宽下高效地传输多媒体数据，并且避免造成网络拥塞，成为了视频、语音等媒体服务器的发展方向之一。语音数据在互联网上的传输依赖网络传输协议，包括TCP和UDP传输协议，如果用不具备任何排序、重传和拥塞控制的协议来传输多媒体数据，网络带宽会被迅速耗尽，而且随着网络状态的恶化，丢包数的增加也会影响传输质量；

现有技术中，语音数据不断的被收集和处理，但当前数据都是一种被动式的收集和传输，缺乏对语音数据的质量检测，严重影响通信质量；同时存在语音数据管理紊乱，无法根据存储区块的存储情况及时对存储的语音数据进行备份和清理，减轻存储区块的存储压力，并根据存储区块的存储情况合理选择对应的存储区块进行数据存储，提高语音数据处理效率。

发明内容

为了解决上述方案存在的问题，本发明提供了一种多源语音数据的自动处理系统。本发明通过质量检测模块结合噪声信号、元音间隔和元音强度对多源语音数据进行质量检测；能够有效保证采集的语音数据的清晰和准确，提高语音通信质量；存储分析模块能够根据存储区块的存储情况进行存储预测，及时对存储的语音数据进行清理，减轻存储区块的存储压力；同时能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储，提高数据处理效率。

本发明的目的可以通过以下技术方案实现：

一种多源语音数据的自动处理系统，包括语音采集模块、控制中心、质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块；

所述语音采集模块用于通过安装在若干声源处的麦克风采集语音信号，得到多源语音数据，并将多源语音数据传输至控制中心，所述控制中心接收到多源语音数据后生成质量检测指令并将质量检测指令和对应的多源语音数据传输至质量检测模块；所述质量检测模块接收到质量检测指令和对应的多源语音数据后对多源语音数据进行质量检测；若检测合格，则将多源语音数据发送至云存储模块；若检测不合格，则重新采集语音数据；具体检测步骤如下：

步骤一：获取多源语音数据，将多源语音数据转换为电信号；对转换的电信号进行数字信号处理；通过数字滤波得到电信号的频谱分布，通过数值的大小分析得到电信号的强度分布；进而根据频率与强度区分出噪声信号；

步骤二：对多源语音数据中的噪声信号进行降噪增强处理；

步骤三：将经降噪增强处理后的多源语音数据标记为目标语音数据；获取目标语音数据中每个元音的采集时间；将相邻两个元音的采集时间进行时间差计算获取得到单元音间隔Tm；

将单元音间隔Tm与标准元音间隔范围相比较，得到元音间隔识别结果；

获取目标语音数据中对应的所有单元音间隔的元音间隔识别结果；图形化展示每个单元音间隔的元音间隔识别结果的变化趋势；判断对应的目标语音数据质量是否合格；

所述云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台，供其他用户查询下载；所述云存储模块的具体存储步骤如下：

V1：将云存储模块划分成若干个存储区块y；将存储区块y的剩余内存标记为Ny；

V2：获取存储区块y当前的内存变化速率值Kz；自动从存储模块中获取存储区块y的清理评值并标记为DLy；

V3：利用公式CPy＝(Ny×a3+1/Kz×a4)/DLy计算得到存储区块y的存配值CPy，其中a3和a4均为系数因子；

V4：选取存配值CPy最大的存储区块为选中区块；所述云存储模块将接收到的多源语音数据进行压缩并加密，将压缩加密后的多源语音数据发送至选中区块内进行存储。

进一步地，所述质量检测模块的具体检测步骤还包括：

获取目标语音数据中每个元音的强度并标记为Qm；

将元音强度Qm与标准元音强度范围相比较；得到元音强度识别结果；

获取目标语音数据中所有元音的元音强度识别结果；

图形化展示每个元音的元音强度识别结果的变化趋势；判断对应的目标语音数据质量是否合格；

进一步地，所述存储分析模块用于采集存储区块的剩余内存并进行存储预测，得到清理信号，具体步骤为：

当存储区块开始存储文件时，所述存储分析模块按照存储区块对应的监测间隔时长采集该存储区块的剩余内存；

将存储区块的剩余内存标记为Nc，建立剩余内存Nc随时间变化的曲线图，并标记为区块内存曲线图；对区块内存曲线图进行求导获取区块内存变化速率曲线图；

当存储区块的剩余内存Nc≤内存阈值时，获取此时存储区块的内存变化速率值Kc，利用公式BH＝(Nc×g1)/(Kc×g2+0.23)计算得到存储系数BH，其中g1、g2为系数因子；

若存储系数BH≤存储系数阈值，则判定此时存储区块内存不足，生成清理信号；存储分析模块用于将清理信号经控制中心传输至内存管理模块；

进一步地，所述内存管理模块用于接收清理信号后对存储区块内存储的语音数据进行清理；具体步骤为：

内存管理模块接收到清理信号时，获取此时的剩余内存并标记为清前内存量B_前；根据清理规则对存储区块内存储的语音数据进行清理，当存储系数BH≥1.2×存储系数阈值，则停止清理；并获取此时的剩余内存，并标记为清后内存量B_后；利用公式BL＝B_后-B_前计算得到清存量BL；内存管理模块用于将清存量BL传输到控制中心；

控制中心用于对清存量BL进行等级评判得到评价信号，具体为：

EE1：将清存量BL与清存阈值相比较；清存阈值包括X2、X3；其中X2、X3均为固定数值且X2>X3；

EE2：当BL≥X2时，此时评价信号为大型清存信号；

EE3：当X3<BL<X2时，此时评价信号为中型清存信号；

EE4：当BL≤X3时，此时评价信号为小型清存信号；

所述控制中心用于将评价信号打上时间戳传输到数据库进行实时存储；

进一步地，所述评估模块用于对数据库内存储的带有时间戳的评价信号进行综合评价，具体评价方法为：

根据时间戳，获取到系统当前时间前十天内的评价信号；将评价信号的总次数标记为ZH；将大型清存信号的次数标记为Zb1，将中型清存信号的次数标记为Zb2，将小型清存信号的次数标记为Zb3；

利用公式TK＝(Zb1×b3+Zb2×b4+Zb3×b5)/ZH-1.3569计算得到存储区块的清理评值TK；其中b3、b4、b5均为系数因子且b3＞b4＞b5；

所述评估模块用于将存储区块的清存评值TK传输到存储模块进行存储。

进一步地，对多源语音数据中的噪声信号进行降噪增强处理；具体包括：

S21：采集噪声信号的频率和强度；将噪声信号的频率标记为P1，将噪声信号的强度标记为P2；其中P1与P2一一对应；

S22：利用公式ZP＝P1×a1+P2×a2计算得到噪声信号的降噪系数ZP，其中a1、a2为系数因子；

若降噪系数ZP＞对应的降噪阈值且降噪系数ZP＞对应的降噪阈值的时长超过预设时长，则此时噪声影响严重，多源语音数据质量不合格；

S23：建立降噪系数ZP随时间变化的曲线图；从初始时刻起，按照预设的采集间隔时长采集噪声信号的降噪系数，将采集的降噪系数标记为ZPi，i＝1，...，n；令最新采集的降噪系数为ZPn，取ZPn及其前X1组降噪系数的值，将其标记为区间系数Ji，i＝n-X1，...，n；其中X1为预设值；

按照标准差计算公式得到区间系数Ji的标准差α；按照平均值计算公式得到降噪系数信息组的平均值并标记为Ks；利用公式CK＝(Ks×b1+α×b2)^0.45得到参考降噪系数CK；其中b1、b2为系数因子；

根据参考降噪系数CK，确定噪声信号的当前噪声等级；再根据当前噪声等级，确定对应的降噪增益值；所述数据库中存储有参考降噪系数范围与噪声等级对照表以及噪声等级与降噪增益值对照表；

S24：按照确定的降噪增益值，对噪声信号进行降噪处理。

进一步地，所述元音间隔识别结果包括间隔合格、间隔不合格；所述间隔合格表现为单元音间隔Tm处于标准元音间隔范围内；所述间隔不合格表现为单元音间隔Tm超出/低于标准元音间隔范围。

进一步地，图形化展示每个单元音间隔的元音间隔识别结果的变化趋势；判断对应的目标语音数据质量是否合格；具体包括：

将元音间隔识别结果标记为Gm，当元音间隔识别结果为合格时，则Gm＝1，当元音间隔识别结果为不合格时，则Gm＝0；获取多个单元音间隔的元音间隔识别结果中Gm＝0的数量；

在Gm＝0的数量达到第一预设数量或者Gm＝0的数量达到预定比例或者连续

Gm＝0的数量达到第二预设数量时，确定对应的目标语音数据质量不合格；其中第二预设数量小于第一预设数量。

与现有技术相比，本发明的有益效果是：

1、本发明中质量检测模块接收到质量检测指令对多源语音数据进行质量检测；首先将多源语音数据转换为电信号；对转换的电信号进行数字信号处理；通过数字滤波得到电信号的频谱分布，通过数值的大小分析得到电信号的强度分布；进而根据频率与强度区分出噪声信号；对多源语音数据中的噪声信号进行降噪增强处理，将经降噪增强处理后的多源语音数据标记为目标语音数据；结合噪声信号、元音间隔和元音强度对多源语音数据进行质量检测；能够有效保证采集的语音数据的清晰和准确，提高语音通信质量；

2、本发明中云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台，供其他用户查询下载；将云存储模块划分成若干个存储区块y；结合存储区块y的剩余内存、内存变化速率值、清理评值；计算得到存储区块y的存配值CPy，选取存配值CPy最大的存储区块为选中区块；本发明能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储，提高数据处理效率；

3、本发明中存储分析模块用于采集存储区块的剩余内存并进行存储预测，当存储区块开始存储文件时，按照存储区块对应的监测间隔时长采集该存储区块的剩余内存；建立剩余内存Nc随时间变化的曲线图，对区块内存曲线图进行求导获取区块内存变化速率曲线图；当存储区块的剩余内存Nc≤内存阈值时，获取此时存储区块的内存变化速率值Kc，利用公式BH＝(Nc×g1)/(Kc×g2+0.23)计算得到存储系数BH，若存储系数BH≤存储系数阈值，则判定此时存储区块内存不足，生成清理信号；本发明能够根据存储区块的存储情况及时对存储的语音数据进行清理，减轻存储区块的存储压力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种多源语音数据的自动处理系统的原理框图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如图1所示，一种多源语音数据的自动处理系统，包括语音采集模块、控制中心、质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块；

实施例1

步骤二：对多源语音数据中的噪声信号进行降噪增强处理，具体包括：

S24：按照确定的降噪增益值，对噪声信号进行降噪处理；

将单元音间隔Tm与标准元音间隔范围相比较，得到元音间隔识别结果；所述元音间隔识别结果包括间隔合格、间隔不合格；所述间隔合格表现为单元音间隔Tm处于标准元音间隔范围内；所述间隔不合格表现为单元音间隔Tm超出/低于标准元音间隔范围；

获取目标语音数据中对应的所有单元音间隔的元音间隔识别结果；

图形化展示每个单元音间隔的元音间隔识别结果的变化趋势；判断对应的目标语音数据质量是否合格；具体包括：

在Gm＝0的数量达到第一预设数量或者Gm＝0的数量达到预定比例或者连续Gm＝0的数量达到第二预设数量时，确定对应的目标语音数据质量不合格；其中第二预设数量小于第一预设数量；

实施例2

在本发明的另一实施例中，所述质量检测模块的具体检测步骤还包括：

获取目标语音数据中每个元音的强度并标记为Qm；

将元音强度Qm与标准元音强度范围相比较；得到元音强度识别结果；所述元音强度识别结果包括强度合格、强度不合格；所述强度合格表现为元音强度Qm处于标准元音强度范围内；所述强度不合格表现为元音强度Qm超出/低于标准元音强度范围；

获取目标语音数据中所有元音的元音强度识别结果；

图形化展示每个元音的元音强度识别结果的变化趋势；判断对应的目标语音数据质量是否合格；具体包括：

将元音强度识别结果标记为Fm，当元音强度识别结果为合格时，则Fm＝1，当元音强度识别结果为不合格时，则Fm＝0；获取多个元音的元音强度识别结果中Fm＝0的数量；

在Fm＝0的数量达到第一预设数量或者Fm＝0的数量达到预定比例或者连续Fm＝0的数量达到第二预设数量时，确定对应的目标语音数据质量不合格；

实施例3

V4：选取存配值CPy最大的存储区块为选中区块；所述云存储模块将接收到的多源语音数据进行压缩并加密，将压缩加密后的多源语音数据发送至选中区块内进行存储；

所述存储分析模块用于采集存储区块的剩余内存并进行存储预测，得到清理信号，具体步骤为：

所述内存管理模块用于接收清理信号后对存储区块内存储的语音数据进行清理；具体步骤为：

内存管理模块接收到清理信号时，获取此时的剩余内存并标记为清前内存量B_前；根据清理规则对存储区块内存储的语音数据进行清理，当存储系数BH≥1.2×存储系数阈值，则停止清理；并获取此时的剩余内存，并标记为清后内存量B_后；利用公式BL＝B_后-B_前计算得到清存量BL；

内存管理模块用于将清存量BL传输到控制中心，控制中心用于对清存量BL进行等级评判得到评价信号，具体为：

EE2：当BL≥X2时，此时评价信号为大型清存信号；

EE3：当X3<BL<X2时，此时评价信号为中型清存信号；

EE4：当BL≤X3时，此时评价信号为小型清存信号；

所述评估模块用于对数据库内存储的带有时间戳的评价信号进行综合评价，具体评价方法为：

上述公式均是去除量纲取其数值计算，公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式，公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。

本发明的工作原理是：

一种多源语音数据的自动处理系统，首先语音采集模块通过安装在若干声源处的麦克风采集语音信号，得到多源语音数据，并将多源语音数据传输至控制中心，所述控制中心接收到多源语音数据后生成质量检测指令；所述质量检测模块接收到质量检测指令对多源语音数据进行质量检测；首先将多源语音数据转换为电信号；对转换的电信号进行数字信号处理；通过数字滤波得到电信号的频谱分布，通过数值的大小分析得到电信号的强度分布；进而根据频率与强度区分出噪声信号；对多源语音数据中的噪声信号进行降噪增强处理，将经降噪增强处理后的多源语音数据标记为目标语音数据；获取目标语音数据中每个元音的采集时间；将相邻两个元音的采集时间进行时间差计算获取得到单元音间隔Tm；将单元音间隔Tm与标准元音间隔范围相比较，得到元音间隔识别结果；图形化展示每个单元音间隔的元音间隔识别结果的变化趋势；判断对应的目标语音数据质量是否合格；若检测合格，则将多源语音数据发送至云存储模块；若检测不合格，则重新采集语音数据；提高语音通信质量；

所述云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台，供其他用户查询下载；将云存储模块划分成若干个存储区块y；将存储区块y的剩余内存标记为Ny；获取存储区块y当前的内存变化速率值Kz；自动从存储模块中获取存储区块y的清理评值并标记为DLy；利用公式CPy＝(Ny×a3+1/Kz×a4)/DLy计算得到存储区块y的存配值CPy，选取存配值CPy最大的存储区块为选中区块；所述云存储模块将接收到的多源语音数据进行压缩并加密，将压缩加密后的多源语音数据发送至选中区块内进行存储；本发明能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储，提高数据处理效率；

所述存储分析模块用于采集存储区块的剩余内存并进行存储预测，得到清理信号，当存储区块开始存储文件时，所述存储分析模块按照存储区块对应的监测间隔时长采集该存储区块的剩余内存；建立剩余内存Nc随时间变化的曲线图，对区块内存曲线图进行求导获取区块内存变化速率曲线图；当存储区块的剩余内存Nc≤内存阈值时，获取此时存储区块的内存变化速率值Kc，利用公式BH＝(Nc×g1)/(Kc×g2+0.23)计算得到存储系数BH，若存储系数BH≤存储系数阈值，则判定此时存储区块内存不足，生成清理信号；所述内存管理模块用于接收清理信号后对存储区块内存储的语音数据进行清理；本发明能够根据存储区块的存储情况及时对存储的语音数据进行清理，减轻存储区块的存储压力。

在本说明书的描述中，参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种多源语音数据的自动处理系统，其特征在于，包括语音采集模块、控制中心、质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块；

所述语音采集模块用于通过安装在若干声源处的麦克风采集语音信号，得到多源语音数据，并将多源语音数据传输至控制中心，所述控制中心接收到多源语音数据后生成质量检测指令；

所述质量检测模块接收到质量检测指令后对多源语音数据进行质量检测，若检测合格，则将多源语音数据发送至云存储模块；若检测不合格，则重新采集语音数据；具体检测步骤如下：

S22：利用公式ZP=P1×a1+P2×a2计算得到噪声信号的降噪系数ZP，其中a1、a2为系数因子；若降噪系数ZP＞对应的降噪阈值且降噪系数ZP＞对应的降噪阈值的时长超过预设时长，则此时多源语音数据质量不合格；

按照标准差计算公式得到区间系数Ji的标准差α；按照平均值计算公式得到降噪系数信息组的平均值并标记为Ks；利用公式CK=(Ks×b1+α×b2)^0.45得到参考降噪系数CK；其中b1、b2为系数因子；

S24：按照确定的降噪增益值，对噪声信号进行降噪处理；

步骤三：将经降噪增强处理后的多源语音数据标记为目标语音数据；

将相邻两个元音的采集时间进行时间差计算获取得到单元音间隔Tm；将单元音间隔Tm与标准元音间隔范围相比较，得到元音间隔识别结果；所述元音间隔识别结果包括间隔合格、间隔不合格；所述间隔合格表现为单元音间隔Tm处于标准元音间隔范围内；所述间隔不合格表现为单元音间隔Tm超出/低于标准元音间隔范围；

获取目标语音数据中所有单元音间隔的元音间隔识别结果，图形化展示每个单元音间隔的元音间隔识别结果的变化趋势；判断对应的目标语音数据质量是否合格；具体包括：

将元音间隔识别结果标记为Gm，当元音间隔识别结果为合格时，则Gm=1，当元音间隔识别结果为不合格时，则Gm=0；在Gm=0的数量达到第一预设数量或者Gm=0的数量达到预定比例或者连续Gm=0的数量达到第二预设数量时，确定对应的目标语音数据质量不合格；其中第二预设数量小于第一预设数量；

获取目标语音数据中每个元音的强度并标记为Qm；将元音强度Qm与标准元音强度范围相比较，得到元音强度识别结果；所述元音强度识别结果包括强度合格、强度不合格；所述强度合格表现为元音强度Qm处于标准元音强度范围内；所述强度不合格表现为元音强度Qm超出/低于标准元音强度范围；

获取目标语音数据中所有元音的元音强度识别结果，图形化展示每个元音的元音强度识别结果的变化趋势；判断对应的目标语音数据质量是否合格；具体包括：

将元音强度识别结果标记为Fm，当元音强度识别结果为合格时，则Fm=1，当元音强度识别结果为不合格时，则Fm=0；在Fm=0的数量达到第一预设数量或者Fm=0的数量达到预定比例或者连续Fm=0的数量达到第二预设数量时，确定对应的目标语音数据质量不合格；

所述云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台，供其他用户查询下载；具体存储步骤如下：

将云存储模块划分成若干个存储区块y；将存储区块y的剩余内存标记为Ny；获取存储区块y当前的内存变化速率值Kz；自动从存储模块中获取存储区块y的清理评值并标记为DLy；利用公式CPy=(Ny×a3+1/Kz×a4)/DLy计算得到存储区块y的存配值CPy，其中a3和a4均为系数因子；

选取存配值CPy最大的存储区块为选中区块；所述云存储模块将接收到的多源语音数据进行压缩并加密，将压缩加密后的多源语音数据发送至选中区块内进行存储。

2.根据权利要求1所述的一种多源语音数据的自动处理系统，其特征在于，所述存储分析模块用于采集存储区块的剩余内存并进行存储预测，计算得到存储系数BH，若存储系数BH≤存储系数阈值，则判定此时存储区块内存不足，生成清理信号；所述内存管理模块用于接收清理信号后对存储区块内存储的语音数据进行清理并记录清存量BL；

控制中心用于对清存量BL进行等级评判得到评价信号，所述评价信号包括大型清存信号、中型清存信号、小型清存信号；所述控制中心用于将评价信号打上时间戳传输到数据库进行实时存储。

3.根据权利要求1所述的一种多源语音数据的自动处理系统，其特征在于，所述评估模块用于对数据库内存储的带有时间戳的评价信号进行综合评价，具体评价方法为：

利用公式TK＝(Zb1×b3+Zb2×b4+Zb3×b5)/ZH-1.3569计算得到存储区块的清理评值TK；其中b3、b4、b5均为系数因子且b3＞b4＞b5；所述评估模块用于将存储区块的清存评值TK传输到存储模块进行存储。