CN112992144A

CN112992144A - 应用于电力领域的智能语音调控方法

Info

Publication number: CN112992144A
Application number: CN202110430321.5A
Authority: CN
Inventors: 杜浩良; 马翔; 支月媚; 崔建业; 郭云鹏; 吕磊炎; 吴炳超; 宋昕; 方璇; 黄剑峰; 项中明; 吴华华; 黄健; 朱英伟; 李振华; 周东波; 谷炜; 李英; 阙凌燕; 张小聪
Original assignee: State Grid Zhejiang Electric Power Co Ltd; Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Current assignee: State Grid Zhejiang Electric Power Co Ltd; Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2021-04-21
Filing date: 2021-04-21
Publication date: 2021-06-18
Anticipated expiration: 2041-04-21
Also published as: CN112992144B

Abstract

本申请实施例提出的应用于电力领域的智能语音调控方法，包括从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形；基于环境噪声波形对关键语音波形进行叠加降噪；根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理，得到针对设备操作的指令语句波形；结合设备操作专有名词库确定对应每条指令语句波形的指令文本，根据设备调控指令语句结构获取每个指令文本的关键要素构建标准化的设备调控指令。基于波峰持续时长对语音波形进行断句能够有效保证断句后的波形对应依据完整的指令，进而根据断句后的语音波形进行指令文本转换，得到较为准确的设备调控指令。进而提升设备调控的准确性。

Description

应用于电力领域的智能语音调控方法

技术领域

本申请涉及语音处理领域，尤其涉及应用于电力领域的智能语音调控方法。

背景技术

保障电网的安全稳定运行，是电网电力供应等行业服务的基础重要环节。随着电网规模的不断扩大，随之而来调度相关方面的工作量也成倍增加，这将越来越多的占用调控人员的精力。目前语音识别技术正逐步的应用于电网调度工作中。但传统语音识别方法的理论假设与实际情况有很大不同，因此实际应用中很难达到预期的性能，而深度学习是大数据处理的重要机器学习理论，对语音识别具有重要的借鉴意义。

发明内容

本申请提出了应用于电力领域的智能语音调控方法，通过对语音信号波形进行叠加降噪的方式降低环境噪声的影响，进而借助波峰持续时长进行断句的处理方式能够尽可能保证单次完整指令的获取，从而有效提升语音指令识别的准确性。

本申请实施例提出的应用于电力领域的智能语音调控方法，包括：

S1，从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形；

S2，基于环境噪声波形对关键语音波形进行叠加降噪，得到降噪后的关键语音波形；

S3，根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理，得到针对设备操作的指令语句波形；

S4，结合设备操作专有名词库确定对应每条指令语句波形的指令文本，根据设备调控指令语句结构获取每个指令文本的关键要素，基于得到的关键要素构建标准化的设备调控指令；

S5，基于得到的设备调控指令完成电力设备调控。

可选的，所述S1包括：

S11，接收针对电力设备调控的通话文件，从通话文件中筛选出语音信号波形；

S12，对得到的语音信号波形进行频谱分析，筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形。

可选的，所述S12包括：

S121，获取语音信号波形，提取语音信号波形中的幅值；

S122，对接收到的幅值进行聚类得到两个聚类中心，将其中的较大值作为关键语音中心幅值，将较小值作为环境噪声中心幅值；

S123，按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形，筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形。

可选的，所述S2包括：

S21，计算环境噪声波形中多个幅值的方差；

S22，如果方差高于预设值，获取最大的五个幅值的出现频率，按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理，得到持续时长与关键语音波形相同的强化后的环境噪声波形；

S23，统计强化后环境噪声波形的相位以及对应每个相位的幅值，构建用于消噪的环境噪声波形；

S24，将S23得到的环境噪声与关键语音波形进行叠加降噪，得到降噪后的关键语音波形。

可选的，所述S2包括：

S25，如果方差低于或等于预设值，将环境噪声波形的持续时长进行调整，得到持续时长与关键语音波形相同的强化后的环境噪声波形；

继续执行步骤S23至步骤S24的处理过程。

可选的，所述S3包括：

S31，获取降噪后的关键语音波形中的波峰；

S32，按预设的峰值宽容度对波峰的出现时刻进行拓展，将拓展后波峰的维持时长作为波峰持续时长；

S33，按得到的波峰持续时长对关键语音波形进行分割，将每一份保存为一条指令语句波形。

可选的，所述S32包括：

S321，计算减去宽容度后的波峰修正值；

S322，在波峰两侧筛选高于波峰修正值的目标峰值，得到包括多个目标峰值以及波峰在内的拓展区间，将拓展区间对应的维持时长作为波峰持续时长。

可选的，所述S4包括：

S41，播放每条指令语句波形，结合设备操作专有名词库确定对应每条指令语句波形的指令文本；

S42，获取设备调控指令语句结构，根据设备调控指令语句结构对每个指令文本进行筛选，得到包含操作设备对象、操作参数详情在内的关键要素；

S43，对得到的关键要素进行指令完整性复核；

S44，将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。

可选的，所述S43包括：

S431，接收关键要素并记录接收时刻；

S432，判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻；

S433，根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内；

S434，如果在有效期内则判定通过指令完整性复核。

可选的，所述S42中包括通过TF-IDF算法提取关键字的操作。

有益效果：

通过降噪处理提升操作指令的有效率，通过断句处理提升指令详情的准确性。

附图说明

图1是本申请实施例提出的应用于电力领域的智能语音调控方法的流程示意图。

具体实施方式

本申请实施例提出的应用于电力领域的智能语音调控方法，如图1所示，包括：

S5，基于得到的设备调控指令完成电力设备调控。

在实施中，为了解决现有技术中采用传统语音识别技术带来的识别精度低下的缺陷，本申请提出了一种新式的智能语音调控方法，基于对语音信号波形进行叠加降噪并基于降噪后语音波形中波峰持续时长的特性实现断句处理，由于在正常的语音调控指令中，针对一个设备的调控语句基本上会使用一句话进行描述，因此基于波峰持续时长对语音波形进行断句能够有效保证断句后的波形对应依据完整的指令，进而根据断句后的语音波形进行指令文本转换，可以得到较为准确的设备调控指令。

具体的，本申请提出的智能语音调控方法，主要包含两个特性，其一为叠加降噪，其二为波峰断句。以下分别就两个特征进行解释说明。

为了实现叠加降噪，首先需要执行S1，以便从接收到的语音信号波形中获取到关键语音波形以及环境噪声波形。

由于环境噪声一般表现为稳定的中低频噪声，因此在接收到的语音信号波形中幅度较低且表现为波动较小的波形代表环境噪声，相对于代表设备操控指令的关键语音波形则由于包含升降调的语音会表现为幅度较高且波动较为明显，因此基于上述两个指标依次执行步骤S11-S12以便获取降噪后的关键语音波形。

在实施中，步骤S11中的具体执行方式是从通话文件中直接筛选本地生成的语音文件即可，常用的文件扩展后缀为.wav、.mp3等。步骤S12提出的基于频谱分析的方案则是基于前文中提及到的波形幅值实现的，具体包括如下内容：

S121，获取语音信号波形，提取语音信号波形中的幅值；

具体的，在基于幅值进行关键语音波形与环境噪声波形的提取时，考虑到单纯依靠阈值进行二者的划分可能会损失部分细节，降低后续设备调控指令的转换质量，这里在步骤S122-S123中基于幅值进行聚类、并按聚类中心幅值大小分别确定关键语音幅值以及环境噪声幅值。考虑到聚类算法已是成熟使用的技术，此处就不在赘述。

值得注意的是，在执行步骤S123时引入了宽容度这一概念，目的是通过对语音信号波形的幅值以类似于滤波器的方式进行过滤，以便于尽可能降低突发噪声对后续方案的影响，如果最终S4得到的设备调控指令效果不佳，可以考虑对此处的宽容度数值进行调节，以便实现更好的效果。

在得到分离后的关键语音波形和环境噪声波形后，即可执行S2以便实现基于环境噪声波形对关键语音波形的降噪处理。具体包括如下内容：

S21，计算环境噪声波形中多个幅值的方差；

S24，将S23得到的环境噪声与关键语音波形进行叠加降噪，得到降噪后的关键语音波形；

S25，如果方差低于或等于预设值，将环境噪声波形的持续时长进行调整，得到持续时长与关键语音波形相同的强化后的环境噪声波形；继续执行步骤S23至步骤S24的处理过程。

在实施中，首先选取环境噪声波形中的多个幅值，进而计算幅值之间的方差。考虑到环境噪声波形的持续时长通常情况下会短于关键语音波形的持续时长，这样无法使用前者对后者进行叠加降噪，因此本步骤中提出了基于方差判断环境噪声的变化幅度是否剧烈。

如果变化剧烈则说明进行降噪的强度较高，此时需要对已有的环境噪声进行强化以及增大持续时长的处理。其中强化处理如步骤S22所示。具体为获取五个最大幅值出现的频率，例如在时长为10s的环境噪声波形中，分别于第1s、2.5s、3s、5s、8.5s出现了五个最大幅值，而关键语音波形的持续时长为30s，因此根据30/10的比例对出现最大幅值的时长进行等比例增长，从而根据增强后的环境噪声进行降噪，以凸显环境噪声对后续降噪过程的作用。

在获取到降噪后的关键语音波形后，对其进行断句处理，得到对应每条设备操作指令的指令语句波形，即S3的内容如下所示：

S31，获取降噪后的关键语音波形中的波峰；

在实施中，由于在诵读设备操作指令时，由于讲出指令内容后的波形幅值肯定会高于未讲出时的波形幅值，因此执行步骤S31中获取波形中波峰的操作，以便确定具体指令出现的时刻。

进一步，考虑到在诵读设备操作指令时，波形幅值会较为稳定地持续一段时长，因此同样引入宽容度的概念对波峰出现的时刻进行适当拓展。选取拓展后的时长对应的关键语音波形进行分割，得到分割后的波形即为一条指令语句波形。

其中执行步骤S32进行拓展的具体内容包括：

S321，计算减去宽容度后的波峰修正值；

这里将减去宽容度后的波峰修正值作为拓展基准的目的是考虑到实际环境噪声中不可避免的会引入部分设备高速运转等类似的高频环境噪声，而该类噪声又很难在降噪过程中被消除，因此考虑到后期指令划分的准确性，此处还需要根据常见的高频环境噪声设定波峰修正值，进而在波峰两侧筛选高于波峰修正值的目标峰值。

在得到指令语句波形后，可以将指令语句波形中的内容转化为指令文本，进而根据指令文本的关键要素构建标准化的设备调控指令。具体内容如下：

S43，对得到的关键要素进行指令完整性复核；

在实施中，初步得到指令文本的方式是播放得到的指令语句波形，结合已有的设备操作专有名词库确定对应每条指令语句波形的指令文本。

考虑到直接得到的指令文本中会存在语法错误、逻辑混乱的问题，还需执行步骤S42以便根据对应设备调控指令语句结构对得到的指令文本进行筛选，从而得到包含操作设备对象、操作参数详情在内的关键要素。例如“12号变压器”、“5点”、“断路检修”、“确保无故障运行1000小时”的字样。

具体的S42的执行内容包括通过TF-IDF算法提取关键字的操作。

在实施中，词频TF（Term Frequency）表示词语在文档d中出现的概率，计算公式如下：

，

式中，

是该词语

在文档

中出现的次数，而分母则是在文档

中所有字词的出现次数之和，

、

、

均为词语选取时的相关序号。

逆文档频率IDF（Inverse Document Frequency）：表示语料库中包含词语

的文档的数目的倒数，计算公式如下：

，

式中，

表示语料库中文档的总数，

表示包含词语

的文档数量。如果该词语不出现在语料库中，就会导致被除数为0，因此一般情况下使用

，TF-IDF在实际中主要是将上面的两者相乘，即

，计算公式如下：

。

得到的结果即为提取到的关键字。

在筛选得到关键指令后，为了保证最终生成的设备调控指令完整，需要再次执行步骤S43对的得到的、用于构建设备调控指令的关键要素进行指令完整性复核，验证是否已完全包括设备对象、操作参数详情等构成设备调控指令的全部必要元素。

其中，S43进行复核的具体内容包括：

S431，接收关键要素并记录接收时刻；

S434，如果在有效期内则判定通过指令完整性复核。

在实施中，为了提高最终得到指令的准确性，一方面需要判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻；另一方面还需要结合关键要素的接收时刻对关键要素是否处于有效期内进行判定，防止在指令有效期外进行指令合成并执行带来的严重后果。

在通过复核后执行步骤S44按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令即可，例如“5点”对“12号变压器”进行“断路检修”，目的实现“确保无故障运行1000小时”，其中双引号内的短语是已得到的关键要素，其余部分为通用模板中构建标准化的元素。

由于根据通用模板构建的标准化的设备调控指令中包含了构建设备操作指令所必须的全部要素，因此根据前述内容最终得到的设备调控指令能够较为准确地完成电力设备调控。

以上所述仅为本申请的实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.应用于电力领域的智能语音调控方法，其特征在于，包括：

S5，基于得到的设备调控指令完成电力设备调控。

2.根据权利要求1所述的应用于电力领域的智能语音调控方法，其特征在于，所述S1包括：

3.根据权利要求2所述的应用于电力领域的智能语音调控方法，其特征在于，所述S12包括：

S121，获取语音信号波形，提取语音信号波形中的幅值；

4.根据权利要求2所述的应用于电力领域的智能语音调控方法，其特征在于，所述S2包括：

S21，计算环境噪声波形中多个幅值的方差；

S24，将S23得到的消噪的环境噪声波形与关键语音波形进行叠加降噪，得到降噪后的关键语音波形。

5.根据权利要求4所述的应用于电力领域的智能语音调控方法，其特征在于，所述S2包括：

继续执行步骤S23至步骤S24的处理过程。

6.根据权利要求1所述的应用于电力领域的智能语音调控方法，其特征在于，所述S3包括：

S31，获取降噪后的关键语音波形中的波峰；

7.根据权利要求6所述的应用于电力领域的智能语音调控方法，其特征在于，所述S32包括：

S321，计算减去宽容度后的波峰修正值；

8.根据权利要求1所述的应用于电力领域的智能语音调控方法，其特征在于，所述S4包括：

S43，对得到的关键要素进行指令完整性复核；

9.根据权利要求8所述的应用于电力领域的智能语音调控方法，其特征在于，所述S43包括：

S431，接收关键要素并记录接收时刻；

S434，如果在有效期内则判定通过指令完整性复核。

10.根据权利要求8所述的应用于电力领域的智能语音调控方法，其特征在于，所述S42中包括通过TF-IDF算法提取关键字的操作。