CN112395404A

CN112395404A - 一种应用于电力调度的语音关键信息提取方法

Info

Publication number: CN112395404A
Application number: CN202011417668.8A
Authority: CN
Inventors: 胡飞飞; 曾时博; 洪丹轲; 黄昱; 张思拓; 王巍; 梁寿愚; 方文崇
Original assignee: China Southern Power Grid Co Ltd
Current assignee: China Southern Power Grid Co Ltd
Priority date: 2020-12-05
Filing date: 2020-12-05
Publication date: 2021-02-23
Anticipated expiration: 2040-12-05
Also published as: CN112395404B

Abstract

本发明涉及人工智能客服的智能调度语音理解技术领域，具体为一种应用于电力调度的语音关键信息提取方法，其不同之处在于，包括以下步骤：步骤一、语音信息采集以及预处理；步骤二、前端处理；步骤三、邻接熵值计算；步骤四、邻接熵值条件判断；步骤五、互信息值计算；步骤六、互信息值条件判断；步骤七、重设处理字符串；步骤八、关键信息提取。本发明可有效提升应用于电力调度的关键信息识别的准确率。

Description

一种应用于电力调度的语音关键信息提取方法

技术领域

本发明涉及人工智能客服的智能调度语音理解技术领域，具体为一种应用于电力调度的语音关键信息提取方法。

背景技术

南方电网作为电力服务平台，拥有整体覆盖全网的智能语音引擎开放平台，满足在电力调度领域开展人工智能客服及智能语音分析两个方面的智能化管理工作需要。用户规模不断增长，作为服务全网的话务压力将急剧增加，同时随着通信业务不断发展，通信服务业务范围也将越来越广。每天都会有大量用户找客服帮忙解决电力调度问题。传统客服系统过度依赖人力模式，存在用户操作繁琐、问题解决周期长、成本开销大等缺点。

鉴于此，为了克服现有技术缺点，提供一种应用于电力调度的语音关键信息提取方法成为本领域亟待解决的问题。

发明内容

本发明目的在于克服现有技术的缺点，提供一种应用于电力调度的语音关键信息提取方法，可有效提升应用于电力调度的关键信息识别的准确率。

为解决以上技术问题，本发明提供了一种应用于电力调度的语音关键信息提取方法，其不同之处在于，包括以下步骤：

步骤一、语音信息采集以及预处理：采集语音匹配内容形成语音信号，并对所述语音信号进行预处理，得到电力调度语音文本字符串；

步骤二、前端处理：从初始位置开始读入预定长度的电力调度语音文本字符串；

步骤三、邻接熵值计算：计算当前电力调度语音文本字符串的左、右邻接熵；

步骤四、邻接熵值条件判断：若左或右邻接熵小于指定阈值X，则字符串向左或右扩展一个字符长度，其中运行中有标点和结束则停止，回到步骤三；

步骤五、互信息值计算：若左和右邻接熵均大于指定阈值X，则计算当前电力调度语音文本字符串中各字符的互信息；

步骤六、互信息值条件判断：若互信息大于指定阈值Y，则将当前字符串作为独立完整词汇召回；

步骤七、重设处理字符串：若互信息小于指定阈值Y，则所述初始位置右移一个字符长度，若电力调度语音文本字符串由初始位置起的剩余长度大于拟读入字符串的预定长度，则回到步骤二；

步骤八、关键信息提取：确定所有被召回的词汇权重，并按权重排序，取出权重较大的词汇作为当前电力调度语音文本的关键词。

按以上技术方案，所述步骤一中，所述语音匹配内容具有对应的电力调度语音文本内容。

按以上技术方案，所述步骤三中，记电力调度语音文本字符串S左邻接字符分布集为α_l，右邻接字符分布集为α_r，计算电力调度语音文本字符串S左、右邻接熵模型如下：

其中，p(αS)表示字符串aS出现的概率，p(Sα)表示字符串Sa出现的概率。

按以上技术方案，所述p(αS)和p(Sα)的近似如下：

其中，f(α_iS)表示字符串α_iS＝α_it₁t₂…t_n在样本中出现的次数，f(Sa_i)表示字符串Sa_i在样本中出现的次数，p(αS)表示字符串aS出现的概率，p(Sα)表示字符串Sa出现的概率。

按以上技术方案，所述步骤四中，对于给定阈值X，若左邻接熵H_l(S)＜X即认为字符t₁为电力调度语音文本字符串S的左边界，若右邻接熵H_r(S)＞X即认为字符t_n为电力调度语音文本字符串S的右边界。

按以上技术方案，所述步骤五中，互信息的计算模型如下：

其中，f(S)和f(t_i)分别表示字符串S＝t₁t₂…t_n和字符t_i在样本中出现的次数；互信息MI(S)越大，则S＝t₁t₂…t_n越有可能是一个完整词。

按以上技术方案，所述步骤六中，电力调度语音文本字符串S对于给定邻接熵阈值X和互信息阈值Y，若左邻接熵H_l(S)＜X，且右邻接熵H_r(S)＜X，且互信息MI(S)＞Y，则将电力调度语音文本字符串S＝t₁t₂…t_n作为独立词汇召回。

按以上技术方案，所述步骤八中，选取词频、词长、词位置、词跨度四种统计特征，并通过权重配置实现归一化。

按以上技术方案，词频因子计算模型如下：

其中，f(S)表示电力调度语音文本字符串S在语料中出现的频次；该计算模型使用非线性函数，它使词频因子随词频的增加而逐渐上升，并向1收敛；

词长因子计算模型如下：

其中，l(S)表示电力调度语音文本字符串S的词长，MAXl(S)表示电力调度语料中所有被召回词汇的最大长度；该电力调度词长因子计算模型随词长的增加逐渐上升，并向1收敛；

词位置因子计算模型如下：

其中，p＝(p₁,p₂,p₃,p₄)表示电力调度语音文本字符串S在语料中标题、首段、段首句、其他位置出现的频率，a＝(a₁,a₂,a₃,a₄)表示在每一个位置上的权重；该词位置因子计算模型中，词汇在不同的位置上对反映语料主题的重要性是不一致的，权重以标题、首段、段首句、其他位置依次递减，即a₁＞a₂＞a₃＞a₄；同样的，add(S)也向1收敛；

词跨度因子计算模型如下：

其中，first(S)和last(S)分别表示电力调度语音文本字符串S在语料中第一次和最后一次出现的位置，f(S)表示电力调度语音文本字符串S在语料中出现的频次；该词跨度因子计算模型中，词汇在语料中的分布越广泛、词跨度越大，就越能反映语料的主题；同样的，dis(S)也向1收敛。

按以上技术方案，为所述词频、词长、词位置、词跨度四种统计特征配置权重w：

w＝(w₁,w₂,w₃,w₄)

所述电力调度语音文本字符串S作为语料主题的影响因子weight(S)：

weight(S)＝w₁×freq(S)+w₂×len(S)+w₃×add(S)+w₄×dis(S)。

与现有技术相比，本发明提供的应用于电力调度的语音关键信息提取方法，本发明可有效准确地提取出语音输入信息的关键信息，改善了传统电力调度方法，提高了电力调度的效率。

附图说明

图1为本发明实施例的整体流程示意图；

图2为本发明实施例中关键信息提取的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1和图2，本发明公开了一种应用于电力调度的语音关键信息提取方法，其不同之处在于，包括以下步骤：

步骤一，确定语音语义匹配库需要的语音匹配内容，所述语音匹配内容具有对应的电力调度语音文本内容；采集所述语音匹配内容形成语音信号，并对所述语音信号进行预处理，得到电力调度语音文本字符串S；

步骤二：从初始位置开始读入预定长度的电力调度语音文本字符串S，设样本电力调度语音文本字符串S＝t₁t₂…t_n，则称t₁为t₂的左邻接字符，t₂为t₁的右邻接字符。根据信息熵的方法，M是离散随机变量，变量M的熵为

其中，M是离散随机变量，其值域记为S_m，对S_m中状态值m∈S_m，其概率分布函数为p_m(x)。

如果一个电力调度语音字符串是一个词汇，那么其左右邻接字符应具有较大的不确定性，即该电力调度语音字符串独立于左右邻接字符，而邻接字符的分布是较为分散的。

举例来说，“去五电站巡逻”、“到五电站值班”、“回五电站取文件”、“上五电站交接”等字符串中，子字符串“电站”的左邻接字符只有唯一确定的一个“五”，而“五电站”的左邻接字符却有“去”、“到”、“回”、“上”四种，不确定性较大，同样的，子字符串“五电”的右邻接字符只有唯一确定的一个“站”，而“五电站”的右邻接字符却有“巡”、“值”、“取”、“交”四种，不确定性较大。

步骤三：计算当前电力调度语音文本字符串的左右邻接熵；记字符串S左邻接字符分布集为α_l，右邻接字符分布集为α_r，计算字符串S左右邻接熵模型如下：

通过样本统计数据给出p(αS)和p(Sα)的近似如下：

步骤四：若电力调度语音文本字符串S的左或右邻接熵小于指定阈值X，则字符串向左或右扩展一个字符长度，其中运行中有标点和结束则停止，回到步骤三；对于给定阈值X，若H_l(S)＜X即认为字符t₁为字符串S的左边界，若H_r(S)＞X即认为字符t_n为字符串S的右边界。

步骤五：若电力调度语音文本字符串S左和右邻接熵均大于指定阈值X，则计算当前电力调度语音文本字符串中个字符的互信息；获得了字符串S的左右边界，在此基础上，根据信息熵的方法，如果一个字符串是一个完整词汇，那么其内部各字符间的相互关联应较为紧密，即该字符串内部各子字符串具有较高的互信息值。

举例来说，“中国南方电网公司”这一字符串在词边界识别的过程中，可能被识别成“中国”、“南方”、“电网”、“公司”四个词汇，而事实上，当“中国”、“南方”、“电网”、“公司”四个词汇连续出现时，更倾向将其作为一个完整词汇。

互信息MI(S)有多种计算表达式，同样通过样本统计数据给出互信息计算表达式：

其中f(S)和f(t_i)分别表示字符串S＝t₁t₂…t_n和字符t_i在样本中出现的次数。互信息MI(S)越大，则S＝t₁t₂…t_n越有可能是一个完整词。

步骤六：若互信息MI(S)大于指定阈值Y，则将当前字符串作为独立完整词汇召回；即电力调度语音文本字符串S对于给定邻接熵阈值X和互信息阈值Y，若H_l(S)＜X，且H_r(S)＜X，且MI(S)＞Y，则将电力调度语音文本字符串S＝t₁t₂…t_n作为独立词汇召回。

步骤七：初始位置右移一个字符长度，若电力调度语音文本字符串由初始位置起的剩余长度大于拟读入字符串的预定长度，则回到步骤二；

步骤八：计算所有被召回的词汇权重，并按权重排序，取出权重较大的词汇作为当前电力调度语音文本字符串S的关键词。

选取词频、词长、词位置、词跨度四种统计特征，并通过权重配置实现归一化。

词频因子计算模型如下：

其中f(S)表示电力调度语音文本字符串S在语料中出现的频次。该计算模型使用非线性函数，它使词频因子随词频的增加而逐渐上升，并向1收敛。

词长因子计算模型如下：

其中l(S)表示电力调度语音文本字符串S的词长，MAXl(S)表示电力调度语料中所有被召回词汇的最大长度。该电力调度词长因子计算模型随词长的增加逐渐上升，并向1收敛。

词位置因子计算模型如下：

其中p＝(p₁,p₂,p₃,p₄)表示电力调度语音文本字符串S在语料中标题、首段、段首句、其他位置出现的频率，a＝(a₁,a₂,a₃,a₄)表示在每一个位置上的权重。该词位置因子计算模型认为，词汇在不同的位置上对反映语料主题的重要性是不一致的，权重以标题、首段、段首句、其他位置依次递减，即a₁＞a₂＞a₃＞a₄。同样的，add(S)也向1收敛。

词跨度因子计算模型如下：

其中first(S)和last(S)分别表示字符串S在语料中第一次和最后一次出现的位置，f(S)表示字符串S在语料中出现的频次。该词跨度因子计算模型认为，词汇在语料中的分布越广泛、词跨度越大，就越能反映语料的主题。同样的，dis(S)也向1收敛。

为词频、词长、词位置、词跨度四种统计特征配置权重w：

w＝(w₁,w₂,w₃,w₄)

电力调度语音文本字符串S作为语料主题的影响因子weight(S)：

weight(S)＝w₁×freq(S)+w₂×len(S)+w₃×add(S)+w₄×dis(S)

举例：

配置邻接熵阈值X＝1.2，互信息阈值Y＝0.08，配置词位置权重a＝(0.41,0.33,0.27,0.09)、配置词频、词长、词位置、词跨度权重w＝(0.39,0.21,0.18,0.22)。以《南方电网“十三五”智能电网发展规划研究报告》为例，实验结果表明，算法能识别“两精两优”、“智能电网架构体系”等新词和术语，能识别“全面贯通的通信网络”、“高效互动的调度及控制体系”、“集成共享的信息平台”、“全面覆盖的技术保障体系”等复合词，能将“智慧能源”、“能源互联网”等具有重复字符的词汇作为两个独立词汇召回，关键词提取效果令人满意。

本发明中，构建应用于电力调度的语音关键信息提取方法和人工在线客服系统的智能客服系统，大大提高了客服人效和用户体验。同时这种语音关键信息提取方法也可适用在电网其他业务方面，比如运维检修、项目管理等，不仅适用于电网内部项目和人员的信息管理调取的智能服务系统，还适用客户与电网之间的信息咨询、业务办理导向等方向的智能客服系统，有助于提高业务效率，使客服系统智能化效率化。

需要说明的是，在本文中，诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种应用于电力调度的语音关键信息提取方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述步骤一中，所述语音匹配内容具有对应的电力调度语音文本内容。

3.根据权利要求1所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述步骤三中，记电力调度语音文本字符串S左邻接字符分布集为α_l，右邻接字符分布集为α_r，计算电力调度语音文本字符串S左、右邻接熵模型如下：

4.根据权利要求3所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述p(αS)和p(Sα)的近似如下：

其中，f(α_iS)表示字符串α_iS＝α_it₁t₂...t_n在样本中出现的次数，f(Sa_i)表示字符串Sa_i在样本中出现的次数，p(αS)表示字符串aS出现的概率，p(Sα)表示字符串Sa出现的概率。

5.根据权利要求1所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述步骤四中，对于给定阈值X，若左邻接熵H_l(S)＜X即认为字符t₁为电力调度语音文本字符串S的左边界，若右邻接熵H_r(S)＞X即认为字符t_n为电力调度语音文本字符串S的右边界。

6.根据权利要求1所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述步骤五中，互信息的计算模型如下：

其中，f(S)和f(t_i)分别表示字符串S＝t₁t₂...t_n和字符t_i在样本中出现的次数；互信息MI(S)越大，则S＝t₁t₂...t_n越有可能是一个完整词。

7.根据权利要求1所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述步骤六中，电力调度语音文本字符串S对于给定邻接熵阈值X和互信息阈值Y，若左邻接熵H_l(S)＜X，且右邻接熵H_r(S)＜X，且互信息MI(S)＞Y，则将电力调度语音文本字符串S＝t₁t₂...t_n作为独立词汇召回。

8.根据权利要求1所述的应用于电力调度的语音关键信息提取方法，其特征在于：所述步骤八中，选取词频、词长、词位置、词跨度四种统计特征，并通过权重配置实现归一化。

9.根据权利要求8所述的应用于电力调度的语音关键信息提取方法，其特征在于：词频因子计算模型如下：

词长因子计算模型如下：

词位置因子计算模型如下：

词跨度因子计算模型如下：

10.根据权利要求9所述的应用于电力调度的语音关键信息提取方法，其特征在于：为所述词频、词长、词位置、词跨度四种统计特征配置权重w：

w＝(w₁,w₂,w₃,w₄)

weight(S)＝w₁×freq(S)+w₂×len(S)+w₃×add(S)+w₄×dis(S)。