CN111489748A

CN111489748A - 一种调度智能语音辅助系统

Info

Publication number: CN111489748A
Application number: CN201910992666.2A
Authority: CN
Inventors: 周智成; 苗增强; 唐健; 张元胜; 谢代钰; 宋吉峰; 潘连荣; 阳晟; 陈新凌; 杨有慧; 罗翠云
Original assignee: Guangxi Power Grid Co Ltd
Current assignee: Guangxi Power Grid Co Ltd
Priority date: 2019-10-18
Filing date: 2019-10-18
Publication date: 2020-08-04

Abstract

本发明公开了一种调度智能语音辅助系统，该系统包括系统管理模块、人机语音交互平台模块、电网接线图导航模块、语音转成模板化的调度日志模块、调度语音文本管理模块；本发明所达到的有益效果是：该调度智能语音辅助系统，充分利用先进的语音识别技术，实现调度信息记录、语音导航等功能，提高调度电话语音与电网调度管理的智能化水平；系统构建调度人机语音交互平台，实现调度语音自动识别，自动解析成文本文字，为语音识别的调度资源导航等其他功能提供底层基础。

Description

一种调度智能语音辅助系统

技术领域

本发明涉及电力调度技术领域，具体为一种调度智能语音辅助系统。

背景技术

近年来，随着电力信息化建设的深入和智能电网技术的发展，电网调度领域的系统建设逐渐由原先的单一功能向多系统协同的综合性应用模式进行转变，但至今还未出现一种能支持语音操作电力调度系统。

本发明提出一种调度智能语音辅助系统，目标是对电网调度运行管理以及调度业务联系过程涉及的语音及语义过程进行解析，智能识别调度电话内容及关键语义信息，并根据解析结果执行相应的功能和应用。

发明内容

本发明的目的在于提供一种调度智能语音辅助系统及方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种调度智能语音辅助系统，该系统包括系统管理模块、人机语音交互平台模块、电网接线图导航模块、语音转成模板化的调度日志模块、调度语音文本管理模块；

所述系统管理模块用于对电网组织机构、系统角色、用户操作权限进行管理；系统管理模块还包括用户管理子模块、权限管理子模块、电话簿管理子模块、通道参数管理子模块、系统参数管理子模块、操作日志管理子模块、服务器运行参数管理子模块；

所述人机语音交互平台模块用于实现自动识别语音语义，实现语音控制功能，实现语音导航以及日志语音文本的检索功能；

所述电网接线图导航模块用于操作人员通过语音输入厂站名称或线路名称，系统自动调阅OCS的潮流图，并自动进行缩放和中心显示处理，避免鼠标点击调看图形的繁琐操作；

所述语音转成模板化的调度日志模块利用自然语言识别、语音分析、语义分析技术，结合电力调控业务，将语音识别出来的信息内容结果映射到电网设备及所关联的业务上，经过语义识别，判断出日志的类型，包括事故汇报信息、交接班重要记事、缺陷信息、临时安全措施、创新高、电力电量调整类型，根据不同类型的日志要求，经过自然语言处理中的实体识别技术，把语音中的相关信息记入不同的字段或者不同类型的模板中；可以识别出无需记录的语音片段，对于识别出需要记录的片段，按照日志记录生成规则形成日志内容。

所述调度语音文本管理模块实现调度语音自动转成文本存储在调度语音交互平台中，便于调度员听取语音记录的同时拷贝对应文本资料；该模块将录音信息整理成文本，同时根据发生的时间将相应的文本信息与调度录音相对应，以便调度员查阅。

优选的，所述人机语音交互平台模块还包括，人机语音交互平台模块通过对调度员与厂站值班员的对话信息进行语音识别判断，形成文本信息，经过筛选过滤处理最终生成规范的调度文本，经调度员确认后，调度文本信息传至OMS系统中调度值班台，生成调度日志；对于需要按OMS系统中调度信息进行分类的语音信息，系统通过判别功能进行分辨，并自动将信息生成至对应的模块中，同时在调度值班平台生成对应调度日志信息，人机语音交互平台模块所生成的文本信息支持人工修改，自动生成对应的时间，并且所生成的时间也支持人工编辑；对录音文本信息的管理包括按时间生成本文的同时关联对应的录音文件，在调度录音时能按时间查找到对应的文本信息和录音信息；

人机语音交互平台模块根据调控运行最新的规范要求和人员配备，提供多种功能，包括电力专业词汇库功能、特定声调库功能、智能联想库功能，新增多种调控录音文件输入输出模式、多种调控录音文件分析模式、多线程调控录音文件处理模式，提高语音识别平台识别率和语音识别平台引擎性能；

所述电力专业词汇库功能是通过语音辨识功能，通过对已获取的上万小时调控录音数据进行分析处理，对TB量级文本数据进行语音标注，再结合日常调控使用下令用户及相关规定、规范形成一个完善的电力专业词汇库，给下一步的语音辨识提供支撑，保证语音辨识的准确性；通过对已经获取的调控录音进行转写与聚类分析，对大量的已有文本数据进行聚类分析，可分析出日常调控的常用语、专业术语，再反向用大量的文本内容去训练语音识别的语言模型，提高了语音识别的准确率；

所述特定声调库功能是通过语音辨识功能，从已有的语音信号中提取声学特征，对环境噪声、通话信道、发音人声调特征、方言声调特征进行归一化和补偿，得到声学建模和匹配的特征，建立完善的特定声调库；对调控人员的录音数据进行标注，提取特定发音人的发音特点，通过训练声学模型，大幅度提升了语音识别的准确率；

所述智能联想库功能包含系统所能处理的词汇集及其音素序列，智能联想库提供了声学模型建模单元与语言模型建模单元间的关联映射，通过关联映射对所有的语言模型进行入库处理，采用高阶N元文法和回归神经网络，对海量文本数据进行统计，建立方便快捷的智能联想库；

人机语音交互平台模块针对大规模连续语音的识别任务，在词汇量达到数十万、语言模型达到数十GB量级的巨大搜索空间，采用解码技术，快速找到对应说话语音的最佳句子匹配，提高了语音辨识的准确性和实时性，具体工作过程包括：

1）语音检测步骤，系统采集的原始语音数据被送入语音检测模块，该模块进行语音信号的预处理和检测, 将原始语音信号数据转换成标准数据格式，并通过快速高质量的语音信号检测算法，检测到语音的起始点和终止点；

2）语音分类步骤，语音分类包含MF-PLP特征提取、分类两个部分；特征提取部分，主要是在对语音进行分帧、加窗预处理步骤之后，提取语音的MF-PLP即美尔频率、感知线性预测系数特征，它反映了发音的最本质的一些特征信息，采用CMN/HLDA技术减少信道影响，并提高特征的区分性；语音分类部分是针对提取的声学特征，基于GMM统计模型，采用语音类型建模分类算法，得到输入发音的准确类型信息；

3）语言模型步骤，采用隐含马尔科夫声学模型，采用业界领先的MPE模型训练算法，提高模型的鉴别能力，在训练数据、特征提取方面都充分考虑了自然环境噪声的干扰，并且采用多条件的训练策略，能够显著提高对于噪声的稳健性；语言模型是在采用三元文法统计语言模型技术的基础上，积累了大量的分类文本语料，使得语言模型能够很好地覆盖各个领域，同时对语言模型存取速度进行了优化；

4）解码步骤，在搜索空间构建方面，系统采用图结构，以隐含马尔科夫模型的状态为图节点，直接构造跨词的搜索空间；在基于音素决策树的上下文相关的声学模型训练框架中，一个三音子HMM由若干HMM状态组成，不同的三音子HMM可共享相同的HMM状态，系统采用前向、后向归并算法，提取并有效表达了这种共享模式，从而构造出可精细描述声学上下文的搜索空间，此外，修正了基于令牌扩展的维特比搜索算法，产生了质量较高的网格，结合基于网格的后处理算法，进一步提高了系统的识别精度；

5）聚类、自适应步骤，利用前期积累的语音数据，可提取出环境的背景噪声，又可以利用之前对该段语音特点的分析，对系统的模型自适应使它能更好的模拟这个人的特点，使得识别结果更加准确；在说话人聚类方面，采用改进的层次聚类算法，它是一种先合并后判决的无监督自动聚类算法；在环境和说话人自适应方面，采用无监督MLLR算法框架；系统还采用了多遍自适应策略, 可进一步提高自适应的性能；

6）取结果步骤，根据识别器解析的信息，从中提取出多种可能的结果返回给用户，包括每个字或词的起止时间、最可能内容、其它候选参考信息，还提供了保存为cvs记录文档接口，同时提供了文本、音频混合存储和读取的接口方案；

所述人机语音交互平台模块还提供录音文件离线接入功能子模块，用于系统处于离线状态需要接入调度录音文件；提供定时接入录音文件功能，接入频率可为每小时、每天；生成录音文件接入日志，可根据日志找出遗漏录音的文件及接入失败的文件，以便下一次继续接入；对接入的录音文件进行分类存储，录音文件基本信息进行数据库表存储，包括开始时间、结束时间、主叫号码、录音号码；录音文件按专业、时间进行分类存储至服务器；

所述人机语音交互平台模块还提供调控人员培训及考试子模块，根据自动生成规范的调控语音和文档，建立调控语音规范库和培训题库，用于安排考试和培训；通过系统进行培训及考试，便于信息共享交流和知识快捷传播；该子模块可模拟事故发生前后调控电话工作场景，提供事故处理的录音信息，为调控人员提供一个更为真实的培训环境，使调控人员通过培训增强电网事故处理的实际能力和心理素质，提高事故处理过程中各相关环节分工配合的熟练程度。

优选的，所述电网接线图导航模块还包括，调度员在日常电网监视、停送电操作、故障处理时，经常要调阅OCS系统中的电网潮流图，查看线路潮流，电厂出力，网络接线信息，由于潮流图是公司整个220kV系统图，线路多、站点广，调度员需要经常用鼠标拖动图形查找线路与变电站和电厂的位置，特别是在事故处理的紧急情况下，时间宝贵需要提高操作效率，电网接线图导航模块提供的语音导航功能可高效进行线路和变电站及发电厂的定位操作，并且可以将图像调整至合适的大小；

图形语音导航与传统的人机界面相比较,在操作效率、输入的自由度和输出端的显示能力上都有明显的优势，基本操作方式包括单键激活式和开放语音式；单键激活式为一个专门的激活热键，在用户不需要使用语音控制时，不按住热键则程序处于非语音控制状态，在需要使用语音控制时按住热键则程序进入语音控制状态；这种操作方式有利于屏蔽控制语音以外的声音信息，同时在非语音控制状态时减小系统负担；开放语音式为开启系统程序后，则全面进入语音控制状态，系统实时收集和分析语音信息，并转化为指令；

电网接线图导航模块还包括厂站、线路语音导航功能，通过接口传递语音转换的规范图形导航指令到OCS系统，OCS系统接收导航指令后进行处理，实现变电站、电厂、线路导航定位功能，可对图形大小可缩放、位置可移动。

优选的，所述语音转成模板化的调度日志模块还包括自然语言处理过程，实现自然语言处理包括经过分词、语法分析、构建语法树、抽取关键数据步骤；

构建电力调度本体库，电力调度本体库是描述对象本体及对象间关系的模型，对调度领域相关专业知识进行建模、描述，电力调度本体库分别从概念实体、概念属性、概念间关系方面对调度领域本体知识库进行建模、描述；本体知识库及其推理规则主要用来实现语义理解、错误诊断功能；电力调度领域的本体知识库主要包括调度对象本体库及专业应用本体库；调度对象本体库：涵盖调度领域所有的结构化数据对象描述，主要包括基础数据对象、电网模型数据对象、运行数据对象及统计分析对象的描述，以及对象间关系的描述；对象本体库遵循IEC61970、电力行业标准、国网企业标准建立；专业应用本体库：涵盖内外部系统的应用模块的描述，主要包括应用模型对象的描述及关系描述，包括所属系统、用户权限、访问路径信息；

构建电力调度词库，主要用来实现精准的中文分词，为后续语法分析及语义分析提供坚实的基础，为了实现精准的中文分词，本系统采用电力专业词汇库和通用词库的词库模型，专业词库用来提高调度领域专业词汇的识别率，而通用词库则用来提高词库的覆盖率，以达到提高搜索语句分词准确率的目标；

分词步骤，分词是自然语言处理的第一步，分词将一个中文自然语言语句切分成一个个单独的通用词、业务词汇或术语、业务实例名称，和其它一些通用自然语言组成的词串，并对每个词标注词性；分词算法主要包括：基于字符串匹配的分词算法以及基于统计的分词算法；基于字符串匹配的分词算法的优点是分词准确率较高，但是其完全依赖于高质量的词库，对于没有在词库中出现的新词，则完全无法辨识；基于统计的分词算法主要是根据字符串在语料库中出现的统计频率来决定其是否构成一个词；本系统采用基于字符串匹配的分词算法结合基于统计的分词算法，在保证中文分词的精准率的基础之上，进一步提高分词算法的适用范围，对没能在各类词库中或实例库中定义的词汇，也能进行恰当的标注；分词的结果返回由“词，词性”组成的串；

语法分析及语法树步骤，语法分析是在分词的基础上，根据系统中配置的本体知识库和自然语言语法规则，对“词，词性”串进行语法分析，包括短语的识别，简单句型的识别，和复杂句型的识别，生成语法分析树，同时进行语法错误诊断，或发现歧义，最后将结果反馈给用户采取行动修改；

实现中文句法分析，构建语法树的方式主要有两大类：基于规则的句法分析方法和基于统计学习的句法分析方法；本系统采用基于统计学习的句法分析算法来构建搜索语句对应的语法树；

建立统一的推理库，推理库包括应用行为库和接口库；应用行为库是应用行为模型的集合，应用行为模型是利用有限状态机来描述应用在某个状态下允许的动作行为以及可能的后续状态；接口库主要包括智能搜索系统调用接口；

建立信息转发机理，借助用户当前状态和用户行为库，对用户的输入进行基于上下文环境的用户行为推理及歧义消除，推导出用户意图，将用户输入转译成无歧义的结构化数据，最后借助接口库将转译后的用户输入传输到智能搜索系统；

本模块还包括调控指令信息辨识功能，完成所有调控录音的完成辨识后，对所记录的文本信息通过应用语音识别中转写技术，以时间轴的方式分析实现与语音文件具有一一对应，实现对调控下令、操作下令、保护投退、开关操作、保护操作调控指令的信息辨识，并在文本信息中进行重点标注，从而实现语音文本中调控指令信息的辨识应用；1）完成调控指令的标注后标签、文本框、颜色标注多种形式进行展示，方便辨识文本的日常查阅工作； 2）在调控人员听取历史调控录音或查阅历史转译文件时，通过系统对已转译的录音文本进行对比分析、关联处理，将已设定的关键词进行重点标注，实现听取语音文本中关键词对应的录音信息； 3）对于文本信息中不规范的调控指令除了进行标识外，通过智能电网调度技术支持系统调控管理类应用的交互进行动态提醒，便于调控人员及时发现并规范使用的调控指令；

本模块还包括自动生成调度日志功能，与OMS系统值班信息关联，准确显示每条调控录音文件对应的班次信息、值班人员信息，快速查询值班录音文件；语音转换成文本文字之后，通过自然语言处理，可以进一步转换成电力调度专业术语，根据关键字和语义分析自动判断调度日志类型，根据日志类型约定的日志生成规则，对语音文本进行转换，自动生成调度日志，并关联语音文件，可通过在线播放或下载语音文件。

优选的，所述调度语音文本管理模块还包括，调度语音自动转成文本存储在调度语音交互平台中，便于调度员听取语音记录的同时拷贝对应文本资料，当发生故障后，调度员需要调度录音，用大量时间去听录音，同时将录音内容整理成文字，将文字与录音一一对应起来待上级部门检查，这个过程浪费了调度员大量的时间，系统将录音信息整理成文本，同时根据发生的时间将相应的文本信息与调度录音相对应，以便调度员查阅；

本模块实现实时接入录音文件，生成录音文件接入日志，可根据日志找出遗漏录音的文件及接入失败的文件，以便下一次继续接入；对接入的录音文件进行分类存储，录音文件基本信息进行数据库表存储，包括开始时间、结束时间、主叫号码、录音号码；录音文件按专业、时间进行分类存储至服务器；

实现录音文件识别成文本，实现对录音文件进行初步的识别成文本功能；实现人工对录音文本进行更正及完善功能；实现对录音文本调阅查看功能，并支持同时听录音看录音文本；

实现录音在线播放及下载，实现播放基本功能，包括播放开始、暂停、停止、下一个、上一个、快进、后退、音量调整；实现选择多个录音文件，自动播放，实现单个或多个录音文件备份下载；

实现录音文件与OMS调控值班关联，根据录音开始时间与结束时间、录音号码及录音通道信息，再结合调控排班记录，便可关联调控值班相关信息，包括值班人员及相关值班日志；

实现调控语音管理，结合大量调控语音转译文件建立调控用语库，对于日常调控人员不规范用语进行智能辨识，进行标注和统计，并动态提醒相应调控人员应规范的调控用语。

实现综合统计分析，对录音文件进行多维度统计查询，可根据开始日期、结束日期、号码、拨出/来电、通道进行多条件组合查询，按值班人员、值班时间相关条件进行录音文件关联查询统计，实现对查询结果进行打包下载。

另一方面，本发明还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述的一种调度智能语音辅助系统。

另一方面，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述的一种调度智能语音辅助系统。

与现有技术相比，本发明所达到的有益效果是：该调度智能语音辅助系统，充分利用先进的语音识别技术，实现调度信息记录、语音导航等功能，提高调度电话语音与电网调度管理的智能化水平；系统构建调度人机语音交互平台，实现调度语音自动识别，自动解析成文本文字，为语音识别的调度资源导航等其他功能提供底层基础。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明的整体架构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种调度智能语音辅助系统，该系统包括系统管理模块、人机语音交互平台模块、电网接线图导航模块、语音转成模板化的调度日志模块、调度语音文本管理模块；

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种调度智能语音辅助系统，其特征在于：该系统包括系统管理模块、人机语音交互平台模块、电网接线图导航模块、语音转成模板化的调度日志模块、调度语音文本管理模块；

2.根据权利要求1所述的一种调度智能语音辅助系统，其特征在于：所述人机语音交互平台模块还包括，人机语音交互平台模块通过对调度员与厂站值班员的对话信息进行语音识别判断，形成文本信息，经过筛选过滤处理最终生成规范的调度文本，经调度员确认后，调度文本信息传至OMS系统中调度值班台，生成调度日志；对于需要按OMS系统中调度信息进行分类的语音信息，系统通过判别功能进行分辨，并自动将信息生成至对应的模块中，同时在调度值班平台生成对应调度日志信息，人机语音交互平台模块所生成的文本信息支持人工修改，自动生成对应的时间，并且所生成的时间也支持人工编辑；对录音文本信息的管理包括按时间生成本文的同时关联对应的录音文件，在调度录音时能按时间查找到对应的文本信息和录音信息；

3.根据权利要求1所述的一种调度智能语音辅助系统，其特征在于：所述电网接线图导航模块还包括，调度员在日常电网监视、停送电操作、故障处理时，经常要调阅OCS系统中的电网潮流图，查看线路潮流，电厂出力，网络接线信息，由于潮流图是公司整个220kV系统图，线路多、站点广，调度员需要经常用鼠标拖动图形查找线路与变电站和电厂的位置，特别是在事故处理的紧急情况下，时间宝贵需要提高操作效率，电网接线图导航模块提供的语音导航功能可高效进行线路和变电站及发电厂的定位操作，并且可以将图像调整至合适的大小；

4.根据权利要求1所述的一种调度智能语音辅助系统，其特征在于：所述语音转成模板化的调度日志模块还包括自然语言处理过程，实现自然语言处理包括经过分词、语法分析、构建语法树、抽取关键数据步骤；

5.根据权利要求1所述的一种调度智能语音辅助系统，其特征在于：所述调度语音文本管理模块还包括，调度语音自动转成文本存储在调度语音交互平台中，便于调度员听取语音记录的同时拷贝对应文本资料，当发生故障后，调度员需要调度录音，用大量时间去听录音，同时将录音内容整理成文字，将文字与录音一一对应起来待上级部门检查，这个过程浪费了调度员大量的时间，系统将录音信息整理成文本，同时根据发生的时间将相应的文本信息与调度录音相对应，以便调度员查阅；

6.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1-5之一所述的一种调度智能语音辅助系统。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-5之一所述的一种调度智能语音辅助系统。