CN110277086B - 基于电网调度知识图谱的语音合成方法、系统及电子设备 - Google Patents

基于电网调度知识图谱的语音合成方法、系统及电子设备 Download PDF

Info

Publication number
CN110277086B
CN110277086B CN201910551954.4A CN201910551954A CN110277086B CN 110277086 B CN110277086 B CN 110277086B CN 201910551954 A CN201910551954 A CN 201910551954A CN 110277086 B CN110277086 B CN 110277086B
Authority
CN
China
Prior art keywords
power grid
scheduling
knowledge
grid dispatching
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910551954.4A
Other languages
English (en)
Other versions
CN110277086A (zh
Inventor
王飞跃
张俊
王晓
侯家琛
王恒
许沛东
王伟臣
崇志强
马世乾
王旭东
李国栋
杨晓静
黄志刚
郭悦
杨帮宇
李振斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Academy Of Intelligent Industries
Institute of Automation of Chinese Academy of Science
Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd
Original Assignee
Qingdao Academy Of Intelligent Industries
Institute of Automation of Chinese Academy of Science
Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Academy Of Intelligent Industries, Institute of Automation of Chinese Academy of Science, Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd filed Critical Qingdao Academy Of Intelligent Industries
Priority to CN201910551954.4A priority Critical patent/CN110277086B/zh
Publication of CN110277086A publication Critical patent/CN110277086A/zh
Application granted granted Critical
Publication of CN110277086B publication Critical patent/CN110277086B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Abstract

本发明涉及一种基于电网调度知识图谱的语音合成方法、系统及电子设备,合成步骤为:根据电网调度异构数据构建电网调度知识图谱;在电网调度知识图谱中进行知识匹配,生成语义关系值;根据语义关系值高低进行排序,将语义关系值最高的实体关系作为调度信令;当调度信令的语义关系值大于预设值时,获取与其对应的文字信令信息;对文字信令信息进行语句拼接,生成文本格式信令语句;导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式信令语句作为整体进行参数转码合成,生成并输出语音信息。本发明能够在满足电网调度业务实时性要求的前提下,提供音质更高,信令更加准确,更加自然流畅的合成语音。

Description

基于电网调度知识图谱的语音合成方法、系统及电子设备
技术领域
本发明属于电力技术领域,具体地说,涉及一种基于电网调度知识图谱的语音合成方法、系统及电子设备。
背景技术
人工智能是未来电网的核心部分。目前,电网公司已经在电网调度系统配置了人工智能相关的技术,人工智能不断收集和整合来自数百万台智能传感器中的数据,并从大型数据集的模式和异常现象中进行自主认知学习,以便能够及时地做出决策。知识图谱是实现机器认知智能的基础。机器认知智能的两个核心能力为“理解”和“解释”,均与知识图谱有着密切关系。机器认知智能是将知识库中的知识与问题或者数据加以关联的过程,有了知识图谱,机器完全可以重现人类的这种理解与解释过程。
语音合成作为人工智能的一个重要分支,已经在电网调度系统中使用,但现有的语音合成方法及设备在电网某些场合(例如:调度命令下达业务无法应用、调度业务技术问询业务无法应用)下并不方便使用,尤其是对于通常都是以异构数据的形式存在的电网调控领域,现有语音合成方法及系统使用的效果差,且当前语音合成方式复杂繁琐,无法满足电网调度系统的业务服务需求。
发明内容
本发明针对电网调度系统中现有语音合成方法及设备存在的使用效果差、合成方式复杂繁琐等上述问题,提供一种基于电网调度知识图谱的语音合成方法、系统及电子设备,能够在满足电网调度业务实时性要求的前提下,提供音质更高,信令更加准确,更加自然流畅的合成语音。
为了达到上述目的,本发明提供了一种基于电网调度知识图谱的语音合成方法,含有以下步骤:
获取电网调度异构数据,根据电网调度异构数据构建电网调度知识图谱;
当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值;
根据语义关系值高低进行排序,并将语义关系值最高的实体关系作为调度信令;
将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息;
利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;
利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息;
将所述语音信息输出。
进一步的,将调度信令的语义关系值与预设阈值进行比较,当调度信令知识图谱的相似度值小于预设阈值时,发送人工干预请求至目标调度专家,由目标调度专家补充电网调度知识图谱和文字信令信息。
进一步的,利用调度指令机器学习模型对所述文字信令信息进行识别,得到文字信令信息中包含的信令分词词语;其具体步骤为:利用调度指令机器学习模型对文字信令信息进行提取、划分、停用词过滤、标注词性、分类和标签提取,得到文字信令信息中包含的电网调度分词词语以及非电网调度分词词语。
进一步的,将所述电网调度分词词语作为整体对所述文字信令信息进行语音拼接合成,生成语音信息;或将调度员输入的文本信息进行直接合成,生成语音信息。
进一步的,还包括:基于所述知识图谱和文字信令信息,以调度中心各部门为单位进行分类,建立标准化语音合成场景。
进一步的,根据电网调度异构数据构建电网调度知识图谱的具体步骤为:
利用机器学习模型识别电网调度异构数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
导入先验知识,所述先验知识与所述实体三元组形成电网调度三元组数据库;
利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解知识融合处理;
利用机器学习模型对知识融合处理后的电网调度三元组数据库进行本体抽取、知识推理、质量评估知识加工处理后,得到电网调度知识图谱。
为了达到上述目的,本发明还提供了一种基于电网调度知识图谱的语音合成系统,包括:
获取模块,用于获取电网调度异构数据;
电网调度知识图谱构建模块,用于根据电网调度异构数据构建电网调度知识图谱;
匹配模块,用于当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值;
排序模块,用于根据语义关系值高低进行排序,并将语义关系值最高的实体关系作为调度信令;
比较模块,用于将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息;
文本模块,用于利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;
合成模块,利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息;
输出模块,用于将所述语音信息输出。
进一步的,还包括用于将语音信息输出的输出模块和用于基于电网调度知识图谱和文字信令信息建立标准化语音合成场景的场景模块。
优选的,所述电网调度知识图谱构建模块包括:
三元模块,用于利用机器学习模型识别所述数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
先验模块,用于导入先验知识;
融合模块,用于利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解知识融合处理;
加工模块,用于利用机器学习模型对知识融合处理后的电网调度三元组数据库进行本体抽取、知识推理、质量评估知识加工处理,得到电网调度知识图谱。
为了达到上述目的,本发明又提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于电网调度知识图谱的语音合成方法的步骤。
与现有技术相比,本发明的有益效果在于:
本发明基于电网调度知识图谱进行语音合成,首先获取电网调度异构数据,建立电网调度知识图谱,当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值;根据语义关系值高低进行排序,并将语义关系值最高的实体关系作为调度信令;将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息;利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息,将语音信息输出。因此,本发明提供的语音合成方法、系统及电子设备能够在满足电网调度业务实时性要求的前提下,提供音质更高,信令更加准确,更加自然流畅的合成语音。
本发明能够对电力领域的电网调度知识图谱进行分析及语音合成,填补了现有技术中存在的电网调度领域知识图谱的应用以及以电网调度知识图谱进行语音合成的技术空白问题,对于电力领域的事业发展具有促进作用。
附图说明
图1为本发明实施例一所述基于电网调度知识图谱的语音合成方法的流程图;
图2为本发明实施例所述电网调度知识图谱的构建方法的流程图;
图3为本发明实施例二所述基于电网调度知识图谱的语音合成方法的流程图;
图4为本发明实施例基于电网调度知识图谱的语音合成系统的结构示意图;
图5为本发明实施例所述电子设备的结构示意图。
具体实施方式
下面,通过示例性的实施方式对本发明进行具体描述。然而应当理解,在没有进一步叙述的情况下,一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。
实施例一:
本实施例提供了一种基于电网调度知识图谱的语音合成方法,应用于电力领域。
参照图1,该方法具体包括:
S1、获取电网调度异构数据,根据电网调度异构数据构建电网调度知识图谱。其具体步骤为:
S11、获取电网的调度异构数据;
具体的,可以直接从能量管理设备(例如调度D5000设备等)检测的异构数据接收获取电网的调度信息。
S12、根据电网调度异构数据构建电网调度知识图谱。参见图2,其具体步骤为:
S121、利用机器学习模型识别电网调度异构数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组。
具体的,利用机器学习模型(如DNN/RNN/CNN)从数据库中利用自然语言处理NLP方法进行包括实体抽取、术语抽取、关系抽取、事件抽取处理,然后建立实体间相互关系,最后对实体进行分类,抽象成本体,并建立本体之间的关系,构建电网调度三元组数据库。对于此类机器学习模型不做具体限制。
这里的实体可以指具有某类事物特征的数据对象集合。识别数据中的实体,并进行实体之间的关系抽取时,可以基于知识数据所体现的上下文信息,进行实体的识别及关系的抽取。具体如,可以根据数据中包含的时间信息,确定预设时间段内生成的知识数据,并根据知识数据中包含的内容数据确定知识数据所体现的上下文信息,从而基于上下文信息对知识数据进行实体的识别及关系的抽取。在识别实体以及抽取实体之间的关系之后,可以根据识别的实体以及实体之间的关系得到包含关系信息的实体三元组,三元组是由实体、属性和关系组成(由Entity、Attribute、Relation组成)。
这里的关系信息可以包括实体以及实体之间的关系,相应地,实体三元组可以包括:第一实体、实体之间的关系、第二实体。例如,知识数据1为:时间1;系统1;智能电网调度系统包含消息总线。知识数据2为:时间2;系统2消息总线包含消息通道。在对知识数据进行实体的识别及关系的抽取时,可以结合知识数据1和知识数据2进行实体的识别及实体关系之间的关系抽取,得到的实体三元组可以为:系统1,智能电网调度系统-消息通道,系统2。
需要说明的是,知识数据中实体的识别和实体之间关系的抽取可以是同时进行的。在识别知识数据中的实体并进行实体之间的关系抽取时,可以根据预设的标注策略为知识数据添加标签,这里的预设的标注策略可以包括以下三个部分:
1)根据实体在知识数据中的位置确定实体中词或字的位置标签,例如,位置标签可以包括:实体开始、实体内部、实体结尾、单个实体。
2)根据预设的实体关系类型确定实体中词或字的关系标签,例如,关系标签可以包括子系统-主系统、业务-信息通路等预先定义的关系类型。
3)根据实体表示的角色信息确定实体中词或字的角色标签,例如,系统1(实体1)、系统2(实体2)
等实体对应的角色标签。
这里,若知识数据中的实体不具有实体关系,则可以将实体的标签设置为预设标签,如“0”。
S122、导入先验知识,所述先验知识与所述实体三元组形成电网调度三元组数据库。
具体的,先验知识包含既有材料,例如电网教材、调度规程、调度案例中获取的调度信息。也包含通过获取各类调度专家操作以及计算经验等知识建立的专家数据库。还包括包含语音参数与文字相互映射的数据库等数据库。
S123、利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解知识融合处理。
具体的,利用机器学习模型(如DNN/RNN/CNN)方法。在为知识数据中的实体添加标签之后,可以根据实体的标签,对知识关系进行实体链接、实体消歧、共指消解知识加工融合处理。使用属性相似度、实体相似度等工具或方法对来自不同的知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、更新等步骤,达到数据、信息、方法、经验以及人的思想的融合,形成高质量的数据库。如将具有相同关系类型的实体合并为一个实体三元组,如将(单个实体,消息总线-智能电网调度系统,系统1)与(单个实体,消息总线-智能电网调度系统,系统2)合并为(系统1,消息总线-智能电网调度系统,系统2)。如果一个知识数据中包含两个以上相同关系类型的实体,则可以计算相似度进行合并。对于此类机器学习模型不做具体限制。
S124、利用机器学习模型对知识融合处理后的电网调度三元组数据库进行本体抽取、知识推理、质量评估知识加工处理后,得到电网调度知识图谱。
具体的,利用机器学习模型(如DNN/RNN/CNN)方法,在进行知识加工之后,利用知识加工工具或方法如演绎推理、归纳推理、确定性推理&不确定推理、数值推理&符号推理、基于表示学习的推理等工具或Tableaux运算的方法、基于逻辑编程改写的方法、基于一阶查询重写方法、基于产生式规则等方法用于推理暗含的知识,检查数据库的不一致。通过各种方法获取新的知识或者结论,这些知识和结论满足语义。在已有的数据库的基础上,进一步挖掘隐含的知识,从而丰富、扩展数据库。对于此类机器学习模型不做具体限制。
如从一般到特殊的推理过程,从一般性的前提出发,通过推导,得到具体描述或个别结论(如:三段论),结论已经蕴含一般性知识中,通过演绎推理揭示出来。从特殊到一般的推理过程,从一类事物的大量特殊事例出发,去推出该类事物的一般性结论(如:数学归纳法),推出的结论没有包含在已有内容中,增加新知识到数据库中。
在具体实施中,得到知识数据对应的实体三元组之后,可以根据实体三元组中实体之间的关系,建立不同实体之间的关系网络,从而构建电网调度知识图谱模型。由于电网调度构建知识图谱模型是基于电网调度数据进行建立的,在利用构建的电网调度知识图谱模型进行语音合成时,可以针对不同电网调度业务提供个性化的合成处理。
S13、当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值。
具体的,指根据调度应用,计算调度应用中实体与电网调度知识图谱中实体之间的关系,这些关系可以是实体间的模糊关系或逻辑符。主要核心就在于如何发现异构本体间的匹配关系,主要包含实例共享、查询重写、本体集成等应用,最终计算调度应用中实体与电网调度知识图谱中实体之间的语义关系值。
需要指出的是,在另一个实施例中,还可以预先根据调度需求类型或者部门等在电网调度知识图谱进行分类,然后根据调度需求所在的部门的电网调度图谱以及分类后的该部门的电网调度知识图谱进行对比,以提高语义关系计算效率。
可以通过机器学习模型(如DNN/RNN/CNN)等方法用于知识推理计算语义关系。对于此类知识推理模型不做具体限制。
S14、根据语义关系值高低进行排序,并将语义关系值最高的实体关系作为调度信令;
具体的,将根据语义关系值由高到低排序,得到电网调度知识图谱中实体关系的排序表,排序表的第一语义关系即为语义关系值最高的电网调度知识图谱,将该电网调度知识图谱作为调度信令。
S15、将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息。
具体的,这里的预设阈值可以根据需要进行设置,以全面性和准确性为基准,防止对比遗漏,预设阈值可以设置为90%-99%之间的任意值。由于电网调度本身需求,本实施例中的预设阈值设置为99%。
由于电网调度知识图谱基于运行数据、调度文献资料等,因此,电网调度知识图谱还包括有与该电网调度知识图谱对应的文字信令信息。因此,可以通过电网调度知识图谱信息获取对应的文字信令信息。
S16、利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句。
具体的,上述的调度文本机器学习模型是通过利用专业词库、电网数据库的词语为单位构筑词向量模型,利用词向量模型和RL/GAN强化学习/对抗学习等模型训练进行拼句训练。专业词库是指调度专业词库,包括调度词典等,电网调度知识图谱包括收集的故障/负载集以及调度专家对故障集的回复构成的答案集,且故障集的问题与答案集的答案一一对应关联起来,方便直接调取利用,且电网调度知识图谱可以用于场景化教学。
依据电网调度知识图谱为每一类实体和描述定义语义标签,并将这些语义标签标注于训练集之中,利用RL/GAN强化学习/对抗学习等模型和训练集训练调度文本机器学习模型实现语义标签的预测,输出句子中每个词所对应的语义标签的序号。在主题陈述的句式层面上对己预测过语义标签的文本进行分类,进一步确定每条数据在所属的主题句式,根据电网调度知识图谱内容,语义信息抽取结果和分类结果,最终确定文本中的词语序列以及词语序列的排列句式,生成成完整的文本格式调度语句。对于此类调度文本机器学习模型不做具体限制。
S17、利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息。
具体的,通过以下步骤实现:
利用机器学习模型将上述生成的文本格式电网调度信令语句转化为文本字向量,对于此类文本字向量的生成方法不做具体限制。
导入电网调度知识图谱中的语音参数,对于此类方法不做具体限制。
利用机器学习模型对待处理文本进行分析,分析韵律及情感特征。本实施例中的韵律及情感特征包括但不限于:停顿、语气、重音等。本实施例对于具体的分析方法不做具体限制。
基于RL/GAN等语音合成机器学习模型,导入汉语声韵母拼读规则和韵律及情感特征。输入文本字向量和声学特征参数,进行机器学习处理.输出声谱图,然后使用Griffin_Lim等算法或工具生成对应音频,利用模型训练误差和MOS评估分析两方面进行效果反馈。对于此类语音合成机器学习模型不做具体限制。
需要指出的是,在另一个实施方式中,还可以根据调度员所输入的文字内容,利用利用语音合成机器学习模型,直接进行生成语音信息。
S18、将语音信息输出。
具体的,以声音形式输出语音信息。
本发明实施例提供的基于电网调度知识图谱的语咅合成方法,包括:获取电网调度异构数据;利用机器学习模型识别所述数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;导入专家知识库、语音参数知识库等先验知识;利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解等知识融合处理;利用机器学习模型对电网调度三元组数据库进行本体抽取、知识推理、质量评估等知识加工处理,得到电网调度知识图谱;将当调度系统应用时,在电网调度知识图谱中进行知识推理,生成语义关系值;根据语义关系值高低进行排序,并将语义关系值最高的实体关系作为调度信令;将调度信令的语义关系值与预设阈值进行比较;当调度信令的语义关系值大于预设阈值时,获取与所述调度信令对应的文字信令信息;利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式调度语句作为整体进行参数转码合成,生成语音信息;将语音信息输出。
因此,本发明实施例提供的技术方案,填补了现有技术中存在的电网调度领域知识图谱的应用以及以电网调度知识图谱进行语音合成的技术空白问题,能够对电力领域的图谱进行分析及语音合成,对于电力领域的事业发展具有促进作用。本实施例提供的语音合成方法能够在满足电网调度业务实时性要求的前提下,提供音质更高,信令更加准确,更加自然流畅的合成语音。
实施例二:
参见图3,在实施例二的基础上,本发明实施例提供的另一种基于电网调度知识图谱的语音合成方法,与实施例一不同的是,在步骤S18之后,该方法还包括:
S19、当调度信令的语义关系值小于预设阈值时,发送人工干预请求至目标调度专家,由目标调度专家补充电网调度知识图谱和文字信令信息。
通过人工干预,可以丰富电网调度知识图谱,扩展电网调度数据库,方便后续案例的调取使用。
需要指出的是,在利用调度文字机器学习模型对所述调度信令进行识别,得到调度信令中包含的调度语句的过程中,也可以加入人工干预,以提高调度语句的准确性,同时防止漏检率,以及对调度文字机器学习模型进行反馈更新,提高调度文字机器学习模型的适应性。
S20、基于所述知识图谱和文字信令信息建立标准化语音合成场景。
通过该步骤S20建立的标准化语音合成场景,一方面方便提取知识图谱对应的调度信令信息的语音信息,并进行直接输出,简化合成步骤,提高效率;另一方面,标准化语音合成场景可以用于场景教学,减轻调度员反复培训的弊端,减轻了调度员的工作负担,同时有利于电力事业的发展。
实施例三:
图4示出了本发明实施例提供的一种基于电网调度知识图谱的语音合成系统的示意图,该基于电网调度知识图谱的语音合成系统包括:
获取模块401,用于获取电网调度异构数据;
电网调度知识图谱构建模块,用于根据电网调度异构数据构建电网调度知识图谱,所述电网调度知识图谱构建模块包括:
三元模块402,用于利用机器学习模型识别所述数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
先验模块403,用于导入先验知识;
融合模块404,用于利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解知识融合处理;
加工模块405,用于利用机器学习模型对知识融合处理后的电网调度三元组数据库进行本体抽取、知识推理、质量评估知识加工处理;
构建模块406,构用于得到电网调度知识图谱;
匹配模块407,用于当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值;
排序模块408,用于根据语义关系值高低进行排序,并将语义关系值最高的实体关系作为调度信令;
比较模块409,用于将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息;
文本模块410,用于利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;
合成模块411,利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息;
输出模块412,用于将所述语音信息输出。
进一步的,所述比较模块409,当调度信令的语义关系值小于预设阈值时,发送人工干预请求至目标调度专家,由目标调度专家补充电网调度知识图谱和文字信令信息。
进一步的,所述文本模块410,具体用于利用深度学习模型对文字信令电网调度进行提取、划分、停用词过滤、标注词性、分类和标签提取,得到文字信令信息中包含的调度分词词语以及非调度分词词语。
在本实施另一实施方式中,所述合成模块411,具体用于利用语音参数、文本格式电网调度信令语句屮的调度分词词语和非调度分词词语进行语音合成,生成语音信息。
在本实施另一实施方式中,所述合成模块411,具体用于利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将调度员输入的文本信息直接合成,生成语音信息。
在本实施一优选实施方式中,该系统还包括场景模块413,基于所述知识图谱和文字信令信息建立标准化语音合成场景。
本发明实施例提供的基于电网调度知识图谱的语音合成系统,与上述实施例提供的基于电网调度知识图谱的语音合成方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例所提供的系统,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,系统实施例部分未提及之处,可参考前述方法实施例中相应内容。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
实施例四:
本发明实施例还提供了一种电子设备500,该电子设备500的结构如图5所示,具体包括:处理器501、存储器502和总线503。
所述存储器存储502有所述处理器501可执行的机器可读指令(比如,图4中的获取模块401、三元模块402,先验模块403,融合模块404,加工模块405,构建模块406,匹配模块407,排序模块408,比较模块409,文本模块410,合成模块411,输出模块412,场景模块413对应的执行指令),当电子设备运行时,所述处理器501与所述存储器502之间通过总线503通信,所述处理器501执行所述机器可读指令时执行。
本发明实施例所提供的进行基于电网调度知识图谱的语音合成方法的计算机设备,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一实施例提供的电网调度知识图谱的构建方法与语音合成的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行语音合成方法的步骤,从而解决目前电网调度中心语音设备不能针对调度业务的问题。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (10)

1.一种基于电网调度知识图谱的语音合成方法,其特征在于,含有以下步骤:
获取电网调度异构数据,根据电网调度异构数据构建电网调度知识图谱;
当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值;
根据语义关系值由高到低进行排序,得到电网调度知识图谱中实体关系的排序表,并将语义关系值最高的实体关系作为调度信令,即排序表的第一语义关系即为语义关系值最高的电网调度知识图谱,将该电网调度知识图谱作为调度信令;
将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息;
利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;其具体步骤为:
依据电网调度知识图谱为每一类实体和描述定义语义标签,并将这些语义标签标注于训练集之中,利用RL/GAN强化学习/对抗学习模型和训练集训练调度文本机器学习模型实现语义标签的预测,输出句子中每个词所对应的语义标签的序号;
在主题陈述的句式层面上对己预测过语义标签的文本进行分类,进一步确定每条数据在所属的主题句式,根据电网调度知识图谱内容,语义信息抽取结果和分类结果,最终确定文本中的词语序列以及词语序列的排列句式,生成完整的文本格式调度语句;
利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息;
将所述语音信息输出。
2.如权利要求1所述的基于电网调度知识图谱的语音合成方法,其特征在于,将调度信令的语义关系值与预设阈值进行比较,当调度信令知识图谱的相似度值小于预设阈值时,发送人工干预请求至目标调度专家,由目标调度专家补充电网调度知识图谱和文字信令信息。
3.如权利要求1所述的基于电网调度知识图谱的语音合成方法,其特征在于,利用调度指令机器学习模型对所述文字信令信息进行识别,得到文字信令信息中包含的信令分词词语;其具体步骤为:利用调度指令机器学习模型对文字信令信息进行提取、划分、停用词过滤、标注词性、分类和标签提取,得到文字信令信息中包含的电网调度分词词语以及非电网调度分词词语。
4.如权利要求3所述的基于电网调度知识图谱的语音合成方法,其特征在于,将所述电网调度分词词语作为整体对所述文字信令信息进行语音拼接合成,生成语音信息;或将调度员输入的文本信息进行直接合成,生成语音信息。
5.如权利要求1所述的基于电网调度知识图谱的语音合成方法,其特征在于,还包括:基于所述知识图谱和文字信令信息,以调度中心各部门为单位进行分类,建立标准化语音合成场景。
6.如权利要求1至5任意一项所述的基于电网调度知识图谱的语音合成方法,其特征在于,根据电网调度异构数据构建电网调度知识图谱的具体步骤为:
利用机器学习模型识别电网调度异构数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
导入先验知识,所述先验知识与所述实体三元组形成电网调度三元组数据库;
利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解知识融合处理;
利用机器学习模型对知识融合处理后的电网调度三元组数据库进行本体抽取、知识推理、质量评估知识加工处理后,得到电网调度知识图谱。
7.一种基于电网调度知识图谱的语音合成系统,其特征在于,包括:
获取模块,用于获取电网调度异构数据;
电网调度知识图谱构建模块,用于根据电网调度异构数据构建电网调度知识图谱;
匹配模块,用于当电网调度系统应用时,在电网调度知识图谱中进行知识匹配,生成语义关系值;
排序模块,用于根据语义关系值由高到 低进行排序,得到电网调度知识图谱中实体关系的排序表,并将语义关系值最高的实体关系作为调度信令,即排序表的第一语义关系即为语义关系值最高的电网调度知识图谱,将该电网调度知识图谱作为调度信令;
比较模块,用于将调度信令的语义关系值与预设阈值进行比较,当调度信令的语义关系值大于预设值时,获取与所述调度信令对应的文字信令信息;
文本模块,用于利用调度文本机器学习模型对所述文字信令信息进行语句拼接,生成文本格式电网调度信令语句;生成文本格式电网调度信令语句的具体步骤为:
依据电网调度知识图谱为每一类实体和描述定义语义标签,并将这些语义标签标注于训练集之中,利用RL/GAN强化学习/对抗学习模型和训练集训练调度文本机器学习模型实现语义标签的预测,输出句子中每个词所对应的语义标签的序号;
在主题陈述的句式层面上对己预测过语义标签的文本进行分类,进一步确定每条数据在所属的主题句式,根据电网调度知识图谱内容,语义信息抽取结果和分类结果,最终确定文本中的词语序列以及词语序列的排列句式,生成完整的文本格式调度语句;
合成模块,用于利用语音合成机器学习模型,导入电网调度知识图谱中的语音参数,同时嵌韵律及情感特征,将文本格式电网调度信令语句作为整体进行参数转码合成,生成语音信息;
输出模块,用于将所述语音信息输出。
8.如权利要求7所述的基于电网调度知识图谱的语音合成系统,其特征在于,还包括用于基于电网调度知识图谱和文字信令信息建立标准化语音合成场景的场景模块。
9.如权利要求7或8所述的基于电网调度知识图谱的语音合成系统,其特征在于,所述电网调度知识图谱构建模块包括:
三元模块,用于利用机器学习模型识别所述数据中的实体,并进行实体之间的关系抽取,得到包含关系信息的实体三元组;
先验模块,用于导入先验知识;
融合模块,用于利用机器学习模型对电网调度三元组数据库进行实体链接、实体消歧、共指消解知识融合处理;
加工模块,用于利用机器学习模型对知识融合处理后的电网调度三元组数据库进行本体抽取、知识推理、质量评估知识加工处理;
构建模块,用于得到电网调度知识图谱。
10.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求1至6任意一项所述的基于电网调度知识图谱的语音合成方法的步骤。
CN201910551954.4A 2019-06-25 2019-06-25 基于电网调度知识图谱的语音合成方法、系统及电子设备 Active CN110277086B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910551954.4A CN110277086B (zh) 2019-06-25 2019-06-25 基于电网调度知识图谱的语音合成方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910551954.4A CN110277086B (zh) 2019-06-25 2019-06-25 基于电网调度知识图谱的语音合成方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN110277086A CN110277086A (zh) 2019-09-24
CN110277086B true CN110277086B (zh) 2021-11-19

Family

ID=67961851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910551954.4A Active CN110277086B (zh) 2019-06-25 2019-06-25 基于电网调度知识图谱的语音合成方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN110277086B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738982B (zh) * 2019-10-22 2022-01-28 珠海格力电器股份有限公司 一种请求处理方法、装置及电子设备
CN110866840A (zh) * 2019-11-12 2020-03-06 南昌工程学院 基于知识图谱的电力负荷特征量训练的数据库建模方法
CN111046189A (zh) * 2019-11-27 2020-04-21 广东电网有限责任公司 一种配电网知识图谱模型的建模方法
WO2021127979A1 (zh) * 2019-12-24 2021-07-01 深圳市优必选科技股份有限公司 语音合成方法、装置、计算机设备及计算机可读存储介质
CN111241298B (zh) * 2020-01-08 2023-10-10 腾讯科技(深圳)有限公司 信息处理方法、装置和计算机可读存储介质
CN111475655B (zh) * 2020-03-05 2022-09-20 国网浙江省电力有限公司 一种基于配电网知识图谱的电力调度文本实体链接方法
CN111552820A (zh) * 2020-04-30 2020-08-18 江河瑞通(北京)技术有限公司 水工程调度数据处理方法及装置
CN111475625A (zh) * 2020-05-09 2020-07-31 山东舜网传媒股份有限公司 基于知识图谱的新闻稿件生成方法及系统
CN112148893A (zh) * 2020-09-25 2020-12-29 南方电网数字电网研究院有限公司 能源分析知识图谱构建方法与能源分析可视化方法
CN112487789B (zh) * 2020-11-27 2023-12-01 贵州电网有限责任公司 一种基于知识图谱的操作票调度逻辑合法性验证方法
CN112528041B (zh) * 2020-12-17 2023-05-30 贵州电网有限责任公司 一种基于知识图谱的调度用语规范验证方法
CN112990793B (zh) * 2021-05-11 2021-07-23 国网浙江省电力有限公司金华供电公司 一种调度指令识别及复诵方法
CN113609264B (zh) * 2021-06-28 2022-09-02 国网北京市电力公司 电力系统节点的数据查询方法、装置
CN113781004A (zh) * 2021-09-22 2021-12-10 深圳供电局有限公司 一种电网智能调度方法及系统
CN114238648B (zh) * 2021-11-17 2022-11-08 中国人民解放军军事科学院国防科技创新研究院 一种基于知识图谱的博弈对抗行为决策方法及装置
CN114333807B (zh) * 2021-12-24 2023-04-25 北京百度网讯科技有限公司 电力调度方法、装置、设备、存储介质及程序

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1455357A (zh) * 2003-05-23 2003-11-12 郑方 一种实现多路对话的人-机汉语口语对话系统的方法
CN101292282A (zh) * 2005-08-29 2008-10-22 沃伊斯博克斯科技公司 支持自然语言人机交互的移动系统和方法
CN101685633A (zh) * 2008-09-28 2010-03-31 富士通株式会社 基于韵律参照的语音合成装置和方法
CN102063902A (zh) * 2010-11-04 2011-05-18 黄安祥 基于模糊理论与专家系统的高效语音指令识别方法
GB201316286D0 (en) * 2013-09-13 2013-10-30 Vivago Oy An arrangement and a method for creating a synthesis from numerical data and textual information
CN103562919A (zh) * 2011-06-02 2014-02-05 浦项工科大学校产学协力团 利用网络的信息检索方法及相应的语音对话方法
CN104461525A (zh) * 2014-11-27 2015-03-25 韩慧健 一种可自定义的智能咨询平台生成系统
CN105118499A (zh) * 2015-07-06 2015-12-02 百度在线网络技术(北京)有限公司 韵律停顿预测方法和装置
CN105975622A (zh) * 2016-05-28 2016-09-28 蔡宏铭 多角色智能聊天的方法及系统
CN106550156A (zh) * 2017-01-23 2017-03-29 苏州咖啦魔哆信息技术有限公司 一种基于语音识别的人工智能客服系统及其实现方法
CN106980640A (zh) * 2017-02-08 2017-07-25 网易(杭州)网络有限公司 针对照片的交互方法、设备和计算机可读存储介质
CN107451276A (zh) * 2017-08-05 2017-12-08 龙飞 一种基于深度学习的智能自助导游系统及其方法
CN107862000A (zh) * 2017-10-22 2018-03-30 北京市农林科学院 一种农业技术咨询人机对话方法
CN109215641A (zh) * 2017-07-03 2019-01-15 九阳股份有限公司 基于云的家电语音控制方法及系统
CN109408799A (zh) * 2018-08-14 2019-03-01 优视科技(中国)有限公司 语义决策方法和系统

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1455357A (zh) * 2003-05-23 2003-11-12 郑方 一种实现多路对话的人-机汉语口语对话系统的方法
CN101292282A (zh) * 2005-08-29 2008-10-22 沃伊斯博克斯科技公司 支持自然语言人机交互的移动系统和方法
CN101685633A (zh) * 2008-09-28 2010-03-31 富士通株式会社 基于韵律参照的语音合成装置和方法
CN102063902A (zh) * 2010-11-04 2011-05-18 黄安祥 基于模糊理论与专家系统的高效语音指令识别方法
CN103562919A (zh) * 2011-06-02 2014-02-05 浦项工科大学校产学协力团 利用网络的信息检索方法及相应的语音对话方法
GB201316286D0 (en) * 2013-09-13 2013-10-30 Vivago Oy An arrangement and a method for creating a synthesis from numerical data and textual information
CN104461525A (zh) * 2014-11-27 2015-03-25 韩慧健 一种可自定义的智能咨询平台生成系统
CN105118499A (zh) * 2015-07-06 2015-12-02 百度在线网络技术(北京)有限公司 韵律停顿预测方法和装置
CN105975622A (zh) * 2016-05-28 2016-09-28 蔡宏铭 多角色智能聊天的方法及系统
CN106550156A (zh) * 2017-01-23 2017-03-29 苏州咖啦魔哆信息技术有限公司 一种基于语音识别的人工智能客服系统及其实现方法
CN106980640A (zh) * 2017-02-08 2017-07-25 网易(杭州)网络有限公司 针对照片的交互方法、设备和计算机可读存储介质
CN109215641A (zh) * 2017-07-03 2019-01-15 九阳股份有限公司 基于云的家电语音控制方法及系统
CN107451276A (zh) * 2017-08-05 2017-12-08 龙飞 一种基于深度学习的智能自助导游系统及其方法
CN107862000A (zh) * 2017-10-22 2018-03-30 北京市农林科学院 一种农业技术咨询人机对话方法
CN109408799A (zh) * 2018-08-14 2019-03-01 优视科技(中国)有限公司 语义决策方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
语音人机交互及其在智能调度中的应用;杨柳青;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131015(第10期);第11-32页 *

Also Published As

Publication number Publication date
CN110277086A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
CN110277086B (zh) 基于电网调度知识图谱的语音合成方法、系统及电子设备
CN107918633B (zh) 基于语义分析技术的敏感舆情内容识别方法和预警系统
CN109325040B (zh) 一种faq问答库泛化方法、装置及设备
CN113268609B (zh) 基于知识图谱的对话内容推荐方法、装置、设备及介质
CN110795913B (zh) 一种文本编码方法、装置、存储介质及终端
CN113127624B (zh) 问答模型的训练方法及装置
CN113268610B (zh) 基于知识图谱的意图跳转方法、装置、设备及存储介质
CN109271513B (zh) 一种文本分类方法、计算机可读储存介质及系统
CN115391499A (zh) 生成多任务生成模型的方法、问答对生成方法和相关装置
CN114510570A (zh) 基于小样本语料的意图分类方法、装置及计算机设备
CN116010581A (zh) 一种基于电网隐患排查场景的知识图谱问答方法及系统
WO2019165732A1 (zh) 基于机器人情绪状态的回复信息生成方法、装置
CN115905528A (zh) 具有时序特征的事件多标签分类方法、装置及电子设备
CN115146124A (zh) 问答系统应答方法及其装置、设备、介质、产品
CN111524043A (zh) 诉讼风险评估问卷自动生成的方法和装置
CN113312924A (zh) 一种基于nlp高精解析标签的风险规则分类方法及装置
CN113849653A (zh) 一种文本分类方法及装置
CN115345177A (zh) 意图识别模型训练方法和对话方法及装置
CN112307767A (zh) 一种基于Bi-LSTM技术的调控知识建模方法
CN116595169A (zh) 一种基于提示学习的煤矿生产领域问答意图分类方法
CN112347150B (zh) 一种学者学术标签标注方法、装置和电子设备
CN115809318A (zh) 问题解答模型的训练方法及装置、问题解答方法及装置
Chetoui et al. Course recommendation model based on Knowledge Graph Embedding
Ribeiro et al. Unsupervised Dialogue Act Classification with Optimum-Path Forest
CN116737964B (zh) 一种人工智能大脑系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant