CN110728980A

CN110728980A - 一种基于语音及对话机器人的智能服务总线系统

Info

Publication number: CN110728980A
Application number: CN201910934865.8A
Authority: CN
Inventors: 王永强; 任凯旋; 陈文钢
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2019-09-29
Filing date: 2019-09-29
Publication date: 2020-01-24

Abstract

本发明公开了一种基于语音及对话机器人的智能服务总线系统，其特征包括：语音交互层、语音与文本转换层、机器人引擎调用层、后台业务实现层。使用采音系统将工作人员所说的声波采集生成音频文件；使用语音识别系统将该音频文件转换成文字文本；传递给对话中意图机器人，意图机器人根据指令参数信息，调用该意图对应的后台业务实现模块，传递参数、执行业务，并生成任务执行结果报告；返回给该机器人，该机器人调用语音合成系统将执行结果转成音频文件，以语音声波的形式播报给对应工作人员。本发明具有的有益效果是：只需要工作人员口头下达指令，代替了传统的鼠标键盘操作，提升了智能化操作流程和工作效率，降低了人力和时间成本。

Description

一种基于语音及对话机器人的智能服务总线系统

技术领域

本发明属于电力调度技术领域，具体设计一种基于语音及对话机器人的智能服务总线系统。

背景技术

近几年来，随着工业与信息化两化融合的发展，国内大数据，人工智能、物联网、通信5G等新技术的发展。尤其是大数据采集、ETL数据处理，数据分析；NLP自然语言处理，DeepLearning深度学习， MachineLearning机器学习；声学模型，声道模型，等一大批新技术出现。智能语音交互、自然语言处理等一系列人工智能技术在国内外取得了重大理论创新与应用突破，为解决电网调控运行领域的部分问题提供了有益的借鉴和参考。

调控系统存在大量的历史数据，运行规程及预案在线化、知识化不够，缺乏知识化工具，难以充分利用。现有系统以监视、分析为主，决策、执行等环节更依赖调控人员的经验及实地现场检查。调控系统人机交互方式单一，效率低下，仍然以鼠标、键盘为主，缺少语音、触摸等交互方式。为了改变这一现状，达到高效、快速、随时响应的效果，提高工作人员的工作效率，降低人工成本，提高自动化程度，减少操作误判，降低调规的工作成本。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种基于语音及对话机器人的智能服务总线系统，能够扩展具体的业务范围，提高自动化程度，降低人力和时间成本；

为解决现有的技术问题，本发明公开了一种基于语音及对话机器人的智能服务总线系统，包括：语音识别模块、语音合成模块、机器人引擎调用模块、后台业务实现模块。语音识别模块、语音合成模块、后台业务实现模块，均与对话机器人系统相连；

所属语音识别模块：用于将工作人员口头下达的语音声波采集到系统中，生成音频文件，再将该音频文件转换成文字；

所属机器人引擎调用模块：用于从语音识别模块转换的文本中提取关键词信息，根据关键词信息匹配到细化的意图机器人，该意图机器人调用后台对应的业务实现模块去执行具体的任务；

所属后台业务实现模块：用于按照机器人推送过来的参数信息，去执行具体的底层业务，并生成业务执行报告，返回给该意图机器人；

所属语音合成模块：该意图机器人将业务模块执行生成的报告，调用语音合成模块生成语音文件，播报给对应工作人员。

作为优选方案，所述语音采集模块硬件为Windows系统、linux系统、Android系统自带的采音设备，软件为采音系统。

作为优选方案，所述语音识别为将语音声波采集形成音频文件与将语音文件转换成文字的软件系统。

作为优选方案，所述对话机器人模块为根据指令中关键词信息匹配到具体意图机器人，该意图机器人通过多次对话反问的方式获所有的意图参数信息，并传递参数，调用后台业务模块执行具体业务。该意图机器人为单轮对话机器人和多轮对话机器人。

作为优选方案，所述后台业务实现模块，二次开发人员可以自行做定制开发，可以是单个业务模块，也可以是多个业务模块并行，该模块具体业务不受本发明的范围保护。

作为优选方案，所述语音合成模块为将文字转换成音频文件的软件系统，播放的硬件系统是指 Windows、Linux、Android自带系统。

本发明还公开了利用上述系统的一种基于语音及对话机器人的智能服务总线系统，包括如下步骤：

S0：系统激活；

S1：语音识别采音模块：通过采音系统，系统采集到工作人员所说的声波，生成音频文件；

S2：语音识别系统将该音频文件转换成文字文本，并传递到对话机器人；

S3：对话机器人提取出关键字信息，并根据关键字信息匹配具体意图机器人，调用具体业务模块，传递参数；

S4：具体业务模块根据参数信息，执行具体的业务流程，根据执行的结果生成报告，返回给该意图机器人；

S5：该意图机器人再调用语音合成系统将该结果生成音频文件并播放给对应工作人员；

作为优选方法，所述语音指令包括普通话或者地方方言形式下的日常词汇或者短语，和具体业务所涉及的专业词汇。

作为优选方法，S0中的系统激活包括系统启动；还包括：采音设备一段时间没有感知到声波，自动进入到休眠状态，工作人员再次下令前的唤醒词唤醒系统。

作为优选方法，语音识别系统将该音频文件转换成文字文本，白字或者多音字歧义情况下，系统默认优先根据具体业务所指定的小范围模型识别，若小范围内没有识别到结果，系统才会调用通用指令模型识别，并返回结果。

作为优选方法，所述对话机器人根据推送的指令文本，提取关键字，匹配意图，若感知到关键字信息不完整，则会进行反问工作人员直到获取所有需要的关键字信息。

作为优选方法，所述的具体业务模块是二次开发中根据具体业务进行适配性定制开发，可以是单独的一个模块，也可以是多个可以并列执行的模块。

作为优选方法，所述语音合成是将对话机器人推送过来的具体业务模块执行之后的报告生成音频文件，并播放给工作人员，播放的声音可以是男声、女声、童声。

本发明具有的有益效果是：只需要工作人员口头下达指令，代替了传统的鼠标键盘操作，使用对话机器人语音交互多次问答的方式，提高了准确度，工作人员使用口头指令判断的方式，提升了智能化操作流程和工作效率，降低了人力和时间成本。

附图说明

附图是该发明的一个实现原理图，一共由语音交互层，语音与文件转换层，机器人引擎调用层、后台业务实现层等组成。

语音交互层：包括系统感知到音频声波，采音端采集语音声波生成音频文件(图中过程①)，和系统将语音合成生成的音频文件播报给工作人员(图中过程⑧)。

语音与文本转换层：包括两部分，一部分是系统将采音端采集到的音频文件转换成文本指令的语音识别(图中过程②)；另一部分是系统将机器人推送过来执行结果的反馈报告，最终生成音频文件的语音合成部分(图中过程⑦)。

机器人引擎调用层：一部分是机器人接收到语音识别推送过来的指令(图中过程③)，识别并匹配意图，反问获取所有需要的词组实体，传递参数，调用该机器人实体对应的实体模块(图中过程④)，执行具体业务；另一部分是该机器人意图接收业务实现模块执行后的结果(图中过程⑤)，调用语音合成系统，将该文本报告转换成音频文件。

后台业务实现层是指具体的业务模块根据机器人意图推送的参数(图中过程④)，执行具体业务，并将结果形成报告，反馈给对应的机器人意图(图中过程⑤)。

具体实施方式

下面结合附图对本发明作进一步描述。以下实例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示，I为工作人员所说的语音声波，过程①为采音端采集到语音声波，形成语音文件。II 为采集到的音频文件，过程②为语音识别系统，将采集到的音频文件识别成文本文件。III为语音识别之后的文本文件，过程③为系统传递指令文本给机器人，机器人切分识别参数，根据关键词组匹配具体的机器人意图。如果关键词组不完整，机器人就会根据设定的方式反问工作人员，直到获取所有需要的参数信息。IV为包含意图的机器人，过程④为意图机器人传递参数给具体的业务模块，调用具体的业务模块实现业务。过程⑤为实现具体业务模块之后，生成结果，并将该报告反馈给对应的机器人。过程⑥为意图机器人反馈结果报告(图中VII)；过程⑦为语音合成系统将文本文件报告转成音频文件(图中VIII)，过程⑧ 为系统将合成生成的音频文件播放成声波，反馈给工作人员。

模块VI部分是二次开发中根据具体业务开发定制开发完善具体的模块部分。例如：系统检测、交接班、监控巡视、事故处置、风险预控、知识搜索。

采音I可以有多个采音端同时采音，共同调用一套语音识别系统。

语音播报IX与语音采音端IP等相关信息一一对应，用于反馈业务实现的结果。

以上所述仅是本发明的优选实施方案，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以作出若干改进和变形，这种改进和变形也应视为本发明的保护范围。

Claims

1.一种基于语音及对话机器人的智能服务总线系统，其特征在于：包括语音交互层、语音与文本转换层、机器人引擎调用层、后台业务实现层。

(1)所属语音识别模块：用于将工作人员口头下达的语音声波采集到系统中，生成音频文件，再将该音频文件转换成文字；

(2)所属机器人引擎调用模块：用于从语音识别模块转换的文本中提取出关键词信息，根据关键词信息匹配到细化的意图机器人，该机器人调用对应的业务模块去执行具体的任务；

(3)所属后台业务实现模块：用于按照机器人推送过来的参数信息，去执行具体的底层业务，并生成业务执行报告，返回给对应的意图机器人；

(4)所属语音合成模块：该意图机器人将业务模块执行生成的报告，调用语音合成模块生成语音文件，播报给对应工作人员，达到一次交互。

2.根据权利要求1所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述语音采集模块硬件为Windows系统、linux系统或者Android系统自带的采音设备，软件为采音系统。所述语音识别为将语音声波采集形成音频文件与将音频文件转换成文字的软件系统。所述语音合成模块为将文字转换成音频文件的软件系统，播放的硬件系统是指Windows、linux、Android自带系统。

3.根据权利要求1所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述对话机器人引擎模块为根据指令中关键词信息匹配到具体意图机器人，该意图机器人通过多次对话反问的方式获取所有的意图参数信息，并传递参数，调用后台业务模块执行具体业务。该意图机器人为单轮对话机器人和多轮对话机器人，单轮对话机器人是机器人只需要和工作人员进行一次交互就能获取所有参数信息，多轮对话机器人是机器人为了获取所有参数信息，需要进行多次和工作人员的交互。

4.根据权利要求1所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述后台业务实现模块，二次开发人员可以根据具体业务做开发，可以是单个业务模块，也可以是多个业务模块并行，该模块具体业务不受本发明的范围保护。

5.一种基于语音及对话机器人的智能服务总线系统，采用如权利要求1所述的基于语音及对话机器人的智能服务总线系统，其特征在于：包括如下步骤：

S0：系统激活；

S1：采音模块：通过采音系统，系统采集到工作人员所说的声波，生成音频文件；

S2：语音识别系统：将该音频文件转换成文字文本，并传递到对话机器人；

S3：对话机器人提取出关键字信息，并根据关键字信息匹配具体意图机器人，传递参数，调用后台业务实现模块；

S4：后台业务实现模块根据参数信息，执行具体的业务流程，根据执行的结果生成报告，返回给该意图机器人；

S5：该意图机器人再调用语音合成系统将该结果生成音频文件并播放给对应工作人员。

6.根据权利要求5所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述语音指令包括普通话或者地方方言形式下的日常词汇或者短语，和具体业务所涉及的专业词汇。语音识别系统将该音频文件转换成文字文本，白字或者多音字歧义情况下，系统默认优先根据具体业务所指定的小范围模型识别，若小范围内没有识别到结果，系统才会调用通用指令模型识别，并返回结果。

7.根据权利要求5所述基于语音及对话机器人的智能服务总线系统，其特征在于：S0中的系统激活包括整套系统启动；还包括：采音设备一段时间没有感知到声波，自动进入到休眠状态，工作人员再次下令前的唤醒词唤醒系统。

8.根据权利要求5所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述对话机器人根据推送的指令文本，提取关键词，匹配意图，若感知到关键字信息不完整，则会进行反问工作人员直到获取所有需要的关键字信息。

9.根据权利要求5所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述的后台业务实现模块是二次开发中，根据具体业务进行适配性与定制性开发，可以是单独的一个模块，也可以是多个并列执行的模块。

10.根据权利要求5所述基于语音及对话机器人的智能服务总线系统，其特征在于：所述语音合成是语音合成系统将对话机器人推送过来的后台业务实现模块执行之后的报告，生成音频文件，并播放给工作人员，播放的声音可以是男声、女声、童声。