CN110728980A - 一种基于语音及对话机器人的智能服务总线系统 - Google Patents
一种基于语音及对话机器人的智能服务总线系统 Download PDFInfo
- Publication number
- CN110728980A CN110728980A CN201910934865.8A CN201910934865A CN110728980A CN 110728980 A CN110728980 A CN 110728980A CN 201910934865 A CN201910934865 A CN 201910934865A CN 110728980 A CN110728980 A CN 110728980A
- Authority
- CN
- China
- Prior art keywords
- robot
- voice
- module
- audio file
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 19
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 19
- 230000003993 interaction Effects 0.000 claims abstract description 11
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 4
- 241001672694 Citrus reticulata Species 0.000 claims description 2
- 230000003213 activating effect Effects 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000011161 development Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于语音及对话机器人的智能服务总线系统,其特征包括:语音交互层、语音与文本转换层、机器人引擎调用层、后台业务实现层。使用采音系统将工作人员所说的声波采集生成音频文件;使用语音识别系统将该音频文件转换成文字文本;传递给对话中意图机器人,意图机器人根据指令参数信息,调用该意图对应的后台业务实现模块,传递参数、执行业务,并生成任务执行结果报告;返回给该机器人,该机器人调用语音合成系统将执行结果转成音频文件,以语音声波的形式播报给对应工作人员。本发明具有的有益效果是:只需要工作人员口头下达指令,代替了传统的鼠标键盘操作,提升了智能化操作流程和工作效率,降低了人力和时间成本。
Description
技术领域
本发明属于电力调度技术领域,具体设计一种基于语音及对话机器人的智能服务总线系统。
背景技术
近几年来,随着工业与信息化两化融合的发展,国内大数据,人工智能、物联网、通信5G等新技 术的发展。尤其是大数据采集、ETL数据处理,数据分析;NLP自然语言处理,DeepLearning深度学习, MachineLearning机器学习;声学模型,声道模型,等一大批新技术出现。智能语音交互、自然语言处理 等一系列人工智能技术在国内外取得了重大理论创新与应用突破,为解决电网调控运行领域的部分问题提 供了有益的借鉴和参考。
调控系统存在大量的历史数据,运行规程及预案在线化、知识化不够,缺乏知识化工具,难以充 分利用。现有系统以监视、分析为主,决策、执行等环节更依赖调控人员的经验及实地现场检查。调控系 统人机交互方式单一,效率低下,仍然以鼠标、键盘为主,缺少语音、触摸等交互方式。为了改变这一现 状,达到高效、快速、随时响应的效果,提高工作人员的工作效率,降低人工成本,提高自动化程度,减 少操作误判,降低调规的工作成本。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种基于语音及对话机器人的智能服务总线系统, 能够扩展具体的业务范围,提高自动化程度,降低人力和时间成本;
为解决现有的技术问题,本发明公开了一种基于语音及对话机器人的智能服务总线系统,包括: 语音识别模块、语音合成模块、机器人引擎调用模块、后台业务实现模块。语音识别模块、语音合成模块、 后台业务实现模块,均与对话机器人系统相连;
所属语音识别模块:用于将工作人员口头下达的语音声波采集到系统中,生成音频文件,再将该 音频文件转换成文字;
所属机器人引擎调用模块:用于从语音识别模块转换的文本中提取关键词信息,根据关键词信息 匹配到细化的意图机器人,该意图机器人调用后台对应的业务实现模块去执行具体的任务;
所属后台业务实现模块:用于按照机器人推送过来的参数信息,去执行具体的底层业务,并生成 业务执行报告,返回给该意图机器人;
所属语音合成模块:该意图机器人将业务模块执行生成的报告,调用语音合成模块生成语音文件, 播报给对应工作人员。
作为优选方案,所述语音采集模块硬件为Windows系统、linux系统、Android系统自带的采音设 备,软件为采音系统。
作为优选方案,所述语音识别为将语音声波采集形成音频文件与将语音文件转换成文字的软件系 统。
作为优选方案,所述对话机器人模块为根据指令中关键词信息匹配到具体意图机器人,该意图机 器人通过多次对话反问的方式获所有的意图参数信息,并传递参数,调用后台业务模块执行具体业务。该 意图机器人为单轮对话机器人和多轮对话机器人。
作为优选方案,所述后台业务实现模块,二次开发人员可以自行做定制开发,可以是单个业务模 块,也可以是多个业务模块并行,该模块具体业务不受本发明的范围保护。
作为优选方案,所述语音合成模块为将文字转换成音频文件的软件系统,播放的硬件系统是指 Windows、Linux、Android自带系统。
本发明还公开了利用上述系统的一种基于语音及对话机器人的智能服务总线系统,包括如下步骤:
S0:系统激活;
S1:语音识别采音模块:通过采音系统,系统采集到工作人员所说的声波,生成音频文件;
S2:语音识别系统将该音频文件转换成文字文本,并传递到对话机器人;
S3:对话机器人提取出关键字信息,并根据关键字信息匹配具体意图机器人,调用具体业务模块, 传递参数;
S4:具体业务模块根据参数信息,执行具体的业务流程,根据执行的结果生成报告,返回给该意 图机器人;
S5:该意图机器人再调用语音合成系统将该结果生成音频文件并播放给对应工作人员;
作为优选方法,所述语音指令包括普通话或者地方方言形式下的日常词汇或者短语,和具体业务 所涉及的专业词汇。
作为优选方法,S0中的系统激活包括系统启动;还包括:采音设备一段时间没有感知到声波,自 动进入到休眠状态,工作人员再次下令前的唤醒词唤醒系统。
作为优选方法,语音识别系统将该音频文件转换成文字文本,白字或者多音字歧义情况下,系统 默认优先根据具体业务所指定的小范围模型识别,若小范围内没有识别到结果,系统才会调用通用指令模 型识别,并返回结果。
作为优选方法,所述对话机器人根据推送的指令文本,提取关键字,匹配意图,若感知到关键字 信息不完整,则会进行反问工作人员直到获取所有需要的关键字信息。
作为优选方法,所述的具体业务模块是二次开发中根据具体业务进行适配性定制开发,可以是单 独的一个模块,也可以是多个可以并列执行的模块。
作为优选方法,所述语音合成是将对话机器人推送过来的具体业务模块执行之后的报告生成音频 文件,并播放给工作人员,播放的声音可以是男声、女声、童声。
本发明具有的有益效果是:只需要工作人员口头下达指令,代替了传统的鼠标键盘操作,使用对 话机器人语音交互多次问答的方式,提高了准确度,工作人员使用口头指令判断的方式,提升了智能化操 作流程和工作效率,降低了人力和时间成本。
附图说明
附图是该发明的一个实现原理图,一共由语音交互层,语音与文件转换层,机器人引擎调用层、 后台业务实现层等组成。
语音交互层:包括系统感知到音频声波,采音端采集语音声波生成音频文件(图中过程①),和系 统将语音合成生成的音频文件播报给工作人员(图中过程⑧)。
语音与文本转换层:包括两部分,一部分是系统将采音端采集到的音频文件转换成文本指令的语 音识别(图中过程②);另一部分是系统将机器人推送过来执行结果的反馈报告,最终生成音频文件的语 音合成部分(图中过程⑦)。
机器人引擎调用层:一部分是机器人接收到语音识别推送过来的指令(图中过程③),识别并匹配 意图,反问获取所有需要的词组实体,传递参数,调用该机器人实体对应的实体模块(图中过程④),执 行具体业务;另一部分是该机器人意图接收业务实现模块执行后的结果(图中过程⑤),调用语音合成系 统,将该文本报告转换成音频文件。
后台业务实现层是指具体的业务模块根据机器人意图推送的参数(图中过程④),执行具体业务, 并将结果形成报告,反馈给对应的机器人意图(图中过程⑤)。
具体实施方式
下面结合附图对本发明作进一步描述。以下实例仅用于更加清楚地说明本发明的技术方案,而不 能以此来限制本发明的保护范围。
如图1所示,I为工作人员所说的语音声波,过程①为采音端采集到语音声波,形成语音文件。II 为采集到的音频文件,过程②为语音识别系统,将采集到的音频文件识别成文本文件。III为语音识别之 后的文本文件,过程③为系统传递指令文本给机器人,机器人切分识别参数,根据关键词组匹配具体的机 器人意图。如果关键词组不完整,机器人就会根据设定的方式反问工作人员,直到获取所有需要的参数信 息。IV为包含意图的机器人,过程④为意图机器人传递参数给具体的业务模块,调用具体的业务模块实现 业务。过程⑤为实现具体业务模块之后,生成结果,并将该报告反馈给对应的机器人。过程⑥为意图机器人反馈结果报告(图中VII);过程⑦为语音合成系统将文本文件报告转成音频文件(图中VIII),过程⑧ 为系统将合成生成的音频文件播放成声波,反馈给工作人员。
模块VI部分是二次开发中根据具体业务开发定制开发完善具体的模块部分。例如:系统检测、交 接班、监控巡视、事故处置、风险预控、知识搜索。
采音I可以有多个采音端同时采音,共同调用一套语音识别系统。
语音播报IX与语音采音端IP等相关信息一一对应,用于反馈业务实现的结果。
以上所述仅是本发明的优选实施方案,应当指出,对于本技术领域的普通技术人员来说,在不脱 离本发明技术原理的前提下,还可以作出若干改进和变形,这种改进和变形也应视为本发明的保护范围。
Claims (10)
1.一种基于语音及对话机器人的智能服务总线系统,其特征在于:包括语音交互层、语音与文本转换层、机器人引擎调用层、后台业务实现层。
(1)所属语音识别模块:用于将工作人员口头下达的语音声波采集到系统中,生成音频文件,再将该音频文件转换成文字;
(2)所属机器人引擎调用模块:用于从语音识别模块转换的文本中提取出关键词信息,根据关键词信息匹配到细化的意图机器人,该机器人调用对应的业务模块去执行具体的任务;
(3)所属后台业务实现模块:用于按照机器人推送过来的参数信息,去执行具体的底层业务,并生成业务执行报告,返回给对应的意图机器人;
(4)所属语音合成模块:该意图机器人将业务模块执行生成的报告,调用语音合成模块生成语音文件,播报给对应工作人员,达到一次交互。
2.根据权利要求1所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述语音采集模块硬件为Windows系统、linux系统或者Android系统自带的采音设备,软件为采音系统。所述语音识别为将语音声波采集形成音频文件与将音频文件转换成文字的软件系统。所述语音合成模块为将文字转换成音频文件的软件系统,播放的硬件系统是指Windows、linux、Android自带系统。
3.根据权利要求1所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述对话机器人引擎模块为根据指令中关键词信息匹配到具体意图机器人,该意图机器人通过多次对话反问的方式获取所有的意图参数信息,并传递参数,调用后台业务模块执行具体业务。该意图机器人为单轮对话机器人和多轮对话机器人,单轮对话机器人是机器人只需要和工作人员进行一次交互就能获取所有参数信息,多轮对话机器人是机器人为了获取所有参数信息,需要进行多次和工作人员的交互。
4.根据权利要求1所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述后台业务实现模块,二次开发人员可以根据具体业务做开发,可以是单个业务模块,也可以是多个业务模块并行,该模块具体业务不受本发明的范围保护。
5.一种基于语音及对话机器人的智能服务总线系统,采用如权利要求1所述的基于语音及对话机器人的智能服务总线系统,其特征在于:包括如下步骤:
S0:系统激活;
S1:采音模块:通过采音系统,系统采集到工作人员所说的声波,生成音频文件;
S2:语音识别系统:将该音频文件转换成文字文本,并传递到对话机器人;
S3:对话机器人提取出关键字信息,并根据关键字信息匹配具体意图机器人,传递参数,调用后台业务实现模块;
S4:后台业务实现模块根据参数信息,执行具体的业务流程,根据执行的结果生成报告,返回给该意图机器人;
S5:该意图机器人再调用语音合成系统将该结果生成音频文件并播放给对应工作人员。
6.根据权利要求5所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述语音指令包括普通话或者地方方言形式下的日常词汇或者短语,和具体业务所涉及的专业词汇。语音识别系统将该音频文件转换成文字文本,白字或者多音字歧义情况下,系统默认优先根据具体业务所指定的小范围模型识别,若小范围内没有识别到结果,系统才会调用通用指令模型识别,并返回结果。
7.根据权利要求5所述基于语音及对话机器人的智能服务总线系统,其特征在于:S0中的系统激活包括整套系统启动;还包括:采音设备一段时间没有感知到声波,自动进入到休眠状态,工作人员再次下令前的唤醒词唤醒系统。
8.根据权利要求5所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述对话机器人根据推送的指令文本,提取关键词,匹配意图,若感知到关键字信息不完整,则会进行反问工作人员直到获取所有需要的关键字信息。
9.根据权利要求5所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述的后台业务实现模块是二次开发中,根据具体业务进行适配性与定制性开发,可以是单独的一个模块,也可以是多个并列执行的模块。
10.根据权利要求5所述基于语音及对话机器人的智能服务总线系统,其特征在于:所述语音合成是语音合成系统将对话机器人推送过来的后台业务实现模块执行之后的报告,生成音频文件,并播放给工作人员,播放的声音可以是男声、女声、童声。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910934865.8A CN110728980A (zh) | 2019-09-29 | 2019-09-29 | 一种基于语音及对话机器人的智能服务总线系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910934865.8A CN110728980A (zh) | 2019-09-29 | 2019-09-29 | 一种基于语音及对话机器人的智能服务总线系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110728980A true CN110728980A (zh) | 2020-01-24 |
Family
ID=69219672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910934865.8A Pending CN110728980A (zh) | 2019-09-29 | 2019-09-29 | 一种基于语音及对话机器人的智能服务总线系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110728980A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159483A (zh) * | 2020-03-30 | 2021-07-23 | 北京来也网络科技有限公司 | 基于rpa及ai的任务调度方法、装置、机器人及介质 |
CN113954083A (zh) * | 2020-07-21 | 2022-01-21 | 北京梦博特科技有限公司 | 一种智能服务的控制装置及服务机器人 |
-
2019
- 2019-09-29 CN CN201910934865.8A patent/CN110728980A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159483A (zh) * | 2020-03-30 | 2021-07-23 | 北京来也网络科技有限公司 | 基于rpa及ai的任务调度方法、装置、机器人及介质 |
CN113954083A (zh) * | 2020-07-21 | 2022-01-21 | 北京梦博特科技有限公司 | 一种智能服务的控制装置及服务机器人 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI576825B (zh) | 一種機器人系統的聲音識別系統及方法 | |
CN103745722B (zh) | 一种语音交互智能家居系统及语音交互方法 | |
EP3923273B1 (en) | Voice recognition method and device, storage medium, and air conditioner | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
CN103760984A (zh) | 人机对话系统 | |
CN111179928A (zh) | 一种基于语音交互的变配电站智能控制方法 | |
CN110728980A (zh) | 一种基于语音及对话机器人的智能服务总线系统 | |
CN104123939A (zh) | 基于变电站巡检机器人的语音交互控制方法 | |
CN104036779B (zh) | 一种用于移动平台的无线语音控制方法及系统 | |
CN110807574B (zh) | 电力智能调度方法、装置及系统 | |
CN111477231B (zh) | 人机交互方法、装置和存储介质 | |
CN113360641B (zh) | 一种基于深度学习的电网故障处置预案语义建模系统及方法 | |
CN113314106A (zh) | 基于语音和意图识别的电力信息查询与调控功能调用方法 | |
CN101488342A (zh) | 人机语言交互演绎系统及人机语言交互需求应答的智能化实现方法 | |
CN111384778B (zh) | 一种配电网设备智能运维系统 | |
CN109767767A (zh) | 一种语音交互方法、系统、电子设备及存储介质 | |
TWI594136B (zh) | 一種通過語音對機器人進行訓練的系統及方法 | |
CN101299333A (zh) | 嵌入式语音识别系统及其内核技术 | |
CN116095532B (zh) | 主站与厂站远动数据智能调试的装置及方法 | |
CN112270922B (zh) | 一种调度日志自动化填写方法及装置 | |
CN112863485A (zh) | 口音语音识别方法、装置、设备及存储介质 | |
CN111353305A (zh) | 基于自然语言识别的规程自动化执行方法 | |
CN201066582Y (zh) | 嵌入式语音识别系统 | |
CN113689851A (zh) | 调度专业语言理解系统及方法 | |
CN110349576A (zh) | 基于语音识别的电力系统操作指令执行方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200124 |