CN113223512B - 一种自动化运维系统语音构建方法 - Google Patents

一种自动化运维系统语音构建方法 Download PDF

Info

Publication number
CN113223512B
CN113223512B CN202010079443.XA CN202010079443A CN113223512B CN 113223512 B CN113223512 B CN 113223512B CN 202010079443 A CN202010079443 A CN 202010079443A CN 113223512 B CN113223512 B CN 113223512B
Authority
CN
China
Prior art keywords
voice
logic
robot
function
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010079443.XA
Other languages
English (en)
Other versions
CN113223512A (zh
Inventor
陈绍东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Fanxi Information Technology Co ltd
Original Assignee
Shanghai Fanxi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fanxi Information Technology Co ltd filed Critical Shanghai Fanxi Information Technology Co ltd
Priority to CN202010079443.XA priority Critical patent/CN113223512B/zh
Publication of CN113223512A publication Critical patent/CN113223512A/zh
Application granted granted Critical
Publication of CN113223512B publication Critical patent/CN113223512B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stored Programmes (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及IT运维行业技术领域,且公开了一种自动化运维系统语音构建方法,包括以下步骤:1)接入语音识别功能接口;2)开发语言运行环境检测逻辑;3)开发语音转换功能逻辑;4)制定语音交互规则;5)搭建语音系统词库和对话库;6)开发语言前端界面。该自动化运维系统语音构建方法,通过建立语音控制,便于在紧急或者特殊场合及时响应,可以通过移动设备直接语音操作,相比拿出电脑‑开机‑登录‑菜单操作执行,通过移动设备语音交互能帮助用户省去大量时间并且适用更多场景,节省了菜单操作和搜索查找时间,当用户有大量任务、模板列表时,菜单点击操作查找一般需要20~30秒,语音识别自动搜索只需要5秒。

Description

一种自动化运维系统语音构建方法
技术领域
本发明涉及IT运维行业技术领域,具体为一种自动化运维系统语音构建方法。
背景技术
云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互,云计算是信息技术发展和服务模式创新的集中体现,是信息化发展的重大变革和必然趋势,为推动企业利用云计算加快数字化、网络化和智能化转型,推进互联网、大数据、人工智能与实体经济深度融合。
目前,自动化运维帮助企业减少人为操作出错概率,降低运维成本提升运维效率,保证企业运维的延续性,然而在过程中,需要运维人员在紧急或者特殊场合及时响应,而现有的自动化运维主要时通过人工手动进行操作,在某些特殊场合如,交通工具上、电脑故障或不在身边时,无法在第一时间对其进行相关操作,当用户有大量任务和模板列表时,菜单点击操作查找一般需要20-30秒,而一些紧急任务可能晚几秒时间响应就会对公司造成重大损失,同时无法同时进行多任务并行操作,故而提出一种自动化运维系统语音构建方法解决上述问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种自动化运维系统语音构建方法,具备语音操作等优点,解决了现有的自动化运维主要时通过人工手动进行操作,在某些特殊场合如,交通工具上、电脑故障或不在身边时,无法在第一时间对其进行相关操作,当用户有大量任务和模板列表时,菜单点击操作查找一般需要20-30秒,而一些紧急任务可能晚几秒时间响应就会对公司造成重大损失,同时无法同时进行多任务并行操作的问题。
(二)技术方案
为实现上述语音操作的目的,本发明提供如下技术方案:
一种自动化运维系统语音构建方法,包括以下步骤:
1)接入语音识别功能接口,接入第三方语音接口功能,实现语音从设备网页端输入、识别、文本转换等功能,并将其与OPSGRAT的用户权限相关联,默认所有系统权限用户都能使用语音操作;
2)开发语言运行环境检测逻辑,检测语音功能适配的浏览器、运行环境和设备麦克风状态等;
3)开发语音转换功能逻辑,将语音转换为文本后与本地功能菜单、模板名称和操作方式关联;
4)制定语音交互规则,使用语音实现与系统交互方式,如纠错、重新输入、取消、关闭和执行反馈等,操作逻辑,设立执行、无人应答和中途关闭三种可能性,以此应对随机出现的状况;
5)搭建语音系统词库和对话库,建立语音机器人逻辑对话内容表、功能操作表、用户自定义模板名称表等数据库,设置VAD参数对语音进行接收,对接收的语音进行文本转化和分词的解析,建立词库,对产品和行业进行初步分类,产品细化为模板名称和操作,行业细化为运维产品名称和上下游厂商,同时制定匹配规则和匹配失败逻辑;
6)开发语言前端界面,在OPSGRAT系统菜单新增语音机器人开关按钮、语音机器人交互形象、对话操作界面,打通交互逻辑,对语音功能进行开关控制,当点击“关闭语音”按钮时,关闭语音功能和麦克风,TTS播放道别语,隐藏机器人,同时设置语音机器人的状态动画,根据待机、使用和对话设置不同的动画,从而提示用户语音输入时和语音输入中,切换输入中状态,并设置语音机器人D的对话脚本,脚本内容由提示音+预设语句+变量组成,方便多场景复用,脚本编号规则为2位模块编号+2位功能编号+3位场景编号+4 位逻辑编号+2位语句编号,同时编号规则会随机器人适用场景不断优化。
优选的,所述模块编号对应OPSGRAT中各模块,如“DASHBOARD”“资源管理”“模板管理”等,功能编号对应OPSGRAT中各功能,如“凭据管理”“项目管理”“主机清单”。
优选的,所述场景编号代表不同场景,如问候、提示、创建、结果反馈和帮助引导等,逻辑编号不同场景对应反馈状态,如执行失败和搜索中等,语句编号不同逻辑下随机抽取的脚本语句,使机器人对话更拟人。
(三)有益效果
与现有技术相比,本发明提供了一种自动化运维系统语音构建方法,具备以下有益效果:
该自动化运维系统语音构建方法,通过建立语音控制,便于在紧急或者特殊场合及时响应,当运维人员在某些特殊场合如:交通工具上、电脑故障或不在身边时,可以通过移动设备直接语音操作,相比拿出电脑-开机-登录- 菜单操作执行,通过移动设备语音交互能帮助用户省去大量时间并且适用更多场景,节省了菜单操作和搜索查找时间,当用户有大量任务、模板列表时,菜单点击操作查找一般需要20~30秒,语音识别自动搜索只需要5秒,同时可以多任务并行,语音操作可以和图形界面操作同时执行,如果用户当前正在执行重要任务,需要关注仪表盘、日志等内容时,语音交互可以不用跳转其他页面,帮助用户实时对临时任务进行多线操作并反馈结果,同样,当用户正在执行其他作业操作,语音功能可实时提醒用户当前后台任务执行结果,而不用分心跳转页面查看结果。
附图说明
图1为本发明框架示意图;
图2为本发明流程框架示意图;
图3为本发明无人应答框架示意图;
图4为本发明匹配失败框架示意图;
图5为本发明框架语音助手示意图;
图6为本发明框架对话气泡示意图;
图7为本发明框架倾听示意图;
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种自动化运维系统语音构建方法,包括以下步骤:
1)接入语音识别功能接口,接入第三方语音接口功能,实现语音从设备网页端输入、识别、文本转换等功能,并将其与OPSGRAT的用户权限相关联,默认所有系统权限用户都能使用语音操作;
2)开发语言运行环境检测逻辑,检测语音功能适配的浏览器、运行环境和设备麦克风状态等;
3)开发语音转换功能逻辑,将语音转换为文本后与本地功能菜单、模板名称和操作方式关联;
4)制定语音交互规则,使用语音实现与系统交互方式,如纠错、重新输入、取消、关闭和执行反馈等,操作逻辑,设立执行、无人应答和中途关闭三种可能性,以此应对随机出现的状况;
5)搭建语音系统词库和对话库,建立语音机器人逻辑对话内容表、功能操作表、用户自定义模板名称表等数据库,设置VAD参数对语音进行接收,对接收的语音进行文本转化和分词的解析,建立词库,对产品和行业进行初步分类,产品细化为模板名称和操作,行业细化为运维产品名称和上下游厂商,同时制定匹配规则和匹配失败逻辑;
6)开发语言前端界面,在OPSGRAT系统菜单新增语音机器人开关按钮、语音机器人交互形象、对话操作界面,打通交互逻辑,对语音功能进行开关控制,当点击“关闭语音”按钮时,关闭语音功能和麦克风,TTS播放道别语,隐藏机器人,同时设置语音机器人的状态动画,根据待机、使用和对话设置不同的动画,从而提示用户语音输入时和语音输入中,切换输入中状态,并设置语音机器人D的对话脚本,脚本内容由提示音+预设语句+变量组成,方便多场景复用,脚本编号规则为2位模块编号+2位功能编号+3位场景编号+4 位逻辑编号+2位语句编号,同时编号规则会随机器人适用场景不断优化,模块编号对应OPSGRAT中各模块,如“DASHBOARD”“资源管理”“模板管理”等,功能编号对应OPSGRAT中各功能,如“凭据管理”“项目管理”“主机清单”,所述场景编号代表不同场景,如问候、提示、创建、结果反馈和帮助引导等,逻辑编号不同场景对应反馈状态,如执行失败和搜索中等,语句编号不同逻辑下随机抽取的脚本语句,使机器人对话更拟人。
实验例:
问候
搜索结果
反馈
(%操作名称读取)
提示
本发明的有益效果是:通过建立语音控制,便于在紧急或者特殊场合及时响应,当运维人员在某些特殊场合如:交通工具上、电脑故障或不在身边时,可以通过移动设备直接语音操作,相比拿出电脑-开机-登录-菜单操作执行,通过移动设备语音交互能帮助用户省去大量时间并且适用更多场景,节省了菜单操作和搜索查找时间,当用户有大量任务、模板列表时,菜单点击操作查找一般需要20~30秒,语音识别自动搜索只需要5秒,同时可以多任务并行,语音操作可以和图形界面操作同时执行,如果用户当前正在执行重要任务,需要关注仪表盘、日志等内容时,语音交互可以不用跳转其他页面,帮助用户实时对临时任务进行多线操作并反馈结果,同样,当用户正在执行其他作业操作,语音功能可实时提醒用户当前后台任务执行结果,而不用分心跳转页面查看结果,解决了现有的自动化运维主要时通过人工手动进行操作,在某些特殊场合如,交通工具上、电脑故障或不在身边时,无法在第一时间对其进行相关操作,当用户有大量任务和模板列表时,菜单点击操作查找一般需要20-30秒,而一些紧急任务可能晚几秒时间响应就会对公司造成重大损失,同时无法同时进行多任务并行操作的问题。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (1)

1.一种自动化运维系统语音构建方法,其特征在于,包括以下步骤:
1)接入语音识别功能接口,接入第三方语音接口功能,实现语音从设备网页端输入、识别、文本转换功能,并将其与OPSGRAT的用户权限相关联,默认所有系统权限用户都能使用语音操作;
2)开发语言运行环境检测逻辑,检测语音功能适配的浏览器、运行环境和设备麦克风状态;
3)开发语音转换功能逻辑,将语音转换为文本后与本地功能菜单、模板名称和操作方式关联;
4)制定语音交互规则,使用语音实现与系统交互方式,包括纠错、重新输入、取消、关闭和执行反馈操作逻辑,设立执行、无人应答和中途关闭三种可能性,以此应对随机出现的状况;
5)搭建语音系统词库和对话库,建立语音机器人逻辑对话内容表、功能操作表、用户自定义模板名称表数据库,设置VAD参数对语音进行接收,对接收的语音进行文本转化和分词的解析,建立词库,对产品和行业进行初步分类,产品细化为模板名称和操作,行业细化为运维产品名称和上下游厂商,同时制定匹配规则和匹配失败逻辑;
6)开发语言前端界面,在OPSGRAT系统菜单新增语音机器人开关按钮、语音机器人交互形象、对话操作界面,打通交互逻辑,对语音功能进行开关控制,当点击“关闭语音”按钮时,关闭语音功能和麦克风,TTS播放道别语,隐藏机器人,同时设置语音机器人的状态动画,根据待机、使用和对话设置不同的动画,从而提示用户语音输入时和语音输入中,切换输入中状态,并设置语音机器人的对话脚本,脚本内容由提示音+预设语句+变量组成,方便多场景复用,脚本编号规则为2位模块编号+2位功能编号+3位场景编号+4位逻辑编号+2位语句编号,同时编号规则会随机器人适用场景不断优化;所述模块编号对应OPSGRAT中各模块,包括“DASHBOARD”、“资源管理”和“模板管理”,所述功能编号对应OPSGRAT中各功能,包括“凭据管理”、“项目管理”和“主机清单”;所述场景编号代表不同场景,包括问候、提示、创建、结果反馈和帮助引导,所述逻辑编号代表不同场景对应反馈状态,包括执行失败和搜索中,所述语句编号代表不同逻辑下随机抽取的脚本语句,使机器人对话更拟人。
CN202010079443.XA 2020-02-04 2020-02-04 一种自动化运维系统语音构建方法 Active CN113223512B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010079443.XA CN113223512B (zh) 2020-02-04 2020-02-04 一种自动化运维系统语音构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010079443.XA CN113223512B (zh) 2020-02-04 2020-02-04 一种自动化运维系统语音构建方法

Publications (2)

Publication Number Publication Date
CN113223512A CN113223512A (zh) 2021-08-06
CN113223512B true CN113223512B (zh) 2024-02-06

Family

ID=77085352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010079443.XA Active CN113223512B (zh) 2020-02-04 2020-02-04 一种自动化运维系统语音构建方法

Country Status (1)

Country Link
CN (1) CN113223512B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049571A (zh) * 2013-01-04 2013-04-17 深圳市中兴移动通信有限公司 基于语音识别的索引菜单的方法、装置及其终端
CN103795876A (zh) * 2012-10-29 2014-05-14 殷程 智能语音脚本
CN107112013A (zh) * 2014-09-14 2017-08-29 谷歌公司 用于创建可定制对话系统引擎的平台
CN109727592A (zh) * 2017-10-31 2019-05-07 上海幻电信息科技有限公司 基于自然语言语音交互的运维指令执行方法、介质及终端
CN110085234A (zh) * 2019-04-29 2019-08-02 苏州狗尾草智能科技有限公司 接入自动语音识别系统
KR20200010533A (ko) * 2020-01-20 2020-01-30 조재현 로봇 제어 어플리케이션 생성을 이용한 코딩 교육 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103795876A (zh) * 2012-10-29 2014-05-14 殷程 智能语音脚本
CN103049571A (zh) * 2013-01-04 2013-04-17 深圳市中兴移动通信有限公司 基于语音识别的索引菜单的方法、装置及其终端
CN107112013A (zh) * 2014-09-14 2017-08-29 谷歌公司 用于创建可定制对话系统引擎的平台
CN109727592A (zh) * 2017-10-31 2019-05-07 上海幻电信息科技有限公司 基于自然语言语音交互的运维指令执行方法、介质及终端
CN110085234A (zh) * 2019-04-29 2019-08-02 苏州狗尾草智能科技有限公司 接入自动语音识别系统
KR20200010533A (ko) * 2020-01-20 2020-01-30 조재현 로봇 제어 어플리케이션 생성을 이용한 코딩 교육 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于WebRTC的浏览器端Web服务器的设计与实现;缪进;移动通信(第08期);正文第56-60页 *

Also Published As

Publication number Publication date
CN113223512A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
US10489112B1 (en) Method for user training of information dialogue system
US20220058343A1 (en) Written-modality prosody subsystem in a natural language understanding (nlu) framework
JP6912579B2 (ja) 文脈を意識した人間−コンピュータ間対話
US12086550B2 (en) System for focused conversation context management in a reasoning agent/behavior engine of an agent automation system
US20200320984A1 (en) Facilitating end-to-end communications with automated assistants in multiple languages
CN111027291B (zh) 文本中标点符号添加、模型训练方法、装置及电子设备
CN110929094B (zh) 一种视频标题处理方法和装置
CN111402861B (zh) 一种语音识别方法、装置、设备及存储介质
JP2022105273A (ja) 自然言語の対話記録から複数のユーザのための要約および次の行動をリアルタイムで生成するためのコンピュータ実施方法、コンピュータ実施システム、およびコンピュータ・プログラム製品
CN112653798A (zh) 智能客服语音应答方法、装置、计算机设备及存储介质
CN110991179A (zh) 基于电力专业术语的语义分析方法
CN113486170B (zh) 基于人机交互的自然语言处理方法、装置、设备及介质
CN114330371A (zh) 基于提示学习的会话意图识别方法、装置和电子设备
CN117787409A (zh) 基于大语言模型的人机交互方法、装置及电子设备
CN112667791A (zh) 潜在事件预测方法、装置、设备及存储介质
Hu et al. Application of artificial intelligence voice technology in radio and television media
CN113705224A (zh) 一种语音识别的调度业务语音交互方法及系统
CN114925206A (zh) 人工智能体、语音信息识别方法、存储介质和程序产品
CN113223512B (zh) 一种自动化运维系统语音构建方法
CN111581971A (zh) 词库的更新方法、装置、终端及存储介质
CN116701811A (zh) 一种网页处理方法、装置、设备及计算机可读存储介质
CN109960489B (zh) 生成智能问答系统的方法、装置、设备、介质及问答系统
CN112711654B (zh) 语音机器人的汉字解释话术生成方法、系统、设备及介质
CN115623134A (zh) 会议音频处理方法、装置、设备及存储介质
CN110209831A (zh) 模型生成、语义识别的方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant