CN109686374A - 数控系统的远程语音控制方法及系统 - Google Patents
数控系统的远程语音控制方法及系统 Download PDFInfo
- Publication number
- CN109686374A CN109686374A CN201811511399.4A CN201811511399A CN109686374A CN 109686374 A CN109686374 A CN 109686374A CN 201811511399 A CN201811511399 A CN 201811511399A CN 109686374 A CN109686374 A CN 109686374A
- Authority
- CN
- China
- Prior art keywords
- control system
- voice
- instruction sequence
- digital control
- cloud computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
本发明提供了一种数控系统的远程语音控制方法及系统,包括:语音信息获取步骤:通过语音控制终端获取语音信息,并转化为对应的文本信息,所述语音信息中包括对数控系统的控制指令;指令序列生成步骤:将所述文本信息发送给云计算中心,并由所述云计算中心内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器;指令执行步骤:所述数控系统控制器接收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。本发明提升了现有语音控制系统的灵活性、容错性和安全性,简化了用户对数控系统的操作控制流程,降低了非专业人员操作数控系统的难度,扩大了数控系统的应用场景。
Description
技术领域
本发明涉及智能人机交互领域,具体地,涉及数控系统的远程语音控制方法及系统。
背景技术
随着控制算法和结构设计的研究深入,数控系统的工作性能得到不断提高,应用场景得到不断拓展,如超精密驱动平台、数控机床等机电设备随着技术的提高,能够完成技术要求更高、流程更复杂的任务。与此同时,此类数控系统的操作控制也变得复杂精细,常常对某一简单任务也需要复杂的程序输入或参数配置,对实验室研究人员和工业场景中工作人员的日常实验和测试增加了操作上的复杂度,而对希望掌握此类设备操作技能的非专业人员更是加深了学习和培训的难度,使得此类数控系统因其复杂而精细的操控流程限制了使用范围和操作效率。
随着语音识别、自然语言处理和深度学习的快速发展,智能语音控制技术已经逐渐应用到生活的各个领域中并为人们带来便利,例如,智能家居领域、语音控制智能机器人领域、智能音箱等。智能语音控制系统一般包括语音识别、自然语言处理、硬件底层智能控制等核心技术。
然而,在现有技术中,智能语音控制系统的应用尚未涉及到与超精密驱动平台、数控机床等数控系统结合。基于上述技术现状,本发明将智能语音控制技术应用于数控系统的控制,从而1)简化和方便用户对数控系统的操作控制,提高工作效率和作业的实时性以及安全性;2)为非技术人员提供操作数控系统的可行性,降低数控系统的操作难度;3)降低操控过程对“手”的依赖,实现口头表达直接操控,扩大数控系统的应用场景。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种数控系统的远程语音控制方法及系统。
根据本发明提供的一种数控系统的远程语音控制方法,包括:
语音信息获取步骤:通过语音控制终端获取语音信息,并转化为对应的文本信息,所述语音信息中包括对数控系统的控制指令;
指令序列生成步骤:将所述文本信息发送给云计算中心,并由所述云计算中心内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器;
指令执行步骤:所述数控系统控制器接收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。
较佳的,还包括在所述语音信息获取步骤之前,根据唤醒词和声纹识别用户身份,并在用户身份有效的情况下启动所述语音信息获取步骤。
较佳的,所述语音信息通过本地语音识别模型识别,或者通过云语音识别引擎识别。
较佳的,在所述云计算中心内置的意图识别模型解析生成指令序列之前,还包括:
获取训练数据,其中所述训练数据中包括多个意图识别数据样本对,每个意图识别数据样本对中包括,数控系统某一动作的文本表达和对应的指令序列;
利用所述训练数据,对预设的深度神经网络模型进行训练,生成意图识别模型。
较佳的,所述将所述指令序列发送到数控系统控制器之后,还包括:
所述云计算中心将所述解析生产的所述指令序列发回至所述语音控制终端,并以文字、语音或文字和语音结合的形式展示;
所述数控系统控制器将所述指令序列的执行状态和结果经由所述云计算中心发送至所述语音控制终端,并以文字、语音或文字和语音结合的形式展示。
根据本发明提供的一种数控系统的远程语音控制系统,包括:云计算中心,以及分别与云计算中心通信连接的语音控制终端和数控系统控制器;
所述语音控制终端,用于获取语音信息,并转化为对应的文本信息,所述语音信息中包括对数控系统的控制指令;
所述云计算中心,用于接收所述文本信息,并由内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器;
数控系统控制器,用于收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。
较佳的,所述语音控制终端,具体包括:
启动模块,用于通过唤醒词和声纹识别用户身份,并在所述用户身份有效的情况下启动获取语音信息;
识别模块,用于采用语音识别引擎将所述语音信息转换为文本信息;
展示模块,用于展示所述语音信息转换后的文本信息、由所述云计算中心返回的指令序列以及所述指令序列的执行状态和结果;
第一通信模块,用于与所述云计算中心之间的网络通信。
较佳的,所述云计算中心,具体包括:
第二通信模块,用于与所述语音控制终端,及所述数控系统控制器之间的网络通信;
意图识别模块,用于通过预先训练好的意图识别模型将所述文本信息解析为指令序列。
较佳的,所述数控系统控制器,具体包括:
第三通信模块,用于与所述云计算中心之间的通信;
控制模块,用于根据所述指令序列依次执行指令,控制所述数控系统。
较佳的,还包括:
数据获取模块,用于获取训练数据,其中所述训练数据中包括多个意图识别数据样本对,每个意图识别数据样本对中包括,数控系统某一动作的文本表达和对应的指令序列;
模型训练模块,用于利用所述训练数据,对预设的深度神经网络模型进行训练,生成所述意图识别模型。
与现有技术相比,本发明具有如下的有益效果:
本发明首先接收用户语音信息,然后通过语音识别转化为对应的文本信息,并通过预先训练好的意图识别模型将所述文本信息解析为指令系列,最后发送至数控系统控制器,并由数控系统控制器执行指令实现对数控系统的控制。由此,通过语音控制终端获取用户语音信息对应的文本信息,并通过预先训练的意图识别模型,生成控制指令序列,提升了现有语音控制系统的灵活性、容错性和安全性,简化了用户对数控系统的操作控制流程,降低了非专业人员操作数控系统的难度,扩大了数控系统的应用场景。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例提供的数控系统的远程语音控制系统的结构图;
图2是本发明实施例提供的数控系统为超精密驱动平台的远程语音控制系统的结构图;
图3是本发明实施例提供的数控系统为数控机床的远程语音控制系统的结构图;
图4是本发明实施例提供的数控系统的远程语音控制方法的流程图;
图5是本发明实施例提供的意图识别模型的训练生成方法的流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
在现有技术中,智能语音控制系统的应用尚未涉及到与超精密驱动平台、数控机床等数控系统结合。基于上述技术现状,本发明将智能语音控制技术应用于数控系统的控制,从而1)简化和方便用户对数控系统的操作控制,提高工作效率和作业的实时性以及安全性;2)为非技术人员提供操作数控系统的可行性,降低数控系统的操作难度;3)降低操控过程对“手”的依赖,实现口头表达直接操控,扩大数控系统的应用场景。
下面参考附图描述本发明实施例的数控系统的远程语音控制系统及方法。
实施例一
图1是本发明实施例提供的数控系统的远程语音控制系统的结构图,该系统包括:
云计算中心102,以及分别与云计算中心通信连接的语音控制终端101和数控系统控制器103:
所述语音控制终端101,用于接用户语音信息,并转化为对应的文本信息,所述语音信息中包括:用户对数控系统的控制指令;
所述云计算中心102,用于接收所述文本信息,并由内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器。
所述数控系统控制器103,用于收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。
在一些实施例中,所述云计算中心还可以在所述解析生成指令序列之后,将所述指令序列发送到所述语音控制终端,并通过文字、语音或者文字与语音结合的形式展示给用户。所述数控系统控制器103还可以在执行所述指令序列的同时或之后,将所述指令序列的执行状态或结果通过所述云计算中心发送给所述语音控制终端,并通过文字、语音或者文字与语音结合的形式展示给用户
上述系统中,所述语音控制终端通过第一通信网络与所述云计算中心通信连接,所述数控系统控制器通过第二通信网络与所述云计算中心通信连接。所述第一通信网络具体可以是移动互联网,所述第二通信网络具体可以是有限以太网、WiFi或者移动互联网。
下面,分别对上述的云计算中心、语音控制终端和数控系统控制器作进一步的补充说明:
所述云计算中心,由厂商或服务提供商提供,通常,该云计算中心包含多个云服务应用模块,用以提供不同的云服务功能。在本发明本实施例中,所述云计算中心,具体包括:通信模块,用于与所述语音控制终端和数控系统控制器之间的消息收发;意图识别模块,用于通过预先训练好的意图识别模型将所述文本信息解析为指令序列。
所述语音控制终端,通过启动模块确认用户操作权限,为数控系统的远程语音控制增加安全操作保障。具体而言,可以在打开语音控制终端后,通过设置启动模块,预先设置或更改设备唤醒词,并注册一个或多个具有远程语音控制系统使用权限的用户的声纹信息,从而所述启动模块可以根据用户语音输入的唤醒词是否与内置唤醒词一致,以及用户声纹信息是否已注册,来确定用户是否具有使用该语音控制终端进行操作数控系统的权限。
所述语音控制终端,还需要包括:识别模块,用于采用语音识别引擎将所述语音信息转换为文本信息;展示模块,用于展示所述语音信息转换后的文本信息、由所述云计算中心返回的指令序列以及所述指令序列的执行状态和结果;通信模块,用于与所述云计算中心之间的网络通信。
所述语音控制终端具体可以是智能手机、掌上电脑(PAD)等具有操作系统的硬件设备。所述语音控制终端执行的各项操作,例如用户身份确认、用户语音输入的语音识别以及将语音识别后的文本信息发送给云计算中心等,可以由语音控制终端上安装的应用软件执行。
所述语音控制终端安装的应用软件应当具有以下功能:
可以通过用户的语音输入识别唤醒词和声纹信息,并与内置唤醒词和声纹信息列表进行对比,从而确定用户是否具有权限;
在用户具有权限的情况下,启动获取用户语音信息;
对获取的语音信息,通过语音识别引擎转化为文本信息;
将文本信息发送至云计算中心;
接收云计算中心返回的指令序列和数控系统控制器返回的数控系统执行状态或结果,并以文字、语音或文字和语音结合的形式展示给用户。
所述数控系统控制器,需要根据所述指令序列中的指令形式,做出相应的响应,从而实现对数控系统的控制,一般是通过预先开发好的程序实现具体指令的响应,由于与指令响应的程序设计技术已发展得非常成熟,在此不再赘述。
为使得本领域的技术人员能够更加清楚地了解本发明,下面将结合具体的数控系统进行举例说明。
举例一
如图2所示,为本发明实施例提供的数控系统为超精密驱动平台的远程语音控制系统的结构图。
由于语音控制终端、云计算中心、数控系统控制器的特点以及它们之间的联系已在前文中详细描述,故在此不再赘述。
此外,如图2所示的系统还包括:
数据获取模块,用于获取训练数据,其中所述训练数据中包括多个意图识别数据样本对,每个意图识别数据样本对中包括,超精密驱动平台某一动作的文本表达和对应的指令序列;
模型训练模块,用于利用所述训练数据,对预设的深度神经网络模型进行训练,生成意图识别模型;
意图识别模块,用于通过预先训练好的意图识别模型将所述文本信息解析为指令序列;
超精密驱动平台,用于执行所述驱动平台控制器的控制,呈现所述数控系统的远程语音控制系统的控制效果。
具体而言,在使用如图2所示系统之前:
一方面,所述数据获取模块根据所述超精密驱动平台的功能范围构建对应的模型训练集,例如,所述超精密驱动平台,其常见功能包括:z轴方向的移动和z轴方向的转动,可以构建的训练数据样本对可以包括:(“z轴方向向下移动5厘米,然后z轴顺时针转动90度”,“z move-0.05;z rotate 90”)。基于自然语言的丰富性,该样本中的指令序列“z move-0.05;z rotate 90”可以对应除“z轴方向向下移动5厘米,然后z轴顺时针转动90度”之外的多条不同语音指令,例如:“z轴下移5厘米,顺时针再转动90度”、“z轴往下5厘米并顺时针转90度”等等。训练样本对中,可以根据指令中数字参数的变化,或者词语或句式结构的变化,形成新的训练样本,以此扩展训练样本容量,增加模型的泛化能力。进一步的,所述模型训练模块利用所述训练数据,对预设的深度神经网络模型进行训练,生成意图识别模型,并被内置到所述意图识别模块中。
另一方面,所述数控系统控制器根据所述指令开发程序,从而能够响应所述指令序列,例如,该程序可以设计成如下方案:接收到指令序列“z move-0.05;z rotate 90”,并将“z move-0.05;z rotate 90”按照“;”进行分割得到两条指令“z move-0.05”、“z rotate90”,进一步的,依次根据每条指令的单词部分,例如,前述指令依次对应的“z move”和“zrotate”,调用相应的内置函数,例如“zMove”和“zRotate”,并将相应指令中的参数传入所述内置函数,实现对“z move-0.05;z rotate 90”的响应。
可以理解的是,上述指令响应方式,在具体程序设计与实现中,可以具有多种具体实现形式,本领域技术人员可以根据实际情况进行设计,以实现对接收到的指令序列进行响应,从而控制数控系统。
在使用如图2所示系统时,当图2所示系统各部分启动后,用户首先通过所述语音控制终端说出唤醒词和语音控制指令,例如“小智,z轴下移8厘米,顺时针再转动50度”,当“小智”与内置唤醒词匹配,且其声纹信息已注册,所述语音控制终端确认该用户具有操作权限,进一步获取“z轴下移8厘米,顺时针再转动50度”的语音信息,并通过语音识别引擎转为对应的文本信息,并将所述文本信息发送到所述云计算中心。所述云计算中心通过所述意图识别模块将所述文本信息解析为指令序列,例如,将字符串“z轴下移8厘米,顺时针再转动50度”传递给所述意图识别模块,返回字符串形式的指令序列“z move-0.08;z rotate50”,并将所述指令序列发送到所述数控系统控制器。当所述数控系统控制器接收到所述指令序列后,通过分析所述指令序列,首先响应指令“z move-0.08”,此时,超精密驱动平台的z轴驱动器开始启动并实现z轴往下移动8厘米的动作;接着所述数控系统控制器响应指令“z rotate 50”,并实现超精密平台z轴顺时针转动50度的动作。由此用户能够通过语音直接控制超精密驱动平台完成相应动作或任务。
举例二
如图3所示,为本发明实施例提供的数控系统为数控机床的远程语音控制系统的结构图。
显而易见地,如图3所示的系统与如图2所示的系统仅存在数控系统的不同,对于相同部分,前文已详细描述,故在此不再赘述。
如图3所示的系统,由于数控系统为数控机床,需要通过所述数据获取模块得到符合所述数控机床功能特点的训练数据,例如,数控机床的常见基本操作功能包括:坐标定位功能、主轴转速控制功能、刀具切换功能等等;数控机床的常见任务包括:加工指定直径的圆柱或孔、表面加工等等。因此,训练数据样本对可以包括:(“主轴转速3000”,“rev3000”)、(“加工一个圆柱度7级、直径3厘米的圆柱”,“cylinder 0.03 7”)等等。
对于所述训练数据的扩充、意图识别模型的训练生成,以及驱动系统控制器的相应程序开发,前文已详细描述,故在此不再赘述。
在使用如图3所示的系统时,当图3所示系统各部分启动后,用户首先通过所述语音控制终端说出唤醒词和语音控制指令,例如“小智,主轴转速调为2100,加工一个圆柱度5级,直径2.5厘米的圆柱”,当“小智”与内置唤醒词匹配,且其声纹信息已注册,所述语音控制终端确认该用户具有操作权限,进一步获取“主轴转速调为2100,加工一个圆柱度5级,直径2.5厘米的圆柱”的语音信息,并通过语音识别引擎转为对应的文本信息,并将所述文本信息发送到所述云计算中心。所述云计算中心通过所述意图识别模块将所述文本信息解析为指令序列,例如,将字符串“主轴转速调为2100,加工一个圆柱度5级,直径2.5厘米的圆柱”传递给所述意图识别模块,返回字符串形式的指令序列“rev 2100;cylinder 0.0255”,并将所述指令序列发送到所述数控系统控制器。当所述数控系统控制器接收到所述指令序列后,通过分析所述指令序列,首先响应指令“rev 2100”,此时,数控机床的主轴接受控制,将转速调整为2100转每分钟;接着所述数控系统控制器响应指令“cylinder 0.0255”,此时,所述数控机床控制器通过调用内部的相应程序,并结合所述指令中的具体参数,开始加工直径2.5厘米、圆柱度5级的圆柱。由此,用户能够通过语音直接控制数控机床完成相应动作或任务。
综上,本发明实施例的数控系统的远程语音控制系统,首先接收用户语音信息,然后通过语音识别转化为对应的文本信息,并通过预先训练好的意图识别模型将所述文本信息解析为指令系列,最后发送至数控系统控制器,并由数控系统控制器执行指令实现对数控系统的控制。由此,通过语音控制终端获取用户语音信息对应的文本信息,并通过预先训练的意图识别模型,生成控制指令序列,提升了现有语音控制系统的灵活性、容错性和安全性,简化了用户对数控系统的操作控制流程,降低了非专业人员操作数控系统的难度,扩大了数控系统的应用场景。
实施例二
图4是本发明一个实施例的数控系统的远程语音控制方法的流程图。
如图4所示,包括:
步骤401,语音控制终端获取用户语音信息,并转化为对应的文本信息,所述语音信息中包括:用户对数控系统的控制指令。
具体的,所述控制指令,为用户希望对数控系统进行行为或动作控制的自然表达,例如,“往前移动5毫米”。所述文本信息,为通过调用语音识别引擎对语音信息进行语音识别得到的结果。可以理解的是,语音识别引擎既可以使用第三方提供的免费或收费语音识别引擎,例如,可以通过调用由讯飞开放平台提供的云语音识别引擎进行识别,也可以是通过另外训练语音识别模型,构建本地语音识别引擎。
所述获取用户语音信息之前,还包括,通过用户语音输入的唤醒词和用户声纹识别用户身份,并在所述用户身份有效的情况下启动获取用户语音信息。语音唤醒和声纹识别在技术上已经比较成熟,在此不再赘述。
步骤402,将所述文本信息发送给云计算中心,并由所述云计算中心内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器。
在所述由所述云计算中心内置的意图识别模型解析生成指令序列之前,还需要对所述数控系统,通过构建相应的训练数据样本,并训练设定好的深度学习模型,得到所述数控系统对应的所述意图识别模型。
训练好的意图识别模型将收到的文本信息作为模型输入,输出字符串形式的指令序列。指令之间以特定分隔符隔开。
在一些实施方式中,所述云计算中心还可以将所述解析生产的所述指令序列发回至所述语音控制终端,并以文字、语音或文字和语音结合的形式展示给用户。
步骤403,所述数控系统控制器接收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。
具体的,所述指令序列被发送到数控系统,所述数控系统在收到字符串形式的指令序列后,根据所述数控系统的控制程序设定,依次执行所述指令序列中每条指令对应的行为或动作,实现通过用户语音信号对数控系统进行行为或动作控制的目的。
在一些实施方式中,所述数控系统控制器还可以将所述指令序列的执行状态和结果经由所述云计算中心发送至所述语音控制终端,并以文字、语音或文字和语音结合的形式展示给用户。
需要说明的是,上述步骤101、步骤102和步骤103中涉及到的文本信息或指令序列的发送与接收,可以通过但不限于下列方式实现:基于TCP/IP协议的网络通信、远程过程调用(RPC)。
图5是本发明一个实施例的意图识别模型的训练生成方法的流程图。
如图5所示,包括:
步骤501,获取训练数据,其中所述训练数据中包括多个意图识别数据样本对,每个意图识别数据样本对中包括,数控系统某一动作的文本表达和对应的指令序列;
步骤502,利用所述训练数据,对预设的深度神经网络模型进行训练,生成意图识别模型。
具体的,对某一特定数控系统,例如,超精密驱动平台,需要根据所述超精密驱动平台的功能范围构建对应的模型训练集,例如,所述超精密驱动平台,其常见功能包括:z轴方向的移动和z轴方向的转动,可以构建的训练数据样本对可以包括:(“z轴方向向下移动5厘米,然后z轴顺时针转动90度”,“z move-0.05;z rotate 90”)。基于自然语言的丰富性,该样本中的指令序列“z move-0.05;z rotate 90”可以对应除“z轴方向向下移动5厘米,然后z轴顺时针转动90度”之外的多条不同语音指令,例如:“z轴下移5厘米,顺时针再转动90度”、“z轴往下5厘米并顺时针转90度”等等。训练样本对中,可以根据指令中数字参数的变化,或者词语或句式结构的变化,形成新的训练样本,以此扩展训练样本容量,增加模型的泛化能力。进一步的,利用所述训练数据,对预设的深度神经网络模型进行训练,生成意图识别模型。该方法利用深度学习模型,实现用户意图的提取,提升了现有语音控制系统中用户意图识别的灵活性和容错性。
综上,本发明实施例的数控系统的远程语音控制方法,首先接收用户语音信息,然后通过语音识别转化为对应的文本信息,并通过预先训练好的意图识别模型将所述文本信息解析为指令系列,最后发送至数控系统控制器,并由数控系统控制器执行指令实现对数控系统的控制。由此,通过语音控制终端获取用户语音信息对应的文本信息,并通过预先训练的意图识别模型,生成控制指令序列,提升了现有语音控制系统的灵活性、容错性和安全性,简化了用户对数控系统的操作控制流程,降低了非专业人员操作数控系统的难度,扩大了数控系统的应用场景。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种数控系统的远程语音控制方法,其特征在于,包括:
语音信息获取步骤:通过语音控制终端获取语音信息,并转化为对应的文本信息,所述语音信息中包括对数控系统的控制指令;
指令序列生成步骤:将所述文本信息发送给云计算中心,并由所述云计算中心内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器;
指令执行步骤:所述数控系统控制器接收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。
2.根据权利要求1所述的数控系统的远程语音控制方法,其特征在于,还包括在所述语音信息获取步骤之前,根据唤醒词和声纹识别用户身份,并在用户身份有效的情况下启动所述语音信息获取步骤。
3.根据权利要求1所述的数控系统的远程语音控制方法,其特征在于,所述语音信息通过本地语音识别模型识别,或者通过云语音识别引擎识别。
4.根据权利要求1所述的数控系统的远程语音控制方法,其特征在于,在所述云计算中心内置的意图识别模型解析生成指令序列之前,还包括:
获取训练数据,其中所述训练数据中包括多个意图识别数据样本对,每个意图识别数据样本对中包括,数控系统某一动作的文本表达和对应的指令序列;
利用所述训练数据,对预设的深度神经网络模型进行训练,生成意图识别模型。
5.根据权利要求1所述的数控系统的远程语音控制方法,其特征在于,所述将所述指令序列发送到数控系统控制器之后,还包括:
所述云计算中心将所述解析生产的所述指令序列发回至所述语音控制终端,并以文字、语音或文字和语音结合的形式展示;
所述数控系统控制器将所述指令序列的执行状态和结果经由所述云计算中心发送至所述语音控制终端,并以文字、语音或文字和语音结合的形式展示。
6.一种数控系统的远程语音控制系统,其特征在于,包括:云计算中心,以及分别与云计算中心通信连接的语音控制终端和数控系统控制器;
所述语音控制终端,用于获取语音信息,并转化为对应的文本信息,所述语音信息中包括对数控系统的控制指令;
所述云计算中心,用于接收所述文本信息,并由内置的意图识别模型解析生成指令序列,并将所述指令序列发送到数控系统控制器;
数控系统控制器,用于收所述指令序列,并根据指令序列依次执行指令,控制所述数控系统。
7.根据权利要求6所述的数控系统的远程语音控制系统,其特征在于,所述语音控制终端,具体包括:
启动模块,用于通过唤醒词和声纹识别用户身份,并在所述用户身份有效的情况下启动获取语音信息;
识别模块,用于采用语音识别引擎将所述语音信息转换为文本信息;
展示模块,用于展示所述语音信息转换后的文本信息、由所述云计算中心返回的指令序列以及所述指令序列的执行状态和结果;
第一通信模块,用于与所述云计算中心之间的网络通信。
8.根据权利要求6所述的数控系统的远程语音控制系统,其特征在于,所述云计算中心,具体包括:
第二通信模块,用于与所述语音控制终端,及所述数控系统控制器之间的网络通信;
意图识别模块,用于通过预先训练好的意图识别模型将所述文本信息解析为指令序列。
9.根据权利要求6所述的数控系统的远程语音控制系统,其特征在于,所述数控系统控制器,具体包括:
第三通信模块,用于与所述云计算中心之间的通信;
控制模块,用于根据所述指令序列依次执行指令,控制所述数控系统。
10.根据权利要求6所述的数控系统的远程语音控制系统,其特征在于,还包括:
数据获取模块,用于获取训练数据,其中所述训练数据中包括多个意图识别数据样本对,每个意图识别数据样本对中包括,数控系统某一动作的文本表达和对应的指令序列;
模型训练模块,用于利用所述训练数据,对预设的深度神经网络模型进行训练,生成所述意图识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811511399.4A CN109686374A (zh) | 2018-12-11 | 2018-12-11 | 数控系统的远程语音控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811511399.4A CN109686374A (zh) | 2018-12-11 | 2018-12-11 | 数控系统的远程语音控制方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109686374A true CN109686374A (zh) | 2019-04-26 |
Family
ID=66186564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811511399.4A Pending CN109686374A (zh) | 2018-12-11 | 2018-12-11 | 数控系统的远程语音控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109686374A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110262960A (zh) * | 2019-05-21 | 2019-09-20 | 深圳壹账通智能科技有限公司 | 测试环境控制方法、装置、计算机可读存储介质及服务器 |
CN111930074A (zh) * | 2019-09-17 | 2020-11-13 | 电子科技大学中山学院 | 一种嵌入式数控机床的控制系统 |
CN112398889A (zh) * | 2019-08-15 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 云服务的操作方法和装置以及电子设备 |
EP4112002A1 (de) * | 2021-07-01 | 2023-01-04 | Ivoclar Vivadent AG | Dentalgerät mit spracherkennung |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1811633A (zh) * | 2004-12-30 | 2006-08-02 | 斗山英维高株式会社 | 可进行语音输出及语音识别的机床控制系统及其处理方法 |
CN107272460A (zh) * | 2017-07-24 | 2017-10-20 | 李良文 | 基于云控制的智能机器人及其远程控制方法、存储介质 |
CN107490980A (zh) * | 2017-09-29 | 2017-12-19 | 四川长虹电器股份有限公司 | 基于语音识别的红外转发家庭控制方法 |
CN108648752A (zh) * | 2018-04-17 | 2018-10-12 | 重庆物奇科技有限公司 | 一种基于云处理的智能语音控制系统及其控制方法 |
-
2018
- 2018-12-11 CN CN201811511399.4A patent/CN109686374A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1811633A (zh) * | 2004-12-30 | 2006-08-02 | 斗山英维高株式会社 | 可进行语音输出及语音识别的机床控制系统及其处理方法 |
CN107272460A (zh) * | 2017-07-24 | 2017-10-20 | 李良文 | 基于云控制的智能机器人及其远程控制方法、存储介质 |
CN107490980A (zh) * | 2017-09-29 | 2017-12-19 | 四川长虹电器股份有限公司 | 基于语音识别的红外转发家庭控制方法 |
CN108648752A (zh) * | 2018-04-17 | 2018-10-12 | 重庆物奇科技有限公司 | 一种基于云处理的智能语音控制系统及其控制方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110262960A (zh) * | 2019-05-21 | 2019-09-20 | 深圳壹账通智能科技有限公司 | 测试环境控制方法、装置、计算机可读存储介质及服务器 |
WO2020233356A1 (zh) * | 2019-05-21 | 2020-11-26 | 深圳壹账通智能科技有限公司 | 测试环境控制方法、装置、计算机可读存储介质及服务器 |
CN112398889A (zh) * | 2019-08-15 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 云服务的操作方法和装置以及电子设备 |
CN111930074A (zh) * | 2019-09-17 | 2020-11-13 | 电子科技大学中山学院 | 一种嵌入式数控机床的控制系统 |
EP4112002A1 (de) * | 2021-07-01 | 2023-01-04 | Ivoclar Vivadent AG | Dentalgerät mit spracherkennung |
EP4112003A1 (de) * | 2021-07-01 | 2023-01-04 | Ivoclar Vivadent AG | Dentalgerät mit spracherkennung |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109686374A (zh) | 数控系统的远程语音控制方法及系统 | |
CN104350541B (zh) | 能够将与用户的自然对话合并到其行为中的机器人,以及编程和使用所述机器人的方法 | |
CN104049964B (zh) | 汉语语音近距或远程控制机电设备运行的方法 | |
CN104699004A (zh) | 汉语文本遥控机器人的控制器装置 | |
CN104235998A (zh) | 非特定人汉语语音遥控智能空调机的方法 | |
CN104698993A (zh) | 汉语文本遥控的机器人系统 | |
CN104699002A (zh) | 汉语文本遥控机器人的方法 | |
CN104699672A (zh) | 非特定人外语语音现场控制的机器人系统 | |
CN105183719A (zh) | 汉语语音遥控汽车驾驶的控制器装置 | |
CN104235042B (zh) | 汉语语音遥控电风扇的方法 | |
CN104698855A (zh) | 汉语文本现场控制机器人的方法 | |
CN105759810A (zh) | 汉语文本现场控制的集群机器人系统 | |
CN105138518A (zh) | 汉语语音遥控驾驶的汽车系统 | |
CN104698988A (zh) | 非特定人外语语音遥控机器人的控制器装置 | |
CN104698994A (zh) | 外语自然语文本遥控的机器人系统 | |
CN105759669A (zh) | 外语自然语文本遥控集群机器人的方法 | |
CN105139477A (zh) | 非特定人外语语音遥控驾驶的汽车系统 | |
CN104698989A (zh) | 汉语文本现场控制机器人的控制器装置 | |
CN105785983A (zh) | 汉语文本遥控的集群机器人系统 | |
CN105759794A (zh) | 外语自然语文本遥控的集群机器人系统 | |
CN105785982A (zh) | 非特定人外语语音遥控集群机器人的方法 | |
CN105759804A (zh) | 外语自然语文本现场控制的集群机器人系统 | |
CN105759803A (zh) | 外语自然语文本遥控集群机器人的控制器装置 | |
CN105759809A (zh) | 非特定人外语语音遥控的集群机器人系统 | |
CN105205049A (zh) | 汉语文本遥控驾驶的汽车系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190426 |