CN109992261A

CN109992261A - 一种基于人工智能的语音在线编程方法及装置

Info

Publication number: CN109992261A
Application number: CN201910365211.8A
Authority: CN
Inventors: 王瑞; 樊春晖; 谢春华; 胡劲松; 王泉涛; 方小康; 官守东; 张莹; 崔阿伟
Original assignee: Wuhan Yawei Electronic Science & Technology Co Ltd
Current assignee: Wuhan Yawei Electronic Science & Technology Co Ltd
Priority date: 2019-04-30
Filing date: 2019-04-30
Publication date: 2019-07-09

Abstract

本发明提供一种基于人工智能的语音在线编程方法及装置，其装置包括物联网终端，所述物联网终端为分布式模块，用于收集语音信号并对语音信号进行解析形成上行数据流，并发送至云端服务器；云端服务器，所述云端服务器通过上行数据流接收语音数据，基于人工智能的语音识别方法编译成可执行文件形成下行数据流，并反馈至物联网终端进行存储并烧写，达到快速更新设备终端功能的目的。本发明的优点在于，语音输入方便、快捷，使用门槛极低，一个可以表达自己思想的人，不懂专业文字和图形，都可进行物联网设备的现场编程，极大提高保障效率，可人性化地解决物联网语音在线编程问题。

Description

一种基于人工智能的语音在线编程方法及装置

技术领域

本发明主要涉及编程相关技术领域，具体是一种基于人工智能的语音在线编程方法及装置。

背景技术

编程就是让计算机或特定设备，通过人机交互的方式，实现某种代码，以期解决某些固定时序或逻辑问题，最终得到相应结果的过程，并可实现自动化的重复执行的过程。为了使设备能够理解人的意图，必须将人的思路通过计算机或特定设备能够理解的形式告诉它，使其可以脱离人自动化完成任务。这种人机交互过程就是编程。

对于编程行为，人机交互的方式主要有键盘、鼠标或触摸屏、摄像设备、录音设备。编程经历了数十年的发展，目前编程行为，主要依赖于键盘、鼠标或触摸屏，主要模式有两种，一是通过键盘敲击字母，实现文本化编程，典型的工具有VC++、VB、Java等。二是通过鼠标或者触摸屏，选择图形模块，并用连线或者搭积木的方法，实现图形化编程，典型的工具有LabVIEW、Scratch、梯形图等。前者一般是通过英文字符实现，从业者一般要求大专以上学历，对其能力素质要求较高，入门和解决实际问题，都比较困难。后者因为图形的形象化、简单化，不需要记忆大量英文单词就可实现编程，很大程度上降低了编程门槛，但也要求从业者具备很强的图形识别和记忆能力，从业者一般要求中学以上学历。且这两种方式须使用电脑键盘和屏幕，无法直接使用在小巧、便携的物联网设备上，尤其是不适合现场调试。

随着人工智能以及5G技术的高速发展，编程交互渠道多样化、人性化，是大势所趋，编程需求会无处不在。因传统编程方法中需要屏幕、键盘或鼠标等外设，不方便携带，现实图像的杂乱性和逻辑不明显的特点，通过图像编程还有待时日，但录音设备的语音编程，会成为一种新趋势。目前语音方案很多，但大都停留在简单的单指令控制领域，也有语音编程的提法，例如一种语音识别型编程方法、装置及计算机设备(CN201810686496)，以独立的计算机加数据库的模式，实现少儿编程培训的引导。此方法的缺点，一是鉴于语音的复杂性，会因数据库样本量的限制，以及其呆板的框架，无法实现高效识别，让编程变得不可靠，甚至不可实现。二是随着物联网的发展，嵌入式、离散化、云端化的小型设备会大量涌现，这些设备不能被该专利所述的计算机或装置取代。

发明内容

为解决目前技术的不足，本发明结合现有技术，从实际应用出发，提供一种基于人工智能的语音在线编程方法及装置，通过基于服务器的人工智能算法，结合现场设备，便捷地通过口述，即可实现对物联网设备逻辑的编程，降低了技术门槛，提升了保障效率，一个可以表达自己思想的人，不懂专业文字和图形，都可进行物联网设备的现场编程，可人性化地解决物联网语音在线编程问题可人性化地解决物联网编程问题。

为实现上述目的，依据本发明的一个方面，提供一种基于人工智能的语音在线编程方法，

所述方法包括，基于人机交互单元收集语音信号，对语音信号进行解析形成上行数据流，并发送至云端；基于云端的人工智能语音识别方法将语音数据编译成可执行文件形成下行数据流并反馈至现场人机交互单元，人机交互单元依据下行数据流进行程序自动存储并烧写。

进一步的，在对语音信号进行解析时，判断信号为指令音或逻辑音，对于逻辑音在本地进行指令性逻辑处理后进行有效性判断，对于逻辑音直接进行有效性判断，对于判断后的有效逻辑音形成上行数据流，并丢弃无效逻辑音。

进一步的，通过有线或无线的方式实现人机交互单元、云端的上行数据流以及下行数据流的传输。

进一步的，基于云端的软件，以流式数据传输的方式实现待识别语音数据的实时接收，基于云端的人工智能语音识别方法，得到高度识别的文本信息内容，通过该信息，程序自动整理成有条理的逻辑结构数据，组合编程指令，通过程序生成器形成嵌入式系统语言，并基于仿真运行单元进行试用或确认，对于仿真正常的程序进行编译形成下行数据流。

进一步的，基于人机交互单元，对下行数据流的程序数据进行自动存储烧写，并自复位设备，自运行程序，同时可通过设备面板的撤销按钮进行复位设备程序逻辑。

依据本发明的另一个方面，提供一种基于人工智能的语音在线编程装置，

包括物联网终端，所述物联网终端为分布式模块，用于收集语音信号并对语音信号进行解析形成上行数据流，并发送至云端服务器；云端服务器，所述云端服务器通过上行数据流接收语音数据，基于人工智能的语音识别方法编译成可执行文件形成下行数据流，并反馈至物联网终端进行存储并烧写。

进一步的，所述物联网终端包括中央控制器、音频采样模块、录音模块、指示器、网络单元、外设接口、电源模块；所述中央处理器分别与音频采样模块、指示器、外设接口、网络单元相连，所述录音模块与音频采样模块相连，所述外设接口用于连接用户外设，所述电源模块用于终端的供电。

进一步的，所述录音模块采用咪头实现；所述网络单元通过有线或无线通信手段，可以是5G、4G、WIFI、NB-IOT或RJ45接口，其通过与云端服务器的上行连接向云端服务器发送上行数据，并通过与云端服务器的下行连接接收服务器发送的下行数据。

进一步的，所述中央处理器对语音数据进行分析判断，对于有效逻辑音形成上行数据流，并丢弃无效逻辑音，中央处理器接收下行数据流，并对程序数据进行程序自动存储烧写，并进行设备复位、程序运行。

进一步的，所述云端服务器以流式数据传输的方式实现待识别语音数据的实时接收，基于人工智能的语音识别方法，得到高度识别的文本信息内容，通过该信息，程序自动整理成有条理的逻辑结构数据，组合编程指令，通过程序生成器形成嵌入式系统语言，并通过设置的仿真运行单元发送用户确认，对于仿真正常的程序进行编译形成下行数据流。

本发明的有益效果：

本发明通过物联网联网技术，采用现场语音录入，高速传至云端服务器，通过人工智能算法提取的语音内容，并通过服务器程序形成编程指令，编译成可执行文件，最终下载至用户本地设备，并实现自动化运行目的。该方法以及相应装置的优点在于，语音输入方便、快捷，使用门槛极低，一个可以表达自己思想的人，不懂专业文字和图形，都可进行物联网设备的现场编程，极大提高保障效率，可人性化地解决物联网语音在线编程问题。

附图说明

附图1为本发明的装置结构图；

附图2为本发明的物联网终端结构图；

附图3为本发明的物联网终端语音处理流程图；

附图4为本发明人工智能分析语音及程序代码生成流程图；

附图5为本发明物联网终端程序运行图；

附图6为本发明中央控制芯片电路设计图；

附图7本发明语音处理电路设计图；

附图8为本发明电源模块电路设计图；

附图9为本发明数字量输入电路设计图；

附图10为本发明输出控制电路设计图；

附图11为本发明指示电路设计图；

附图12为本发明语音采集电路设计图。

具体实施方式

结合附图和具体实施例，对本发明作进一步说明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所限定的范围。

如图1～5所示，为本发明所提供的基于人工智能的工业物联网语音在线编程的方法及编程装置结构。

在本发明中，其主要是通过物联网技术，采用现场语音输入的方式，将语音数据高速传至云端服务器，通过人工智能算法提取的语音内容，通过云端服务器形成编程指令，编译成可执行文件，最终在物联网终端设备进行自动化运行。

为了实现上述的在线编程，本发明的装置包括如图1所示的两大部分结构：物联网终端和云端服务器。物联网终端为分布式模块，通过公共网络，与服务器建立稳定连接。物联网终端作为人机直接交互单元，承担着编程语音录入接口，以及程序执行任务。服务器作为人工智能算法和自动化编程程序合成软件运行载体。

如图2所示，为本发明所提供的物联网终端结构图。包括：中央控制器，是该终端的主控单元，负责整个电路的协调工作，内部集成时钟、内存、指令集、存储器等模块；录音模块，用于在语音识别过程中，收集待识别的语音信号，可采用成本低廉的咪头实现；音频采样模块，将音频信号采集为高精度离散波形数据；指示器，用于指示设备运行和编程状态；电源模块，用于给该终端供电；网络单元，可用有线或无线通信手段实现，例如网口、WiFi、3G、4G、5G、NB-IOT、RJ45接口等，用于通过与服务端的上行连接，向服务端发送上行数据流，其中，上行数据流包括语音数据，并行通过与服务端的下行连接，接收服务端发送的下行数据；其中，下行数据，包括结果数据，结果数据是服务端根据语音数据进行语音识别得到的编程数据，命令数据，以及反馈信号。IO接口，为外设接口，包括模拟量输入，模拟量输出，数字量输入，数字量输出等功能，可以与现场传感器进行交互，可接入各种传感器、设备、装备和工具。

通过该物联网终端，能够实现现场语音的采集，并将语音数据简单处理后发送至云端服务器，并接受云端服务器反馈的数据进行程序存储和烧写，完成自动编程，达到快速更新设备终端功能的目的。本物联网终端相关电路图参考附图6～12。

如图3所示，本发明的物联网终端语音处理流程如下：对于录音，通过解析，辨别是否为指令音，对于指令音，本地处理简单指令性逻辑，并进行有效性判断，对于逻辑音直接判断有效性，对于有效逻辑音，形成上行数据流，并发送至云端，对于无效逻辑音则直接丢弃。

如图4所示，本发明中，云端服务器人工智能分析语音及程序代码生成流程有：通过上行数据流收到语音数据，通过服务端的软件，以流式数据传输的方式实现待识别语音数据的实时接收，基于人工智能的语音识别方法，得到高识别度的文本信息内容，通过该信息，程序自动整理成有条理的逻辑结构数据，组合编程指令，通过程序生成器形成嵌入式系统语言。

为确保程序的有效性和安全性，在服务器端设有仿真运行单元，并发送用户进行试用或确认，对于仿真正常的程序进行编译，形成下行数据流，发送给物联网终端。

如图5所示，对于下行数据流，即结果和程序数据，数据是云端服务器根据语音数据进行语音识别和自动化编程得到的。然后通过物联网终端的中央控制器，接收程序数据，程序自动存储并烧写，并自复位设备，自运行程序，从而实现编程目的。为确保安全性和可靠性，用户可以操作设备面板上的撤销按钮，复位设备程序逻辑。

Claims

1.一种基于人工智能的语音在线编程方法，其特征在于：所述方法包括，

基于人机交互单元收集语音信号，对语音信号进行解析形成上行数据流，并发送至云端；

基于云端的人工智能语音识别方法将语音数据编译成可执行文件形成下行数据流并反馈至现场人机交互单元，人机交互单元依据下行数据流进行程序自动存储并烧写。

2.如权利要求1所述的一种基于人工智能的语音在线编程方法，其特征在于：在对语音信号进行解析时，判断信号为指令音或逻辑音，对于逻辑音在本地进行指令性逻辑处理后进行有效性判断，对于逻辑音直接进行有效性判断，对于判断后的有效逻辑音形成上行数据流，并丢弃无效逻辑音。

3.如权利要求1所述的一种基于人工智能的语音在线编程方法，其特征在于：通过有线或无线的方式实现人机交互单元、云端的上行数据流以及下行数据流的传输。

4.如权利要求1所述的一种基于人工智能的语音在线编程方法，其特征在于：基于云端的软件，以流式数据传输的方式实现待识别语音数据的实时接收，基于云端的人工智能语音识别方法，得到高度识别的文本信息内容，通过该信息，程序自动整理成有条理的逻辑结构数据，组合编程指令，通过程序生成器形成嵌入式系统语言，并基于仿真运行进行试用或确认，对于仿真正常的程序进行编译形成下行数据流。

5.如权利要求1所述的一种基于人工智能的语音在线编程方法，其特征在于：基于人机交互单元，对下行数据流的程序数据进行自动存储烧写，并自复位设备，自运行程序，同时可通过设备面板的撤销按钮进行复位设备程序逻辑。

6.一种基于人工智能的语音在线编程装置，其特征在于：包括

物联网终端，所述物联网终端为分布式模块，用于收集语音信号并对语音信号进行解析形成上行数据流，并发送至云端服务器；

云端服务器，所述云端服务器通过上行数据流接收语音数据，基于人工智能的语音识别方法编译成可执行文件形成下行数据流，并反馈至物联网终端进行存储并烧写。

7.如权利要求1所述的一种基于人工智能的语音在线编程装置，其特征在于：所述物联网终端包括中央控制器、音频采样模块、录音模块、指示器、网络单元、外设接口、电源模块；

所述中央处理器分别与音频采样模块、指示器、外设接口、网络单元相连，所述录音模块与音频采样模块相连，所述外设接口用于连接用户外设，所述电源模块用于终端的供电。

8.如权利要求7所述的一种基于人工智能的语音在线编程装置，其特征在于：所述录音模块采用咪头实现；

所述网络单元通过有线或无线通信手段，可以是5G、4G、WIFI、NB-IOT或RJ45接口，其通过与云端服务器的上行连接向云端服务器发送上行数据，并通过与云端服务器的下行连接接收服务器发送的下行数据。

9.如权利要求7所述的一种基于人工智能的语音在线编程装置，其特征在于：所述中央处理器对语音数据进行分析判断，对于有效逻辑音形成上行数据流，并丢弃无效逻辑音，中央处理器接收下行数据流，并对程序数据进行程序自动存储烧写，并进行设备复位、程序运行。

10.如权利要求1所述的一种基于人工智能的语音在线编程装置，其特征在于：所述云端服务器以流式数据传输的方式实现待识别语音数据的实时接收，基于人工智能的语音识别方法，得到高度识别的文本信息内容，通过该信息，程序自动整理成有条理的逻辑结构数据，组合编程指令，通过程序生成器形成嵌入式系统语言，并通过设置的仿真运行单元进行试用或确认，对于仿真正常的程序进行编译形成下行数据流。