CN108040111A - 一种支持自然语言交互的装置和方法 - Google Patents

一种支持自然语言交互的装置和方法 Download PDF

Info

Publication number
CN108040111A
CN108040111A CN201711327864.4A CN201711327864A CN108040111A CN 108040111 A CN108040111 A CN 108040111A CN 201711327864 A CN201711327864 A CN 201711327864A CN 108040111 A CN108040111 A CN 108040111A
Authority
CN
China
Prior art keywords
natural language
language information
smart machine
modules
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711327864.4A
Other languages
English (en)
Inventor
林皓
高曦
钟力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing VRV Software Corp Ltd
Original Assignee
Beijing VRV Software Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing VRV Software Corp Ltd filed Critical Beijing VRV Software Corp Ltd
Priority to CN201711327864.4A priority Critical patent/CN108040111A/zh
Publication of CN108040111A publication Critical patent/CN108040111A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Abstract

本发明公开了一种支持自然语言交互的装置,内置安装在智能设备上,包括网络模块、音频采集模块、音频播放模块、语音处理模块、AI模块和操作接口模块,AI模块分别与网络模块、音频采集模块、音频播放模块、语音处理模块和操作接口模块连接。所述装置用于处理语音和文字形式的自然语言信息,从而支持人与智能设备、智能设备与智能设备进行基于自然语言的交互操作。本发明还公开了一种基于自然语言的智能设备交互方法。通过本发明,人与物、物与物之间能够以自然语言进行直接的交互,不需要任何交互协议,从而大幅度提高万物互联的智能化水平。

Description

一种支持自然语言交互的装置和方法
技术领域
本发明属于信息技术和物联网领域,涉及人与智能设备、智能设备与智能设备之间的交互问题,特别涉及如何通过自然语言信息进行相互交互的问题。
背景技术
随着移动互联网、物联网和人工智能的飞速发展,越来越多的智能设备能够入网,接受人们的控制,帮助人们完成很多富有想象力的工作,提升人们的生活和工作质量,例如智能手机、远程监控摄像头、智能家居设备、智能汽车、无人机、机器人和智能穿戴设备等。这时,人们对方便快捷、高效准确的智能交互需求越来越强烈。自然语言作为人类表达自己思想最方便、最自然的方式,已逐渐成为最主流的人机智能交互方式。
前几年,人们对智能设备的操控通常通过应用程序的菜单、图标以及配合物理操纵设备进行,有的还可以接受简单的语音控制,但通常都是格式化的控制指令信息。智能设备在与人的结合上还处于初级阶段,人的高智能性与智能设备的低智能性不能很好地匹配,使操控性和交互体验大打折扣。近年来,得益于语音识别技术的发展,出现了基于自然语言的人机交互方案,人能够通过自然语言与机器或智能设备直接或间接地进行交互,智能设备能够听懂人的一些话并做出回应。
但与此同时,在智能设备与智能设备的交互方面,却仍然处于相对低级的指令级交互的阶段,智能化水平较低。设备之间的交互往往依赖于特定的交互协议,而在大部分领域中,不同厂商生产的设备往往没有统一的交互协议,若不同设备分别采用了不同的交互协议,将会导致这些设备无法进行正常的交互。为了实现不同交互协议的设备之间的交互,现有的实现方式一般是统一两者的交互协议,例如采用源设备(交互指令发送方)或者目标设备(交互指令接收方)的交互协议进行设备之间的交互。但是,对于第三方厂商或者普通用户而言,这却不够便捷、高效,实现难度也较大。
在万物互联的场景下,需要做到人与物、物与物之间基于自然语言的直接智能交互。通过该发明,人与物、物与物之间能够以自然语言直接进行交互,不需要任何交互协议,也不需要任何的中间辅助设备,从而大幅度提高万物互联的智能化水平。
发明内容
本发明的目的,是为万物互联时代提供一种基于自然语言的人与物、物与物之间的智能交互解决方案,通过在智能设备中内置一个支持自然语言交互的装置(表现为小微型芯片或板卡),使智能设备具备智能特性和自然语言交互能力,从而实现人与物、物与物之间的基于自然语言的直接交互。
本发明的一种支持自然语言交互的装置,内置在智能设备中,由网络接口模块、音频采集模块、音频播放模块、语音处理模块、操作接口模块、AI模块组成。具体如下:
网络接口模块,支持通过有线网络和无线网络方式,接收或发送自然语言信息,属于所述装置的外部接口;所述自然语言信息包括语音形式的自然语言信息和文字形式的自然语言信息。
音频采集模块,支持声音采集并转化为语音文件,属于所述装置的外部接口;音频播放模块,支持语音文件的播放,属于所述装置的外部接口;语音处理模块,对语音形式的自然语言信息进行语音识别,转换为文字形式的自然语言信息,或者,将文字形式的自然语言信息转换为语音形式的自然语言信息。
操作接口模块,与智能设备的控制接口连接,对智能设备进行操控,并获得智能设备的反馈数据,所述反馈数据包括智能设备的操控结果与过程数据,以及智能设备的运行状态数据。
AI模块,是所述装置的智能数据处理中心,由自然语言处理单元和自然语言例句库组成,用于解析自然语言信息,获得智能设备的控制指令和附加信息,以及将智能设备返回的所述反馈数据转换成自然语言信息;所述AI模块分别与所述网络接口模块、所述音频采集模块、所述音频播放模块、所述语音处理模块和所述操作接口模块连接。
AI模块在自然语言信息处理中,其自然语言处理单元首先提取所述自然语言信息的关键字,接着根据智能设备的语义场景,得到关键字的语义,最后根据自然语言例句库和所述关键字的语义进行关键信息提取,获取所述自然语言信息的解析结果。而且,其自然语言处理单元还能根据自然语言例句库以及智能设备的语义场景,将智能设备返回的所述反馈数据转换成自然语言信息。自然语言例句库根据智能设备的语义场景,分类存储了人与智能设备、智能设备与智能设备之间的各种典型交互的自然语言句子。
本发明的一种基于自然语言的智能设备交互方法,分为如下步骤:
S1:源智能设备向目标智能设备发送自然语言信息;
S2:目标智能设备接收并解析自然语言信息,做出与自然语言信息相应的动作;
S3:目标智能设备向源智能设备回应自然语言信息;
所述自然语言信息包括语音形式的自然语言信息和文字形式的自然语言信息。
在步骤“S1:源智能设备向目标智能设备发送自然语言信息”中,包括两种方式:一是通过网络接口模块发送所述自然语言信息;二是通过音频播放模块播放所述自然语言信息。
步骤“S2:目标智能设备接收并解析自然语言信息”,又可细分为:
S201:网络接口模块接收所述自然语言信息,传给AI模块;或者,音频采集模块采集声音信号,生成语音形式的自然语言信息,传给AI模块;
S202:AI模块查看所述自然语言信息是否为语音形式,如果是,则将所述自然语言信息传给语音处理模块,由语音处理模块对所述自然语言信息进行语音识别,转换为文字形式的自然语言信息,再传回AI模块;如果不是,则转到下一步;
S203:AI模块对所述自然语言信息进行解析,得到其中的功能指令和附加信息;
S204:AI模块通过操作接口模块将所述功能指令传给目标智能设备的控制接口。
步骤“S2:做出与自然语言信息相应的动作”,又可细分为:
S205:目标智能设备根据其控制接口收到的功能指令,做出相应的功能操作;
S206:目标智能设备通过其控制接口向操作接口模块传回所述功能操作的反馈数据;
所述反馈数据包括所述功能指令的执行结果和执行过程数据,以及目标智能设备的运行状态数据。
步骤“S3:目标智能设备向源智能设备回应自然语言信息”,又可细分为:
S301:操作接口模块将反馈数据传输给AI模块;
S302:AI模块对所述反馈数据进行处理,生成文字形式的自然语言信息;
S303:AI模块将所述文字形式的自然语言信息传给语音处理模块,由所述语音处理模块将所述文字形式的自然语言信息转换为语音形式的自然语言信息,再传回AI模块;
S304:AI模块根据预置的策略,将所述语音形式的自然语言信息或文字形式的自然语言信息,通过网络接口模块发回给源智能设备;或者,将所述语音形式的自然语言信息,通过音频播放模块进行播放。
本发明的一种基于自然语言的智能设备交互方法,如果是人与智能设备的自然语言交互,智能设备的交互方法会分为如下步骤:
S2001:音频采集模块采集人发出的语音信号,生成语音形式的自然语言信息,传给AI模块;
S2002:AI模块将所述语音形式的自然语言信息交由语音处理模块进行语音识别,转换为文字形式的自然语言信息,再传回AI模块;
S2003:AI模块对所述文字形式的自然语言信息进行解析,得到其中的功能指令和附加信息;
S2004:AI模块通过操作接口模块将所述功能指令传给智能设备的控制接口;
S2005:智能设备根据其控制接口收到的所述功能指令,做出相应的功能操作;
S2006:智能设备通过其控制接口向操作接口模块传回所述功能操作的反馈数据;所述反馈数据包括所述功能指令的执行结果和执行过程数据,以及智能设备的运行状态数据;
S2007:操作接口模块将所述反馈数据传给AI模块;
S2008:AI模块对所述反馈数据进行处理,生成文字形式的自然语言信息,然后将所述文字形式的自然语言信息交由语音处理模块转换为语音形式的自然语言信息,再传回AI模块;
S2009:AI模块通过音频播放模块播放所述语音形式的自然语言信息。
通过本发明,人与物、物与物之间能够以自然语言进行直接的交互,不需要任何交互协议,也不需要任何的中间辅助设备(比如云服务器、解析设备等),从而大幅度提高万物互联的智能化水平。
附图说明
图1是本发明装置的结构框图。
图2是本发明装置的信息处理图。
图3是本发明方法的流程图1。
图4是本发明方法的流程图2。
图5是本发明人与智能设备之间的交互方法。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明装置的结构框图。本发明的一种支持自然语言交互的装置,由网络接口模块、音频采集模块、音频播放模块、语音处理模块、操作接口模块、AI模块组成,内置在智能设备中,与智能设备合为一体。所述装置被制造为一块芯片或一块板卡,能够很容易内置在智能设备中,借助智能设备为其供电,与智能设备的控制接口相连。智能设备包括但不限于智能手机、智能家居设备、可穿戴设备以及物联网设备。
所述装置的网络接口模块,支持通过有线网络和无线网络方式,接收或发送自然语言信息,属于所述装置的外部接口。无线网络支持WIFI、蓝牙、ZIGBEE和移动通信。这里,自然语言信息包括语音形式的自然语言信息和文字形式的自然语言信息。
所述装置的音频采集模块,支持声音采集并转化为语音文件,属于所述装置的外部接口;所述装置的音频播放模块,支持语音文件的播放,也属于所述装置的外部接口;所述装置的语音处理模块,对语音形式的自然语言信息进行语音识别,转换为文字形式的自然语言信息,或者,将文字形式的自然语言信息转换为语音形式的自然语言信息。
所述装置的操作接口模块,与智能设备的控制接口连接,对智能设备进行操控,并获得智能设备的反馈数据;所述反馈数据包括智能设备的操控结果与过程数据,以及智能设备的运行状态数据。
所述装置的AI模块,是所述装置的智能数据处理中心,由自然语言处理单元和自然语言例句库组成,用于解析自然语言信息,获得智能设备的控制指令和附加信息,以及将智能设备返回的所述反馈数据转换成自然语言信息。AI模块分别与网络接口模块、音频采集模块、音频播放模块、语音处理模块和操作接口模块连接。
AI模块在自然语言信息处理中,其自然语言处理单元首先提取所述自然语言信息的关键字,接着根据智能设备的语义场景,得到关键字的语义,最后根据自然语言例句库和所述关键字的语义进行关键信息提取,获取所述自然语言信息的解析结果。而且,其自然语言处理单元还能根据自然语言例句库以及智能设备的语义场景,将智能设备返回的所述反馈数据转换成自然语言信息。由于每种智能设备的应用场景并不复杂,其语义场景也会相对简单且明确,加上有自然语言例句库的支持,自然语言处理结果的正确率就会非常高。特别是智能设备之间的交互,由于自然语言信息都来自自然语言例句库,不会出现解析出错的情况。
自然语言例句库根据智能设备的语义场景,分类存储了人与智能设备、智能设备与智能设备之间的各种典型交互的自然语言句子。例如,根据智能家居设备、智能手机、可穿戴设备以及物联网设备等进行分类,对于每一类比如智能家居设备,还可细分为:智能空调、智能电视、智能洗衣机、智能冰箱、智能门禁、智能窗帘等设备,将每一种设备在各种应用场景下交互可能使用的句子,都存储到数据库中,以此来构建自然语言例句库。例如,“空调已打开并设定到***度”,交互时,只需根据设备返回的结果替换相应的参数即可。
图2是本发明装置的信息处理图。可以看到,在所述装置内部的各模块之间,流转的都是自然语言信息,只有在所述装置的操作接口模块与智能设备的控制接口之间,才是具体的控制指令和格式化的数据。这能够大大降低智能设备的设计与制造复杂度,智能设备只需提供规范化的控制接口,通过本发明的所述装置,就能够实现基于自然语言的人与物、物与物直接交互。
一个智能设备上的所述装置,其网络接口模块会接收来自其他智能设备的自然语言信息,交给AI模块进行处理,也会将发给其他智能设备的自然语言信息发送出去。其音频采集模块会采集其他智能设备或人的自然语言信息,交给AI模块;音频播放模块则将要发给其他智能设备或人的自然语言信息播放出去。网络接口模块、音频采集模块、音频播放模块三个模块是一个智能设备与其他智能设备或人的交互接口,是所述装置的外部接口。
一个智能设备上的所述装置,其操作接口属于内部接口,是所述装置与所在智能设备的交互接口,这其中是指令级和格式化数据的交互。
图3、图4是本发明方法的流程图。本发明的一种基于自然语言的智能设备交互方法,分为如下步骤。智能设备之间的交互信息,不像人与智能设备之间交互信息那样存在随意性和自由发挥的因素,都是自然语言例句库中的句子,通过不断地扩充自然语言例句库,就能够丰富智能设备之间交互的灵活性和趣味性,同时,又不会影响智能设备对于对方交互信息的准确理解。
S1:源智能设备向目标智能设备发送自然语言信息;
S2:目标智能设备接收并解析自然语言信息,做出与自然语言信息相应的动作;
S3:目标智能设备向源智能设备回应自然语言信息。
这里,所述自然语言信息包括语音形式的自然语言信息和文字形式的自然语言信息。
在步骤“S1:源智能设备向目标智能设备发送自然语言信息”中,包括两种方式:一是通过网络接口模块发送所述自然语言信息;二是通过音频播放模块播放所述自然语言信息。
这里,采用何种信息发送方式取决于装置中预设的策略,但同时只会以一种方式进行发送,只有在用一种方式发送后对方没有响应,才会用另一种方式进行发送。例如,如果通过网络接口模块发送后,目标智能设备没有响应,基于对方网络接口模块可能出现故障的因素,源智能设备会通过音频播放模块播放语音信息。
步骤“S2:目标智能设备接收并解析自然语言信息”,又可细分为:
S201:网络接口模块接收所述自然语言信息,传给AI模块;或者,音频采集模块采集声音信号,生成语音形式的自然语言信息,传给AI模块;
S202:AI模块查看所述自然语言信息是否为语音形式,如果是,则将所述自然语言信息传给语音处理模块,由语音处理模块对所述自然语言信息进行语音识别,转换为文字形式的自然语言信息,再传回AI模块;如果不是,则转到下一步;
S203:AI模块对所述自然语言信息进行解析,得到其中的功能指令和附加信息;
S204:AI模块通过操作接口模块将所述功能指令传给目标智能设备的控制接口。
步骤“S2:做出与自然语言信息相应的动作”,又可细分为:
S205:目标智能设备根据其控制接口收到的功能指令,做出相应的功能操作;
S206:目标智能设备通过其控制接口向操作接口模块传回所述功能操作的反馈数据;
所述反馈数据包括所述功能指令的执行结果和执行过程数据,以及目标智能设备的运行状态数据。
步骤“S3:目标智能设备向源智能设备回应自然语言信息”,又可细分为:
S301:操作接口模块将反馈数据传输给AI模块;
S302:AI模块对所述反馈数据进行处理,生成文字形式的自然语言信息;
S303:AI模块将所述文字形式的自然语言信息传给语音处理模块,由所述语音处理模块将所述文字形式的自然语言信息转换为语音形式的自然语言信息,再传回AI模块;
S304:AI模块根据预置的策略,将所述语音形式的自然语言信息或文字形式的自然语言信息,通过网络接口模块发回给源智能设备;或者,将所述语音形式的自然语言信息,通过音频播放模块进行播放。
这里,预置的所述策略有三种:文字形式的自然语言信息交互、语音形式的自然语言信息交互和话音交互。如果是前两种策略,交互信息将通过网络接口模块发回给源智能设备,如果是第三种策略,交互信息将通过音频播放模块播放出去(源智能设备将通过音频采集模块获得交互信息)。通常,智能设备之间的交互,双方预置的所述策略会相同,默认的,目标智能设备会采用和源智能设备相同的策略。例如,如果源智能设备向目标智能设备发送文字形式的自然语言信息,那么目标智能设备回应的也会是文字形式的自然语言信息;如果源智能设备向目标智能设备发送语音形式的自然语言信息,那么目标智能设备回应的也会是语音形式的自然语言信息;如果源智能设备向目标智能设备发送话音信息,那么目标智能设备回应的也会是话音信息。
图5是本发明人与智能设备之间的交互方法。本发明的一种基于自然语言的智能设备交互方法,如果是人与智能设备的自然语言交互,智能设备的交互方法会分为如下步骤。同时,以人与智能空调的交互为例,说明整个方法过程及有关内容。
S2001:音频采集模块采集人发出的语音信号,生成语音形式的自然语言信息,传给AI模块;
S2002:AI模块将所述语音形式的自然语言信息交由语音处理模块进行语音识别,转换为文字形式的自然语言信息,再传回AI模块;
S2003:AI模块对所述文字形式的自然语言信息进行解析,得到其中的功能指令和附加信息;
这里,人与智能设备之间交互的自然语言信息不仅仅是只包含控制指令意思的语句,可能还会一些含有附加信息的语句。人对智能空调说:“我感到有些热了,空调打开到26度吧”,“我感到有些热了”就是附加信息,“空调打开到26度吧”则是含有控制指令意思的语句。对于附加信息,AI模块能够即时产生回应信息“好的主人,空调马上就开”,并给人回应。
具体的功能指令,可以是这样的结构:
指令 := <目标智能设备ID><功能操作><参数1><参数2>……;
S2004:AI模块通过操作接口模块将所述功能指令传给智能设备的控制接口;
S2005:智能设备根据其控制接口收到的所述功能指令,做出相应的功能操作;
例如,在这里空调会打开制冷并设定在26度。
S2006:智能设备通过其控制接口向操作接口模块传回所述功能操作的反馈数据;所述反馈数据包括所述功能指令的执行结果和执行过程数据,以及智能设备的运行状态数据;
例如,在这里空调会返回功能指令执行后有关的数据,这些数据可能是人不易识别或理解的数据,数据结构可能是:
数据 := <目标智能设备ID ><功能操作><结果><状态>……;
S2007:操作接口模块将所述反馈数据传给AI模块;
S2008:AI模块对所述反馈数据进行处理,生成文字形式的自然语言信息,然后将所述文字形式的自然语言信息交由语音处理模块转换为语音形式的自然语言信息,再传回AI模块;
这里,会得到智能空调即将回应的自然语言信息,例如是“空调已打开并设定在26度,运转一切正常”。
S2009:AI模块通过音频播放模块播放所述语音形式的自然语言信息。
人和智能设备的交互与智能设备之间的交互,最大的区别是人直接通过语音和智能设备进行交互,自然语言信息直接通过话音被所述装置采集并处理,同时,智能设备通过所述装置回应的也是语音信息。这里需要指出的是,人通过智能手机与智能设备交互,在本发明的范畴内实际上是智能设备与智能设备的交互。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种支持自然语言交互的装置,内置在智能设备中,包括:
网络接口模块,支持通过有线网络和无线网络方式,接收或发送自然语言信息,属于所述装置的外部接口;所述自然语言信息包括语音形式的自然语言信息和文字形式的自然语言信息;
音频采集模块,支持声音采集并转化为语音文件,属于所述装置的外部接口;
音频播放模块,支持语音文件的播放,属于所述装置的外部接口;
语音处理模块,对语音形式的自然语言信息进行语音识别,转换为文字形式的自然语言信息,或者,将文字形式的自然语言信息转换为语音形式的自然语言信息;
操作接口模块,与智能设备的控制接口连接,对智能设备进行操控,并获得智能设备的反馈数据,所述反馈数据包括智能设备的操控结果与过程数据,以及智能设备的运行状态数据;
AI模块,是所述装置的智能数据处理中心,由自然语言处理单元和自然语言例句库组成,用于解析自然语言信息,获得智能设备的控制指令和附加信息,以及将智能设备返回的所述反馈数据转换成自然语言信息;
所述AI模块分别与所述网络接口模块、所述音频采集模块、所述音频播放模块、所述语音处理模块和所述操作接口模块连接。
2.根据权利要求1所述的支持自然语言交互的装置,其特征在于,所述自然语言处理单元首先提取所述自然语言信息的关键字,接着根据智能设备的语义场景,得到关键字的语义,最后根据所述自然语言例句库和所述关键字的语义进行关键信息提取,获取所述自然语言信息的解析结果。
3.根据权利要求1所述的支持自然语言交互的装置,其特征在于,所述自然语言处理单元还包括:根据所述自然语言例句库以及智能设备的语义场景,将智能设备返回的所述反馈数据转换成自然语言信息。
4.根据权利要求1所述的支持自然语言交互的装置,其特征在于,所述自然语言例句库根据智能设备的语义场景,分类存储了人与智能设备、智能设备与智能设备之间的各种典型交互的自然语言句子。
5.一种基于自然语言的智能设备交互方法,分为如下步骤:
源智能设备向目标智能设备发送自然语言信息;
目标智能设备接收并解析自然语言信息,做出与自然语言信息相应的动作;
目标智能设备向源智能设备回应自然语言信息;
所述自然语言信息包括语音形式的自然语言信息和文字形式的自然语言信息。
6.根据权利要求5所述的交互方法,其特征在于,所述源智能设备向目标智能设备发送自然语言信息,包括:
通过网络接口模块发送所述自然语言信息;或者,
通过音频播放模块播放所述自然语言信息。
7.根据权利要求5所述的交互方法,其特征在于,所述目标智能设备接收并解析自然语言信息,包括:
网络接口模块接收所述自然语言信息,传给AI模块;或者,音频采集模块采集声音信号,生成语音形式的自然语言信息,传给AI模块;
AI模块查看所述自然语言信息是否为语音形式,如果是,则将所述自然语言信息传给语音处理模块,由语音处理模块对所述自然语言信息进行语音识别,转换为文字形式的自然语言信息,再传回AI模块;如果不是,则转到下一步;
AI模块对所述自然语言信息进行解析,得到其中的功能指令和附加信息;
AI模块通过操作接口模块将所述功能指令传给目标智能设备的控制接口。
8.根据权利要求5所述的交互方法,其特征在于,所述做出与自然语言信息相应的动作,包括:
目标智能设备根据其控制接口收到的功能指令,做出相应的功能操作;
目标智能设备通过其控制接口向操作接口模块传回所述功能操作的反馈数据;
所述反馈数据包括所述功能指令的执行结果和执行过程数据,以及目标智能设备的运行状态数据。
9.根据权利要求5所述的交互方法,其特征在于,所述目标智能设备向源智能设备回应自然语言信息,包括:
操作接口模块将反馈数据传输给AI模块;
AI模块对所述反馈数据进行处理,生成文字形式的自然语言信息;
AI模块将所述文字形式的自然语言信息传给语音处理模块,由所述语音处理模块将所述文字形式的自然语言信息转换为语音形式的自然语言信息,再传回AI模块;
AI模块根据预置的策略,将所述语音形式的自然语言信息或文字形式的自然语言信息,通过网络接口模块发回给源智能设备;或者,将所述语音形式的自然语言信息,通过音频播放模块进行播放。
10.根据权利要求5所述的交互方法,其特征在于,还包括:
音频采集模块采集人发出的语音信号,生成语音形式的自然语言信息,传给AI模块;
AI模块将所述语音形式的自然语言信息交由语音处理模块进行语音识别,转换为文字形式的自然语言信息,再传回AI模块;
AI模块对所述文字形式的自然语言信息进行解析,得到其中的功能指令和附加信息;
AI模块通过操作接口模块将所述功能指令传给智能设备的控制接口;
智能设备根据其控制接口收到的所述功能指令,做出相应的功能操作;
智能设备通过其控制接口向操作接口模块传回所述功能操作的反馈数据;所述反馈数据包括所述功能指令的执行结果和执行过程数据,以及智能设备的运行状态数据;
操作接口模块将所述反馈数据传给AI模块;
AI模块对所述反馈数据进行处理,生成文字形式的自然语言信息,然后将所述文字形式的自然语言信息交由语音处理模块转换为语音形式的自然语言信息,再传回AI模块;
AI模块通过音频播放模块播放所述语音形式的自然语言信息。
CN201711327864.4A 2017-12-13 2017-12-13 一种支持自然语言交互的装置和方法 Pending CN108040111A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711327864.4A CN108040111A (zh) 2017-12-13 2017-12-13 一种支持自然语言交互的装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711327864.4A CN108040111A (zh) 2017-12-13 2017-12-13 一种支持自然语言交互的装置和方法

Publications (1)

Publication Number Publication Date
CN108040111A true CN108040111A (zh) 2018-05-15

Family

ID=62102563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711327864.4A Pending CN108040111A (zh) 2017-12-13 2017-12-13 一种支持自然语言交互的装置和方法

Country Status (1)

Country Link
CN (1) CN108040111A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108650324A (zh) * 2018-05-17 2018-10-12 深圳友讯达科技股份有限公司 农业物联网系统
CN110347451A (zh) * 2019-07-29 2019-10-18 爱投斯智能技术(深圳)有限公司 一种基于ai和iot的通用人机交互系统和方法
CN110554695A (zh) * 2019-08-13 2019-12-10 安徽农业大学 一种支持自然语言接口的室内避障环境监测小车
CN113407687A (zh) * 2021-06-04 2021-09-17 海南师范大学 一种基于人工智能的自然语言处理设备
CN113593573A (zh) * 2021-07-30 2021-11-02 思必驰科技股份有限公司 机器交互方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015163831A1 (en) * 2014-04-21 2015-10-29 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi A programmable logic circuit for night sight systems
CN105137789A (zh) * 2015-08-28 2015-12-09 青岛海尔科技有限公司 一种智能物联家电的控制方法、装置及相关设备
CN106448664A (zh) * 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的系统及方法
CN106557034A (zh) * 2015-09-29 2017-04-05 北京北信源软件股份有限公司 一种基于即时通信的智能家居控制方法
CN107085463A (zh) * 2016-02-15 2017-08-22 北京北信源软件股份有限公司 一种支持自然语言信息交互的智能设备控制体系和方法
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015163831A1 (en) * 2014-04-21 2015-10-29 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi A programmable logic circuit for night sight systems
CN105137789A (zh) * 2015-08-28 2015-12-09 青岛海尔科技有限公司 一种智能物联家电的控制方法、装置及相关设备
CN106557034A (zh) * 2015-09-29 2017-04-05 北京北信源软件股份有限公司 一种基于即时通信的智能家居控制方法
CN107085463A (zh) * 2016-02-15 2017-08-22 北京北信源软件股份有限公司 一种支持自然语言信息交互的智能设备控制体系和方法
CN106448664A (zh) * 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的系统及方法
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108650324A (zh) * 2018-05-17 2018-10-12 深圳友讯达科技股份有限公司 农业物联网系统
CN110347451A (zh) * 2019-07-29 2019-10-18 爱投斯智能技术(深圳)有限公司 一种基于ai和iot的通用人机交互系统和方法
CN110347451B (zh) * 2019-07-29 2022-02-11 爱投斯智能技术(深圳)有限公司 一种基于ai和iot的通用人机交互系统和方法
CN110554695A (zh) * 2019-08-13 2019-12-10 安徽农业大学 一种支持自然语言接口的室内避障环境监测小车
CN113407687A (zh) * 2021-06-04 2021-09-17 海南师范大学 一种基于人工智能的自然语言处理设备
CN113407687B (zh) * 2021-06-04 2022-06-07 海南师范大学 一种基于人工智能的自然语言处理设备
CN113593573A (zh) * 2021-07-30 2021-11-02 思必驰科技股份有限公司 机器交互方法和装置
CN113593573B (zh) * 2021-07-30 2024-01-12 思必驰科技股份有限公司 机器交互方法和装置

Similar Documents

Publication Publication Date Title
CN108040111A (zh) 一种支持自然语言交互的装置和方法
CN103377252B (zh) 在物联网中进行数据过滤的方法和装置
CN106294854B (zh) 一种用于智能机器人的人机交互方法及装置
EP3796110A1 (en) Method and apparatus for determining controlled object, and storage medium and electronic device
CN107728780A (zh) 一种基于虚拟机器人的人机交互方法及装置
CN106952646A (zh) 一种基于自然语言的机器人交互方法和系统
CN107294837A (zh) 采用虚拟机器人进行对话交互的方法和系统
CN109448709A (zh) 一种终端投屏的控制方法和终端
CN109065035A (zh) 信息交互方法及装置
CN106653008A (zh) 一种语音控制方法、装置及系统
CN102985922A (zh) 在计算空间中管理分布计算的方法和装置
CN103477590B (zh) 基于管理规则的配置方法和设备
CN109688474A (zh) 电视语音控制方法、装置和计算机可读存储介质
CN116483980A (zh) 人机交互方法、装置及系统
CN106817144A (zh) 多维度机器人系统
CN106127526A (zh) 智能机器人系统及其工作方法
CN108986810A (zh) 一种通过耳机实现语音交互的方法及装置
CN109951430A (zh) 一种数据处理方法及装置
CN106326087B (zh) 基于机器人操作系统的网页体验方法及系统
CN106356056A (zh) 语音识别方法和装置
CN104793984B (zh) 一种设备的建模方法、装置和云平台
CN110086946A (zh) 智能聊天语音控制方法、装置、计算机设备及存储介质
CN109445384A (zh) 一种多设备控制系统
CN110347451B (zh) 一种基于ai和iot的通用人机交互系统和方法
CN116701601A (zh) 人机交互的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180515