CN114898751B - 自动化配置方法及系统、存储介质和电子设备 - Google Patents

自动化配置方法及系统、存储介质和电子设备 Download PDF

Info

Publication number
CN114898751B
CN114898751B CN202210682080.8A CN202210682080A CN114898751B CN 114898751 B CN114898751 B CN 114898751B CN 202210682080 A CN202210682080 A CN 202210682080A CN 114898751 B CN114898751 B CN 114898751B
Authority
CN
China
Prior art keywords
information
identification information
intelligent
user
integrity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210682080.8A
Other languages
English (en)
Other versions
CN114898751A (zh
Inventor
何军响
杨明川
李伟
刘振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210682080.8A priority Critical patent/CN114898751B/zh
Publication of CN114898751A publication Critical patent/CN114898751A/zh
Application granted granted Critical
Publication of CN114898751B publication Critical patent/CN114898751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开涉及计算机技术领域,涉及自动化配置方法及系统、存储介质和电子设备,包括:对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,根据检测结果生成第二识别信息,第二识别信息用于指示用户对智能平台内的多个智能设备的配置意图,动态知识体系是根据所述智能平台内的当前设备信息构建;根据所述第二识别信息生成自动化配置信息,自动化配置信息包括所述多个智能设备的状态之间的联动关系。本公开结合用户语音的识别结果和动态知识体系,自动生成反映用户操作意图的自动化配置信息,实现智能设备的状态之间的联动,降低智能平台的操作门槛,利于智能生活的普及。

Description

自动化配置方法及系统、存储介质和电子设备
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种自动化配置方法、自动化配置系统、存储介质和电子设备。
背景技术
随着计算机与互联网技术领域的发展,人们的生活逐渐迈入智能化时代,各种智能平台层出不穷,例如智能家居、智能安保等。智能平台内包括多种智能设备,如机器人、智能音响、音视频采集设备、灯光设备、传感器等。智能化主要体现在多种智能设备在不同的应用场景下实现场景联动,例如:在晚上19点后,若大门解锁,则客厅灯打开。
但是,相关技术通过用户手动地在操作界面上创建各智能设备之间的联动规则,例如通过手机APP(Application,应用程序)或Web(World Wide Web,全球广域网)平台上进行联动设置,然而对操作者提出较高的要求,操作效率低,限制了智能平台的使用群体,影响智能生活的普及。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种自动化配置方法及系统、计算机存储介质和电子设备,进而提高智能平台的操作自动化水平,提高智能生活的普及。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种自动化配置方法,包括:
对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,所述第二识别信息用于指示用户对智能平台内的多个智能设备的配置意图,所述动态知识体系是根据所述智能平台内的当前设备信息构建;
根据所述第二识别信息生成自动化配置信息,所述自动化配置信息包括所述多个智能设备的状态之间的联动关系
在本公开的一种示例性实施例中,所述对接收到的用户语音进行语音识别和语义理解,得到第一识别信息,包括:
对所述用户语音进行语音识别处理得到文本数据;
通过对所述文本数据进行关键词提取和语义识别,得到所述文本数据的多个关键信息;
确定各所述关键信息之间的关系,所述关系用于指示各所述关键信息之间的逻辑执行关系;
根据所述关键信息和所述关系,得到所述第一识别信息。
在本公开的一种示例性实施例中,所述基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,包括:
根据信息完整性条件,对所述的第一识别信息的完整性进行检测,所述信息完整性条件用于指示所述第一识别信息至少包括触发条件信息和执行动作信息;
基于所述动态知识体系,对所述第一识别信息进行合理性检测;
在所述第一识别信息通过完整性检测和合理性检测后,根据通过检测后的第一识别信息得到所述第二识别信息。
在本公开的一种示例性实施例中,所述根据信息完整性条件,对所述的第一识别信息的完整性进行检测,包括:
若所述第一识别信息不满足所述信息完整信息条件,则向用户终端发送完整性调整信息;
响应于基于所述完整性调整信息的第一识别信息调整操作,对调整后的第一识别信息的完整性进行检测,直到调整后的第一识别信息满足所述信息完整性条件。
在本公开的一种示例性实施例中,所述基于所述动态知识体系,对所述第一识别信息进行合理性检测,包括:
获取所述第一识别信息中的目标触发条件信息和目标执行动作信息;
若所述目标触发条件信息和目标执行动作信息中的至少一个所对应的第一设备信息,与所述动态知识体系中对应的第二设备信息不匹配,则向用户终端发送合理性调整信息;
响应于基于所述合理性调整信息的第一识别信息调整操作,对调整后的第一识别信息进行合理性检测,直到调整后的第一识别信息所对应的第一设备信息与所述动态知识体系中对应的第二设备信息匹配。
在本公开的一种示例性实施例中,所述第二设备信息至少包括设备属性和所述设备属性对应的当前状态信息。
在本公开的一种示例性实施例中,所述根据所述第二识别信息生成自动化配置信息,包括:
将所述第二识别信息,按照所述智能平台对应的配置规则信息生成所述自动化配置信息;
将所述自动化配置信息发送至所述智能平台,以使所述智能平台对所述自动化配置信息进行语法校验。
在本公开的一种示例性实施例中,所述接收到的用户语音包括通过与用户终端进行多轮对话获得的多条用户语音。
根据本公开的一个方面,提供一种自动化配置系统,所述自动化配置系统通过系统接口与智能平台连接,所述系统包括:
意图引擎模块,用于对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
智能决策模块,用于基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,所述第二识别信息用于指示用户对所述智能平台内的多个智能设备的配置意图,所述动态知识体系是根据所述智能平台内的当前设备信息构建;
规则引擎模块,用于根据所述第二识别信息生成自动化配置信息,所述自动化配置信息包括所述多个智能设备的状态之间的联动关系。
根据本公开的一个方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
本公开的示例性实施例中的自动化配置方法,根据对用户语音的语音识别和语义理解,得到第一识别信息,基于动态知识体系对第一识别信息的完整性和合理性进行检测,并根据检测结果生成用于指示用户对智能平台内的多个智能设备的配置意图的第二识别信息,最后根据第二识别信息生成自动化配置信息,以实现多个智能设备的状态之间的联动关系。一方面,用户能将智能设备的操作配置意图以语音的方式输入,通过对用户语音的识别和语义理解即可自动创建自动化配置信息,无需任何手动配置,降低智能平台的操作门槛,增加智能生活的普及;另一方面,根据智能平台内的当前设备信息构建的动态知识体系,在生成自动化配置信息的过程中,以动态知识体系为基础,对第一识别信息的完整性和合理性进行推理与检测,以实时确保生成的自动化配置信息的准确性,保证智能平台的生态秩序和稳定性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示出了根据本公开示例性实施例所涉及的一种应用环境图;
图2示出了根据本公开示例性实施例的一种自动化配置方法的流程图;
图3示出了根据本公开示例性实施例的一种知识体系图谱的示意图;
图4示出了根据本公开示例性实施例的一种对用户语音进行语音识别和语义理解获得第一识别信息的实现方式的流程图;
图5示出了根据本公开示例性实施例的一种通过多轮对话模式获取用户语音的流程图;
图6示出了根据本公开示例性实施例的一种基于动态知识体系辅助生成第二识别信息的实现方式的流程图;
图7示出了根据本公开示例性实施例的一种应用场景下的自动化配置方法的流程图;
图8示出了根据本公开示例性实施例的另一种应用场景下的自动化配置方法的流程图;
图9示出了根据本公开示例性实施例的再一种应用场景下的自动化配置方法的流程图;
图10示出了根据本公开示例性实施例的自动化配置系统的结构示意图;
图11示出了根据本公开示例性实施例的一种应用场景下的自动化配置系统各模块的架构图;
图12示出了根据本公开示例性实施例的一种应用场景下的自动化配置系统各模块的交互示意图;
图13示出了根据本公开示例性实施例的存储介质的示意图;以及
图14示出了根据本公开示例性实施例的电子设备的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
现在将参考附图更全面地描述示例性实施方式。然而,示例性实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施例使得本公开将更加全面和完整,并将示例性实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
在本领域的相关技术中,各种智能平台层出不穷,例如智能家居、智能安保等。智能平台内包括多种智能设备,如机器人、智能音响、音视频采集设备、灯光设备、传感器等。智能化主要体现在多种智能设备在不同的应用场景下实现场景联动,例如:在晚上19点后,若大门解锁,则客厅灯打开。
然而,相关技术通常由用户通过手机APP或Web平台等,在操作界面上手动创建多个智能设备的联动规则,但此种操作方式更适用于具有一定知识储备的人,对于普通大众而言,理解和操作均有难度,尤其对于较复杂的场景联动,从而限制了智能平台的使用群体,也不利于智能生活的普及。
基于此,在本公开示例性实施例中,首先提供了一种自动化配置方法。应用于自动化配置系统,参考图1为本公开示例性实施例所涉及的一种应用环境图。如图1所示,自动化配置系统110通过系统接口120与智能平台130进行数据交互和连通。在智能平台130中,还可以包括各种智能设备,其中智能设备包括但不限于智能开关、灯、空调、人体传感器、门窗传感器、音视频采集设备(如摄像头)、电视、冰箱等。其中,智能设备的数量为至少一个,为了实现智能设备的场景联动,则智能设备的数量为多个。
其中,自动化配置系统110可以部署于移动终端中,移动终端可以为智能手机、平板电脑、台式电脑、可穿戴电子设备等,在此不做限定。在实际实施中,移动终端用于与用户之间进行交互,方便用户通过移动终端的操作界面来输入用户语音,以使自动化配置系统110根据用户语音生成自动化配置信息,并将自动化配置信息下发至智能平台130。当然,自动化配置系统110也可以是独立于移动终端,自动化配置系统110与移动终端之间建立无线通信。
值得说明的是,图1中的智能终端的数目仅仅是示意性的,根据实际实施需要,可以具有任意数据的智能终端,本公开对此不做特殊限定。
如图2示出了根据本公开实施例的一种自动化配置方法的流程图,如图2所示,本公开实施例的自动化配置方法可以包括步骤S210至步骤S230:
步骤S210:对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
步骤S220:基于动态知识体系,对第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,第二识别信息用于指示用户对智能平台内的多个智能设备的配置意图,动态知识体系是根据智能平台内的当前设备信息构建;
步骤S230:根据第二识别信息生成自动化配置信息,自动化配置信息包括多个智能设备的状态之间的联动关系。
根据本公开实施例的自动化配置方法,用户能将智能设备的操作配置意图以语音的方式输入,通过对用户语音的识别和语义理解即可自动创建自动化配置信息,无需任何手动配置,降低智能平台的操作门槛,增加智能生活的普及;根据智能平台内的当前设备信息构建的动态知识体系,在生成自动化配置信息的过程中,以动态知识体系为基础,对第一识别信息的完整性和合理性进行推理与检测,以实时确保生成的自动化配置信息的准确性,保证智能平台的生态秩序和稳定性。
下面结合图2对本公开实施例的自动化配置方法进行详细阐述。
在步骤S210中,对接收到的用户语音进行语音识别和语义理解,得到第一识别信息。
在本示例性实施例中,第一识别信息是对接收到的用户语音进行语音识别和语义理解后得到的识别结果,该第一识别信息用于反映用户对智能平台内智能终端的配置意图。
其中,第一识别信息可以是用户输入的完整表达配置意图的单句,则对应的用户语音为完整的单句,例如“离家后,当后院有人进入的时候,自动拍照且自动报警”。或者,用户语音包括与用户终端通过多轮次对话获得的多条用户语音,通过对多条用户语音进行语音识别和语义理解,得到第一识别信息。例如,系统提示“请输入触发条件信息”,则接收用户输入的第一条用户语音“当后院有人进入时”,然后系统提示“请输入限制条件信息”,则接收用户输入的第二条用户语音“天黑时”,最后系统提示“请输入执行动作信息”,则接收用户输入的第三条用户语音“自动拍照且自动报警”,相应的,通过对接收到的各条用户语音进行语音识别和语义理解后,也得到第一识别信息为“离家后,当后院有人进入的时候,自动拍照且自动报警”。
在对用户语音进行语音识别和语义理解时,可以向将用户语音转换为文本数据,例如采用ASR(Automatic Speech Recognition,自动语音识别技术)技术,将用户语音转换为方便系统处理的文本数据。当然,本公开实施例中将用户语音转换为文本数据的方式不限于此,可以根据实际应用需求选择相应的识别技术。
对用户语音进行语音识别和语义理解时,可以预先通过采集大量通用语料和智能平台控制相关的特定语料构建训练样本集,并利用训练样本集对关键信息提取模型和意图分类模型进行训练,以用于提取文本数据中的第一识别信息。
在步骤S220中,基于动态知识体系,对第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息。
在本示例性实施例中,第二识别信息用于指示用户对智能平台内的多个智能设备的配置意图。其中,第二识别信息可以与第一识别信息相同,即若基于动态知识体系,第一识别信息的完整性和合理性检测通过,表明用户已完整表达配置意图,且该配置意图符合生成自动化配置信息的要求,则第二识别信息与第一识别信息相同。相反,若第一识别信息的完整性和合理性中的至少一个未通过检测,则需要对第一识别信息做出调整,以使得调整后的第一识别信息符合生成自动化配置信息的要求,最终得到第二识别信息。
举例而言,若第一识别信息为“晚上开灯”未完成检测,则对第一识别信息进行调整后为“晚上17点后,门锁打开,开灯”,即得到第二识别信息。
动态知识体系是根据智能平台内的当前设备信息构建,自动化配置系统通过系统接口获取智能平台内部的当前设备信息。其中,当前设备信息包括智能平台内部智能设备的软件设备信息和硬件设备信息,软件设备信息包括但不限于定位信息、天气信息、运营商信息、时间信息等,硬件设备信息包括但不限于设备类型、设备内存、屏幕分辨率等。基于获得的当前设备信息可以确定设备属性和设备属性所对应的当前状态信息。例如,后院是否存在摄像头,后院摄像头是否处于联网状态,等等。
在一种可能的实施方式中,可以基于采集到的当前设备信息构建动态知识体系图谱,以基于动态知识体系图谱所反映出的各智能设备之间的内在规律性和逻辑关联性,用于对第一识别信息的完整性和合理性进行检测。
其中,知识体系图谱可以由不同类型的节点和边以及这些节点和边具有的属性共同构成的关系图(Graph)型数据结构。如图3所示,其中的圆点表示节点,黑色和白色的圆点分别代表不同类型的节点;线条表示边,实线和虚线的线条代表不同类型的边。在知识体系图谱中,关系图型数据结构的节点称之为“实体”(Entity),实体代表现实世界的主体事物,例如产品、用户、功能等主体都可以作为知识体系图谱中的实体,显然它们是不同类型的实体。关系图型数据结构的边被称之为“关系”(Relation),关系代表实体之间的任何联系,例如,智能设备具有某种功能,用户使用了该智能设备的某种功能,用户将一个智能设备与另一智能设备关联,这些联系都可以用关系来表示,这些关系也分别归属于不同类型。实体和关系都可以通过“属性”来表示自身的特性;例如用户作为实体,可以具有性别、身高等属性以及对应的属性值;用户使用了智能终端的某种功能,这一“使用”关系可以具有用户的使用次数、使用频率、平均使用时长等属性以及对应的属性值。可见,实体、关系以及属性是知识体系图谱中的基本概念。从具体的数据结构表现形式来看,通常用三元数组表示知识体系图谱中的实体、关系及属性,例如<实体A-关系-实体B>,<实体-属性-属性值>,<关系-属性-属性值>等三元数组。
值得说明的是,由于智能平台内的智能终端的当前设备信息可以根据用户需求进行动态调整,动态知识体系也随之相应调整。例如,某摄像头掉线,则在动态知识体系中也相应更新该摄像头的状态。
基于获得的智能平台内部的当前设备信息构建动态知识体系,挖掘出这些设备信息等在状态上表现的内在规律性和逻辑关联性,才能够为第一识别信息的完整性和合理性检测提供依据。
在步骤S230中,根据第二识别信息生成自动化配置信息。
在本示例性实施例中,自动化配置信息包括多个智能设备的状态之间的联动关系。例如:“人体传感器检测到的人体移动,卧室灯打开”、“手机的显示时间为晚上11点30分,则关闭电视”。
自动化配置信息为智能平台可识别的机器语言,在获得第二识别信息后,可以将第二识别信息转换为智能平台可识别的自动化配置信息,进而使智能平台基于自动化配置信息创建自动化规则。例如,智能平台支持YAML脚本语言,则按照YAML脚本语言规范,将第二识别信息生成自动化配置信息。
在本公开一示例性实施例中,还提供一种对用户语音进行语音识别和语义理解获得第一识别信息的实现方式。对接收到的用户语音进行语音识别和语义理解,得到第一识别信息可以包括步骤S410至步骤S440:
步骤S410:对用户语音进行语音识别处理得到文本数据。
在本示例性实施例中,对用户语音进行语音识别处理,以将用户语音转换为文本数据。其中,可以对用户语音进行预处理,如语音活动检测、降噪、回声消除、混响消除、声源定位和波束形成等,以使处理后的语音信号更能反映语音的本质特征。其中,可采用相关技术的语音识别技术对用户语音进行识别,如ASR技术,本公开对此不做特殊限定。
步骤S420:通过对文本数据进行关键词提取和语义识别,得到文本数据的多个关键信息。
在获得文本数据后,可以采用预先训练好的关键信息抽取模型和意图分类模型,从文本数据中提取多个关键信息。例如,用户输入了“离家后,当后院有人进入的时候,自动拍照且自动报警”,则通过对文本数据进行关键词提取和语义识别,则得到多个关键信息为“地点:后院;触发条件:后院的摄像头、目标检测、发现人;执行条件:离家;执行动作1为:后院的摄像头拍照,执行动作2为:报警,推送报警信息至用户手机(可选)”。
在一种可能的实施方式中,用户输入的为完整表达配置意图的用户语音,例如“离家后,当后院有人进入的时候,自动拍照且自动报警”,则通过关键词提取和语义识别,得到以上多个关键信息。
在另一种可能的实施方式中,也能通过多轮对话的方式,获得多条用户语音,并分别对每条用户语音进行语音识别和语义理解。如图5示出了根据本公开一示例性实施例的采用多轮对话的方式接收用户语音的示意图,如图5所示,首先,用户开启多轮对话模式,本公开实施例的自动化配置系统提示“请输入自动化名称”;然后用户输入用户语音“xxxx”;接着,自动化配置系统提示“请问触发条件是什么”,则用户输入用户语音“当后院有人进入的时候”;进一步的,自动化配置系统提示“是否还需要其它触发条件”,则用户可以选择是否继续输入其它触发条件,例如用户继续输入用户语音“有人在大门在移动”;更进一步的,自动化配置系统提示“请输入执行动作”,则用户输入用户语音“摄像头拍照”,相应的,自动化配置系统还可以继续提示“是否还需要其它执行动作”,则用户可以选择是否继续输入其它执行动作,例如用户输入用户语音“将照片发送至用户终端”。
通过多轮对话的方式,获得的用户语音为“当后院有人进入的时候,有人在大门前移动,拍照且将照片发送至用户终端”,由此可知,本公开实施例可以根据实际应用需求选择完整输入用户语音,还是通过多轮对话的方式输入用户语音,本公开实施例对此不做特殊限定。
步骤S430:确定各关键信息之间的关系,其中关系用于指示各关键信息之间的逻辑执行关系。
在本示例性实施例中,在获得各关键信息后,可以将动态条件作为触发条件信息,例如“当后院有人进入的时候”、“有人在大门前移动”,将此类动态条件作为触发条件,而将包含智能设备的关键信息作为执行动作信息,例如“摄像头拍照”、“将照片发送至用户终端”,而其他关键信息则作为执行条件信息,如“中午12点至13点”,等等。
步骤S440:根据关键信息和关键信息之间的关系,得到第一识别信息。
在本示例性实施例中,可以根据关键信息和关键信息之间逻辑执行关系,生成第一识别信息。
通过本示例性实施例,可以通过语音交互的方式获知用户对智能平台内的智能设备的配置意图,得到第一识别信息,方便任何群体对智能平台的操控,有利于智能生活的普及。
在本公开一示例性实施例中,可以以智能平台内智能终端的当前设备信息为基础,辅助生成用户语音的识别结果,即本公开实施例还提供一种基于动态知识体系辅助生成第二识别信息的实现方式。基于动态知识体系,对第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息可以包括步骤S610至步骤S630:
步骤S610:根据信息完整性条件,对所述第一识别信息的完整性进行检测。
在本示例性实施例中,信息完整性条件用于指示识别信息至少包括触发条件信息和执行动作信息,触发条件信息为触发智能平台内智能设备执行动作信息的条件,例如“后院有人进入”、“窗户被打开”等,执行动作信息为智能设备所执行的动作,例如“摄像头拍照”、“灯打开”等。值得说明的是,触发条件信息的数量可以为一个或多个,若触发条件信息的数量为多个,还可以设置各个触发条件之间的关系,执行动作信息的数量也可以为一个或多个,若执行动作信息的数量为多个,也可以设置各个执行动作之间的关系(如执行先后关系)等。
其中,若第一识别信息不满足信息完整信息条件,则向用户终端发送完整性调整信息,然后响应于用户基于完整性调整信息的第一识别信息调整操作,对调整后的第一识别信息的完整性进行检测,直到调整后的第一识别信息满足信息完整性条件。
例如,第一识别信息仅包括执行动作信息“摄像头拍照”,缺少触发条件信息,则向用户发送“缺少触发条件,请输入”的完整性调整信息,并在接收用户的用户语音“后院有人进入的时候,摄像头拍照”后,继续进行完整性检测,直到调整后的第一识别信息满足信息完整性条件。
在一种可能的实施方式中,信息完整性条件还可以包括执行条件信息,例如“中午12点至13点”,即信息完整性条件包括触发条件信息、执行条件信息和执行动作信息,以根据这三个信息对第一识别信息的完整性进行检测,检测过程与上述检测过程相同,本公开对此不再赘述。
其中,完整性调整信息可以以语音的方式反馈至用户终端,使得通过与用户之间的语音交互,不断完善第一识别信息,使第一识别信息通过完整性检测,即得到第二识别信息,以提高第一识别信息的完整性,操作效率高。
步骤S620:基于动态知识体系,对第一识别信息进行合理性检测。
在本示例性实施例中,可以基于动态知识体系,对第一识别信息进行合理性检测,可以包括:
获取第一识别信息中的目标触发条件信息和目标执行动作信息;
若目标触发条件信息和目标执行动作信息中的至少一个所对应的第一设备信息,与动态知识体系中对应的第二设备信息不匹配,则向用户终端发送合理性调整信息;
响应于基于合理性调整信息的第一识别信息调整操作,对调整后的第一识别信息进行合理性检测,直到调整后的第一识别信息所对应的第一设备信息与动态知识体系中对应的第二设备信息匹配。
其中,第二设备信息至少包括设备属性和设备属性所对应的当前状态信息。设备属性包括但不限于设备位置、设备类型、设备数量以及设备所支持的服务等,当前状态信息包括但不限于联网状态、开启或关闭状态等。
在实际实施时,用户语音识别到的第一识别信息中,可能存在不合理的需求,例如用户想要在后院有人的情况下进行拍照,但是基于动态知识体系获知,后院实际不存在具备人体识别能力的摄像头,即目标触发条件信息和目标执行动作信息中的至少一个所对应的第一设备信息,与动态知识体系中对应的第二设备信息不匹配,则可以向用户终端发送合理性调整信息,例如“当前智能平台不能完整您所设定的触发条件,请调整”。基于此,可以响应用户的第一识别信息调整操作,获取调整后的第一识别信息,并对调整后的第一识别信息进行合理性检测,直到调整后的第一识别信息所对应的第一设备信息,与动态知识体系中对应的第二设备信息匹配。
以动态知识体系为基础,对第一识别信息进行合理性检测,提高最终的第二识别信息的合理性和可执行性。
在本公开一示例性实施例中,还提供一种根据第二识别信息生成自动化配置信息的实现方式,可以包括:将第二识别信息,按照智能平台对应的配置规则信息生成自动化配置信息,将自动化配置信息发送至智能平台,以使智能平台对自动化配置信息进行语法校验,以确保自动化配置信息配置无误。
值得说明的是,对于不同智能平台,所支持的脚本语音不同,因此将第二识别信息按照智能平台对应的配置规则信息,生成自动化将配置信息,得到智能平台可以理解的机器语言,以便后续智能平台根据自动化配置信息创建自动化规则。
此外,本公开实施例还可以删除已存在的自动化配置信息,并且将最终生成的自动化规则保存在智能平台,而本公开实施例的自动化配置系统不保存自动化配置规则,仅保存生成自动化配置信息的过程记录,以便进行回溯、跟踪和优化。
步骤S630:在第一识别信息通过完整性检测和合理性检测后,根据检测结果得到第二识别信息。
在本示例性实施例中,可以在第一识别信息通过完整性检测和合理性检测后,根据检测结果得到第二识别信息。其中,若第一识别信息未经调整,则直接将第一识别信息确定为第二识别信息,若第一识别信息在完整性检测或合理性检测的过程中经过调整,则将调整后的第一识别信息确定为第二识别信息。
根据检测结果得到第二识别信息,使第二识别信息既与智能平台内当前设备信息匹配,也满足智能平台的自动化配置需求,从而提高生成的自动化配置信息的准确性、可执行性。
在生成自动化配置信息后,可以将自动化配置信息通过系统接口发送至智能平台,以使智能平台根据自动化配置信息创建自动化规则,并将创建结果反馈至自动化配置系统,相应的,自动化配置系统可以将创建结果反馈至用户终端。
图7至9示出了应用场景下的自动化配置方法的流程图,下面结合图7至9,以创建多轮对话的方式获取用户语音,智能平台以智能家居平台为例,对本公开实施例的自动化配置方法进行说明。
步骤S710:用户创建自动化规则生成对话。
步骤S720:自动化配置系统向用户终端发送“请问自动化规则名称”。
步骤S730:自动化配置系统接收用户发送的用户语音“xxxx”,并进行语音识别和语义理解后,检测智能家居平台中是否已存在“xxxx”的自动化规则名称,若已存在,则向用户反馈提示信息“存在同名”,以使用户对自动化规则名称进行调整,直到再次检测智能平台中不存在重复的自动化规则名称。
其中,用户与本公开实施例的自动化配置系统之间通过语音交互的方式,自动化配置系统接收用户语音,并将其转换为文本数据,以对文本数据进行识别;相应的,自动化配置系统将反馈至用户终端的文本数据转换为语音,以方便用户接听。在后续步骤中,自动化配置系统与用户终端之间的交互数据均采用此种处理方式,之后不再赘述。
步骤S740:当用户设置的自动化规则名称在智能家居平台中不存在重复的自动化规则名称后,可以在智能家居平台预留内存,并分配对应的自动化标识。
其中,用户在后续创建的自动化规则的相关信息将存储于自动化标识对应的内存中。
步骤S750:自动化配置系统向用户终端发送“请问触发条件是什么”。
步骤S760:自动化配置系统接收用户发送的用户语音“触发条件为yyyy”,并进行语音识别和语义理解后,基于动态知识体系,检测智能家居平台内智能设备是否支持该类型的触发条件。
其中,若基于动态知识体系,检测智能家居平台内智能设备支持该类型的触发条件,还可以通过步骤S770,向用户终端发送“是否还需要其它触发条件”,即触发条件的数量可以为多个,本公开实施例对触发条件的数量不做特殊限定。
若基于动态知识体系,检测智能家居平台内智能设备不支持该类型的触发条件,还可以通过步骤S780,向用户终端发送“当前不支持该类型的触发条件”的提醒信息,可选地,同时向用户终端发送“是否列出当前支持的触发条件类型”。
例如,若用户输入的触发条件为“当后院有人进入的时候”,自动化配置系统基于动态知识体系,检测后院存在视频设备可以实现人体识别的功能,则记录该触发条件。若基于动态知识体系,检测后院不存在具备人体识别功能的设备,则向用户终端发送提示信息“当前智能家居中不能完成您所设定的触发条件,请提供具备人体识别功能的视频捕捉设备”,或者“是否列出当前智能家居支持的触发条件类型”。
步骤S790,若用户发送“列出支持的触发条件类型”,则自动化配置系统可以基于动态知识体系,获取智能家居平台当前所支持的触发条件类型。
其中,若在自动化配置系统中存在缓存的触发条件类型,则可以基于缓存的触发条件类型反馈至用户终端;若在自动化配置系统中不存在缓存的触发条件类型,则可以基于动态知识体系,检索智能家居平台当前支持的触发条件类型,并反馈至用户终端。
以上完成触发条件的设置,下面结合图8说明执行条件的设置流程。
步骤S810:自动化配置系统向用户终端发送“请输入执行条件”。
步骤S820:自动化配置系统接收用户发送的用户语音“执行条件为zzzz”,并进行语音识别和语义理解后,基于动态知识体系,检测智能家居平台内智能设备是否支持该类型的执行条件。
其中,若检测智能家居平台内智能设备支持该类型的执行条件,则可以向用户终端发送“是否还需要其它执行条件”,即本公开实施例的执行条件的数量可以为多个。若检测智能家居平台内智能设备不支持该类型的执行条件,则可以向用户终端发送提示信息,例如“当前不支持该类型的执行条件”,或者“是否列出当前支持的执行条件类型”。
步骤S830:自动化配置系统接收用户发送的用户语音“列出支持的执行条件类型”,并进行语音识别和语义理解后,自动化配置系统可以基于动态知识体系,获取智能家居平台当前所支持的执行条件类型。
其中,若在自动化配置系统中存在缓存的执行条件类型,则可以基于缓存的执行条件类型反馈至用户终端;若在自动化配置系统中不存在缓存的执行条件类型,则可以基于动态知识体系,检索智能家居平台当前支持的执行条件类型,并反馈至用户终端。
步骤S840:自动化配置系统向用户发送“请设置执行条件的关系”。
其中,由于执行条件的数量可以为多个,执行条件之间的关系可以为同时执行,或者执行至少一个,可以由用户来设置各个执行条件之间的关系。自动化配置系统接收用户语音“执行关系为hhhh”,并返回确认信息至用户终端。
以上完成执行条件的设置,下面结合图9说明执行动作的设置流程。
步骤S910:自动化配置系统向用户终端发送“请输入执行动作”。
步骤S920:自动化配置系统接收用户发送的用户语音“执行动作为dddd”,并进行语音识别和语义理解后,基于动态知识体系,检测智能家居平台内智能设备是否支持该类型的执行动作。
其中,若检测智能家居平台内智能设备支持该类型的执行动作,则可以向用户发送“是否还需要其它执行动作”,即本公开实施例的执行动作的数量可以为多个。若检测智能家居平台内智能设备不支持该类型的执行动作,则可以向用户发送提示信息,例如“当前不支持该类型的执行动作”,或者“是否列出当前支持的执行动作类型”。
步骤S930:自动化配置系统接收用户发送的用户语音“列出支持的执行动作类型”,并进行语音识别和语义理解后,自动化配置系统可以基于动态知识体系,获取智能家居平台当前所支持的执行动作类型。
其中,若在自动化配置系统中存在缓存的执行动作类型,则可以基于缓存的执行动作类型反馈至用户终端;若在自动化配置系统中不存在缓存的执行动作类型,则可以基于动态知识体系,检索智能家居平台当前支持的执行动作类型,并反馈至用户终端。
以上完成执行动作的设置,在步骤S940中,自动化配置系统接收用户触发的结束设置操作,根据以上得到的触发条件、执行条件和执行动作(即识别得到的第二识别信息),生成自动化配置信息。
步骤S950:自动化配置系统发送自动化配置信息至智能家居平台,以使智能家居平台根据自动化配置信息创建自动化规则,并反馈创建结果至自动化配置系统,自动化配置系统将创建结果反馈至用户终端。
值得说明的是,通过多轮对话的方式获取用户语音,可以分别对每个用户语音进行语音识别和语义理解,且在自动化生成的过程中,可以基于动态知识体系实时地进行完整性和合理性检测,以确保设置的准确性。并且,在自动化配置体系识别用户语音后,还可以根据相似度算法检测出文本数据的同指向信息,例如文本数据为“离家后”的同指向信息为“家中检测人体数量为零”,以避免因文本数据的差异导致的检测结果异常,提高配置效率和准确性。
由以上可知,用户能将智能设备的操作配置意图以语音的方式输入,通过对用户语音的识别和语义理解即可自动创建自动化配置信息,无需任何手动配置,降低智能平台的操作门槛,增加智能生活的普及;根据智能平台内的当前设备信息构建的动态知识体系,在生成自动化配置信息的过程中,以动态知识体系为基础,对第一识别信息的完整性和合理性进行推理与检测,以实时确保生成的自动化配置信息的准确性,保证智能平台的生态秩序和稳定性。
此外,根据本公开的示例性实施例,还提供一种自动化配置系统,如图10所示,该系统1000包括:
意图引擎模块1010,用于对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
智能决策模块1020,用于基于动态知识体系,对第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,第二识别信息用于指示用户对智能平台内的多个智能设备的配置意图,动态知识体系是根据智能平台内的当前设备信息构建;
规则引擎模块1030,用于根据第二识别信息生成自动化配置信息,自动化配置信息包括多个智能设备的状态之间的联动关系。
在本公开一示例性实施例中,意图引擎模块1010可以包括:
语音识别单元,用于对所述用户语音进行语音识别处理得到文本数据;
信息提取单元,用于通过对所述文本数据进行关键词提取和语义识别,得到所述文本数据的多个关键信息;
关系确定单元,用于确定各所述关键信息之间的关系,所述关系用于指示各所述关键信息之间的逻辑执行关系;
第一信息生成单元,用于根据所述关键信息和所述关系,得到所述第一识别信息。
在本公开一示例性实施例中,智能决策模块1020可以包括:
第一检测单元,用于根据信息完整性条件,对所述第一识别信息的完整性进行检测,所述信息完整性条件用于指示识别信息至少包括触发条件信息和执行动作信息;
第二检测单元,用于基于所述动态知识体系,对所述第一识别信息进行合理性检测;
检测结果生成单元,用于在所述第一识别信息通过完整性检测和合理性检测后,根据检测结果得到所述第二识别信息。
在本公开一示例性实施例中,第一检测单元被配置为:
若所述第一识别信息不满足所述信息完整性条件,则向用户终端发送完整性调整信息;响应于基于所述完整性调整信息的第一识别信息调整操作,对调整后的第一识别信息的完整性进行检测,直到调整后的第一识别信息满足所述信息完整性条件。
在本公开一示例性实施例中,第二检测单元被配置为:
获取所述第一识别信息中的目标触发条件信息和目标执行动作信息;
若所述目标触发条件信息和目标执行动作信息中的至少一个所对应的第一设备信息,与所述动态知识体系中对应的第二设备信息不匹配,则向用户终端发送合理性调整信息;
响应于基于所述合理性调整信息的第一识别信息调整操作,对调整后的第一识别信息进行合理性检测,直到调整后的第一识别信息所对应的第一设备信息与所述动态知识体系中对应的第二设备信息匹配。
在本公开一示例性实施例中,所述第二设备信息至少包括设备属性和所述设备属性对应的当前状态信息。
在本公开一示例性实施例中,规则引擎模块1030可以包括:
第二信息生成单元,用于将所述第二识别信息,按照所述智能平台对应的配置规则信息生成所述自动化配置信息;
信息校验单元,用于将所述自动化配置信息发送至所述智能平台,以使所述智能平台对所述自动化配置信息进行语法校验。
在本公开一示例性实施例中,所述接收到的用户语音包括通过多轮对话获得的多条用户语音。
如图11示出了应用场景下的自动化配置系统各模块的架构图,图12为图11对应的自动化配置系统各模块的交互示意图,下面结合图11和图12对本公开实施例的自动化配置系统各模块的功能进行说明。
如图12,首先,通过ASR模块将用户语音转换为文本数据后,将文本数据发送至意图引擎模块,由意图引擎模块对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
其次,意图引擎模块将第一识别信息发送至智能决策模块,由智能决策模块基于动态知识体系,对第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息。其中,若智能决策模块需要下发信息至用户终端,则可以通过TTS(Text ToSpeech,文字转语音)模块将文本数据转换为语音数据后发送至用户终端。
接着,在智能决策模块完成对第一识别信息的完整性和合理性检测后,将生成的第二识别信息发送至规则引擎模块,由规则引擎模块根据第二识别信息生成自动化配置信息,并将创建结果反馈至智能决策模块,以及通过将创男结果转换为语音反馈至用户终端。
参见图11所示,智能决策模块通过系统接口获取智能平台内的当前设备信息构建动态知识体系,系统接口为抽象层,通过系统接口可以获取智能平台内的智能设备列表、智能设备属性和状态、智能设备支持的操作和可调用的服务,等等。历史记录模块用于将生成的自动化规则存储于智能平台,本公开实施例的自动化配置系统多配置过程产生的记录数据进行保存,以便进行回溯、跟踪和优化等。
由于本公开的示例性实施例的自动化配置系统的各个功能模块(单元)的具体细节在上述自动化配置方法的发明实施例中已经详细说明,因此不再赘述。
应当注意,尽管在上文详细描述中提及了自动化配置系统的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
参考图13所示,描述了根据本公开的示例性实施方式的用于实现上述方法的程序产品1300,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
下面参照图14来描述根据本公开的这种实施例的电子设备1400。图14显示的电子设备1400仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图14所示,电子设备1400以通用计算设备的形式表现。电子设备1400的组件可以包括但不限于:上述至少一个处理单元1410、上述至少一个存储单元1420、连接不同系统组件(包括存储单元1420和处理单元1410)的总线1430、显示单元1440。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1410执行,使得所述处理单元1410执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
存储单元1420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1421和/或高速缓存存储单元1422,还可以进一步包括只读存储单元(ROM)1423。
存储单元1420还可以包括具有一组(至少一个)程序模块1425的程序/实用工具1424,这样的程序模块1425包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1400也可以与一个或多个外部设备1500(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1400交互的设备通信,和/或与使得该电子设备1400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1450进行。并且,电子设备1400还可以通过网络适配器1460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1460通过总线1430与电子设备1400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (9)

1.一种自动化配置方法,其特征在于,包括:
对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,所述第二识别信息用于指示用户对智能平台内的多个智能设备的配置意图,所述动态知识体系是根据所述智能平台内的当前设备信息构建,所述当前设备信息包括所述智能平台内的智能设备的软件设备信息和硬件设备信息,基于所述当前设备信息能确定智能设备的设备属性和设备属性所对应的当前状态信息;
将所述第二识别信息,按照所述智能平台对应的配置规则信息生成自动化配置信息;将所述自动化配置信息发送至所述智能平台,以使所述智能平台对所述自动化配置信息进行语法校验,所述自动化配置信息包括所述多个智能设备的状态之间的联动关系;
基于所述动态知识体系,对所述第一识别信息进行合理性检测,包括:
获取所述第一识别信息中的目标触发条件信息和目标执行动作信息;
若所述目标触发条件信息和目标执行动作信息中的至少一个所对应的第一设备信息,与所述动态知识体系中对应的第二设备信息不匹配,则向用户终端发送合理性调整信息。
2.根据权利要求1所述的方法,其特征在于,所述对接收到的用户语音进行语音识别和语义理解,得到第一识别信息,包括:
对所述用户语音进行语音识别处理得到文本数据;
通过对所述文本数据进行关键词提取和语义识别,得到所述文本数据的多个关键信息;
确定各所述关键信息之间的关系,所述关系用于指示各所述关键信息之间的逻辑执行关系;
根据所述关键信息和所述关系,得到所述第一识别信息。
3.根据权利要求1所述的方法,其特征在于,所述基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,包括:
根据信息完整性条件,对所述第一识别信息的完整性进行检测,所述信息完整性条件用于指示所述第一识别信息至少包括触发条件信息和执行动作信息;
基于所述动态知识体系,对所述第一识别信息进行合理性检测;
在所述第一识别信息通过完整性检测和合理性检测后,根据通过检测后的第一识别信息得到所述第二识别信息。
4.根据权利要求3所述的方法,其特征在于,所述根据信息完整性条件,对所述的第一识别信息的完整性进行检测,包括:
若所述第一识别信息不满足所述信息完整性条件,则向用户终端发送完整性调整信息;
响应于基于所述完整性调整信息的第一识别信息调整操作,对调整后的第一识别信息的完整性进行检测,直到调整后的第一识别信息满足所述信息完整性条件。
5.根据权利要求3所述的方法,其特征在于,在所述向用户终端发送合理性调整信息之后,还包括:
响应于基于所述合理性调整信息的第一识别信息调整操作,对调整后的第一识别信息进行合理性检测,直到调整后的第一识别信息所对应的第一设备信息与所述动态知识体系中对应的第二设备信息匹配。
6.根据权利要求5所述的方法,其特征在于,所述第二设备信息至少包括设备属性和所述设备属性对应的当前状态信息。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述接收到的用户语音包括通过与用户终端进行多轮对话获得的多条用户语音。
8.一种自动化配置系统,其特征在于,所述自动化配置系统通过系统接口与智能平台连接,所述系统包括:
意图引擎模块,用于对接收到的用户语音进行语音识别和语义理解,得到第一识别信息;
智能决策模块,用于基于动态知识体系,对所述第一识别信息的完整性和合理性进行检测,并根据检测结果生成第二识别信息,所述第二识别信息用于指示用户对所述智能平台内的多个智能设备的配置意图,所述动态知识体系是根据所述智能平台内的当前设备信息构建,所述当前设备信息包括所述智能平台内的智能设备的软件设备信息和硬件设备信息,基于所述当前设备信息能确定智能设备的设备属性和设备属性所对应的当前状态信息;
规则引擎模块,用于将所述第二识别信息,按照所述智能平台对应的配置规则信息生成自动化配置信息;将所述自动化配置信息发送至所述智能平台,以使所述智能平台对所述自动化配置信息进行语法校验,所述自动化配置信息包括所述多个智能设备的状态之间的联动关系;
其中,基于所述动态知识体系,对所述第一识别信息进行合理性检测,包括:
获取所述第一识别信息中的目标触发条件信息和目标执行动作信息;
若所述目标触发条件信息和目标执行动作信息中的至少一个所对应的第一设备信息,与所述动态知识体系中对应的第二设备信息不匹配,则向用户终端发送合理性调整信息。
9.一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至7中任一项所述的方法。
CN202210682080.8A 2022-06-15 2022-06-15 自动化配置方法及系统、存储介质和电子设备 Active CN114898751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210682080.8A CN114898751B (zh) 2022-06-15 2022-06-15 自动化配置方法及系统、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210682080.8A CN114898751B (zh) 2022-06-15 2022-06-15 自动化配置方法及系统、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN114898751A CN114898751A (zh) 2022-08-12
CN114898751B true CN114898751B (zh) 2024-04-23

Family

ID=82729149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210682080.8A Active CN114898751B (zh) 2022-06-15 2022-06-15 自动化配置方法及系统、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN114898751B (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050002108A (ko) * 2003-06-30 2005-01-07 주식회사 팬택 네트워크 환경 하에서의 홈 및 빌딩 오토메이션을 위한지능형 제어 및 감시 시스템
CN101189659A (zh) * 2004-09-27 2008-05-28 罗伯特·博世公司 用于认知超负荷的设备用户的交互式对话
WO2013098830A1 (en) * 2011-12-30 2013-07-04 Yogesh Chunical Rathod A system and method for dynamic, portable, customize, contextual, unified and integrated network(s).
CN104808521A (zh) * 2015-02-26 2015-07-29 百度在线网络技术(北京)有限公司 智能设备的控制方法和装置
JP2016028346A (ja) * 2015-09-30 2016-02-25 洋彰 宮崎 自己組織的に処理能力を拡大する人工知能装置
CN106445924A (zh) * 2016-11-14 2017-02-22 Tcl集团股份有限公司 一种基于语义服务器控制智能设备的方法及系统
CN107343087A (zh) * 2017-06-15 2017-11-10 北京小米移动软件有限公司 智能设备控制方法及装置
CN108572594A (zh) * 2018-05-09 2018-09-25 深圳绿米联创科技有限公司 智能设备控制指令的生成方法、装置及终端设备
CN109635237A (zh) * 2018-11-23 2019-04-16 山东航天电子技术研究所 一种基于动态剪裁配置知识的目标平台快速识别方法
CN109754804A (zh) * 2019-02-21 2019-05-14 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及智能家居系统
KR101979118B1 (ko) * 2017-11-28 2019-05-15 숭실대학교산학협력단 지문정보를 이용한 스마트 디바이스 제어 방법 및 이를 수행하기 위한 기록매체
CN110324216A (zh) * 2019-05-23 2019-10-11 深圳绿米联创科技有限公司 自动化配置方法、装置、系统、服务器及存储介质
CN110336892A (zh) * 2019-07-25 2019-10-15 北京蓦然认知科技有限公司 一种多设备协作方法、装置
US10510348B1 (en) * 2018-09-28 2019-12-17 International Business Machines Corporation Smart medical room optimization of speech recognition systems
CN110597075A (zh) * 2019-09-09 2019-12-20 珠海格力电器股份有限公司 一种检测控制冲突的方法、装置、电子设备及存储介质
CN110688549A (zh) * 2019-07-02 2020-01-14 特斯联(北京)科技有限公司 一种基于知识体系图谱构建的人工智能分类方法与系统
CN110998567A (zh) * 2017-07-31 2020-04-10 微软技术许可有限责任公司 用于对话语义分析的知识图谱
CN111949390A (zh) * 2020-08-13 2020-11-17 深圳市极限网络科技有限公司 基于事理图谱的多种类大规模任务自动化调度方法及系统
WO2021073298A1 (zh) * 2019-10-18 2021-04-22 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质
CN113495489A (zh) * 2020-04-07 2021-10-12 深圳爱根斯通科技有限公司 自动化配置方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11019207B1 (en) * 2019-11-07 2021-05-25 Hithink Royalflush Information Network Co., Ltd. Systems and methods for smart dialogue communication

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050002108A (ko) * 2003-06-30 2005-01-07 주식회사 팬택 네트워크 환경 하에서의 홈 및 빌딩 오토메이션을 위한지능형 제어 및 감시 시스템
CN101189659A (zh) * 2004-09-27 2008-05-28 罗伯特·博世公司 用于认知超负荷的设备用户的交互式对话
WO2013098830A1 (en) * 2011-12-30 2013-07-04 Yogesh Chunical Rathod A system and method for dynamic, portable, customize, contextual, unified and integrated network(s).
CN104808521A (zh) * 2015-02-26 2015-07-29 百度在线网络技术(北京)有限公司 智能设备的控制方法和装置
JP2016028346A (ja) * 2015-09-30 2016-02-25 洋彰 宮崎 自己組織的に処理能力を拡大する人工知能装置
CN106445924A (zh) * 2016-11-14 2017-02-22 Tcl集团股份有限公司 一种基于语义服务器控制智能设备的方法及系统
CN107343087A (zh) * 2017-06-15 2017-11-10 北京小米移动软件有限公司 智能设备控制方法及装置
CN110998567A (zh) * 2017-07-31 2020-04-10 微软技术许可有限责任公司 用于对话语义分析的知识图谱
KR101979118B1 (ko) * 2017-11-28 2019-05-15 숭실대학교산학협력단 지문정보를 이용한 스마트 디바이스 제어 방법 및 이를 수행하기 위한 기록매체
CN108572594A (zh) * 2018-05-09 2018-09-25 深圳绿米联创科技有限公司 智能设备控制指令的生成方法、装置及终端设备
US10510348B1 (en) * 2018-09-28 2019-12-17 International Business Machines Corporation Smart medical room optimization of speech recognition systems
CN109635237A (zh) * 2018-11-23 2019-04-16 山东航天电子技术研究所 一种基于动态剪裁配置知识的目标平台快速识别方法
CN109754804A (zh) * 2019-02-21 2019-05-14 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及智能家居系统
CN110324216A (zh) * 2019-05-23 2019-10-11 深圳绿米联创科技有限公司 自动化配置方法、装置、系统、服务器及存储介质
CN110688549A (zh) * 2019-07-02 2020-01-14 特斯联(北京)科技有限公司 一种基于知识体系图谱构建的人工智能分类方法与系统
CN110336892A (zh) * 2019-07-25 2019-10-15 北京蓦然认知科技有限公司 一种多设备协作方法、装置
CN110597075A (zh) * 2019-09-09 2019-12-20 珠海格力电器股份有限公司 一种检测控制冲突的方法、装置、电子设备及存储介质
WO2021073298A1 (zh) * 2019-10-18 2021-04-22 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质
CN113495489A (zh) * 2020-04-07 2021-10-12 深圳爱根斯通科技有限公司 自动化配置方法、装置、电子设备及存储介质
CN111949390A (zh) * 2020-08-13 2020-11-17 深圳市极限网络科技有限公司 基于事理图谱的多种类大规模任务自动化调度方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
主体网格智能平台AGrIP构建及其应用;史忠植;林芬;罗杰文;;智能系统学报;20060228(第01期);全文 *

Also Published As

Publication number Publication date
CN114898751A (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN111488433B (zh) 一种适用于银行的提升现场体验感的人工智能交互系统
CN110741433A (zh) 使用多个计算设备的对讲式通信
CN109920419B (zh) 语音控制方法和装置、电子设备及计算机可读介质
US20200219384A1 (en) Methods and systems for ambient system control
EP3591540B1 (en) Retroactive sound identification system
CN114038457B (zh) 用于语音唤醒的方法、电子设备、存储介质和程序
US20180246964A1 (en) Speech interface for vision-based monitoring system
US20190346929A1 (en) Attention Levels in a Gesture Control System
US11080600B2 (en) Recurrent neural network based acoustic event classification using complement rule
CN111462732B (zh) 语音识别方法和装置
CN116582382B (zh) 智能设备控制方法、装置、存储介质及电子设备
WO2024093578A1 (zh) 语音识别方法、装置、电子设备、存储介质及计算机程序产品
CN114898751B (zh) 自动化配置方法及系统、存储介质和电子设备
CN114571473A (zh) 足式机器人的控制方法、装置及足式机器人
CN112669837A (zh) 智能终端的唤醒方法、装置及电子设备
CN111539214A (zh) 一种用于自然语言内容标题消歧的方法、设备和系统
CN112202655A (zh) 智能电器、图像识别方法、电子设备以及存储介质
US12094454B2 (en) Multimodal intent understanding for automated assistant
Veena et al. Sound classification system using deep neural networks for hearing impaired people
CN114550720A (zh) 语音交互方法、装置、电子设备和存储介质
US11275555B1 (en) Resolving a device prompt
Roshan et al. Using mel‐frequency audio features from footstep sound and spatial segmentation techniques to improve frame‐based moving object detection
CN116580711B (zh) 音频控制方法、装置、存储介质及电子设备
KR102258531B1 (ko) 복합 입력 인지 시스템용 통합 인지 분석부
US20230368785A1 (en) Processing voice input in integrated environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant