CN116072113A - 控制指令的确定方法及装置、存储介质及电子装置 - Google Patents

控制指令的确定方法及装置、存储介质及电子装置 Download PDF

Info

Publication number
CN116072113A
CN116072113A CN202211686147.1A CN202211686147A CN116072113A CN 116072113 A CN116072113 A CN 116072113A CN 202211686147 A CN202211686147 A CN 202211686147A CN 116072113 A CN116072113 A CN 116072113A
Authority
CN
China
Prior art keywords
target
control instruction
equipment
determining
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211686147.1A
Other languages
English (en)
Inventor
秦鹏鹏
李阅苗
郭义合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Haier Uplus Intelligent Technology Beijing Co Ltd
Original Assignee
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Haier Uplus Intelligent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Technology Co Ltd, Haier Smart Home Co Ltd, Haier Uplus Intelligent Technology Beijing Co Ltd filed Critical Qingdao Haier Technology Co Ltd
Priority to CN202211686147.1A priority Critical patent/CN116072113A/zh
Publication of CN116072113A publication Critical patent/CN116072113A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本申请公开了一种控制指令的确定方法及装置、存储介质及电子装置,涉及智慧家庭技术领域,该控制指令的确定方法包括:对获取到的语音指令进行语音识别,得到识别文本;在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;根据所述动作关键词确定所述目标设备的目标控制指令。采用上述技术方案,解决了根据用户的模糊语音指令对设备进行控制时准确率较低的问题。

Description

控制指令的确定方法及装置、存储介质及电子装置
技术领域
本申请涉及智慧家庭技术领域,具体而言,涉及一种控制指令的确定方法及装置、存储介质及电子装置。
背景技术
在智能家居背景下,语音操控是便捷操控的重要途径之一,尤其是在厨房场景,针对用户手上有油污不便操作、手中有食物无法释放双手、设备温度高的时候手触容易产生危险等情景,在厨房空间下语音操控可极大提升用户使用体验。目前厨房支持语音控制的设备,用户下发的语音指令要与设备预设指令一致才可实现设备控制,对于相对模糊或与设备预设指令偏差较大的语义无法执行,由于用户发话较为随意且与用户习惯强关联,即用户下发的语音指令很难与系统预设的指令完全一致,使得实际语音控制成功率低,设备制定动作与用户意图偏差大。导致用户体验较差,进而弃用语音功能。
针对相关技术中,根据用户的模糊语音指令对设备进行控制时准确率较低的问题,目前尚未提出有效的解决方案。
因此,有必要对相关技术予以改良以克服相关技术中的所述缺陷。
发明内容
本发明实施例提供了一种控制指令的确定方法及装置、存储介质及电子装置,以至少解决根据用户的模糊语音指令对设备进行控制时准确率较低的问题。
根据本发明实施例的一方面,提供一种控制指令的确定方法,包括:对获取到的语音指令进行语音识别,得到识别文本;在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;根据所述动作关键词确定所述目标设备的目标控制指令。
在一个示例性的实施例中,所述方法还包括:确定是否从所述识别文本中提取到设备名称;在从所述识别文本中提取到设备名称的情况下,将与所述设备名称相对应的设备确定为所述目标设备;在从所述识别文本中未提取到设备名称的情况下,按照预设规则确定所述目标设备。
在一个示例性的实施例中,按照预设规则确定所述目标设备,包括:将在第一预设时间内执行过操作的设备确定所述目标设备;或根据所述动作关键词确定设备集合,并根据设备集合中设备的优先级关系从所述设备集合中确定目标设备,其中,所述设备集合中的每个设备允许执行与所述动作关键词相对应的操作;或将距离下发所述语音指令的目标对象最近的设备确定为所述目标设备。
在一个示例性的实施例中,根据所述动作关键词确定所述目标设备的目标控制指令,包括:获取所述目标设备的设备控制指令集合,其中,所述设备控制指令集合包括所述目标设备允许执行的设备控制指令;在从所述设备控制指令集合中确定出与所述动作关键词相对应的一个设备控制指令的情况下,将所述设备控制指令确定为所述目标控制指令;在从所述设备控制指令集合中确定出与所述动作关键词相对应的多个设备控制指令的情况下,从所述多个设备控制指令中确定出目标控制指令。
在一个示例性的实施例中,从所述多个设备控制指令中确定出目标控制指令,包括:获取所述目标设备的当前设备状态;根据所述当前设备状态确定所述多个设备控制指令的优先级关系;将所述多个设备控制指令中优先级最高的设备控制指令确定为所述目标控制指令。
在一个示例性的实施例中,根据所述动作关键词确定所述目标设备的目标控制指令,包括:获取所述目标设备的历史控制记录集合,其中,所述历史控制记录集合中的每条记录包括:历史语音指令,所述历史语音指令对应的历史控制指令;从所述历史控制记录集合中确定多条历史语音指令,其中,所述多条历史语音指令对应的识别文本中均具有所述动作关键词;将所述多条历史语音指令中与所述语音指令相似度最高的历史语音指令对应的历史控制指令确定为所述目标控制指令。
在一个示例性的实施例中,根据所述动作关键词确定所述目标设备的目标控制指令之后,所述方法还包括:控制所述目标设备执行所述目标控制指令;或者播放提示语音,并在第二预设时间内未收到响应语音的情况下,控制所述目标设备执行所述目标控制指令,其中,所述提示语音用于提示是否控制所述目标设备执行所述目标控制指令;或者在预设时间内收到的响应语音用于指示所述目标设备执行所述目标控制指令的情况下,控制所述目标设备执行所述目标控制指令。
根据本发明实施例的另一方面,还提供了一种控制指令的确定装置,包括:获取模块,用于对获取到的语音指令进行语音识别,得到识别文本;提取模块,用于在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;确定模块,用于根据所述动作关键词确定所述目标设备的目标控制指令。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述控制指令的确定方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述控制指令的确定方法。
通过本发明,对获取到的语音指令进行语音识别,得到识别文本,并在根据识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,并根据动作关键词确定目标设备的目标控制指令。由于通过识别文本中的动作关键词确定设备的控制指令,降低了用户学习成本,使得用户与语音设备交互更自然;并且解决了根据用户的模糊语音指令对设备进行控制时准确率较低的问题,进而提高了设备执行语音指令的成功率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种控制指令的确定方法的硬件环境示意图;
图2是根据本发明实施例的控制指令的确定方法的流程图(一);
图3是根据本发明实施例的控制指令的确定方法的流程图(二);
图4是根据本发明实施例的控制指令的确定装置的结构框图(一);
图5是根据本发明实施例的控制指令的确定装置的结构框图(二)。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种控制指令的确定方法。该控制指令的确定方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述控制指令的确定方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
为了解决上述问题,在本实施例中提供了一种控制指令的确定方法,包括但不限于应用在目标设备或者目标设备对应的服务器中,图2是根据本发明实施例的控制指令的确定方法的流程图(一),该流程包括如下步骤:
步骤S202,对获取到的语音指令进行语音识别,得到识别文本;
在一个示例性的实施例中,目标设备可以通过语音识别模块将语音指令转化为文字信息,得到识别文本,上述目标设备包括上述终端设备102。
步骤S204,在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;
在一个示例性的实施例中,如果识别文本中存在预先设置的指令,即成功匹配到了设备控制指令,则设备直接执行对应的预先设置的指令即可。如果识别文本中不存在预先设备的指令,则从识别文本中提取动作关键词。
在一个示例性的实施例中,如果可以成功的确定出设备控制意图,即成功匹配到了设备控制指令,则设备直接执行设备控制意图对应的设备控制指令即可。
作为一种可选的示例,上述动作关键词包括但不限于:开、关、调节等。
在一个示例性的实施例中,从识别文本中提取动作关键词之前或之后,还具有以下步骤S11-S13:
步骤S11:确定是否从所述识别文本中提取到设备名称;
作为一种可选的示例,设备名称可以为用户自定义的。例如:“小小”等。
步骤S12:在从所述识别文本中提取到设备名称的情况下,将与所述设备名称相对应的设备确定为所述目标设备;
步骤S13:在从所述识别文本中未提取到设备名称的情况下,按照预设规则确定所述目标设备。
在一个示例性的实施例中,按照预设规则确定目标设备,可以通过以下方式一、或方式二、或方式三实现:
方式一:将在第一预设时间内执行过操作的设备确定所述目标设备;
作为一种可选的示例,第一预设时间可以由用户自定义,第一预设时间可以为1分钟,30秒等等。即如果用户在第一预设时间内操作过油烟机,则本次的语音指令是控制油烟机执行操作的语音指令的概率大于预设阈值(如大于90%)。
方式二:根据所述动作关键词确定设备集合,并根据设备集合中设备的优先级关系从所述设备集合中确定目标设备,其中,所述设备集合中的每个设备允许执行与所述动作关键词相对应的操作;
作为一种可选的示例,如果动作关键词为“调节”,则从用户家庭的设备中确定可以执行“调节”动作的设备,得到设备集合,进而根据设备集合中的设备优先级关系确定目标设备。可选的,设备的优先级关系可以根据设备距离用户的远近确定,即距离用户越近,设备优先级越高。可选的,设备的优先级关系还可以是用户自定义的,或者预先设置的。
方式三:将距离下发所述语音指令的目标对象最近的设备确定为所述目标设备。
需要说明的是,由于声音的能量会距离的增加而减少,进而用户在通过语音控制设备的时候通常都会站在设备的附近,进而可以将距离用户最近的设备确定为待控制的目标设备。此外,在一些特殊的场景下,用户通常都会近距离靠近设备(例如用户在厨房做饭时使用油烟机),进而可以将距离用户最近的设备确定为待控制的目标设备。
在一个示例性的实施例中,在确定出待控制的目标设备以后,还可以播放询问语音“是否需要控制目标设备”。
步骤S206,根据所述动作关键词确定所述目标设备的目标控制指令。
需要说明的是,虽然用户因为语言表达习惯的原因并不会下发完整的控制指令,但经过数据统计,用户下发的语音指令中通常都会存在动作关键词(例如:烤箱“开开”),进而可以通过动作关键词确定出自身携带有动作关键词的一个或多个设备控制指令(例如:开机、开门、开灯),最后再根据设备当前的状态确定出一个具体的目标控制指令。作为一种可选示例,还可以获取设备的历史控制记录(每条记录包括:历史语音指令以及相对应的历史控制指令),进而将历史控制记录中包括动作关键词的历史语音指令都筛选出来,并将筛选出来的历史语音指令中与本次的语音指令相似度最高的历史语音指令对应的历史控制指令确定为目标控制指令。
在一个示例性的实施例中,上述步骤S206可以通过以下步骤S21-S23实现:
步骤S21:获取所述目标设备的设备控制指令集合,其中,所述设备控制指令集合包括所述目标设备允许执行的设备控制指令;
需要说明的是,设备控制指令集合中包括设备可以执行的所有控制指令。
步骤S22:在从所述设备控制指令集合中确定出与所述动作关键词相对应的一个设备控制指令的情况下,将所述设备控制指令确定为所述目标控制指令;
也就是说,如果设备控制指令集合只有一个与动作关键词相对应的设备控制指令,则将此设备控制指令直接确定为目标控制指令。
步骤S23:在从所述设备控制指令集合中确定出与所述动作关键词相对应的多个设备控制指令的情况下,从所述多个设备控制指令中确定出目标控制指令。
也就是说,如果设备控制指令集合有多个与动作关键词相对应的设备控制指令,则需要进一步的从多个设备控制指令中确定目标控制指令。
在一个示例性的实施例中,从所述多个设备控制指令中确定出目标控制指令,可以通过以下步骤S231-S233实现:
步骤S231:获取所述目标设备的当前设备状态;
作为一种可选的示例,当前设备状态包括但不限于:处于开机状态,处于xx模式等等。
步骤S232:根据所述当前设备状态确定所述多个设备控制指令的优先级关系;
作为一种可选的示例,如果目标设备为烤箱,动作关键词为“开”,确定出的多个设备控制指令为“开机”、“开门”、“开灯”。如果目标设备的当前设备状态为未开机状态,则这三个设备控制指令中“开机”指令的优先级最高。如果目标设备的当前设备状态为开机状态,则“开门”指令的优先级最高。
步骤S233:将所述多个设备控制指令中优先级最高的设备控制指令确定为所述目标控制指令。
在一个示例性的实施例中,上述步骤S206还可以通过以下步骤S31-S33实现:
步骤S31:获取所述目标设备的历史控制记录集合,其中,所述历史控制记录集合中的每条记录包括:历史语音指令,所述历史语音指令对应的历史控制指令;
作为一种可选的示例,可以获取目标设备最近一周的历史控制记录,得到控制指令记录集合。
步骤S32:从所述历史控制记录集合中确定多条历史语音指令,其中,所述多条历史语音指令对应的识别文本中均具有所述动作关键词;
步骤S33:将所述多条历史语音指令中与所述语音指令相似度最高的历史语音指令对应的历史控制指令确定为所述目标控制指令。
在本实施例中,通过上述步骤可以准确的确定语音指令对应的设备控制指令。
通过上述步骤,对获取到的语音指令进行语音识别,得到识别文本,并在根据识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,并根据动作关键词确定目标设备的目标控制指令。由于通过识别文本中的动作关键词确定设备的控制指令,降低了用户学习成本,使得用户与语音设备交互更自然;并且解决了根据用户的模糊语音指令对设备进行控制时准确率较低的问题,进而提高了设备执行语音指令的成功率。
在一个示例性的实施例中,在执行上述步骤S206之后,还可以执行以下步骤S41或者步骤S42或者步骤S43:
步骤S41:控制所述目标设备执行所述目标控制指令;
步骤S42:播放提示语音,并在第二预设时间内未收到响应语音的情况下,控制所述目标设备执行所述目标控制指令,其中,所述提示语音用于提示是否控制所述目标设备执行所述目标控制指令;
步骤S43:在预设时间内收到的响应语音用于指示所述目标设备执行所述目标控制指令的情况下,控制所述目标设备执行所述目标控制指令。
显然,上述所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。为了更好的理解上述方法,以下结合实施例对上述过程进行说明,但不用于限定本发明实施例的技术方案,具体地:
在一个可选的实施例中,图3是根据本发明实施例的控制指令的确定方法的流程图(二),具体的,具有以下步骤:
步骤1:用户发话;
通过设备自带拾音装置,收集用户发话语料,如烟机、音响等设备。
步骤2:音频信息转化为文字;
通过语音识别模块,将采集到的语音信息转化为文字信息。
步骤3:关键词抽取;
根据关键词抽取规则,抽取文字字符串中关键信息,如动作:开/打开/调大,对象:门/音量/设备名等信息。
步骤4:语义与预设指令匹配判断;
语义与预设指令匹配,如关键词均可以匹配成功,则判定为完全匹配,否则判定为不匹配。其中预设指令条数有限,多为基本的明确的命令。如“打开门”。如果完全匹配则执行步骤5,不匹配则执行步骤4-1。
步骤4-1:“动作”与设备指令集匹配;
设备指令集:泛指可以被语音控制的功能。
“动作”与指令集匹配:指令可支持的动作,举例:如烤箱支持语音开机、语音开门、语音开灯、语音调节温度,则与动作“开”匹配的指令有三条,分别为开机、开门、开灯。如果“动作”未命中指令集中的指令,则执行步骤4-1-1。如果“动作”命中指令集中的指令,则执行步骤4-1-2。
步骤4-1-1:语音异常播报;
用户语音意图设备不支持,播报异常话术,告知用户操作失败结果及原因。
步骤4-1-2:匹配结果个数条数判断;
如果匹配结果只有一条指令可执行,则执行步骤5。
如果匹配结果有多条指令可供设备执行,则进入步骤4-1-2-1。
步骤4-1-2-1:从支持的指令集中筛选最高优指令;
从匹配的指令集中筛选优先级最高指令。设备指令优先级按设备品类或设备型号定义。举例:烤箱品类优先级:1、开机2、开门3、开灯4、调节模式5、设置温度、设置时间。
针对动作“开”命中的指令为1、2、3。如当前设备未开机,则最高优指令为1、开机。如当前设备已开机,则最高优指令为2、开门。筛选出最高优指令后执行步骤5。
步骤5:设备执行对应指令;
设备制定对应指令。执行完后执行步骤6。
步骤6:语音反馈执行结果;
根据设备实际执行结果,语音反馈用户。流程结束。
需要说明的是,本申请针对用于模糊语义,将抽取到的动作关键词与设备定义的指令集匹配,结合设备当前状态等因素抽取最优匹配指令,下发设备可执行指令,实现设备精准控制。避免出现指令不识别,影响用户体验。此外,本申请指令优先级和指令集可人工后台干预调整,提升用户意图和设备执行匹配度。
此外,通过本方案的方法,可以有效地提高用户语音指令执行成功率,用户可通过更自然的语音交互实现设备的精准控制,同时也是设备智能的体现。解决当前行业普遍存在的用户自然语言与设备预设指令匹配度低问题。语音输入更自然、语义理解更深入、设备执行更精准,为用户提供易用的语音交互产品。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
在本实施例中还提供了一种控制指令的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的控制指令的确定装置的结构框图(一),该装置包括:
获取模块42,用于对获取到的语音指令进行语音识别,得到识别文本;
提取模块44,用于在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;
确定模块46,用于根据所述动作关键词确定所述目标设备的目标控制指令。
通过上述装置,对获取到的语音指令进行语音识别,得到识别文本,并在根据识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,并根据动作关键词确定目标设备的目标控制指令。由于通过识别文本中的动作关键词确定设备的控制指令,降低了用户学习成本,使得用户与语音设备交互更自然;并且解决了根据用户的模糊语音指令对设备进行控制时准确率较低的问题,进而提高了设备执行语音指令的成功率。
在一个示例性的实施例中,确定模块46,还用于确定是否从所述识别文本中提取到设备名称;在从所述识别文本中提取到设备名称的情况下,将与所述设备名称相对应的设备确定为所述目标设备;在从所述识别文本中未提取到设备名称的情况下,按照预设规则确定所述目标设备。
在一个示例性的实施例中,确定模块46,还用于将在第一预设时间内执行过操作的设备确定所述目标设备;或根据所述动作关键词确定设备集合,并根据设备集合中设备的优先级关系从所述设备集合中确定目标设备,其中,所述设备集合中的每个设备允许执行与所述动作关键词相对应的操作;或将距离下发所述语音指令的目标对象最近的设备确定为所述目标设备。
在一个示例性的实施例中,确定模块46,还用于获取所述目标设备的设备控制指令集合,其中,所述设备控制指令集合包括所述目标设备允许执行的设备控制指令;在从所述设备控制指令集合中确定出与所述动作关键词相对应的一个设备控制指令的情况下,将所述设备控制指令确定为所述目标控制指令;在从所述设备控制指令集合中确定出与所述动作关键词相对应的多个设备控制指令的情况下,从所述多个设备控制指令中确定出目标控制指令。
在一个示例性的实施例中,确定模块46,还用于获取所述目标设备的当前设备状态;根据所述当前设备状态确定所述多个设备控制指令的优先级关系;将所述多个设备控制指令中优先级最高的设备控制指令确定为所述目标控制指令。
作为一种可选的示例,如果动作关键词为“调节”,则从用户家庭的设备中确定可以执行“调节”动作的设备,得到设备集合,进而根据设备集合中的设备优先级关系确定目标设备。可选的,设备的优先级关系可以根据设备距离用户的远近确定,即距离用户越近,设备优先级越高。可选的,设备的优先级关系还可以是用户自定义的,或者预先设置的。
在一个示例性的实施例中,确定模块46,还用于获取所述目标设备的历史控制记录集合,其中,所述历史控制记录集合中的每条记录包括:历史语音指令,所述历史语音指令对应的历史控制指令;从所述历史控制记录集合中确定多条历史语音指令,其中,所述多条历史语音指令对应的识别文本中均具有所述动作关键词;将所述多条历史语音指令中与所述语音指令相似度最高的历史语音指令对应的历史控制指令确定为所述目标控制指令。
在一个示例性的实施例中,图5是根据本发明实施例的控制指令的确定装置的结构框图(二),上述装置还包括:控制模块48,用于在根据所述动作关键词确定所述目标设备的目标控制指令之后,控制所述目标设备执行所述目标控制指令;或者播放提示语音,并在第二预设时间内未收到响应语音的情况下,控制所述目标设备执行所述目标控制指令,其中,所述提示语音用于提示是否控制所述目标设备执行所述目标控制指令;或者在预设时间内收到的响应语音用于指示所述目标设备执行所述目标控制指令的情况下,控制所述目标设备执行所述目标控制指令。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,对获取到的语音指令进行语音识别,得到识别文本;
S2,在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;
S3,根据所述动作关键词确定所述目标设备的目标控制指令。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,对获取到的语音指令进行语音识别,得到识别文本;
S2,在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;
S3,根据所述动作关键词确定所述目标设备的目标控制指令。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种控制指令的确定方法,其特征在于,包括:
对获取到的语音指令进行语音识别,得到识别文本;
在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;
所述目标设备为待执行所述语音指令的设备;
根据所述动作关键词确定所述目标设备的目标控制指令。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定是否从所述识别文本中提取到设备名称;
在从所述识别文本中提取到设备名称的情况下,将与所述设备名称相对应的设备确定为所述目标设备;
在从所述识别文本中未提取到设备名称的情况下,按照预设规则确定所述目标设备。
3.根据权利要求2所述的方法,其特征在于,按照预设规则确定所述目标设备,包括:
将在第一预设时间内执行过操作的设备确定所述目标设备;或
根据所述动作关键词确定设备集合,并根据设备集合中设备的优先级关系从所述设备集合中确定目标设备,其中,所述设备集合中的每个设备允许执行与所述动作关键词相对应的操作;或
将距离下发所述语音指令的目标对象最近的设备确定为所述目标设备。
4.根据权利要求1至3任一项所述的方法,其特征在于,根据所述动作关键词确定所述目标设备的目标控制指令,包括:
获取所述目标设备的设备控制指令集合,其中,所述设备控制指令集合包括所述目标设备允许执行的设备控制指令;
在从所述设备控制指令集合中确定出与所述动作关键词相对应的一个设备控制指令的情况下,将所述设备控制指令确定为所述目标控制指令;
在从所述设备控制指令集合中确定出与所述动作关键词相对应的多个设备控制指令的情况下,从所述多个设备控制指令中确定出目标控制指令。
5.根据权利要求4所述的方法,其特征在于,从所述多个设备控制指令中确定出目标控制指令,包括:
获取所述目标设备的当前设备状态;
根据所述当前设备状态确定所述多个设备控制指令的优先级关系;
将所述多个设备控制指令中优先级最高的设备控制指令确定为所述目标控制指令。
6.根据权利要求1至3任一项所述的方法,其特征在于,根据所述动作关键词确定所述目标设备的目标控制指令,包括:
获取所述目标设备的历史控制记录集合,其中,所述历史控制记录集合中的每条记录包括:历史语音指令,所述历史语音指令对应的历史控制指令;
从所述历史控制记录集合中确定多条历史语音指令,其中,所述多条历史语音指令对应的识别文本中均具有所述动作关键词;
将所述多条历史语音指令中与所述语音指令相似度最高的历史语音指令对应的历史控制指令确定为所述目标控制指令。
7.根据权利要求1至6中任一项所述的方法,其特征在于,根据所述动作关键词确定所述目标设备的目标控制指令之后,所述方法还包括:
控制所述目标设备执行所述目标控制指令;或者
播放提示语音,并在第二预设时间内未收到响应语音的情况下,控制所述目标设备执行所述目标控制指令,其中,所述提示语音用于提示是否控制所述目标设备执行所述目标控制指令;或者
在预设时间内收到的响应语音用于指示所述目标设备执行所述目标控制指令的情况下,控制所述目标设备执行所述目标控制指令。
8.一种控制指令的确定装置,其特征在于,包括:
获取模块,用于对获取到的语音指令进行语音识别,得到识别文本;
提取模块,用于在根据所述识别文本未匹配到设备控制指令的情况下,从所述识别文本中提取动作关键词,其中,所述动作关键词用于描述目标设备待执行的操作行为;所述目标设备为待执行所述语音指令的设备;
确定模块,用于根据所述动作关键词确定所述目标设备的目标控制指令。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。
CN202211686147.1A 2022-12-27 2022-12-27 控制指令的确定方法及装置、存储介质及电子装置 Pending CN116072113A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211686147.1A CN116072113A (zh) 2022-12-27 2022-12-27 控制指令的确定方法及装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211686147.1A CN116072113A (zh) 2022-12-27 2022-12-27 控制指令的确定方法及装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN116072113A true CN116072113A (zh) 2023-05-05

Family

ID=86177904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211686147.1A Pending CN116072113A (zh) 2022-12-27 2022-12-27 控制指令的确定方法及装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN116072113A (zh)

Similar Documents

Publication Publication Date Title
KR20200012933A (ko) 어시스턴트 애플리케이션을 위한 음성 사용자 인터페이스 단축
CN109688036A (zh) 一种智能家电的控制方法、装置、智能家电和存储介质
CN108766431B (zh) 一种基于语音识别的自动唤醒方法及电子设备
CN108932947B (zh) 语音控制方法及家电设备
CN108303902B (zh) 一种设备控制方法、介质、设备及装置
CN107977072B (zh) 一种机器人使用的养成方法、养成专家系统及电子设备
CN114755931A (zh) 控制指令的预测方法和装置、存储介质及电子装置
CN113990324A (zh) 一种语音智能家居控制系统
CN114120996A (zh) 语音交互方法及装置
CN108173722A (zh) 一种智能家居设备自动运行方法
CN116072113A (zh) 控制指令的确定方法及装置、存储介质及电子装置
CN115479370A (zh) 一种空调控制方法、装置、设备和空调
CN114915514B (zh) 意图的处理方法和装置、存储介质及电子装置
WO2023173596A1 (zh) 语句文本的意图识别方法和装置、存储介质及电子装置
CN113470642A (zh) 基于智能家居app的语音控制场景的实现方法及系统
CN116090461A (zh) 控制指令的意图识别方法、存储介质及电子装置
CN115171699A (zh) 唤醒参数的调整方法和装置、存储介质及电子装置
CN117912492A (zh) 一种设备拒识率的评估方法和装置
CN116483961A (zh) 对话模型的训练方法、装置和存储介质及电子设备
CN117095677A (zh) 语义理解模板的生成方法、装置、存储介质及电子装置
CN117892171A (zh) 基于gpt模型的场景规则信息的生成方法和装置
CN113673253A (zh) 语义交互方法、装置及电子设备
CN116386597A (zh) 方言识别模型的构建方法和装置、存储介质及电子装置
CN115810359A (zh) 语音的识别方法和装置、存储介质及电子装置
CN116364079A (zh) 设备控制方法、装置和存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination