CN113555019A - 语音控制方法、装置和电子设备 - Google Patents

语音控制方法、装置和电子设备 Download PDF

Info

Publication number
CN113555019A
CN113555019A CN202110823587.6A CN202110823587A CN113555019A CN 113555019 A CN113555019 A CN 113555019A CN 202110823587 A CN202110823587 A CN 202110823587A CN 113555019 A CN113555019 A CN 113555019A
Authority
CN
China
Prior art keywords
voice control
sub
instruction
instructions
slave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110823587.6A
Other languages
English (en)
Inventor
肖明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Hangzhou Co Ltd
Original Assignee
Vivo Mobile Communication Hangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Hangzhou Co Ltd filed Critical Vivo Mobile Communication Hangzhou Co Ltd
Priority to CN202110823587.6A priority Critical patent/CN113555019A/zh
Publication of CN113555019A publication Critical patent/CN113555019A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种语音控制方法、装置和电子设备,属于语音控制技术领域。所述方法应用于主设备,所述主设备连接有若干从设备,所述方法包括:获取用户的语音控制指令;对所述语音控制指令进行解析,得到若干子指令;将所述若干子指令下发至至少部分所述从设备中执行。

Description

语音控制方法、装置和电子设备
技术领域
本申请属于语音控制技术领域,具体涉及一种语音控制方法、装置和电子设备。
背景技术
随着万物互联概念的逐步发展以及智能家居等场景的日趋完善,家庭中智能化设备越来越多,搭载语音助手的设备也越来越多,但目前的状态是这些设备可能源于不同厂家,或者即使是同一厂家,也很少有多设备间的互动场景的实现,当使用指令唤醒多台设备时,会导致执行紊乱或者重复执行等问题的发生。
发明内容
本申请实施例的目的是提供一种语音控制方法、装置和电子设备,能够解决现有技术中使用语音指令控制设备时容易让多台设备重复执行相同的命令、多台设备之间无法协作配合完成更多控制任务与控制意图的问题。
第一方面,本申请实施例提供了一种语音控制方法,应用于主设备,所述主设备连接有若干从设备,该方法包括:
获取用户的语音控制指令;
对所述语音控制指令进行解析,得到若干子指令;
将所述若干子指令下发至至少部分所述从设备中执行。
第二方面,本申请实施例提供了一种语音控制装置,应用于主设备,所述主设备连接有若干从设备,该装置包括:
获取模块,用于获取用户的语音控制指令;
解析模块,用于对所述语音控制指令进行解析,得到若干子指令;
下发模块,用于将所述若干子指令下发至至少部分所述从设备中执行。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
在本申请实施例中,通过主设备获取语音控制指令并进行解析,得到若干子指令后下发至对应的从设备中,可以使多个从设备协作配合完成所述语音控制指令,从而使一条语音控制指令达成多个控制意图,丰富和完善了控制逻辑。
附图说明
图1为本申请实施例提供的一种语音控制方法的流程示意图;
图2为本申请实施例提供的第一设备采集语音控制指令的示意图;
图3为本申请实施例提供的设置主设备和从设备的示意图;
图4为本申请实施例提供的从设备的默认执行软件的示意图;
图5为本申请实施例提供的一种语音控制装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图;
图7为本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的语音控制方法、装置和电子设备进行详细地说明。
请参考图1,为本申请实施例提供的一种语音控制方法的流程示意图。如图1所示,本申请实施例中的语音控制方法应用于主设备,所述主设备连接有若干从设备,所述方法包括以下步骤:
步骤101:获取用户的语音控制指令;
其中,所述主设备可以直接或间接地获取用户的语音控制指令,例如直接采集用户的语音输入以获取语音控制指令,或者接收与所述主设备连接的第三方设备发送的语音信息以获取用户的语音控制指令。
步骤102:对所述语音控制指令进行解析,得到若干子指令;
本步骤中,在对所述语音控制指令进行解析时,可以结合语义、语法、场景、所述语音控制指令的发出时间、用户对所述主设备以及从设备的操作习惯、用户对所述主设备以及从设备的默认设置等等对所述语音控制指令进行解析,得到若干子指令,从而更全面、准确地获取所述语音控制指令中包含的控制目的或意图,达到用户仅通过一条语音控制指令即可实现多种控制效果的目的。
步骤103:将所述若干子指令下发至至少部分所述从设备中执行。
本申请实施例中,在所述主设备通过对所述语音控制指令进行正确、全面的解析得到若干子指令后,进一步将这些子指令下发至相应的从设备中,使相应从设备执行响应指令,从而使主设备和多个从设备协同合作执行相应指令,以达成多个控制目的,丰富和完善了控制逻辑。其中,主设备和各从设备之间可以通过蓝牙或者网关等方式进行连接。其中,所述若干子指令可以由所有从设备中的部分协同执行,也可以由所有从设备协同执行
在本申请实施例中,通过主设备获取语音控制指令并进行解析,得到若干子指令后下发至对应的从设备中,可以使多个从设备协作配合完成所述语音控制指令,从而使一条语音控制指令达成多个控制意图,丰富和完善了控制逻辑。
在本申请的一些实施例中,所述获取用户的语音控制指令包括:
接收第一设备发送的用户的语音控制指令,所述语音控制指令由所述第一设备通过第一应用采集得到。
也就是说,所述语音控制指令是由作为第三方的第一设备发送的。示例性的,所述主设备与所述第一设备连接,所述语音控制指令首先由第一设备通过第一应用采集得到,例如,所述第一设备通过所述第一应用调用麦克风对用户的语音进行采集,之后,所述第一设备将采集到的用户的语音控制指令发送给所述主设备,例如通过所述第一应用将所述语音控制指令发送给所述主设备。可选的,所述第一设备可以是手机等终端。通过第一设备采集用户的语音控制指令并发送给所述主设备,可以方便用户在远离所述主设备时依旧可以通过所述第一设备快速地将语音控制指令下达至所述主设备,方便了用户随时随地进行语音控制。
在本申请的另一些实施例中,所述获取用户的语音控制指令包括:
在所述主设备被预设语音唤醒指令唤醒的情况下,开启语音识别,采集用户的语音控制指令。
也就是说,所述语音控制指令是由所述主设备主动采集获取到的。示例性的,在获取用户的语音控制指令之前,所述主设备先接收用户的预设语音唤醒指令,例如所述预设语音唤醒指令为某一唤醒词,则所述主设备将响应于所述预设语音唤醒指令,从待机状态或者睡眠状态中唤醒,然后,开启语音识别功能,开始采集用户的语音控制指令。通过所述主设备直接采集用户的语音控制指令的方式,可以方便用户直接对所述主设备进行语音控制,而不需要通过第三方(例如上述中的第一设备)进行二次传输控制,省去了中间的操作过程。
本申请的一些实施例中,所述对所述语音控制指令进行解析,得到若干子指令包括:
对所述语音控制指令进行语法解析和/或语义解析,得到至少一个关键词;
根据所述至少一个关键词,生成若干子指令。。
具体来说,所述主设备在对所述语音控制指令进行解析时,可以结合语义和/或语法对所述语音控制指令进行解析,以得到至少一个关键词,可选的,所述关键词可以是名词、动词等等;之后,根据得到的关键词,生成若干子指令。其中,在根据得到的至少一个关键词生成若干子指令时,若所述语音控制指令为简单的控制指令,例如,所述语音控制指令中直接包含目标动作以及目的指示的词语,例如,语音控制指令为“播放音乐”,对该语音控制指令进行语法解析得到的关键词可以为“播放”、“音乐”等动词或名词,由于这些关键词可以直接表明控制手段、控制目的或者执行该语音控制指令的设备等,因此,可以根据得到的关键词直接生成相应子指令。
在本申请的另一些实施例中,所述根据所述至少一个关键词,生成若干子指令包括:
对所述关键词进行二次解析,确定与所述关键词对应的若干指令要素;
根据所述若干指令要素,生成若干子指令。
也即,若所述语音控制指令为复杂的控制指令,在结合语义和/或语法对所述语音控制指令进行解析,得到至少一个关键词之后,这些关键词并未直接表明控制手段、控制目的或者执行该语音控制指令的设备等,因此,还需要确定出与该关键词对应的指令要素,也即,对得到的关键词进行二次解析,找出与所述关键词关联的控制变量,继而确定出关联的若干指令要素,最终根据所述若干指令要素生成若干子指令。
例如,所述语音控制指令为“我要睡午觉”,对该语音控制指令需要进行语法及语义解析,得到的关键词可以为“睡觉”、“中午”等,然后,对其进行进一步的解析(二次解析),可以得到与“睡觉”相关联的控制变量可以包括:温度、湿度、亮度、音量等等,从而确定出关联的指令要素可以有:“控制温度”、“控制湿度”、“控制环境光照”、“控制环境音量”等等;最终,根据确定出的指令要素,生成若干子指令,下发至各从设备进行执行。可选的,在对语音控制指令的解析、以及对得到的关键词进行二次解析时,为了获得更好的解析效果、使控制效果更满足用户的控制需求,解析过程中还可以进一步结合实际场景、所述语音控制指令的发出时间、用户对所述主设备以及从设备的操作习惯、用户对所述主设备以及从设备的默认设置等等,以对所述语音控制指令进行全面、准确的解析,达到用户仅通过一条语音控制指令即可实现多种控制效果的目的。示例性的,继续以所述语音控制指令为“我要睡午觉”为例,在对该语音控制指令进行解析后,可以得到“睡觉”、“中午”等关键词,而对这些关键词进行二次解析时,结合实际场景、所述语音控制指令的发出时间,可以得到“控制温度”、“控制湿度”、“控制环境光照”、“控制环境音量”等指令要素外,进一步结合用户对所述主设备以及从设备的操作习惯、用户对所述主设备以及从设备的默认设置等,还可以得到“播放助眠音乐”等指令要素,最终根据这些指令要素得到若干条子指令。
本申请上述实施例中,由于在生成子指令的过程中,会先进行语法解析和/或语义解析,得到关键词,之后还会对所述关键词进行二次解析,确定出对应的若干指令要素,之后再根据若干指令要素,生成若干子指令,故本申请实施例中可以对复杂的语音控制指令进行深度解析后执行,因此,本申请实施例中的所述语音控制指令可以不包括从设备的标识信息等,也即可以不包含从设备的设备名称、代号、编码等等用于标识从设备身份的标识信息,主设备可以自主解析判断所述语音控制指令所需要协同执行的是哪些从设备,由此,本申请实施例可以提高语音控制指令的执行成功率,不必包含执行对象,方便了用户发出符合人类语言特征的语音控制指令,使得控制过程更加智能、自然。
本申请的一些实施例中,所述将所述若干子指令下发至至少部分所述从设备中执行包括:
根据每一所述指令要素以及各所述从设备的功能,确定各所述子指令对应的目标从设备;
将各所述子指令发送至对应的目标从设备中执行。
在得到上述多个子指令之后,需要根据各条子指令对应的指令要素以及各个从设备的功能,来确定用来执行相应子指令的目标从设备。示例性的,若一条子指令对应的指令要素为“控制温度”,则该条子指令对应的目标从设备应该具有控制温度的功能,例如为空调;又如,若一条子指令对应的指令要素为“控制湿度”,则该条子指令对应的目标从设备应该具有控制湿度的功能,例如为加湿器。由此,将各子指令发送至对应的目标从设备中,以让各目标从设备分别执行相应子指令,最终实现各个从设备协同配合,达成用户的语音控制指令中包含的多个控制目的。
可选的,在各子指令下发到对应从设备中之后,从设备可以对该子指令进行进一步解析,结合用户的操作习惯等,执行该子指令。例如,若下发的子指令仅为“控制温度”,则从设备(空调)可以根据用户的设置习惯,将温度设置为最常设置的26°。
本申请的一些实施例中,所述将所述若干子指令下发至至少部分所述从设备中执行之前,还包括:
获取第一从设备的设置信息,所述设置信息用于指示所述第一从设备执行所述语音控制指令;
所述确定各所述子指令对应的目标从设备包括:
根据所述设置信息,从所述第一从设备中确定各所述子指令对应的目标从设备。
也就是说,用户可以对执行所述语音控制指令的设备进行设置。具体的,在确定各子指令对应的目标从设备之前,所述主设备获取用户选择用于执行所述语音控制指令的第一从设备的设置信息,第一从设备可以是所有从设备中的部分;从而,在确定各子指令对应的目标从设备时,便从第一从设备中找出各子指令对应的目标从设备。通过用户设置执行语音控制指令的从设备的方式,可以对语音控制指令的执行主体范围进行限定,从而更好地确定子指令所对应的目标从设备,减少由于主设备错误匹配子指令对应的从设备而导致指令执行不正确的情况的发生。示例性的,对于所述语音控制指令为“我要睡午觉”时,通过获取用户选择执行的第一从设备的设置信息,将执行该条语音控制指令的第一从设备确定为空调、加湿器这两个从设备,而无需音响这一从设备的参与。
在本申请的一些实施例中,所述将所述若干子指令下发至至少部分所述从设备中执行之前,还包括:
获取所述从设备的功能定义信息,所述功能定义信息用于定义从设备工作时可实现的功能。也就是说,用户还可以对各从设备的功能进行定义,以限定、明确各从设备的指令执行范围或者说确定各从设备对应的指令要素,方便在进行对语音控制指令进行解析得到子指令时可以根据各从设备定义的功能或者对应的指令要素来确定执行该条语音控制指令的目标从设备。例如,可以定义空调的功能为调控温度、湿度,定义电动窗帘的功能为控制环境光照。
请参考图2至图4,图2为本申请实施例提供的第一设备采集语音控制指令的示意图,图3为本申请实施例提供的设置主设备和从设备的示意图,图4为本申请实施例提供的从设备的默认执行软件的示意图。如图2至图4所示,在本申请的一些实施例中,在所述语音控制指令是由作为第三方的第一设备发送的情况下,所述第一设备与主设备以及从设备连接,用户可以在第一设备上设置执行本次语音控制指令的主设备和/或从设备、以及各设备执行指令时采用的软件,在用户不设置时,则采用默认的主设备和从设备以及默认软件。此时主设备获取用户选择用于执行所述语音控制指令的第一从设备的设置信息的途径为:第一设备发送设置信息给所述主设备。
在一些实施例中,用户可以设置各设备在执行指令时采用的软件。也就是说,主设备可以通过获取从设备执行子指令时所采用的目标软件的配置信息,控制执行子指令的从设备在执行接收到的子指令时所采用的目标软件。示例性的,所述语音控制指令为“播放摇滚音乐”,接收到相应子指令的从设备为音箱,而音箱内安装有多个软件,例如包括第一软件和第二软件,第一软件中第一类音乐较多、第二软件中第二类音乐较多,所述第一类音乐可以为古典音乐,所述第二类音乐可以为摇滚音乐,则用户此时可以设置音箱在执行指令时采用的软件为第二软件,使从设备在执行指令时采用第二软件执行,由此更能贴合用户的需求,提升语音控制的满意度。
在本申请的一些实施例中,若子指令的数量多,而设置的第一从设备的数量少,导致子指令不能完全与第一从设备对应匹配,也即主设备中存在部分子指令无法下发至目标从设备中进行执行时,可以将剩余的子指令分发给除目标从设备。
在本申请实施例中,通过主设备获取语音控制指令并进行解析,得到若干子指令后下发至对应的从设备中,可以使多个从设备协作配合完成所述语音控制指令,从而使一条语音控制指令达成多个控制意图,丰富和完善了控制逻辑。
需要说明的是,本申请实施例提供的语音控制方法,执行主体可以为语音控制装置,或者该语音控制装置中的用于执行语音控制方法的控制模块。本申请实施例中以语音控制装置执行语音控制方法为例,说明本申请实施例提供的语音控制装置。
请参考图5,为本申请实施例提供的一种语音控制装置的结构示意图。如图5所示,本申请另一方面实施例还提供了一种语音控制装置,应用于主设备,所述主设备连接有若干从设备,所述装置50包括:
获取模块51,用于获取用户的语音控制指令;
解析模块52,用于对所述语音控制指令进行解析,得到若干子指令;
下发模块53,用于将所述若干子指令下发至至少部分所述从设备中执行。
可选的,所述获取模块包括:
接收单元,用于接收第一设备发送的用户的语音控制指令,所述语音控制指令由所述第一设备通过第一应用采集得到。
可选的,所述获取模块包括:
采集单元,用于在所述主设备被预设语音唤醒指令唤醒的情况下,开启语音识别,采集用户的语音控制指令。
可选的,所述解析模块包括:
解析单元,用于对所述语音控制指令进行语法解析和/或语义解析,得到至少一个关键词;
生成单元,用于根据所述至少一个关键词,生成若干子指令。
可选的,所述生成单元包括:
二次解析子单元,用于对所述关键词进行二次解析,确定与所述关键词对应的若干指令要素;
生成子单元,用于根据所述若干指令要素,生成若干子指令。
可选的,所述下发模块包括:
确定单元,用于根据每一所述指令要素以及各所述从设备的功能,确定各所述子指令对应的目标从设备;
发送单元,用于将各所述子指令发送至对应的目标从设备中执行。
可选的,所述装置还包括:
设置模块,用于获取第一从设备的设置信息,所述设置信息用于指示所述第一从设备执行所述语音控制指令;
所述确定单元包括:
确定子单元,用于根据所述设置信息,从所述第一从设备中确定各所述子指令对应的目标从设备。
在本申请实施例中,通过主设备获取语音控制指令并进行解析,得到若干子指令后下发至对应的从设备中,可以使多个从设备协作配合完成所述语音控制指令,从而使一条语音控制指令达成多个控制意图,丰富和完善了控制逻辑。
本申请实施例中的语音控制装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的语音控制装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的语音控制装置能够实现图1至图4的方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选的,如图6所示,本申请实施例还提供一种电子设备600,包括处理器601,存储器602,存储在存储器602上并可在所述处理器601上运行的程序或指令,该程序或指令被处理器601执行时实现上述语音控制方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图7为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、以及处理器7010等部件。
本领域技术人员可以理解,电子设备700还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器7010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,射频单元701或输入单元704用于获取用户的语音控制指令;
处理器7010,用于对所述语音控制指令进行解析,得到若干子指令;
射频单元701,还用于将所述若干子指令下发至至少部分所述从设备中执行。
在本申请实施例中,通过主设备获取语音控制指令并进行解析,得到若干子指令后下发至对应的从设备中,可以使多个从设备协作配合完成所述语音控制指令,从而使一条语音控制指令达成多个控制意图,丰富和完善了控制逻辑。
可选的,射频单元701,还用于接收第一设备发送的用户的语音控制指令,所述语音控制指令由所述第一设备通过第一应用采集得到。
可选的,输入单元704,还用于在所述主设备被预设语音唤醒指令唤醒的情况下,开启语音识别,采集用户的语音控制指令。
处理器7010,还用于对所述语音控制指令进行语法解析和/或语义解析,得到至少一个关键词;
根据所述至少一个关键词,生成若干子指令。
可选的,所述根据所述至少一个关键词,生成若干子指令包括:
对所述关键词进行二次解析,确定与所述关键词对应的若干指令要素;
根据所述若干指令要素,生成若干子指令。
可选的,处理器7010,还用于根据每一所述指令要素以及各所述从设备的功能,确定各所述子指令对应的目标从设备;
射频单元701,还用于将各所述子指令发送至对应的目标从设备中执行。
可选的,射频单元701还用于获取第一从设备的设置信息,所述设置信息用于指示所述第一从设备执行所述语音控制指令;
处理器7010,还用于根据所述设置信息,从所述第一从设备中确定各所述子指令对应的目标从设备
在本申请实施例中,通过主设备获取语音控制指令并进行解析,得到若干子指令后下发至对应的从设备中,可以使多个从设备协作配合完成所述语音控制指令,从而使一条语音控制指令达成多个控制意图,丰富和完善了控制逻辑。
应理解的是,本申请实施例中,输入单元704可以包括图形处理器(GraphicsProcessing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器709可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器7010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器7010中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述语音控制方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述语音控制方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种语音控制方法,其特征在于,应用于主设备,所述主设备连接有若干从设备,所述方法包括:
获取用户的语音控制指令;
对所述语音控制指令进行解析,得到若干子指令;
将所述若干子指令下发至至少部分所述从设备中执行。
2.根据权利要求1所述的方法,其特征在于,所述对所述语音控制指令进行解析,得到若干子指令包括:
对所述语音控制指令进行语法解析和/或语义解析,得到至少一个关键词;
根据所述至少一个关键词,生成若干子指令。
3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一个关键词,生成若干子指令包括:
对所述关键词进行二次解析,确定与所述关键词对应的若干指令要素;
根据所述若干指令要素,生成若干子指令。
4.根据权利要求3所述的方法,其特征在于,所述将所述若干子指令下发至至少部分所述从设备中执行包括:
根据每一所述指令要素以及各所述从设备的功能,确定各所述子指令对应的目标从设备;
将各所述子指令发送至对应的目标从设备中执行。
5.根据权利要求4所述的方法,其特征在于,所述将所述若干子指令下发至至少部分所述从设备中执行之前,还包括:
获取第一从设备的设置信息,所述设置信息用于指示所述第一从设备执行所述语音控制指令;
所述确定各所述子指令对应的目标从设备包括:
根据所述设置信息,从所述第一从设备中确定各所述子指令对应的目标从设备。
6.一种语音控制装置,其特征在于,应用于主设备,所述主设备连接有若干从设备,所述装置包括:
获取模块,用于获取用户的语音控制指令;
解析模块,用于对所述语音控制指令进行解析,得到若干子指令;
下发模块,用于将所述若干子指令下发至至少部分所述从设备中执行。
7.根据权利要求6所述的装置,其特征在于,所述解析模块包括:
解析单元,用于对所述语音控制指令进行语法解析和/或语义解析,得到至少一个关键词;
生成单元,用于根据所述至少一个关键词,生成若干子指令。
8.根据权利要求7所述的装置,其特征在于,所述生成单元包括:
二次解析子单元,用于对所述关键词进行二次解析,确定与所述关键词对应的若干指令要素;
生成子单元,用于根据所述若干指令要素,生成若干子指令。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的语音控制方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的语音控制方法的步骤。
CN202110823587.6A 2021-07-21 2021-07-21 语音控制方法、装置和电子设备 Pending CN113555019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110823587.6A CN113555019A (zh) 2021-07-21 2021-07-21 语音控制方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110823587.6A CN113555019A (zh) 2021-07-21 2021-07-21 语音控制方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN113555019A true CN113555019A (zh) 2021-10-26

Family

ID=78103719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110823587.6A Pending CN113555019A (zh) 2021-07-21 2021-07-21 语音控制方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN113555019A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908116A (zh) * 2017-10-20 2018-04-13 深圳市艾特智能科技有限公司 语音控制方法、智能家居系统、存储介质和计算机设备
CN108447480A (zh) * 2018-02-26 2018-08-24 深圳市晟瑞科技有限公司 智能家居设备控制的方法、智能语音终端和网络设备
CN109634132A (zh) * 2019-01-03 2019-04-16 深圳壹账通智能科技有限公司 智能家居管理方法、装置、介质及电子设备
CN110197662A (zh) * 2019-05-31 2019-09-03 努比亚技术有限公司 语音控制方法、可穿戴设备及计算机可读存储介质
CN110459222A (zh) * 2019-09-06 2019-11-15 Oppo广东移动通信有限公司 语音控制方法、语音控制装置及终端设备
CN110618613A (zh) * 2019-09-03 2019-12-27 珠海格力电器股份有限公司 一种智能设备的联动控制方法及装置
CN110675870A (zh) * 2019-08-30 2020-01-10 深圳绿米联创科技有限公司 一种语音识别方法、装置、电子设备及存储介质
CN110942773A (zh) * 2019-12-10 2020-03-31 上海雷盎云智能技术有限公司 语音控制智能家居设备的方法及装置
CN111367188A (zh) * 2020-03-09 2020-07-03 京东方科技集团股份有限公司 智能家居的控制方法、装置、电子设备和计算机存储介质
CN112415908A (zh) * 2020-11-26 2021-02-26 珠海格力电器股份有限公司 智能设备控制方法、装置、可读存储介质和计算机设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908116A (zh) * 2017-10-20 2018-04-13 深圳市艾特智能科技有限公司 语音控制方法、智能家居系统、存储介质和计算机设备
CN108447480A (zh) * 2018-02-26 2018-08-24 深圳市晟瑞科技有限公司 智能家居设备控制的方法、智能语音终端和网络设备
CN109634132A (zh) * 2019-01-03 2019-04-16 深圳壹账通智能科技有限公司 智能家居管理方法、装置、介质及电子设备
CN110197662A (zh) * 2019-05-31 2019-09-03 努比亚技术有限公司 语音控制方法、可穿戴设备及计算机可读存储介质
CN110675870A (zh) * 2019-08-30 2020-01-10 深圳绿米联创科技有限公司 一种语音识别方法、装置、电子设备及存储介质
CN110618613A (zh) * 2019-09-03 2019-12-27 珠海格力电器股份有限公司 一种智能设备的联动控制方法及装置
CN110459222A (zh) * 2019-09-06 2019-11-15 Oppo广东移动通信有限公司 语音控制方法、语音控制装置及终端设备
CN110942773A (zh) * 2019-12-10 2020-03-31 上海雷盎云智能技术有限公司 语音控制智能家居设备的方法及装置
CN111367188A (zh) * 2020-03-09 2020-07-03 京东方科技集团股份有限公司 智能家居的控制方法、装置、电子设备和计算机存储介质
CN112415908A (zh) * 2020-11-26 2021-02-26 珠海格力电器股份有限公司 智能设备控制方法、装置、可读存储介质和计算机设备

Similar Documents

Publication Publication Date Title
CN108121490B (zh) 用于处理多模式输入的电子装置、方法和服务器
CN106098063B (zh) 一种语音控制方法、终端设备和服务器
CN109618202B (zh) 控制外设的方法、电视及可读存储介质
US9754581B2 (en) Reminder setting method and apparatus
CN105740263B (zh) 页面显示方法和装置
CN108881649B (zh) 用于提供语音服务的方法和装置
CN110675873B (zh) 智能设备的数据处理方法、装置、设备及存储介质
EP3610479B1 (en) Electronic apparatus for processing user utterance
CN112735418B (zh) 一种语音交互的处理方法、装置、终端及存储介质
CN107402713B (zh) 加快黑屏手势处理的方法、装置、存储介质及移动终端
CN110047484A (zh) 一种语音识别交互方法、系统、设备和存储介质
CN108038243A (zh) 音乐推荐方法、装置、存储介质及电子设备
KR20190032026A (ko) 자연어 표현 제공 방법 및 이를 지원하는 전자 장치
CN112131015A (zh) 一种信息处理方法、装置、云服务器和存储介质
CN106773817B (zh) 一种用于智能机器人的命令解析方法及机器人
CN108810274A (zh) 应用辅助功能的启动方法、装置、存储介质和终端
CN110741365A (zh) 用于管理多媒体内容中的加载时间的数据结构查询
CN113157966B (zh) 显示方法、装置及电子设备
CN109725798B (zh) 智能角色的切换方法及相关装置
CN113555019A (zh) 语音控制方法、装置和电子设备
CN113593614B (zh) 图像处理方法及装置
CN113593559B (zh) 一种内容显示方法、显示设备及服务器
CN112653919B (zh) 字幕添加方法及装置
CN115019798A (zh) 语音识别设备的控制方法、装置、电子设备及存储介质
CN111443905B (zh) 业务数据的处理方法、装置、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination