CN115562054A - 设备控制方法、装置、可读存储介质与芯片 - Google Patents

设备控制方法、装置、可读存储介质与芯片 Download PDF

Info

Publication number
CN115562054A
CN115562054A CN202211193908.XA CN202211193908A CN115562054A CN 115562054 A CN115562054 A CN 115562054A CN 202211193908 A CN202211193908 A CN 202211193908A CN 115562054 A CN115562054 A CN 115562054A
Authority
CN
China
Prior art keywords
target
server
voice
control instruction
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211193908.XA
Other languages
English (en)
Inventor
张秀云
蔡纯兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202211193908.XA priority Critical patent/CN115562054A/zh
Priority to US18/086,249 priority patent/US20240105164A1/en
Priority to EP22217062.3A priority patent/EP4346172A1/en
Publication of CN115562054A publication Critical patent/CN115562054A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开涉及一种设备控制方法、装置、可读存储介质与芯片,涉及智能家居技术领域,该方法包括:在该目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,该第一语音信息用于该第一服务器将该第一语音信息转换成第一控制指令发送至第二服务器,该第一语音信息中包含有对第二目标设备进行控制的信息;接收该第二服务器反馈的该第一控制指令;根据该第一控制指令使用该目标语音模组或处理器对第二目标设备进行控制,该目标语音模组与该处理器位于第一目标设备中。使用本公开提出的设备控制方法,可以使得用户能够利用能够对话的第一目标设备来对第二目标设备进行控制,给用户操控第二目标设备带来了便利。

Description

设备控制方法、装置、可读存储介质与芯片
技术领域
本公开涉及智能家居技术领域,尤其涉及一种设备控制方法、装置、可读存储介质与芯片。
背景技术
随着人们生活水平的日益提高,智能家居在人们的日常生活中扮演了重要的角色,智能家居为人们生活带来了较大的便利。
相关技术中,用户可以在手机等终端上控制智能家居,然而,当用户没有携带终端且想要控制智能家居时,则需要用户主动走到智能家居所在位置操控智能家居,或走到终端所在位置使用终端控制智能家居,这也给用户的生活也带来了一些不便。
发明内容
为克服相关技术中存在的问题,本公开提供一种设备控制方法、装置、可读存储介质与芯片。
根据本公开实施例的第一方面,提供一种设备控制方法,所述方法运用至目标语音模组,所述方法包括:
在所述目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,所述第一语音信息用于所述第一服务器将所述第一语音信息转换成第一控制指令发送至第二服务器,所述第一语音信息中包含有对第二目标设备进行控制的信息;
接收所述第二服务器反馈的所述第一控制指令;
根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,所述目标语音模组与所述处理器位于第一目标设备中。
可选地,所述目标语音模组通过以下步骤唤醒:
通过第三服务器接收第三目标设备发送的第二语音信息;
通过所述第三服务器,根据多个语音模组的优先级,以及多个语音模组与输出所述第二语音信息的声源之间的距离,从多个语音模组中唤醒所述目标语音模组。
可选地,所述根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,包括:
在所述第一语音信息为第一预设语音信息的情况下,将所述第一控制指令发送至所述处理器,所述第一控制指令用于指示所述处理器根据所述第一控制指令对所述第二目标设备进行控制。
可选地,所述根据所述第一控制指令,使用所述目标语音模组或处理器对第二目标设备进行控制,包括:
在所述第一语音信息为第二预设语音信息的情况下,根据所述第一控制指令对所述第二目标设备进行控制。
可选地,所述方法还包括:
在所述第一语音信息为所述第三预设语音信息的情况下,接收所述第一服务器反馈的所述第二控制指令;
根据所述第二控制指令,对所述第二目标设备进行控制。
可选地,所述方法还包括:
在所述第一目标设备与第四服务器建立连接的情况下,接收所述第四服务器发送的配置文件,所述配置文件用于对所述目标语音模组的唤醒功能进行更新。
可选地,所述方法还包括:
将所述第一目标设备的第一设备信息同时注册至所述第二服务器与第四服务器,所述第二服务器与所述第四服务器均依据所述第一设备信息与所述第一目标设备的目标语音模组建立连接。
可选地,所述方法还包括:
接收所述第二服务器发送的升级文件;
根据所述升级文件,对所述目标语音模组与所述处理器进行升级。
根据本公开实施例的第二方面,提供一种设备控制装置,所述装置运用至目标语音模组,所述装置包括:
语音发送模块,被配置为在所述目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,所述第一语音信息用于所述第一服务器将所述第一语音信息转换成第一控制指令发送至第二服务器,所述第一语音信息中包含有对第二目标设备进行控制的信息;
第一控制指令接收模块,被配置为接收所述第二服务器反馈的所述第一控制指令;
控制模块,被配置为根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,所述目标语音模组与所述处理器位于第一目标设备中。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的设备控制方法的步骤。
根据本公开实施例的第四方面,提供一种芯片,包括处理器和接口;所述处理器用于读取指令以执行本公开第一方面所提供的设备控制方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过本公开提出的设备控制方法,用户可以在目标语音模组被唤醒的情况下,将用户输出的第一语音信息发送给第一服务器与第二服务器,通过第一服务器与第二服务器将与第一语音信息对应的第一控制指令返回给第一目标设备的目标语音模组,以使得第一目标设备中的目标语音模组或处理器依据第一控制指令控制第二目标设备;即目标语音模组既具备iot控制能力也具备了语音交互能力,使得与该目标语音模组连接的第一目标设备能够作为智能家居的控制入口,实现对第二目标设备的语音控制。
在这个过程中,若用户没有携带终端,用户只需与自身能够对话的第一目标设备进行沟通,即可控制第二目标设备,无需走到第二目标设备所在位置控制第二目标设备,也无需走到终端所在位置利用终端控制第二目标设备,给用户操控第二目标设备带来便利。
另外,相关技术中wifi模组具有实现iot的控制能力,但是无法进行语音交互;而本公开的目标语音模组,除了具备iot控制能力之外,还具备语音交互的能力,使得与其连接的智能设备能够成为智能家居的控制中心,完成对其它家居设备的语音控制,并且该目标语音模组,不需要每个智能设备都单独配置,只要智能设备接入该目标语音模组,就能够具备上述目标语音模组的能力,就可以实现对其他设备的语音控制,具有一定的通用性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种设备控制方法的流程图。
图2是根据一示例性实施例示出的一种多个服务器与目标语音模组交互的框图。
图3是根据一示例性实施例示出的设备控制装置的框图。
图4是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
图1是根据一示例性实施例示出的一种设备控制方法的流程图,如图1所示,设备控制方法可以运用至目标语音模组中,包括以下步骤。
在步骤S11中,在所述目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,所述第一语音信息用于所述第一服务器将所述第一语音信息转换成第一控制指令发送至第二服务器,所述第一语音信息中包含有对第二目标设备进行控制的信息。
本公开中,目标语音模组除了具备iot能力之外,还具有音频处理能力,目标语音模组具备iot能力可以理解为目标语音模组可以与智能家居控制平台建立连接,比如目标语音模组可以与iot服务器等服务器建立连接,能够实现对智能设备的控制,目标语音模组与处理器可以位于第一目标设备中,目标语音模组与处理器之间通过串口连接,第二目标设备中也可以配置有语音模组与处理器。
其中,第一目标设备为被唤醒的可以控制第二目标设备的设备,第二目标设备为被控制设备;第一服务器可以为能够处理语音信息的服务器,例如可以为小爱服务器;第二服务器可以为整个设备控制方法中下发控制指令的服务器,大部分的指令需要第二服务器下达给第一目标设备中的目标语音模组,由目标语音模组判断自身是否能够处理,第二服务器可以为iot(Internet of Things,物联网)服务器;第一控制指令与第一语音信息对应,用于对第二目标设备上的功能进行控制。
本公开中,目标语音模组可以通过以下子步骤被唤醒:
在子步骤A1中,通过第三服务器接收第三目标设备发送的第二语音信息;在子步骤A2中,通过所述第三服务器,根据多个语音模组的优先级,以及多个语音模组与输出所述第二语音信息的声源之间的距离,从多个语音模组中唤醒所述目标语音模组。
其中,第三服务器可以是从多个服务器中唤醒第一目标设备中的目标语音模组的服务器,例如可以为图2所示的协同服务器,第三目标设备可以是距离输出第二语音信息的声源较近的设备,第三目标设备、第二目标设备与第一目标设备可以是同一智能家居,也可以是不同的智能家居。
具体地,声源所在位置的空间中,距离声源较近的第三目标设备中的语音模组接收到第二语音信息,并将第二语音信息发送至第三服务器,第三服务器接收第三目标设备中的语音模组发送的第二语音信息;并根据声源所在空间中多个设备的语音模组的优先级,以及多个语音模组与声源之间的距离,从多个语音模组中唤醒第一目标设备的目标语音模组。
以房屋中具有洗衣机、电视机与微波炉这三个智能家居,第一目标设备为洗衣机,第二目标设备为电视机,第三目标设备为微波炉,第一服务器为小爱服务器,第二服务器为iot服务器,第三服务器为协同服务器举例。
请参阅图2所示,用户在房屋中发出“小爱同学,在吗”的第二语音信息,此时房屋中距离用户最近的微波炉的语音模组接收到第二语音信息,将第二语音信息传输给协同服务器;协同服务器根据房屋中三个智能家居的语音模组的优先级,以及三个智能家居的语音模组与用户之间的距离,从房屋中的三个智能家居的语音模组中唤醒洗衣机的目标语音模组,使得洗衣机的目标语音模组处于被唤醒的状态。
其中,请参阅图2所示,目标语音模组可以配备有声音采集装置与音频播放装置,声音采集装置可以为麦克风,音频播放装置可以为播放器,在目标语音模组被唤醒的情况下,目标语音模组可以通过声音采集装置采集用户输出的第一语音信息,再通过音频播放装置播放与语音相关的信息,或者通过音频播放装置输出对用户输出的第一语音信息进行反馈的语音。
第二目标设备与第三目标设备等智能家居中的语音模组也均可以配备声音采集装置与音频播放装置,以实现采集语音的功能与播放音频的功能,实现与第一目标设备相同的功能,本公开在此不做限制。
例如,当第三目标设备的语音模组接收到“小爱同学,在吗”的第二语音信息时,第三目标设备的语音模组会通过协同服务器唤醒第一目标设备的目标语音模组,目标语音模组可以通过音频播放装置输出“我在”的语音,从而对用户输出的语音信息作出反馈。
其中,第三服务器可以根据多个语音模组的优先级,以及多个语音模组与输出所述第二语音信息的声源之间的距离,从多个语音模组中唤醒所述目标语音模组。
具体地,在声源所在的空间的语音模组的数量为1时,第三服务器将该唯一的语音模组作为目标语音模组进行唤醒;在声源所在空间的语音模组的数量大于1时,第三服务器可以先从多个语音模组中,将优先级最高的语音模组作为目标语音模组;在存在多个最高优先级的语音模组的情况下,将多个最高优先级的语音模组中距离输出第二语音信息的声源最近的语音模组,作为目标语音模组。
可以理解地,优先级越高,语音模组处理音频数据的能力越高,例如小爱音响、播放器等设备中的语音模组的音频处理能力,高于洗衣机、微波炉等设备的音频处理能力,所以音频处理能力越高的语音模组的优先级高于音频处理能力较弱的语音模组的优先级。
例如,在第三服务器从多个语音模组中唤醒目标语音模组时,可以优先唤醒小爱音响等设备的语音模组,在不存在小爱音响的情况下,洗衣机、微波炉等设备的语音模组的优先级相同,因此可以从多个优先级相同的语音模组中,将距离用户最近的洗衣机的语音模组作为目标语音模组进行唤醒。
在步骤S12中,接收所述第二服务器反馈的所述第一控制指令。
本公开中,请参阅图2所示,第一目标设备包括目标语音模组与处理器,目标语音模组与处理器之间通过串口连接,也可以理解为通过串行通信接口连接。语音模组与音频相关,所以目标语音模组上配备有语音采集装置与音频播放装置;处理器与设备本身的功能相关,处理器上配备有功能按钮与灯光,例如洗衣机的处理器上配备有可以打开洗衣机、定时洗衣机等功能按钮,也配备有对洗衣机显示面板上灯光的控制。
当然,第二目标设备与第三目标设备也可以与第一目标设备相同,包括语音模组与处理器,用来接收第二服务器反馈的第一控制指令。
其中,语音模组可以为小爱语音模组,是由若干电路形成的芯片;处理器是MCU((Microcontroller Unit,微控制单元)处理器。
其中,目标语音模组接收到的第一控制指令可以是请求值,不同的控制指令对应不同的请求值,例如请求打开洗衣机的请求值是1,请求打电视机的请求值是2等。
在步骤S13中,根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,所述目标语音模组与所述处理器位于第一目标设备中。
本公开中,第一目标设备所控制的第二目标设备可以是第一目标设备本身,也可以是其余智能家居。
其中,当目标语音模组接收到的第一语音信息是第一预设语音信息的情况下,目标语音模组确定自身无法依据第二服务器发送的第一控制指令对第二目标设备进行控制;当目标语音模组接收到的第一语音信息是第二预设语音信息的情况下,目标语音模组确定自身可以依据第二服务器发送的第一控制指令对第二目标设备进行控制;当目标语音模组接收到的第一语音信息为第三预设语音信息的情况下,目标语音模组确定自身可以依据第一服务器发送的第二控制指令来与发出声源的用户进行交互。
具体地,第一预设语音信息是与音频播放无关的语音,例如打开电视机、调整电视机亮度、打开微波炉、调整微波炉加热时长等。在第一语音信息为第一预设语音信息的情况下,表明用户是想要对第二目标设备进行控制,而非播放音频,此时目标语音模组在接收到第二服务器输出的第一控制指令后,确定目标语音模组自身无法处理第一控制指令,因此会将第一控制指令转发给处理器,来指示处理器依据第一控制指令来对第二目标设备进行控制。
例如,在洗衣机的目标语音模组被协同服务器唤醒后,当用户再次输出“打开电视机”的第一语音信息时,被唤醒的目标语音模组将第一语音信息发送至小爱服务器;小爱服务器解析第一语音信息之后,将第一语音信息转换成第一控制指令,并将第一控制指令转发至iot服务器,iot服务器通过OT通道,将第一控制指令转发至目标语音模组,目标语音模组将第一控制指令转发给洗衣机中的处理器,洗衣机内的处理器依据第一控制指令控制电视机打开。
具体地,第二预设语音信息是与音频播放相关的语音,例如播放音乐、暂停播放音乐等。在第一语音信息为第二预设语音信息的情况下,表明用户是想要对第二目标设备的音频功能进行控制,此时目标语音模组在接收到第二服务器输出的第一控制指令后,确定目标语音模组自身可以处理第一控制指令,因此可以直接依据第一控制指令对第二目标设备进行控制。
例如,在用户输出“播放音乐”的第一语音信息之后,被唤醒的目标语音模组将第一语音信息上传给小爱服务器,小爱服务器将第一语音信息转换成第一控制指令,并将第一控制指令转发至iot服务器,iot服务器通过OT通道,将第一控制指令转发至目标语音模组,目标语音模组依据第一控制指令控制自身或播放器播放音乐。
具体地,第三预设语音信息可以是与语音交互相关的语音,例如用户需要与第二目标设备进行交互的语音。在第一语音信息为第三预设语音信息的情况下,表明用户想要与第二目标设备进行交互。此时目标语音模组在接收到第一服务器输出的第二控制指令后,确定目标语音模组自身可以处理第二控制指令,因此会直接依据第二控制指令回应声源发出的第一语音信息,来与用户进行语音交互。
在上述过程中,由于目标语音模组上配备有语音采集装置与音频播放装置,所以目标语音模组可采集语音并播放音频,以此来实现第二目标设备的音频播放功能与语音交互功能;处理器与设备直接连接,所以处理器可以直接控制第二目标设备,来执行非音频播放功能。
其中,在处理器成功执行完第一控制指令之后,处理器会将成功执行第一控制指令的反馈信息返回至目标语音模组,目标语音模组再返回至第二服务器,以使得第二服务器确定处理器满足了用户所需功能;同理,在目标语音模组成功执行了第二控制指令之后,目标语音模组也可以将成功执行第二控制指令的反馈信息返回至第二服务器或第一服务器,以使得第一服务器或第二服务器确定目标语音模组满足了用户所需功能。
其中,请参阅图2所示,第一服务器(图2中的小爱服务器)、第二服务器(图2中的iot服务器)、第三服务器(图2中的协同服务器)与第四服务器(图2中的mico服务器),均可以与应用程序通讯连接,用户可以在应用程序上实现初始化配网,使得与各个服务器连接的第一目标设备能够处于连网状态。
另外,用户使用应用程序也可以直接下发控制指令,来控制第二目标设备,本公开在此不再赘述。
通过本公开提出的设备控制方法,用户可以在目标语音模组被唤醒的情况下,将用户输出的第一语音信息发送给第一服务器与第二服务器,通过第一服务器与第二服务器将与第一语音信息对应的第一控制指令返回给第一目标设备的目标语音模组或处理器,以使得第一目标设备中的目标语音模组或处理器依据第一控制指令控制第二目标设备。
在这个过程中,若用户没有携带终端,用户只需与自身能够对话的第一目标设备的目标语音模组进行沟通,即可控制第二目标设备,无需走到第二目标设备所在位置控制第二目标设备,也无需走到终端所在位置利用终端控制第二目标设备,给用户操控第二目标设备带来便利。
另外,相关技术中,设备主控包括WIFI模组与处理器,WIFI模组接收服务器的控制指令,再将控制指令转发给处理器,由处理器来对第二目标设备进行控制。由于WIFI模组不具备音频处理功能,所以第二目标设备的控制只能通过处理器来实现,当需要对第二目标设备的音频功能进行控制时,需要配置一种处理器来对第二目标设备进行控制,当需要对第二目标设备的非音频功能进行控制时,又需要配置另一种处理器来对第二目标设备进行控制,即,具有不同功能的第二目标设备需要不同的设备主控来进行控制,导致设备主控的通用性较低。
而本公开中,目标语音模组相较于WIFI模组而言,具有音频处理能力,目标语音模组会将目标语音模组自身能够处理的第一控制指令进行处理,以实现音频播放与暂停等与音频控制相关的功能,目标语音模组也可以将自身无法处理的第一控制指令转发至处理器,通过处理器实现第二目标设备的直接控制,实现电视机的开启、屏幕亮度控制、定时功能等与音频控制无关的功能。可见,本公开提出的目标音频模组具有音频处理能力,处理器具有非音频处理能力,二者相结合可以对不同的第二目标设备进行控制,其通用性较高。
在一种可能的实施方式中,在第一目标设备的目标语音模组与各个服务器进行通讯之前,需要建立第一目标设备的目标语音模组与各个服务器之间的通讯连接,基于该连接才能实现第一目标设备的目标语音模组与各个服务器之间的数据传输,具体包括:
在步骤S21中,将第一目标设备的第一设备信息同时注册至第二服务器与第四服务器,第二服务器与第四服务器均依据第一设备信息与第一目标设备的目标语音模组建立连接。
本公开中,第二服务器为iot服务器,第四服务器为mico(Micro-controllerbased Internet Connectivity Operating system,物联网操作系统)服务器。
其中,第一设备信息包括设备的标识、注册信息与类型等,这些信息用于唯一标识一个设备。
其中,不同的服务器与第一目标设备的目标语音模组建立连接时,需要目标语音模组上传不同格式的第一设备信息,才能被不同的服务器所解析。
例如,在目标语音模组将第一设备信息注册至第二服务器上时,需要将第一设备信息以model格式或者pid格式,来将第一设备信息上传至第二服务器;第二服务器依据model格式或者pid格式的第一设备信息,才能解析第一设备信息,并依据第一设备信息确定第一目标设备,来与第一目标设备的目标语音模组建立连接。
又如,在目标语音模组将第一设备信息注册至第四服务器上时,需要将第一设备信息以hardware格式,来将第一设备信息上传至第四服务器;第四服务器才能解析hardware格式的第一设备信息,并依据第一设备信息确定第一目标设备,来与第一目标设备的目标语音模组建立连接。
在第一目标设备的目标语音模组与第二服务器建立连接后,可以通过二者之间的OT通道,来实现第一控制指令的传输或者升级文件的传输。
具体地,请参阅图2所示,第二服务器与应用程序通讯连接,应用程序可以为安装在终端内的米家app(Application,应用程序),应用程序检查版本信息,当确定有版本更新时,通过第二服务器下发版本信息给目标语音模组,目标语音模组再从第二服务器中获取升级所需的升级文件,来将升级文件对自身进行升级,或传输给处理器,来对处理器进行升级。
在第一目标设备的目标语音模组与第四服务器建立连接后,可以实现OTA(Over-the-Air Technology,空中下载技术),也可以从第四服务器下载配置文件,来对第一目标设备中目标语音模组的唤醒功能进行更新;也可以上传记录日志给第四服务器。
具体地,协同服务器在多次唤醒第一目标设备的目标语音模组之后,可能仍然存在唤醒目标语音模组失败的情况,此时可以将唤醒失败的记录日志上传给第四服务器;开发人员在第四服务器上开发配置文件,再将配置文件下发给目标语音模组,来对目标语音模组的唤醒功能进行更新,以保证目标语音模组能够被正常唤醒。
在步骤S22中,将第一目标设备的第一设备信息注册至第一服务器,第一服务器依据第一设备信息与第一目标设备的目标语音模组建立连接。
本公开中,第一服务器可以是小爱服务器,在第一设备信息注册在第四服务器与第二服务器成功后,再将第一设备信息注册至第一服务器,以与第一服务器建立连接。
其中,在第一目标设备将第一设备信息注册至第一服务器上时,需要将第一设备信息以Appid格式注册在第一服务器上,第一服务器才能解析Appid格式的第一设备信息,并依据第一设备信息确定第一目标设备,来与第一目标设备的目标语音模组建立连接。
具体地,目标语音模组通过小爱sdk(Software Development Kit,软件开发工具包)将第一设备信息发送至第一服务器,来建立目标语音模组与第一服务器之间的语音交互云端通道,以将目标语音模组的语音上传给第一服务器,或从第一服务器上下载语音资源等。
在步骤S23中,将第一目标设备的第一设备信息注册至第三服务器,第三服务器依据第一设备信息与第一目标设备的目标语音模组建立连接。
本公开中,第三服务器可以是协同服务器,在第一设备信息注册在第一服务器成功后,再将第一设备信息注册至第三服务器,以与第三服务器建立连接。
其中,在第一目标设备将第一设备信息注册至第三服务器上时,需要将第一设备信息以hardware格式注册在第三服务器上,第三服务器才能解析hardware格式的第一设备信息,并依据第一设备信息确定第一目标设备,来与第一目标设备的目标语音模组建立连接。
具体地,目标语音模组通过协同sdk将第一设备信息注册至第三服务器,来与协同服务器建立连接,实现协同服务器对目标语音模组的唤醒控制。
图3是根据一示例性实施例示出的一种设备控制装置框图。参照图3,该设备控制装置120包括语音发送模块121、第一控制指令接收模块122与控制模块123。
语音发送模块121,被配置为在在所述目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,所述第一语音信息用于所述第一服务器将所述第一语音信息转换成第一控制指令发送至第二服务器,所述第一语音信息中包含有对第二目标设备进行控制的信息;
第一控制指令接收模块122,被配置为接收所述第二服务器反馈的所述第一控制指令;
控制模块123,被配置为根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,所述目标语音模组与所述处理器位于第一目标设备中。
可选地,设备控制装置120包括:
第二语音信息接收模块,被配置为通过第三服务器接收第三目标设备发送的第二语音信息;
唤醒模块,被配置为通过所述第三服务器,根据多个语音模组的优先级,以及多个语音模组与输出所述第二语音信息的声源之间的距离,从多个语音模组中唤醒所述目标语音模组。
可选地,控制模块123包括:
第一控制模块,被配置为在所述第一语音信息为第一预设语音信息的情况下,将所述第一控制指令发送至所述处理器,所述第一控制指令用于指示所述处理器根据所述第一控制指令对所述第二目标设备进行控制。
可选地,控制模块123包括:
第二控制模块,被配置为在所述第一语音信息为第二预设语音信息的情况下,根据所述第一控制指令对所述第二目标设备进行控制。
可选地,设备控制装置120包括:
第二控制指令接收模块,被配置为在所述第一语音信息为所述第三预设语音信息的情况下,收所述第一服务器反馈的所述第二控制指令;
第三控制模块,被配置为根据所述第二控制指令,对所述第二目标设备进行控制。
可选地,设备控制装置120包括:
更新模块,被配置为在所述第一目标设备与第四服务器建立连接的情况下,接收所述第四服务器发送的配置文件,所述配置文件用于对所述目标语音模组的唤醒功能进行更新。
可选地,设备控制装置120包括:
注册模块,被配置为将所述第一目标设备的第一设备信息同时注册至所述第二服务器与第四服务器,所述第二服务器与所述第四服务器均依据所述第一设备信息与所述第一目标设备的目标语音模组建立连接。
可选地,设备控制装置120包括:
升级文件接收模块,被配置为接收所述第二服务器发送的升级文件;
升级模块,被配置为根据所述升级文件,根据所述升级文件,对所述目标语音模组与所述处理器进行升级。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的设备控制方法的步骤。
图4是根据一示例性实施例示出的一种用于设备控制的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的设备控制方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
输入/输出接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述设备控制方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述设备控制方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
上述装置除了可以是独立的电子设备外,也可是独立电子设备的一部分,例如在一种实施例中,该装置可以是集成电路(Integrated Circuit,IC)或芯片,其中该集成电路可以是一个IC,也可以是多个IC的集合;该芯片可以包括但不限于以下种类:GPU(GraphicsProcessing Unit,图形处理器)、CPU(Central Processing Unit,中央处理器)、FPGA(Field Programmable Gate Array,可编程逻辑阵列)、DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、SOC(System on Chip,SoC,片上系统或系统级芯片)等。上述的集成电路或芯片中可以用于执行可执行指令(或代码),以实现上述的设备控制方法。其中该可执行指令可以存储在该集成电路或芯片中,也可以从其他的装置或设备获取,例如该集成电路或芯片中包括处理器、存储器,以及用于与其他的装置通信的接口。该可执行指令可以存储于该存储器中,当该可执行指令被处理器执行时实现上述的设备控制方法;或者,该集成电路或芯片可以通过该接口接收可执行指令并传输给该处理器执行,以实现上述的设备控制方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的设备控制方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (11)

1.一种设备控制方法,其特征在于,所述方法运用至目标语音模组,所述方法包括:
在所述目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,所述第一语音信息用于所述第一服务器将所述第一语音信息转换成第一控制指令发送至第二服务器,所述第一语音信息中包含有对第二目标设备进行控制的信息;
接收所述第二服务器反馈的所述第一控制指令;
根据所述第一控制指令,使用所述目标语音模组或处理器对第二目标设备进行控制,所述目标语音模组与所述处理器位于第一目标设备中。
2.根据权利要求1所述的方法,其特征在于,所述目标语音模组通过以下步骤唤醒:
通过第三服务器接收第三目标设备发送的第二语音信息;
通过所述第三服务器,根据多个语音模组的优先级,以及多个语音模组与输出所述第二语音信息的声源之间的距离,从多个语音模组中唤醒所述目标语音模组。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,包括:
在所述第一语音信息为第一预设语音信息的情况下,将所述第一控制指令发送至所述处理器,所述第一控制指令用于指示所述处理器根据所述第一控制指令对所述第二目标设备进行控制。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一控制指令,使用所述目标语音模组或处理器对第二目标设备进行控制,包括:
在所述第一语音信息为第二预设语音信息的情况下,根据所述第一控制指令对所述第二目标设备进行控制。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第一语音信息为所述第三预设语音信息的情况下,接收所述第一服务器反馈的所述第二控制指令;
根据所述第二控制指令,对所述第二目标设备进行控制。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在所述第一目标设备与第四服务器建立连接的情况下,接收所述第四服务器发送的配置文件,所述配置文件用于对所述目标语音模组的唤醒功能进行更新。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第一目标设备的第一设备信息同时注册至所述第二服务器与第四服务器,所述第二服务器与所述第四服务器均依据所述第一设备信息与所述第一目标设备的目标语音模组建立连接。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述第二服务器发送的升级文件;
根据所述升级文件,对所述目标语音模组与所述处理器进行升级。
9.一种设备控制装置,其特征在于,所述装置运用至目标语音模组,所述装置包括:
语音发送模块,被配置为在所述目标语音模组被唤醒的情况下,将采集到的第一语音信息发送至第一服务器,所述第一语音信息用于所述第一服务器将所述第一语音信息转换成第一控制指令发送至第二服务器,所述第一语音信息中包含有对第二目标设备进行控制的信息;
第一控制指令接收模块,被配置为接收所述第二服务器反馈的所述第一控制指令;
控制模块,被配置为根据所述第一控制指令使用所述目标语音模组或处理器对第二目标设备进行控制,所述目标语音模组与所述处理器位于第一目标设备中。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~8中任一项所述方法的步骤。
11.一种芯片,其特征在于,包括处理器和接口;所述处理器用于读取指令以执行权利要求1~8中任一项所述的方法。
CN202211193908.XA 2022-09-28 2022-09-28 设备控制方法、装置、可读存储介质与芯片 Pending CN115562054A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202211193908.XA CN115562054A (zh) 2022-09-28 2022-09-28 设备控制方法、装置、可读存储介质与芯片
US18/086,249 US20240105164A1 (en) 2022-09-28 2022-12-21 Device control method and apparatus, readable storage medium and chip
EP22217062.3A EP4346172A1 (en) 2022-09-28 2022-12-29 Controlling devices in a network using voice information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211193908.XA CN115562054A (zh) 2022-09-28 2022-09-28 设备控制方法、装置、可读存储介质与芯片

Publications (1)

Publication Number Publication Date
CN115562054A true CN115562054A (zh) 2023-01-03

Family

ID=84689196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211193908.XA Pending CN115562054A (zh) 2022-09-28 2022-09-28 设备控制方法、装置、可读存储介质与芯片

Country Status (3)

Country Link
US (1) US20240105164A1 (zh)
EP (1) EP4346172A1 (zh)
CN (1) CN115562054A (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9984686B1 (en) * 2015-03-17 2018-05-29 Amazon Technologies, Inc. Mapping device capabilities to a predefined set
CN104965448A (zh) * 2015-07-17 2015-10-07 小米科技有限责任公司 智能设备的控制方法和装置
US10755706B2 (en) * 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
CN113470634B (zh) * 2020-04-28 2024-05-17 海信集团有限公司 语音交互设备的控制方法、服务器及语音交互设备
CN111722824B (zh) * 2020-05-29 2024-04-30 北京小米松果电子有限公司 语音控制方法、装置及计算机存储介质

Also Published As

Publication number Publication date
EP4346172A1 (en) 2024-04-03
US20240105164A1 (en) 2024-03-28

Similar Documents

Publication Publication Date Title
CN109379261B (zh) 智能设备的控制方法、装置、系统、设备和存储介质
CN111722824B (zh) 语音控制方法、装置及计算机存储介质
WO2021000876A1 (zh) 一种语音控制方法、电子设备及系统
CN108520746B (zh) 语音控制智能设备的方法、装置及存储介质
EP3136793B1 (en) Method and apparatus for awakening electronic device
CN110233934B (zh) 电子设备控制方法、装置及计算机可读存储介质
CN106371799A (zh) 多媒体播放设备的音量控制方法及装置
CN104811776B (zh) 多媒体播放方法及装置
CN112037787A (zh) 唤醒控制方法、装置及计算机可读存储介质
CN104394137A (zh) 一种提醒语音通话的方法及装置
CN111128148B (zh) 语音点餐的方法、装置、系统、计算机可读存储介质
CN104159283A (zh) 信息发送的控制方法及装置
CN107885307B (zh) 设备控制方法及装置
CN109522058B (zh) 唤醒方法、装置、终端及存储介质
CN111277984A (zh) 无线局域网接入方法及装置
CN106933111B (zh) 一种控制设备的方法及装置
CN111093248B (zh) 配网方法、配网装置及电子设备
CN114822525A (zh) 语音控制方法和电子设备
CN112351321A (zh) 一种遥控响应方法、电子设备与计算机可读存储介质
CN111130183A (zh) 无线充电方法和装置、无线充电设备、电子设备
CN106357360A (zh) 播放节目的方法及装置、智能收音机、终端设备
CN115562054A (zh) 设备控制方法、装置、可读存储介质与芯片
CN115798476A (zh) 设备控制方法、装置、可读存储介质与芯片
CN107979695B (zh) 网络消息接收方法及装置、存储介质
CN114866828B (zh) 音视频播放方法、装置、服务器、存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination