CN113096658A

CN113096658A - 一种终端设备及其唤醒方法、装置和计算机可读存储介质

Info

Publication number: CN113096658A
Application number: CN202110348002.XA
Authority: CN
Inventors: 刘修伦
Original assignee: Goertek Inc
Current assignee: Goertek Inc
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2021-07-09

Abstract

本申请公开了一种终端设备及其唤醒方法、装置和计算机可读存储介质，该方法包括：终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，唤醒信息包括声源距离和/或信噪比；根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备；其中，终端设备与目标终端设备通过蓝牙Mesh网络连接，唤醒设备为终端设备和目标终端设备中的任一设备；若终端设备为唤醒设备，则唤醒启动并根据唤醒词进行应答；本申请利用蓝牙Mesh功能将用户家庭中相同唤醒词的设备进行组网，使得网络中的各个设备能够交互确定，保证网络中只有一个设备应答用户的唤醒词，避免同一时刻多个设备被一个的唤醒词同时唤醒应答的情况，提升了用户体验。

Description

一种终端设备及其唤醒方法、装置和计算机可读存储介质

技术领域

本申请涉及语音识别技术领域，特别涉及一种终端设备的唤醒方法、装置、终端设备及计算机可读存储介质。

背景技术

随着智能语音类电子产品的不断发展，带有语音唤醒和识别功能的终端设备，如智能音箱、智能电视、智能手柄等，以其语音操作的便利性逐步进入消费者的生活并被消费者认可，成为家庭生活中不可或缺的终端设备之一。

现有技术中，智能语音类的终端设备的唤醒都需要有一个类似姓名的唤醒词，由于唤醒词需要专门训练，通常一个厂家只有一个唤醒词用于标识自家设备。但是在一个用户家庭中有多个相同唤醒词的终端设备的情况下，当用户使用唤醒词唤醒终端设备的时候，会存在多个终端设备同时唤醒并响应用户请求的情况，造成用户体验差的问题。

因此，如何避免同一时刻多个终端设备被一个的唤醒词同时唤醒应答的情况，提升用户体验，是现今急需解决的问题。

发明内容

本申请的目的是提供一种终端设备的唤醒方法、装置、终端设备及计算机可读存储介质，以避免同一时刻多个终端设备被一个的唤醒词同时唤醒应答的情况，提升用户体验。

为解决上述技术问题，本申请提供一种终端设备的唤醒方法，包括：

终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，所述唤醒信息包括声源距离和/或信噪比；

根据所述唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备；其中，所述终端设备与所述目标终端设备通过蓝牙Mesh网络连接，所述唤醒设备为所述终端设备和所述目标终端设备中的任一设备；

若所述终端设备为所述唤醒设备，则唤醒启动并根据所述唤醒词进行应答。

可选的，所述根据所述唤醒信息，与所述蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备，包括：

根据所述唤醒信息，确定所述终端设备的唤醒分数；

通过蓝牙Mesh网络将所述唤醒分数发送给所述目标终端设备，并接收所述目标终端设备发送的各自的目标唤醒分数；

根据所述唤醒分数和所述目标唤醒分数，确定所述唤醒设备。

可选的，所述唤醒信息包括所述声源距离和所述信噪比时，所述根据所述唤醒信息，确定所述终端设备的唤醒分数，包括：

根据所述唤醒信息，利用S＝K*M+λ*N，计算所述唤醒分数；其中，S为所述唤醒分数，M为所述声源距离对应的距离分数，K为距离权重，N为所述信噪比对应的信噪比分数，λ为信噪比权重。

可选的，所述信噪比权重大于所述距离权重时，所述根据所述唤醒分数和所述目标唤醒分数，确定所述唤醒设备，包括：

确定所述唤醒分数和所述目标唤醒分数中的数值最大的最优唤醒分数；

判断所述最优唤醒分数的数量是否为1；

若是，则将所述最优唤醒分数对应的终端设备或目标终端设备确定为所述唤醒设备；

若否，则将所述最优唤醒分数中信噪比分数的数值最大的最优唤醒分数对应的终端设备或目标终端设备确定为所述唤醒设备。

可选的，所述唤醒信息包括所述声源距离和所述信噪比时，所述终端设备获取麦克风采集的唤醒词后，确定唤醒信息，包括：

所述终端设备获取所述唤醒词后，利用所述麦克风采集的语音信号，分别进行声源定位和信噪比计算，计算得到所述声源距离和信噪比。

可选的，所述唤醒启动并根据所述唤醒词进行应答之后，还包括：

获取所述麦克风采集的控制语音；

判断所述终端设备是否能够响应所述控制语音；

若是，则执行所述控制语音对应的操作；

若否，则通过蓝牙Mesh网络与响应设备进行交互，控制响应设备执行所述控制语音对应的操作；其中，响应设备为任一所述目标终端设备。

本申请还提供了一种终端设备的唤醒装置，包括：

信息确定模块，用于在终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，所述唤醒信息包括声源距离和/或信噪比；

设备确定模块，用于根据所述唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备；其中，所述终端设备与所述目标终端设备通过蓝牙Mesh网络连接，所述唤醒设备为所述终端设备和所述目标终端设备中的任一设备；

唤醒模块，用于若所述终端设备为所述唤醒设备，则唤醒启动并根据所述唤醒词进行应答。

可选的，所述设备确定模块，包括：

分数确定子模块，用于根据所述唤醒信息，确定所述终端设备的唤醒分数；

交互子模块，用于通过蓝牙Mesh网络将所述唤醒分数发送给所述目标终端设备，并接收所述目标终端设备发送的各自的目标唤醒分数；

设备确定子模块，用于根据所述唤醒分数和所述目标唤醒分数，确定所述唤醒设备。

本申请还提供了一种终端设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述所述的终端设备的唤醒方法的步骤。

本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述所述的终端设备的唤醒方法的步骤。

本申请所提供的一种终端设备的唤醒方法，包括：终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，唤醒信息包括声源距离和/或信噪比；根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备；其中，终端设备与目标终端设备通过蓝牙Mesh网络连接，唤醒设备为终端设备和目标终端设备中的任一设备；若终端设备为唤醒设备，则唤醒启动并根据唤醒词进行应答；

可见，本申请通过根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备，利用蓝牙Mesh功能将用户家庭中相同唤醒词的设备进行组网形成一个蓝牙Mesh网络系统，使得网络中的各个设备通过蓝牙Mesh功能传递和接收信息，保证网络中只有一个设备应答用户的唤醒词，避免同一时刻多个设备被一个的唤醒词同时唤醒应答的情况，提升了用户体验。此外，本申请还提供了一种终端设备的唤醒装置、终端设备及计算机可读存储介质，同样具有上述有益效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种终端设备的唤醒方法的流程图；

图2为本申请实施例所提供的另一种终端设备的唤醒方法的流程图；

图3为本申请实施例所提供的一种终端设备的唤醒装置的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1，图1为本申请实施例所提供的一种终端设备的唤醒方法的流程图。该方法可以包括：

步骤101：终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，唤醒信息包括声源距离和/或信噪比。

其中，本实施例中的终端设备可以为具备语音唤醒和识别功能的设备，如智能音箱、智能电视和智能手柄等。本步骤中的麦克风可以设置在终端设备中。本实施例并不限定麦克风的具体数量和类型，如终端设备中可以设置多个麦克风组成的麦克风阵列，以提高确定的唤醒信息的准确性。

具体的，本步骤中的唤醒信息可以为用于确定用户发出的唤醒词所要唤醒的一个设备(即唤醒设备)的信息。对于本实施例中唤醒信息的具体内容，可以由设计人员根据使用场景和用户需求自行设置，如唤醒信息可以包括终端设备与发出唤醒词的声源(即用户)的距离(即声源距离)；唤醒信息也可以包括麦克风采集到的语音信号的信噪比；唤醒信息还可以包括终端设备在预设时间段内被唤醒词唤醒应答的次数。只要终端设备的处理器可以利用唤醒信息确定唤醒设备，本实施例对此不作任何限制。

可以理解的是，本步骤中终端设备的处理器可以在识别到其麦克风采集到的能够唤醒自身的唤醒词后，确定唤醒信息，以利用唤醒信息确定自身是否为需要唤醒并应答的唤醒设备。也就是说，本步骤之前可以包括终端设备的处理器识别麦克风采集的唤醒词的步骤，例如终端设备的处理器可以采用与现有技术中的语音识别方法相同或相似的方式，识别麦克风采集到的能够唤醒该终端设备的语音信号(即唤醒词)。

具体的，本实施例中的终端设备可以为蓝牙Mesh网络中任一能够被本步骤中的唤醒词唤醒的设备(即节点)。对于本步骤中终端设备的处理器在识别到其麦克风采集到的能够唤醒自身的唤醒词后，确定唤醒信息的具体方式，可以由设计人员自行设置，如处理器可以在识别到其麦克风采集到的唤醒词后，利用麦克风采集语音信号，并根据麦克风采集的语音信号，确定唤醒信息；例如唤醒信息包括声源距离和信噪比时，当用户用要发出唤醒词唤醒蓝牙Mesh网络中某个节点时，蓝牙Mesh网络中各节点均收到用户的唤醒词，从用户说完唤醒词到唤醒设备响应(类似响应“我在”、“你好，我在”等)通常而言，考虑到用户体验，这一过程的时间大约为200～300Ms，蓝牙Mesh网络中各节点收到唤醒词后，通过各节点各自的麦克风(如麦克风阵列)采集的语音信号，进行声源定位，计算各节点与用户之间的距离(即声源距离)，并且根据各自的麦克风收到的语音信号的强弱，计算信噪比。处理器也可以在识别到其麦克风采集到的唤醒词后，利用麦克风采集的唤醒词对应的语音信号，确定唤醒信息。本实施例对此不作任何限制。

对应的，对于本步骤中终端设备的处理器在识别到其麦克风采集到的能够唤醒自身的唤醒词后，确定唤醒信息的具体过程，可以由设计人员自行设置，如可以采用与现有技术中的唤醒信息计算方法相同或相似的方式实现，如唤醒信息包括声源距离和信噪比，可以采用现有技术中的声源定位方法和信噪比计算方法，利用麦克风采集的语音信号，计算声源距离和信噪比。

步骤102：根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备；其中，终端设备与目标终端设备通过蓝牙Mesh网络连接，唤醒设备为终端设备和目标终端设备中的任一设备。

可以理解的是，本实施例中的蓝牙Mesh网络可以为能够被相同唤醒词唤醒的设备利用各自的蓝牙Mesh功能组成的一个网络系统，即目标终端设备与终端设备通过蓝牙Mesh连接，组成蓝牙Mesh网络；目标终端设备可以为具备语音唤醒和识别功能的设备，能够被步骤101中终端设备中麦克风采集的唤醒词所唤醒。本步骤中的唤醒设备可以为选择确定的能够被步骤101中的唤醒词所唤醒的蓝牙Mesh网络中终端设备和目标终端设备中的一个设备，即本实施例中可以仅由唤醒设备进行唤醒词对应的唤醒和应答，其他设备不会进行应答，避免同一时刻多个设备被一个的唤醒词同时唤醒应答的情况。

具体的，本步骤中每个目标终端设备可以识别到在各自的麦克风采集的唤醒词后，利用各自确定的唤醒信息(即目标唤醒信息)，与通过蓝牙Mesh网络与终端设备和其他的目标终端设备进行交互，使蓝牙Mesh网络中识别到唤醒词的每个设备(如终端设备和目标终端设备)均可以自行确定唤醒终端。

对应的，对于本步骤中终端设备的处理器根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备的具体方式，可以由设计人员根据使用场景和用户需求自行设置，如终端设备的处理器可以直接通过蓝牙Mesh网络将自身的唤醒信息发送到目标终端设备，并接收目标终端设备发送的各自的唤醒信息(即目标唤醒信息)，利用唤醒信息和目标唤醒信息确定唤醒设备；例如蓝牙Mesh网络中每个能够被唤醒词唤醒的设备(如终端设备和目标终端设备)可以将自身确定的唤醒信息发送给蓝牙Mesh网络中的其他设备，从而利用自身确定的唤醒信息和其他设备发送的各自的唤醒信息，确定唤醒设备。终端设备的处理器也可以先确定自身的唤醒信息对应的分数(即唤醒分数)，再将唤醒分数发送到目标终端设备，并接收目标终端设备发送的各自的唤醒分数(即目标唤醒分数)，利用唤醒分数和目标唤醒分数的比较确定唤醒设备；例如蓝牙Mesh网络中每个能够被唤醒词唤醒的设备(如终端设备和目标终端设备)可以自行确定各自的唤醒信息对应的唤醒分数并发送给蓝牙Mesh网络中的其他设备，从而利用自身确定的唤醒分数与其他设备发送的各自的唤醒分数的比较，确定唤醒设备。本实施例对此不作任何限制。

步骤103：若终端设备为唤醒设备，则唤醒启动并根据唤醒词进行应答。

可以理解的是，本步骤的目的可以为终端设备在确定自身为唤醒设备时，唤醒启动并根据唤醒词进行应答，使得能够被唤醒词唤醒的终端设备和目标终端设备中仅由终端设备进行该唤醒词的应答，目标终端设备并不进行该唤醒词的应答，从而使得蓝牙Mesh网络中的终端设备和目标终端设备中只有一个设备(即唤醒设备)响应用户的唤醒词，不会造成全部设备都应答的情况。

对应的，本实施例中终端设备不为唤醒设备时，终端设备可以直接结束本流程不进行唤醒启动；或者也可以唤醒启动并保持唤醒状态，但不会进行唤醒词的应答。相应的，确定自身为唤醒设备的目标终端设备，可以唤醒启动并根据唤醒词进行应答。

具体的，对于本步骤中终端设备的处理器唤醒启动并根据唤醒词进行应答的具体方式，可以采用与现有技术中的语音唤醒应答方法相同或相似的方式实现，例如终端设备可以利用自身的扬声器进行唤醒词对应的应答(如应答“我在”或“你好，我在”等)；终端设备也可以利用被控终端进行唤醒词对应的应答，例如电视遥控器为唤醒设备时，可以被其麦克风采集的唤醒词所唤醒启动，并控制电视进行唤醒词对应的应答，如语音播放或显示“我在”。只要终端设备为唤醒设备时，能够被麦克风采集的唤醒词所唤醒启动，并进行相应的应答，本实施例对此不做任何限制。

进一步的，由于有时响应应答用户唤醒词的设备(即唤醒设备)可能不能满足用户的真实意图。例如，蓝牙Mesh网络中存在音箱、电视和手柄等设备，如手柄作为唤醒设备响应用户的唤醒词而唤醒后，用户的真实请求为“我要听xxx的音乐”的控制语音，显然手柄无法满足用户的请求。本实施例中可以利用蓝牙Mesh网络中节点之间的协调应答机制，使能满足用户真实请求的节点最终响应用户的控制语音，例如手柄作为唤醒设备在其麦克风采集的“我要听xxx的音乐”的控制语音时，可以在其不能够响应该控制语音时，通过蓝牙Mesh网络与能够响应该控制语音的设备(即响应设备，如音箱)进行交互，控制响应设备执行控制语音对应的操作，如控制音箱播放该控制语音对应的音乐，从而最大程度地保证满足用户的真实意图。

也就是说，本实施例还可以包括：终端设备在唤醒启动并根据唤醒词进行应答后，获取麦克风采集的控制语音；判断终端设备是否能够响应控制语音；若是，则执行控制语音对应的操作；若否，则通过蓝牙Mesh网络与响应设备进行交互，控制响应设备执行控制语音对应的操作；其中，响应设备为任一目标终端设备。

本实施例中，本申请实施例通过根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备，利用蓝牙Mesh功能将用户家庭中相同唤醒词的设备进行组网形成一个蓝牙Mesh网络系统，使得网络中的各个设备通过蓝牙Mesh功能传递和接收信息，保证网络中只有一个设备应答用户的唤醒词，避免同一时刻多个设备被一个的唤醒词同时唤醒应答的情况，提升了用户体验。

请参考图2，图2为本申请实施例所提供的另一种终端设备的唤醒方法的流程图。该方法可以包括：

步骤201：终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，唤醒信息包括声源距离和信噪比。

具体的，本步骤中终端设备的处理器在识别到麦克风采集的能够唤醒该终端设备的唤醒词后，可以利用麦克风采集的语音信号，分别进行声源定位和信噪比计算，计算得到声源距离和信噪比。也就是说，蓝牙Mesh网络中的各个节点(如终端设备和目标终端设备)在识别到各自麦克风采集的能够唤醒自身的唤醒词后，可以利用各自的麦克风(如麦克风阵列)采集的语音信号进行声源定位，通过各节点自带的麦克风计算节点与用户之间的大致距离(即声源距离)，同时各节点根据各自麦克风收到的语音信号的强弱，计算信噪比。

步骤202：根据唤醒信息，确定终端设备的唤醒分数。

可以理解的是，本步骤的目的可以为终端设备的处理器通过确定唤醒信息对应的分数(即唤醒得分)，使蓝牙Mesh网络中的各个节点可以直接通过唤醒得分的数值比较，确定唤醒设备。

具体的，对于本步骤中处理器根据唤醒信息，确定终端设备的唤醒分数的具体方式，可以由设计人员和根据使用场景和用户需求自行设置，如唤醒分数可以为唤醒信息中声源距离对应的分数(即距离分数)和唤醒信息中信噪比对应的分数(即信噪比分数)与各自对应的权重的乘积之和，即处理器可以根据唤醒信息，利用S＝K*M+λ*N，计算唤醒分数；其中，S为唤醒分数，M为声源距离对应的距离分数，K为距离权重，N为信噪比对应的信噪比分数，λ为信噪比权重。

对应的，本实施例并不限定信噪比分数和距离分数的具体计算方式，如距离分数可以为唤醒信息中声源距离与第一预设数值的乘积，信噪比分数可以为唤醒信息中信噪比与第二预设数值的乘积，例如可以设置第一预设数值和第二预设数值均为正数，使得距离分数越大则声源距离越大，信噪比分数越大则信噪比越大，即距离分数与声源距离成正比，且信噪比分数信噪比成正比。距离分数也可以为唤醒信息中声源距离所在的距离范围对应的分数值，信噪比分也可以为唤醒信息中信噪比所在的信噪比范围对应的分数值，即预先设置多个距离范围和每个距离范围各自对应的分数值以及多个信噪比范围和每个信噪比范围对应的分数值，通过声源距离和信噪比所处范围的确定，确定距离分数和信噪比分数，例如可以设置最小值越大的距离范围对应的分数值越大，和最小值越大的信噪比范围对应的分数值越大，使得距离分数越大则声源距离越大，信噪比分数越大则信噪比越大，即距离分数与声源距离成正比，且信噪比分数信噪比成正比。

步骤203：通过蓝牙Mesh网络将唤醒分数发送给目标终端设备，并接收目标终端设备发送的各自的目标唤醒分数。

其中，本步骤中终端设备的处理器可以通过蓝牙Mesh网络将唤醒分数发送给能够被唤醒词所唤醒的蓝牙Mesh网络中的其它设备(即目标终端设备)，并通过蓝牙Mesh网络接收目标终端设备发送的各自的唤醒分数(即目标唤醒分数)。

具体的，本步骤中终端设备的处理器可以通过蓝牙Mesh网络将唤醒分数发送给蓝牙Mesh网络中的其它的全部设备，并将预设时间段内通过蓝牙Mesh网络接收的唤醒分数作为目标唤醒分数。

步骤204：根据唤醒分数和目标唤醒分数，确定唤醒设备。

可以理解的是，本步骤的目的可以为终端设备的处理器通过自身的唤醒分数与目标终端设备各自的目标唤醒分数的比较，确定唤醒设备。对于处理器根据唤醒分数和目标唤醒分数，确定唤醒设备的具体方式，可以由设计人员自行设置，如S＝K*M+λ*N，且距离分数与声源距离成正比，信噪比分数信噪比成正比时，可以选择唤醒分数和目标唤醒分数中数值最大的一个作为最优唤醒分数，将最优唤醒分数对应的设备作为唤醒设备(如终端设备或任一目标终端设备)；进一步的，如存在两个或两个以上最优唤醒分数，即存在两个或两个以上设备对应的分数相等且最大，可以设置声源距离和信噪比的优先级，如设置信噪比权重大于距离权重(即λ＞K)时，可以确定信噪比的优先级高于声源距离的优先级，处理器可以将多个最优唤醒分数中信噪比分数的数值最大的最优唤醒分数对应的终端设备或目标终端设备确定为唤醒设备。

也就是说，本步骤中处理器确定目标唤醒分数和唤醒分数中的数值最大的最优唤醒分数；判断最优唤醒分数的数量是否为1；若是，则将最优唤醒分数对应的终端设备或目标终端设备确定为唤醒设备；若否，则将最优唤醒分数中信噪比分数的数值最大的最优唤醒分数对应的终端设备或目标终端设备确定为唤醒设备。

步骤205：若终端设备不为唤醒设备，则唤醒启动并保持唤醒状态。

可以理解的是，本步骤中终端设备在确定自身不为唤醒设备时，唤醒启动并保持唤醒状态，但其不会根据唤醒词进行应答，使得蓝牙Mesh网络中被唤醒词唤醒的所有设备虽然都处于唤醒状态，但保证只有一个设备(即唤醒设备)响应应答用户的唤醒词，避免所有设备都应答的情况发生；并且由于终端设备能够在不为唤醒设备的情况下保持唤醒状态，使得唤醒设备不能响应控制语音时，唤醒设备能够更快地通过蓝牙Mesh网络与终端设备进行交互，从而提高控制语音的响应速度。进一步的，终端设备通过本步骤保持唤醒状态后，可以在唤醒状态利用自身的麦克风采集控制语音，检测自身能否响应控制语音，以在唤醒设备不能够响应控制语音时，与唤醒设备交互控制语音的响应检测结果，方便唤醒设备对能够执行控制语音对应的操作的响应设备的确定。

步骤206：若终端设备为唤醒设备，则唤醒启动并根据唤醒词进行应答。

其中，本步骤与步骤103相似，在此不再赘述。

步骤207：获取麦克风采集的控制语音。

可以理解的是，本步骤中终端设备为唤醒设备时，终端设备的处理器可以在进行唤醒词对应的应答后，获取并识别其麦克风采集的控制语音，即用户的真实请求的语音，如“我要听xxx的音乐”。

具体的，本实施例并不限定处理器获取麦克风采集的控制语音的具体方式，如可以采用与现有技术中的语音识别和语音控制方法相同或相似方式实现，本实施例对此不作任何限制。

步骤208：判断终端设备是否能够响应控制语音；若是，则进入步骤209；若否，则进入步骤210。

其中，本步骤的目的可以为终端设备的处理器通过判断终端设备是否能够响应控制语音，确定自身是否能够响应执行控制语音对应的操作，即用户是否想要唤醒终端设备响应控制语音；若是，则可以进入步骤209，由终端设备响应执行控制语音对应的操作；若否，则可以进入步骤210，利用蓝牙Mesh网络之间的协调应答机制，选择并控制响应设备执行控制语音对应的操作，从而最大程度地保证满足用户的真实意图。

步骤209：执行控制语音对应的操作。

具体的，本步骤的目的可以为终端设备的处理器在确定终端设备能够响应控制语音时，直接执行控制语音对应的操作，从而将终端设备作为用户的真实想要语音控制的设备，由终端设备自行完成控制语音对应操作的响应执行。

步骤210：通过蓝牙Mesh网络与响应设备进行交互，控制响应设备执行控制语音对应的操作；其中，响应设备为任一目标终端设备。

可以理解的是，本步骤中的响应设备可以为选择确定的能够响应执行控制语音对应操作的蓝牙Mesh网络中的一个目标终端设备，也就是说，本步骤中为终端设备的处理器在确定终端设备不能够响应控制语音时，可以利用蓝牙Mesh网络中节点间的协调应答机制，与蓝牙Mesh网络中的各目标终端设备进行交互，选择确定一个能够响应执行控制语音对应操作的目标终端设备(即响应设备)。

具体的，对于本步骤中响应设备的具体确定方式，可以由设计人员自行设置，如蓝牙Mesh网络中仅有一个目标终端设备能够响应执行控制语音对应的操作时，可以直接将该目标终端设备确定为响应设备；蓝牙Mesh网络中有多个目标终端设备能够响应执行控制语音对应的操作时，可以根据这些目标终端设备各自的目标唤醒分数，选择一个目标终端设备确定为响应设备，如将能够响应执行控制语音对应操作的多个目标终端设备中对应目标唤醒分数最大的一个目标终端设备确定为响应设备。本实施例对此不作任何限制。

具体的，本实施例并不限定终端设备的处理器控制响应设备执行控制语音对应的操作的具体方式，如可以利用蓝牙Mesh网络直接将麦克风采集的控制语音发送到响应设备，以控制响应设备执行控制语音对应的操作；也可以利用蓝牙Mesh网络向响应设备发送控制语音对应的控制指令，以控制响应设备执行控制语音对应的操作。

需要说明的是，本实施例是以在终端设备不能够响应控制语音时，从发送各自的目标唤醒分数的目标终端设备中选择一个目标终端设备确定为响应终端为例进行的展示，响应终端也可以为蓝牙Mesh网络中的一个未发送目标唤醒分数的设备，即与终端设备通过蓝牙Mesh连接的一个未收到唤醒词的设备。本实施例对此不作任何限制。

具体的，本实施例中终端设备为唤醒设备时，目标终端设备可以不再利用各自的麦克风采集控制语音，而是等待终端设备的交互；目标终端设备也可以在唤醒状态利用各自的麦克风采集控制语音，以在终端设备不能够响应控制语音时，方便终端设备确定能够执行控制语音对应的操作的响应设备；只要终端设备的处理器可以通过蓝牙Mesh网络与响应设备进行交互，确定并控制响应设备执行控制语音对应的操作，本实施例对此不作任何限制。

本实施例中，本申请实施例通过在终端设备不能够响应控制语音时，通过蓝牙Mesh网络与响应设备进行交互，控制响应设备执行控制语音对应的操作，能够根据用户的真实意图协调应答决定哪个设备响应用户的控制语音，有效提高语音设备的智能化和人性化，进一步提升了用户体验。

请参考图3，图3为本申请实施例所提供的一种终端设备的唤醒装置的结构框图。该装置可以包括：

信息确定模块10，用于在终端设备获取麦克风采集的唤醒词后，确定唤醒信息；其中，唤醒信息包括声源距离和/或信噪比；

设备确定模块20，用于根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备；其中，终端设备与目标终端设备通过蓝牙Mesh网络连接，唤醒设备为终端设备和目标终端设备中的任一设备；

唤醒模块30，用于若终端设备为唤醒设备，则唤醒启动并根据唤醒词进行应答。

可选的，设备确定模块20，可以包括：

分数确定子模块，用于根据唤醒信息，确定终端设备的唤醒分数；

交互子模块，用于通过蓝牙Mesh网络将唤醒分数发送给目标终端设备，并接收目标终端设备发送的各自的目标唤醒分数；

设备确定子模块，用于根据唤醒分数和目标唤醒分数，确定唤醒设备。

可选的，唤醒信息包括声源距离和信噪比时，分数确定子模块可以具体用于根据唤醒信息，利用S＝K*M+λ*N，计算唤醒分数；其中，S为唤醒分数，M为声源距离对应的距离分数，K为距离权重，N为信噪比对应的信噪比分数，λ为信噪比权重。

可选的，信噪比权重大于距离权重时，设备确定子模块可以包括：

最大值确定单元，用于确定唤醒分数和目标唤醒分数中的数值最大的最优唤醒分数；

判断确定单元，用于判断最优唤醒分数的数量是否为1；若是，则将最优唤醒分数对应的终端设备或目标终端设备确定为唤醒设备；若否，则将最优唤醒分数中信噪比分数的数值最大的最优唤醒分数对应的终端设备或目标终端设备确定为唤醒设备。

可选的，唤醒信息包括声源距离和信噪比时，终信息确定模块10可以具体用于在终端设备获取唤醒词后，利用麦克风采集的语音信号，分别进行声源定位和信噪比计算，计算得到声源距离和信噪比。

可选的，该装置还可以包括：

获取模块，用于在唤醒启动并根据唤醒词进行应答之后，获取麦克风采集的控制语音；

判断模块，用于判断终端设备是否能够响应控制语音；

响应执行模块，用于若能够响应控制语音，则执行控制语音对应的操作；

控制模块，用于若不能够响应控制语音，则通过蓝牙Mesh网络与响应设备进行交互，控制响应设备执行控制语音对应的操作；其中，响应设备为任一目标终端设备。

本实施例中，本申请实施例通过设备确定模块20根据唤醒信息，与蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备，利用蓝牙Mesh功能将用户家庭中相同唤醒词的设备进行组网形成一个蓝牙Mesh网络系统，使得网络中的各个设备通过蓝牙Mesh功能传递和接收信息，保证网络中只有一个设备应答用户的唤醒词，避免同一时刻多个设备被一个的唤醒词同时唤醒应答的情况，提升了用户体验。

本申请实施例还提供了一种终端设备，包括：存储器，用于存储计算机程序；处理器，用于执行计算机程序时实现如上述实施例所提供的终端设备的唤醒方法的步骤。

相应的，本实施例所提供的终端设备还可以包括麦克风和蓝牙部件。

可选的，本实施例所提供的终端设备可以具体为智能手机、智能音箱和智能电视等带有语音唤醒和识别功能的智能设备。

此外，本申请实施例还提供了一种计算机可读存储介质，其上存有计算机程序，该计算机程序被执行时可以实现上述实施例所提供的终端设备的唤醒方法的步骤。该存储介质可以包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、终端设备及计算机可读存储介质而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

以上对本申请所提供的一种终端设备的唤醒方法、装置、终端设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

Claims

1.一种终端设备的唤醒方法，其特征在于，包括：

2.根据权利要求1所述的终端设备的唤醒方法，其特征在于，所述根据所述唤醒信息，与所述蓝牙Mesh网络中的各目标终端设备进行交互，确定唤醒设备，包括：

根据所述唤醒信息，确定所述终端设备的唤醒分数；

3.根据权利要求2所述的终端设备的唤醒方法，其特征在于，所述唤醒信息包括所述声源距离和所述信噪比时，所述根据所述唤醒信息，确定所述终端设备的唤醒分数，包括：

4.根据权利要求3所述的终端设备的唤醒方法，其特征在于，所述信噪比权重大于所述距离权重时，所述根据所述唤醒分数和所述目标唤醒分数，确定所述唤醒设备，包括：

判断所述最优唤醒分数的数量是否为1；

5.根据权利要求1所述的终端设备的唤醒方法，其特征在于，所述唤醒信息包括所述声源距离和所述信噪比时，所述终端设备获取麦克风采集的唤醒词后，确定唤醒信息，包括：

6.根据权利要求1至5任一项所述的终端设备的唤醒方法，其特征在于，所述唤醒启动并根据所述唤醒词进行应答之后，还包括：

获取所述麦克风采集的控制语音；

判断所述终端设备是否能够响应所述控制语音；

若是，则执行所述控制语音对应的操作；

7.一种终端设备的唤醒装置，其特征在于，包括：

8.根据权利要求7所述的终端设备的唤醒装置，其特征在于，所述设备确定模块，包括：

9.一种终端设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至6任一项所述的终端设备的唤醒方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的终端设备的唤醒方法的步骤。