CN115346521A

CN115346521A - 智能音箱的权限确定方法、本地服务器及智能音箱

Info

Publication number: CN115346521A
Application number: CN202110525082.1A
Authority: CN
Inventors: 孟卫明; 李广琴; 蒋鹏民
Original assignee: Hisense Group Holding Co Ltd
Current assignee: Hisense Group Holding Co Ltd
Priority date: 2021-05-14
Filing date: 2021-05-14
Publication date: 2022-11-15

Abstract

本公开提供智能音箱的权限确定方法、本地服务器及智能音箱。该方法包括：对音频文本进行语义理解，确定用户的目标操作，所述音频文本是基于用户发送的音频确定的；将所述目标操作与预设的各隐私操作进行比对，若确定所述目标操作是所述隐私操作，则利用所述用户的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限；若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作。由此保护了用户的隐私安全。

Description

智能音箱的权限确定方法、本地服务器及智能音箱

技术领域

本发明涉及信息处理技术领域，特别涉及一种智能音箱的权限确定方法、本地服务器及智能音箱。

背景技术

随着互联网的迅速发展，智能音箱的功能越来越强大，其可以控制的家庭设备越来越多。随着智能音箱越来越普及，并且智能音箱在家庭中控制设备的权限越来越大，智能音箱所涉及的用户隐私内容也越来越多。

现有技术中，智能音箱并没有涉及保护用户隐私安全的问题。由此，导致用户的隐私安全无法保证。

发明内容

本公开示例性的实施方式中提供一种智能音箱的权限确定方法、本地服务器及智能音箱，用于保护智能音箱中用户的隐私安全。

本公开的第一方面提供一种智能音箱的权限确定方法，所述方法包括：

对音频文本进行语义理解，确定用户的目标操作，所述音频文本是基于用户发送的音频确定的；

将所述目标操作与预设的各隐私操作进行比对，若确定所述目标操作是所述隐私操作，则利用所述用户的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限；

若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作。

本实施例中根据用户通过智能音箱发送的音频确定出音频文本，并对该音频文本进行语义理解，确定用户的目标操作，若确定出该目标操作为隐私操作，则利用该用户的音频的声纹识别结果，确定用户是否具有执行所述目标操作的权限，若确定出用户有权限，则执行目标操作。由此，只有用户具有执行目标操作的权限时，才能执行该目标操作，以此保护了用户的隐私安全。

在一个实施例中，所述声纹识别结果为所述用户的声纹特征；

所述利用所述用户的音频的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限，包括：

根据预先存储的声纹特征与用户的身份信息的对应关系，确定所述用户的身份信息，若确定所述用户的身份信息对所述目标操作的权限设置为允许，则确定所述用户具有执行所述目标操作的权限，否则确定所述用户不具有执行所述目标操作的权限；或，

根据预先存储的声纹特征与用户的身份信息的对应关系，确定所述用户的身份信息，若确定所述目标操作与所述用户的身份信息相对应，则确定所述用户具有执行所述目标操作的权限，否则确定所述用户不具有执行所述目标操作的权限。

本实施例通过可通过上述两种方式确定出用户是否具有执行目标操作的权限，以此保障用户的隐私安全。

在一个实施例中，所述方法还包括：

若确定所述目标操作不是所述隐私操作，则执行所述目标操作；或，

若确定所述用户不具有执行所述目标操作的权限，且所述目标操作的类型为媒体资源请求操作，则向云端服务器发送随机媒体资源请求；并将接收到所述云端服务器发送的随机媒体资源进行播放；或，

若确定所述用户不具有执行所述目标操作的权限，且所述目标操作的类型为网络设备控制操作或本地控制操作，则利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并播放所述无权限提示音频，其中所述网络设备控制操作为控制与所述智能音箱通过网络连接的设备，且所述本地控制操作为控制与所述智能音箱通过非网络连接的设备。

本实施例中当用户不具有执行目标操作的权限时，则根据目标操作的类型执行对应的操作，即随机播放媒体资源或者是提示用户无权限执行目标操作，以此使得用户的隐私安全得到更好的保护。

在一个实施例中，所述若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作，包括：

若所述目标操作的类型为媒体资源请求操作，则利用用户的媒体资源推荐结果，确定目标媒体资源；并向云端服务器发送获取所述目标媒体资源的请求，并将接收到所述云端服务器发送的目标媒体资源进行播放；

若所述目标操作的类型为网络设备控制操作，则向所述云端服务器发送控制所述网络设备的指令，以使所述云端服务器控制所述网络设备；

若所述目标操作的类型为本地设备控制操作，则控制所述本地设备。

本实施例通过目标操作的类型对应的方法来执行所述目标操作，以此使提高人机交互效率。

本公开的第二方面提供一种本地服务器，包括存储器和处理器，其中：

所述存储器，被配置为存储各隐私操作；

所述处理器，被配置为：

所述处理器在执行所述利用所述用户的音频的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限，具体被配置为：

在一个实施例中，所述处理器，还被配置为：

若确定所述用户不具有执行所述目标操作的权限，且所述目标操作为媒体资源请求操作，则向云端服务器发送随机媒体资源请求；并将接收到所述云端服务器发送的随机媒体资源进行播放；或，

若确定所述用户不具有执行所述目标操作的权限，且所述目标操作为网络设备控制操作或本地控制操作，则利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并播放所述无权限提示音频，其中所述网络设备控制类型为控制与所述智能音箱进行网络连接的设备的类型，且所述本地控制类型为控制与所述智能音箱进行非网络连接的设备的类型。

在一个实施例中，所述处理器在执行所述若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作，具体被配置为：

若所述目标操作为媒体资源请求操作，则利用用户的媒体资源推荐结果，确定目标媒体资源；并向云端服务器发送获取所述目标媒体资源的请求，并将接收到所述云端服务器发送的目标媒体资源进行播放；

若所述目标操作为网络设备控制操作，则向所述云端服务器发送控制所述网络设备的指令，以使所述云端服务器控制所述网络设备；

若所述目标操作为本地设备控制操作，则控制所述本地设备。

本公开的第三方面提供一种智能音箱，包括录音单元、存储器和处理器，其中：

所述录音单元，被配置为录制用户发送的音频；

所述存储器，被配置为存储各隐私操作；

所述处理器，被配置为：

在一个实施例中，所述处理器，还被配置为：

本公开的第四方面提供一种配置互联网协议地址的方法，应用于本地服务器中，所述方法包括：

针对接收到的任一智能音箱发送的连接请求，将所述连接请求中的所述智能音箱的互联网协议地址和所述智能音箱的位置信息进行保存，以便于与所述智能音箱建立通信连接；并，

向所述智能音箱的指定端口发送自身的互联网协议地址，以使所述智能音箱保存自身的互联网协议地址，以便于所述智能音箱与所述本地服务器建立通信连接。

本实施例通过将智能音箱发送的连接请求中的互联网协议地址和智能音箱的位置信息进行保存，以便于本地服务器与智能音箱建立通信连接，并将自身的互联网协议地址发送给智能音箱，以便于智能音箱建立与本地服务器建立通信连接，由此，可以智能音箱可以自动的和本地服务器建立通信连接，并不需要手动与本地服务器建立连接，由此提高了通信连接的效率。

在一个实施例中，向所述智能音箱的指定端口发送自身的互联网协议地址之后，所述方法还包括：

针对任一智能音箱，向所述智能音箱发送用于检测是否与所述智能音箱保持通信连接的心跳指令；

若确定与所述智能音箱断开通信连接，则更新通信连接的智能音箱的信息，并通知除所述智能音箱之外的其他智能音箱更新通信连接的智能音箱的信息。

本实施例通过本地服务器向各智能音箱发送心跳指令，并通过心跳指令确定出各智能音箱是否与本地服务器保持通信连接，以此当智能音箱与本地服务器断开通信连接后，本地服务器可以及时的确定出，可以及时更新的连接的智能音箱的信息，提高智能音箱与服务器之间的通信连接效率。

在一个实施例中，所述方法还包括：

在向所述智能音箱的指定端口发送自身的互联网协议地址的同时，向除所述智能音箱之外的其他智能音箱发送更新指令，以使其他智能音箱保存所述智能音箱的互联网协议地址和所述智能音箱的位置信息，以便于与所述智能音箱建立通信连接，所述更新指令中包括所述智能音箱的互联网协议地址和所述智能音箱的位置信息；以及，

在向所述智能音箱的指定端口发送自身的互联网协议地址的同时，向所述智能音箱发送其他智能音箱的互联网协议地址和其他智能音箱的位置信息，以使所述智能音箱保存所述其他智能音箱的互联网协议地址和其他智能音箱的位置信息，以便于所述智能音箱与所述其他智能音箱建立通信连接。

本实施例中通过将接收到的智能音箱的信息发送至其他智能音箱中，以便于其他智能音箱与该智能音箱建立通信连接，并将其他智能音箱的信息发送至该智能音箱中，以便于该智能音箱与其他智能音箱建立通信连接，由此，使得各智能音箱之间可以建立通信连接，提高各智能音箱之间的使用效率。

本公开的第五方面提供一种本地服务器，包括存储器和处理器，其中：

所述处理器，被配置为：

向所述智能音箱的指定端口发送自身的互联网协议地址，以使所述智能音箱保存自身的互联网协议地址，以便于所述智能音箱与所述本地服务器建立通信连接；

所述存储器，被配置为存储所述智能音箱的互联网协议地址和所述智能音箱的位置信息。

在一个实施例中，所述处理器，还被配置为：

向所述智能音箱的指定端口发送自身的互联网协议地址之后，针对任一智能音箱，向所述智能音箱发送用于检测是否与所述智能音箱保持通信连接的心跳指令；

在一个实施例中，所述处理器，还被配置为：

本公开的第六方面提供一种智能音箱的声纹注册方法，所述方法包括：

针对任一用户与智能音箱进行语音交互时的音频，对所述音频进行声纹识别，得到声纹特征；

若利用所述声纹特征确定所述用户为未注册用户，则将所述音频保存至与所述声纹特征相对应的指定区域中，以使与所述本地服务器建立连接的终端设备在收到所述用户发送的针对所述指定区域中的任一音频的命名指令后，确定与所述音频对应的声纹特征的用户的身份信息；

将终端设备发送的所述音频的声纹特征和所述声纹特征对应的用户的身份信息对应存储至已注册用户区域。

本实施例通过将未注册用户的音频保存至与所述声纹特征相对应的指定区域中，以使终端设备在接收到用户发送的针对所述指定区域中的任一音频的命名后，确定该音频对应的声纹特征的用户的身份信息，并将该声纹特征和用户的身份信息进行对应存储。由此，本实施例并不需要各用户都录取注册提示文本来进行注册，以此提高了声纹注册效率。

在一个实施例中，所述若利用所述声纹特征确定所述用户为未注册用户，则将所述音频保存至与所述声纹特征相对应的指定区域中，包括：

将所述音频的声纹特征与各指定区域对应的各声纹特征进行比对；

若存在所述音频的声纹特征与各指定区域相对应的各声纹特征中的任意一个声纹特征相同，则将所述音频存储在与所述音频的声纹特征相对应的指定区域中；

若所述音频的声纹特征与各指定区域对应的各声纹特征不相同，则创建与所述音频的声纹特征相对应的指定区域，并将所述音频存储至所述指定区域中。

本实施例通过将各音频都存储至与音频的声纹特征相对应的指定区域中，以此保证同一声纹特征的各音频都存储至同一区域，由此，用户并不需要对每一个音频都进行命名，由此，节省用户时间，提高用户注册效率。

本公开的第七方面提供一种本地服务器，包括存储器和处理器，其中：

所述处理器，被配置为：

将终端设备发送的所述音频的声纹特征和所述声纹特征对应的用户的身份信息对应存储至已注册用户区域；

所述存储器，被配置为存储音频的声纹特征和所述声纹特征对应的用户的身份信息以及未注册用户的音频。

在一个实施例中，所述处理器在执行所述若利用所述声纹特征确定所述用户为未注册用户，则将所述音频保存至与所述声纹特征相对应的指定区域中，具体被配置为：

根据本公开实施例提供的第八方面，提供一种智能音箱，包括录音单元、存储器和处理器，其中：

所述录音单元，被配置为录制用户与智能音响进行交互时的音频；

所述处理器，被配置为：

根据本公开实施例提供的第九方面，提供一种智能音箱的声纹注册方法，应用于终端设备，所述方法包括：

接收用户发送的查看音频指令后，显示本地服务器的各指定区域中的音频，所述各指定区域中的音频包括未注册的用户在与所述智能音箱进行语音交互时的音频，且同一指定区域包括的音频的声纹特征相同；

响应于用户对所述各指定区域中的任一音频的播放指令，播放所述音频；

接收用户发送的针对所述音频的命名指令后，确定与所述音频相对应的声纹特征的用户的身份信息，并将所述用户的身份信息和声纹信息发送至所述本地服务器中，以使所述本地服务器基于所述声纹信息确定声纹特征，并将所述声纹特征和所述用户的身份信息对应存储至已注册用户区域。

本实施通过用户对存储的未注册用户与智能音箱进行交互时的音频进行命名，以此实现未注册用户的声纹注册，提高了声纹注册效率。

在一个实施例中，所述接收用户发送的查看音频指令后，显示本地服务器的各指定区域中的音频之前，所述方法还包括：

接收用户发送的声纹注册指令后，显示预设的用户需要读取的文本信息；

获取所述用户读取所述文本信息的音频；并，

将所述音频进行转换后的文本信息与所述预设的用户需要读取的文本信息进行比对；

若确定转换后的文本信息与所述用户需要读取的文本信息相同且所述转换后的文本信息的数量在指定范围内，则提示用户对所述音频进行命名；

接收用户发送的命名指令后，确定所述音频的用户的身份信息；并，

将所述音频以及所述音频的用户的身份信息发送至本地服务器中，以使所述本地服务器对所述音频进行声纹识别，得到声纹特征，并将所述声纹特征和所述音频的用户的身份信息对应存储至已注册用户区域。

本实施例在用户对未注册用户进行命名实现未注册用户的声纹之前，用户自己需要通过预设的用户需要读取的文本信息进行读取并录取音频来实现用户的声纹注册，以此来提高声纹注册的效率。

在一个实施例中，所述方法还包括：

若确定转换后的文本信息与所述用户需要读取的文本信息不一致或所述转换后的文本信息的数量不在所述指定范围内，则返回执行显示预设的用户需要读取的文本信息的步骤，直至确定转换后的文本信息与所述用户需要读取的文本信息一致且所述转换后的文本信息的数量在所述指定范围内。

本实施例通过若确定转换后的文本信息与所述用户需要读取的文本信息不一致或所述转换后的文本信息的数量不在所述指定范围内，则需要用户重新读取文本信息，直至满足注册条件，以此保证用户的声纹注册的准确率。

根据本公开实施例提供的第十方面，提供一种终端设备，包括显示屏和处理器，其中：

所述显示屏，被配置为接收用户发送的查看音频指令后，显示本地服务器的各指定区域中的音频，所述各指定区域中的音频包括未注册的用户在与所述智能音箱进行语音交互时的音频，且同一指定区域包括的音频的声纹特征相同；

所述处理器，被配置为：

在一个实施例中，所述处理器，还被配置为：

所述接收用户发送的查看音频指令后，显示本地服务器的各指定区域中的音频之前，接收用户发送的声纹注册指令后，显示预设的用户需要读取的文本信息；

获取所述用户读取所述文本信息的音频；并，

在一个实施例中，所述处理器，还被配置为：

根据本公开实施例提供的第十一方面，提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序用于执行如第一方面和/或第四方面和/或第六方面和/或第九方面所述的方法。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为根据本公开一个实施例的智能音箱的权限确定方法的流程示意图之一；

图2为根据本公开一个实施例的智能音箱的权限确定方法的流程示意图之二；

图3为根据本公开一个实施例的智能音箱的权限确定方法的应用场景示意图之一；

图4为根据本公开一个实施例的智能音箱的权限确定方法的应用场景示意图之二；

图5为根据本公开一个实施例的智能音箱的权限确定方法的流程示意图之三；

图6为根据本公开一个实施例的配置互联网协议地址的方法的流程示意图之一；

图7为根据本公开一个实施例的配置互联网协议地址的方法的流程示意图之二；

图8为根据本公开一个实施例的智能音箱的声纹注册方法的流程示意图之一；

图9A-9B为根据本公开一个实施例的智能音箱的界面示意图；

图10为根据本公开一个实施例的智能音箱的声纹注册方法的流程示意图之二；

图11为根据本公开一个实施例的本地服务器的结构示意图；

图12为根据本公开一个实施例的智能音箱的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开实施例中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案，并不构成对于本公开实施例提供的技术方案的限定，本领域普通技术人员可知，随着新应用场景的出现，本公开实施例提供的技术方案对于类似的技术问题，同样适用。其中，在本公开的描述中，除非另有说明，“多个”的含义是两个或两个以上。

因此，本公开提供一种智能音箱的权限确定方法，根据用户通过智能音箱发送的音频确定出音频文本，并对该音频文本进行语义理解，确定用户的目标操作，若确定出该目标操为预设的隐私操作，则利用该用户的音频的声纹识别结果，确定用户是否具有执行所述目标操作的权限，若确定出用户有权限，则执行目标操作。由此，只有用户具有执行目标操作的权限时，才能执行该目标操作，以此保护了用户的隐私安全。下面，结合附图对本公开的方案详细的进行介绍。

图1为本公开的智能音箱的权限确定方法的流程示意图，可包括以下步骤：

步骤101：对音频文本进行语义理解，确定用户的目标操作，所述音频文本是基于用户发送的音频确定的；

其中，通过预设的家庭语义理解算法对音频文本进行语义理解，以此确定用户的目标操作。由于进行语义理解的操作是在本地中进行的，所以能够更好的保护用户的隐私。

步骤102：将所述目标操作与预设的各隐私操作进行比对，若确定所述目标操作是所述隐私操作，则利用所述用户的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限；

其中，用户的声纹识别结果可通过以下四种方式来确定：

方式一：智能音箱在接收到用户发送的唤醒词进行唤醒之后，对该用户的唤醒词音频进行声纹识别，得到声纹识别结果。此方式的计算量较低，节省资源。

方式二：智能音箱在唤醒之后，对用户发送的音频(包含目标操作的音频)进行声纹识别，得到声纹识别结果。此方式能够避免唤醒智能音箱和发送音频的不是同一个人的问题。能够更好的保护用户的隐私安全。

方式三：本地服务器对音频中的唤醒词音频进行声纹识别，得到声纹识别结果。

方式四：本地服务器对接收到的用户的音频(包含目标操作的音频)进行声纹识别，得到声纹识别结果。

在一个实施例中，所述声纹识别结果为所述用户的声纹特征。可通过以下两种方式确定所述用户是否具有所述目标操作的权限：

方式一：根据预先存储的声纹特征与用户的身份信息的对应关系，确定所述用户的身份信息，若确定所述用户的身份信息对所述目标操作的权限设置为允许，则确定所述用户具有执行所述目标操作的权限，否则确定所述用户不具有执行所述目标操作的权限；其中，可通过表1确定出所述用户的身份信息是否具有执行所述目标操作的权限。

表1：

如表1所示，若用户的身份信息为用户1，目标操作为操作A，则确定用户1具有执行目标操作的权限。若确定出的用户的身份信息为用户2，目标操作为操作B，则确定用户2不具有执行目标操作的权限。

方式二：根据预先存储的声纹特征与用户的身份信息的对应关系，确定所述用户的身份信息，若确定所述目标操作与所述用户的身份信息相对应，则确定所述用户具有执行所述目标操作的权限，否则确定所述用户不具有执行所述目标操作的权限。其中，可通过表2确定出用户是否执行目标操作的权限。

表2：

从表2可以看出，若用户为用户3，且目标操作为操作A，可以确定出用户具有执行所述目标操作的权限。若用户为用户3，且目标操作为操作B，则确定出用户不具有执行目标操作的权限。

步骤103：若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作。

在一个实施例中，步骤103可具体实施为：

(1)若所述目标操作的类型为媒体资源请求操作，则利用用户的媒体资源推荐结果，确定目标媒体资源；并向云端服务器发送获取所述目标媒体资源的请求，并将接收到所述云端服务器发送的目标媒体资源进行播放。

其中，用户的媒体资源推荐结果可通过用户的播放记录确定出媒体资源推荐结果，以此确定出目标媒体资源。其中媒体资源推荐结果可包括媒体资源以及与该媒体资源对应的推荐指数，或者为媒体资源类型以及与该媒体资源类型对应的推荐指数。本公开在此并不进行限定。

(2)若所述目标操作的类型为网络设备控制操作，则向所述云端服务器发送控制所述网络设备的指令，以使所述云端服务器控制所述网络设备。

其中，网络设备为与智能音箱通过网络连接的设备。例如，电视、智能冰箱等。

(3)若所述目标操作的类型为本地设备控制操作，则控制所述本地设备。

其中，本地设备包括与智能音箱通过蓝牙连接的设备(例如，外置低音炮、手机、平板电脑等)、与智能音箱通过红外线连接的设备(例如，智能化程度稍微低些的空调、电视等)和与智能音箱通过紫峰ZigBee连接的设备(例如，电表设备等)中的至少一个。

在一个实施例中，当确定出用户不具有执行目标操作的权限时，所执行的步骤可包括以下两种：

(1)所述目标操作的类型为媒体资源请求操作，则向云端服务器发送随机媒体资源请求；并将接收到所述云端服务器发送的随机媒体资源进行播放；

(2)所述目标操作的类型为网络设备控制操作或本地控制操作，则利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并播放所述无权限提示音频。

其中，目标操作对应的类型可通过表3确定：

表3：

为了进一步了解本公开中的智能音箱的权限确定方法，下面结合图2进行详细的介绍，可包括以下步骤：

步骤201：对音频文本进行语义理解，确定用户的目标操作，所述音频文本是基于用户发送的音频确定的；

步骤202：将所述目标操作与预设的各隐私操作进行比对，判断所述目标操作是否为隐私操作，若是，则执行步骤204，若否，则执行步骤203；

步骤203：执行所述目标操作；

步骤204：利用所述用户的声纹识别结果，判断所述用户是否具有执行所述目标操作的权限，若是，则执行步骤205，若否，则执行步骤209；

步骤205：确定所述目标操作的类型；

步骤206：若所述目标操作为媒体资源请求操作，则利用用户的媒体资源推荐结果，确定目标媒体资源；并向云端服务器发送获取所述目标媒体资源的请求，并将接收到所述云端服务器发送的目标媒体资源进行播放；

步骤207：若所述目标操作为网络设备控制操作，则向所述云端服务器发送控制所述网络设备的指令，以使所述云端服务器控制所述网络设备；

步骤208：若所述目标操作为本地设备控制操作，则控制所述本地设备；

步骤209：确定所述目标操作的类型；

步骤210：若所述目标操作为媒体资源请求操作，则向云端服务器发送随机媒体资源请求，并将接收到所述云端服务器发送的随机媒体资源进行播放；

步骤211：若所述目标操作为网络设备控制操作或本地控制操作，则利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并播放所述无权限提示音频。

下面，结合具体的场景对本公开的智能音箱的权限确定方法进行详细的说明：

如图3所示，包括本地服务器310、智能音箱320、云端服务器330、受控设备340、受控设备350和受控设备360，其中，本公开实施例中智能音箱320的数量为一个，实际上智能音箱320的数量可为一个，也可为多个，本公开在此并不进行限定。且本公开实施例中的受控设备(受控设备340、受控设备350和受控设备360)的数量为三个，实际上受控设备的数量可为一个，也可为多个，本公开在此并不进行限定。

场景一：目标操作为媒体资源请求操作。

智能音箱320接收到用户发送的音频之后，将所述音频发送至本地服务器310，本地服务器310接收到音频后，将所述音频转化为音频文本，并对该音频文本进行语义理解，确定用户的目标操作。将目标操作与预设的各隐私操作进行比对，若确定所述目标操作是所述隐私操作，则利用所述用户的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限。

若本地服务器310确定所述用户具有执行所述目标操作的权限，则利用用户的媒体资源推荐结果，确定目标媒体资源，并向云端服务器330发送获取所述目标媒体资源的请求，云端服务器330接收到该请求后，将该目标媒体资源发送至本地服务器310，本地服务器310将所述目标媒体资源发送至智能音箱320中，智能音箱320接收到该目标媒体资源后进行播放。

若本地服务器310确定所述用户不具有执行所述目标操作的权限，则向云端服务器330发送随机媒体资源请求；云端服务器330接收到该请求后，将随机媒体资源发送至本地服务器310，本地服务器310将所述随机媒体资源发送至智能音箱320中，智能音箱320接收到该随机媒体资源后进行播放。

场景二：目标操作为网络设备控制操作。以目标操作为打开受控设备340为例进行说明。

若本地服务器310确定所述用户具有执行所述目标操作的权限，则向所述云端服务器330发送打开受控设备340的指令，云端服务器330接收到该指令后，则发送打开指令给受控设备340，受控设备340接收到该打开指令后进行打开。

若本地服务器310确定所述用户不具有执行所述目标操作的权限，利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并将确定所述无权限提示音频发送至智能音箱320中，智能音箱320播放所述无权限提示音频。

场景三：目标操作的类型为本地设备控制操作，以关闭受控设备350为例进行说明。

若本地服务器310确定所述用户具有执行所述目标操作的权限，向受控设备350发送关闭指令，受控设备350接收到该关闭指令后进行关闭。

如图4所示，包括智能音箱410、云端服务器420、受控设备430、受控设备440和受控设备450，其中，本公开实施例中智能音箱410的数量为一个，实际上智能音箱410的数量可为一个，也可为多个，本公开在此并不进行限定。且本公开实施例中的受控设备(受控设备430、受控设备440和受控设备450)的数量为三个，实际上受控设备的数量可为一个，也可为多个，本公开在此并不进行限定。

场景一：目标操作为媒体资源请求操作。

智能音箱410接收到用户发送的音频之后，将所述音频转化为音频文本，并对该音频文本进行语义理解，确定用户的目标操作。将目标操作与预设的各隐私操作进行比对，若确定所述目标操作是所述隐私操作，则利用所述用户的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限。

若智能音箱410确定所述用户具有执行所述目标操作的权限，则利用用户的媒体资源推荐结果，确定目标媒体资源，并向云端服务器420发送获取所述目标媒体资源的请求，云端服务器420接收到该请求后，将该目标媒体资源发送至智能音箱410，智能音箱410播放所述目标媒体资源。

若智能音箱410确定所述用户不具有执行所述目标操作的权限，则向云端服务器420发送随机媒体资源请求；云端服务器420接收到该请求后，将随机媒体资源发送至智能音箱410，智能音箱410播放所述随机媒体资源。

场景二：目标操作为网络设备控制操作。以目标操作为打开受控设备430为例进行说明。

智能音箱410确定所述用户具有执行所述目标操作的权限，则向所述云端服务器420发送打开受控设备430的指令，云端服务器420接收到该指令后，则发送打开指令给受控设备430，受控设备430接收到该打开指令后进行打开。

若智能音箱410确定所述用户不具有执行所述目标操作的权限，利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并播放所述无权限提示音频。

场景三：目标操作的类型为本地设备控制操作，以关闭受控设备440为例进行说明。

若智能音箱410确定所述用户具有执行所述目标操作的权限，向受控设备440发送关闭指令，受控设备440接收到该关闭指令后进行关闭。

需要说明的是，用户除了可以通过智能音箱控制受控设备和请求媒体资源之外，还可以控制智能音箱的模式。其中，智能音箱的模式包括：闲聊模式、连续拾音模式以及连续拾音播音模式等。如图5所示，为智能音箱工作状态流程图，可包括：

首先，智能音箱在待机状态时，接收到唤醒词唤醒之后，智能音箱切换到定向拾音状态，拾取到用户发送的音频之后，对该音频进行语义理解以及权限确定，此时智能音箱再次进入待机状态，当接收到指令后，执行该指令(包括：切换至闲聊模式、切换至连续拾音模式、切换至连续拾音播音模式以及不切换指令中的一个)。

若是本地服务器对智能音箱的权限进行确定，则在进行权限确定之前，智能音箱需要与本地服务器需要进行网络配置，由于现有技术中需要手动将智能音箱和本地服务器进行网络配置。导致网络配置的效率较低。

因此，本公开还提供一种配置互联网协议地址的方法，用于实现智能音箱与本地服务器自动进行网络配置，以此来提高网络配置的效率。下面结合附图对公开的方法进行详细的介绍。

如图6所示，为配置互联网协议地址的方法的流程图，可包括以下步骤：

步骤601：针对接收到的任一智能音箱发送的连接请求，将所述连接请求中的所述智能音箱的互联网协议地址和所述智能音箱的位置信息进行保存，以便于与所述智能音箱建立通信连接；

步骤602：向所述智能音箱的指定端口发送自身的互联网协议地址，以使所述智能音箱保存自身的互联网协议地址，以便于所述智能音箱与所述本地服务器建立通信连接。

为了保证能够及时的确定出各智能音箱是否与本地服务器保持通信连接，在执行完步骤602之后，在一个实施例中，针对任一智能音箱，向所述智能音箱发送用于检测是否与所述智能音箱保持通信连接的心跳指令；若确定与所述智能音箱断开通信连接，则更新通信连接的智能音箱的信息，并通知除所述智能音箱之外的其他智能音箱更新通信连接的智能音箱的信息。

例如，与本地服务器建立通信连接的智能音箱包括智能音箱1、智能音箱2和智能音箱3。若确定出智能音箱1与本地服务器断开连接，则将智能音箱1的互联网协议地址以及智能音箱的位置信息从本地服务器通信连接的智能音箱的信息中进行删除，并通知智能音箱2和智能音箱3更新通信连接的智能音箱的信息。

为了保障各智能音箱之间能够建立通信连接，在一个实施例中，本地服务器在向所述智能音箱的指定端口发送自身的互联网协议地址的同时，向除所述智能音箱之外的其他智能音箱发送更新指令，以使其他智能音箱保存所述智能音箱的互联网协议地址和所述智能音箱的位置信息，以便于与所述智能音箱建立通信连接，所述更新指令中包括所述智能音箱的互联网协议地址和所述智能音箱的位置信息；以及，本地服务器在向所述智能音箱的指定端口发送自身的互联网协议地址的同时，向所述智能音箱发送其他智能音箱的互联网协议地址和其他智能音箱的位置信息，以使所述智能音箱保存所述其他智能音箱的互联网协议地址和其他智能音箱的位置信息，以便于所述智能音箱与所述其他智能音箱建立通信连接。

为了进一步了解本公开中的配置互联网协议地址的方法，下面，结合图7进行详细的说明，可包括以下步骤：

步骤701：智能音箱向本地服务器发送连接请求，所述连接请求中包括所述智能音箱的互联网协议地址和所述智能音箱的位置信息；

步骤702：本地服务器接收所述连接请求后，将所述连接请求中的所述智能音箱的互联网协议地址和所述智能音箱的位置信息进行保存，以便于与所述智能音箱建立通信连接；

步骤703：本地服务器向所述智能音箱的指定端口发送自身的互联网协议地址以及其他智能音箱的互联网协议地址和位置信息；

步骤704：智能音箱保存自身的互联网协议地址和其他智能音箱的互联网协议地址和位置信息，以便于所述智能音箱分别与所述本地服务器和所述其他智能音箱建立通信连接；

步骤705：本地服务器在向所述智能音箱的指定端口发送自身的互联网协议地址的同时，向所述其他智能音箱发送所述智能音箱的互联网协议地址和所述智能音箱的位置信息；

步骤706：其他智能音箱接收到本地服务器发送的所述智能音箱的互联网协议地址和所述智能音箱的位置信息后，保存所述智能音箱的互联网协议地址和所述智能音箱的位置信息，以便于与所述智能音箱建立通信连接；

步骤707：本地服务器向各智能音箱发送用于检测是否与所述智能音箱保持通信连接的心跳指令；

步骤708：本地服务器若确定与所述智能音箱断开通信连接，则更新通信连接的智能音箱的信息；

步骤709：本地服务器向其他智能音箱发送更新指令，所述更新指令用于指示删除所述智能音箱的互联网协议地址和位置信息；

步骤710：其他智能音箱接收到该更新之后，更新通信连接的智能音箱的信息。

由此，本实施例通过将智能音箱发送的连接请求中的互联网协议地址和智能音箱的位置信息进行保存，以便于本地服务器与智能音箱建立通信连接，并将自身的互联网协议地址发送给智能音箱，以便于智能音箱建立与本地服务器建立通信连接，由此，可以智能音箱可以自动的和本地服务器建立通信连接，并不需要手动与本地服务器建立连接，由此提高了通信连接的效率。

另外，智能音箱对用户进行权限确定的基础是各用户都进行了声纹注册。但是，由于现有技术中的智能音箱的声纹注册方法中，每个用户都需要按照提示文本进行录取注册音频来实现声纹注册，但是对于老人或者小孩来说执行起来是比较困难的，甚至可能无法完成注册，所以，导致声纹注册的效率较低。

因此，本公开还提供一种智能音箱的声纹注册方法，用以提高智能音箱的声纹注册的效率，下面，结合附图对本公开中智能音箱的声纹注册方法进行详细的介绍：

如图8所示，为智能音箱的声纹注册方法的流程示意图，可包括以下步骤：

步骤801：本地服务器/智能音箱针对任一用户与智能音箱进行语音交互时的音频，对所述音频进行声纹识别，得到声纹特征；

步骤802：本地服务器/智能音箱若利用所述声纹特征确定所述用户为未注册用户，则将所述音频保存至与所述声纹特征相对应的指定区域中；

在一个实施例中，步骤802可具体实施为：将所述音频的声纹特征与各指定区域对应的各声纹特征进行比对；若存在所述音频的声纹特征与各指定区域相对应的各声纹特征中的任意一个声纹特征相同，则将所述音频存储在与所述音频的声纹特征相对应的指定区域中；若所述音频的声纹特征与各指定区域对应的各声纹特征不相同，则创建与所述音频的声纹特征相对应的指定区域，并将所述音频存储至所述指定区域中。

步骤803：终端设备接收用户发送的查看音频指令后，显示本地服务器/智能音箱的各指定区域中的音频，所述各指定区域中的音频包括未注册的用户在与所述智能音箱进行语音交互时的音频，且同一指定区域包括的音频的声纹特征相同；

例如，如图9A所示，为终端设备显示各指定区域中的音频，用户可点击任一声纹特征，点击之后，如图9B所示，会显示与该声纹特征对应的音频。

步骤804：终端设备响应于用户对所述各指定区域中的任一音频的播放指令，播放所述音频；

步骤805：终端设备接收用户发送的针对所述音频的命名指令后，确定与所述音频相对应的声纹特征的用户的身份信息；

其中，需要说明的是，对于同一指定区域中的音频，若用户对任一音频进行命名后，则该指定区域中的所有音频都与已命名的音频的名称相同。且与该区域相对应的声纹特征的用户的身份信息也与命名的名称相同。

例如，与声纹特征1相对应的音频包括：音频1、音频2和音频3。若用户对音频3进行命名为小明，则确定出声纹特征1的用户的身份信息为小明。

步骤806：终端设备将所述用户的身份信息和声纹信息发送至所述本地服务器；

步骤807：本地服务器/智能音箱将终端设备发送的所述音频的声纹特征和所述声纹特征对应的用户的身份信息对应存储至已注册用户区域。

其中，只有之前注册过的主用户才能查看音频本地服务器中未注册用户的音频权限，其他注册过的用户并没有查看权限。

在一个实施例中，主用户可通过以下方式进行注册，应用于终端设备，如图10所示，可包括以下步骤：

步骤1001：接收用户发送的声纹注册指令后，显示预设的用户需要读取的文本信息；

步骤1002：获取所述用户读取所述文本信息的音频；

步骤1003：将所述音频进行转换后的文本信息与所述预设的用户需要读取的文本信息进行比对，判断转换后的文本信息与所述用户需要读取的文本信息是否相同，若是，则执行步骤1004，若否，则返回执行步骤1001；

步骤1004：判断所述转换后的文本信息的数量是否在指定范围内，若是，则执行步骤1005，若否，则返回执行步骤1001；

步骤1005：提示用户对所述音频进行命名；

步骤1006：接收用户发送的命名指令后，确定所述音频的用户的身份信息；

步骤1007：将所述音频以及所述音频的用户的身份信息发送至本地服务器中，以使所述本地服务器对所述音频进行声纹识别，得到声纹特征，并将所述声纹特征和所述音频的用户的身份信息对应存储至已注册用户区域。

需要说明的是，除了主用户之外的其他用户也可以直接通过上述方式进行声纹注册，本公开在此并不进行限定。

在介绍了本公开示例性实施方式的一种智能音箱的权限确定方法之后，接下来，介绍根据本公开的另一示例性实施方式的本地服务器。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本公开的本地服务器可以至少包括至少一个处理器、以及至少一个计算机存储介质。其中，计算机存储介质存储有程序代码，当程序代码被处理器执行时，使得处理器执行本说明书上述描述的根据本公开各种示例性实施方式的智能音箱的权限确定方法中的步骤。例如，处理器可以执行如图2中所示的步骤201-203。

下面参照图11来描述根据本公开的这种实施方式的本地服务器1100。图11显示的本地服务器1100仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。如图11所示，本地服务器1100以通用本地服务器的形式表现。本地服务器1100的组件可以包括但不限于：上述至少一个处理器1101、上述至少一个计算机存储介质1102、连接不同系统组件(包括计算机存储介质1102和处理器1101)的总线1103。

总线1103表示几类总线结构中的一种或多种，包括计算机存储介质总线或者计算机存储介质控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。计算机存储介质1102可以包括易失性计算机存储介质形式的可读介质，例如随机存取计算机存储介质(RAM)1121和/或高速缓存存储介质1122，还可以进一步包括只读计算机存储介质(ROM)1123。计算机存储介质1102还可以包括具有一组(至少一个)程序模块1124的程序/实用工具1125，这样的程序模块1124包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

本地服务器1100也可以与一个或多个外部设备1104(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与本地服务器1100交互的设备通信，和/或与使得该本地服务器1100能与一个或多个其它本地服务器进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1105进行。并且，本地服务器1100还可以通过网络适配器1106与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1106通过总线1103与用于本地服务器600的其它模块通信。应当理解，尽管图中未示出，可以结合本地服务器600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

在一些可能的实施方式中，如图12所示，本公开还提供一种智能音响1200，包括录音单元1201、存储器1202和处理器1203，其中：

所述录音单元1201，被配置为录制用户发送的音频。所述存储器1202，被配置为存储各隐私操作。所述处理器1203，被配置为：对音频文本进行语义理解，确定用户的目标操作，所述音频文本是基于用户发送的音频确定的；将所述目标操作与预设的各隐私操作进行比对，若确定所述目标操作是所述隐私操作，则利用所述用户的声纹识别结果，确定所述用户是否具有执行所述目标操作的权限；若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作。

在一些可能的实施方式中，本公开提供的一种智能音箱的权限确定方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在计算机设备上运行时，程序代码用于使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的智能音箱的权限确定方法中的步骤。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取计算机存储介质(RAM)、只读计算机存储介质(ROM)、可擦式可编程只读计算机存储介质(EPROM或闪存)、光纤、便携式紧凑盘只读计算机存储介质(CD-ROM)、光计算机存储介质件、磁计算机存储介质件、或者上述的任意合适的组合。

本公开的实施方式的智能音箱的权限确定的程序产品可以采用便携式紧凑盘只读计算机存储介质(CD-ROM)并包括程序代码，并可以在电子设备上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中，远程电子设备可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)—连接到用户电子设备，或者，可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘计算机存储介质、CD-ROM、光学计算机存储介质等)上实施的计算机程序产品的形式。

本公开是参照根据本公开的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读计算机存储介质中，使得存储在该计算机可读计算机存储介质中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样，倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

1.一种智能音箱的权限确定方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述声纹识别结果为所述用户的声纹特征；

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若确定所述用户不具有执行所述目标操作的权限，且所述目标操作的类型为网络设备控制操作或本地控制操作，则利用预设的目标操作的类型与无权限提示文本的对应关系，确定与所述目标操作的类型相对应的无权限提示文本，并将确定出的所述无权限提示文本转换为无权限提示音频，并播放所述无权限提示音频，其中所述网络设备控制操作为控制与智能音箱通过网络连接的设备，且所述本地控制操作为控制与所述智能音箱通过非网络连接的设备。

4.根据权利要求1所述的方法，其特征在于，所述若确定所述用户具有执行所述目标操作的权限，则执行所述目标操作，包括：

5.一种配置互联网协议地址的方法，其特征在于，应用于本地服务器中，所述方法包括：

6.根据权利要求5所述的方法，其特征在于，向所述智能音箱的指定端口发送自身的互联网协议地址之后，所述方法还包括：

7.一种智能音箱的声纹注册方法，其特征在于，所述方法包括：

8.一种智能音箱的声纹注册方法，其特征在于，应用于终端设备，所述方法包括：

9.一种本地服务器，其特征在于，包括存储器和处理器，其中：

所述存储器，被配置为存储各隐私操作；

所述处理器，被配置为：

10.一种智能音箱，其特征在于，包括录音单元、存储器和处理器，其中：

所述录音单元，被配置为录制用户发送的音频；

所述存储器，被配置为存储各隐私操作；

所述处理器，被配置为：