CN109493866A

CN109493866A - 智能音箱及其操作方法

Info

Publication number: CN109493866A
Application number: CN201811267363.6A
Authority: CN
Inventors: 何哲嘉; 林佳纬
Original assignee: Suzhou Raken Technology Co Ltd
Current assignee: Suzhou Raken Technology Co Ltd
Priority date: 2018-10-29
Filing date: 2018-10-29
Publication date: 2019-03-19

Abstract

一种智能音箱的操作方法，其包含以下步骤：预载声纹注册数据、用户信息与用户装置的播放设定之间的关联性设定；接收唤醒词以设定唤醒状态并产生声纹辨识结果；在唤醒状态下，在接收语音后，将语音转换成语音文字，当声纹辨识结果与声纹注册数据匹配时，将用户信息与语音文字传送给云端服务器，使云端服务器回传关联于用户信息的响应消息至智能音箱；依据播放设定，将响应消息推送至用户装置。相比现有技术而言，本发明的实用性更高，用户体验度更好。

Description

智能音箱及其操作方法

技术领域

本发明涉及一种智能音箱产品，具体涉及一种智能音箱及其操作方法。

背景技术

近年来随着人工智能技术的发展，市面上陆续出现各类特色的智能音箱产品，其中多数都具有智能对话互动、音乐播放、信息检索…等功能。其中部分智能音箱产品具有显示屏幕，有屏幕的产品会在发出语音对话的同时，在画面上显示更多的视觉信息，如用户询问天气时，智能音箱产品的屏幕可显示当前天气综合信息或是一周天气图表；用户询问特定音乐时，智能音箱可显示歌手或专辑封面；用户购买东西时，智能音箱可显示商品图片信息…等等，无屏幕的智能音箱产品则是纯粹使用合成语音答复用户。对于产品厂商而言，具有屏幕的音箱需要搭配较高规格的硬件（包含显示面板、Touch Cell、较高容量的内存与储存装置等等），在成本上比无屏幕音箱高出许多，因此目前市面上大部分智能音箱不具有显示屏幕。

智能音箱产品主要特色为提供用户语音助理服务，智能音箱产品在收到用户语音后，上传云端处理实时产生答复用户的信息，由智能音箱产品产生合成语音念出信息，由于部分智能音箱产品不具有屏幕无法显示相关信息给用户直接观看，所以在信息较为庞大时合成语音需要更长的时间才能表达完成，另外，具有显示屏幕的型号目前也只能显示信息给用户观看，用户仍需要手动记录想要的信息，无法将语音助理服务回复的信息随身携带利用。

因此，如何解决上述现有技术存在的不足，便成为本发明所要研究解决的课题。

发明内容

本发明目的是提供一种智能音箱及其操作方法。

为达到上述目的，本发明采用的技术方案是：

一种智能音箱，包含：

一网络装置；

一处理器；

一放音装置，电性连接所述处理器；

一储存装置，预载一声纹注册数据、一用户信息与一用户装置的播放设定之间的关联性设定；以及

一收音装置，接收一语音，所述处理器将该语音转换成一语音文字，当一声纹辨识结果与所述声纹注册数据匹配时，所述处理器通过所述网络装置将所述用户信息与所述语音文字传送给一云端服务器，使该云端服务器回传一响应消息至所述网络装置，所述处理器依据所述播放设定通过网络装置将所述响应消息推送至所述用户装置。

上述技术方案中的有关内容解释如下：

1、上述方案中，当所述网络装置已与所述用户装置及一影像输出装置建立通讯时，若所述云端服务器所回传的所述响应消息具有一私人标记，所述处理器仅通过所述网络装置将该响应消息推送至所述用户装置，而不通过网络装置将该响应消息推送至所述影像输出装置。

2、上述方案中，所述储存装置预载一权限设定与所述影像输出装置的播放设定之间的关联性设定，所述处理器会判断所述响应消息的内容分级信息是否符合所述权限设定。

3、上述方案中，若所述响应消息的内容分级信息符合所述权限设定，所述处理器通过所述网络装置将该响应消息推送至所述用户装置与所述影像输出装置。

4、上述方案中，若所述响应消息的内容分级信息不符合所述权限设定，所述处理器不会通过所述网络装置将该响应消息推送至所述影像输出装置。

为达到上述目的，本发明采用的另一技术方案是：

一种智能音箱的操作方法，其特征在于：包含：

预载一声纹注册数据、一用户信息与一用户装置的播放设定之间的关联性设定；

在唤醒状态下，在接收一语音后，将该语音转换成一语音文字，当一声纹辨识结果与该声纹注册数据匹配时，将所述用户信息与所述语音文字传送给一云端服务器，使该云端服务器回传一响应消息至所述智能音箱；以及

依据所述播放设定，将所述响应消息推送至所述用户装置。

上述技术方案中的有关内容解释如下：

1、上述方案中，更包含：

当所述智能音箱已与所述用户装置及一影像输出装置建立通讯时，若所述云端服务器所回传的所述响应消息具有一私人标记，仅该响应消息推送至所述用户装置，而不将该响应消息推送至所述影像输出装置。

2、上述方案中，更包含：

预载一权限设定与所述影像输出装置的播放设定之间的关联性设定；以及

判断所述响应消息的内容分级信息是否符合所述权限设定。

3、上述方案中，更包含：

若所述响应消息的内容分级信息符合所述权限设定，将该响应消息推送至所述用户装置与所述影像输出装置。

4、上述方案中，更包含：

若所述响应消息的内容分级信息不符合所述权限设定，不将该响应消息推送至所述影像输出装置。

附图说明

附图1为本发明实施例的智能音箱的结构框图；

附图2为本发明实施例的用户装置注册的流程图；

附图3为本发明实施例的智能音箱登记影像输出装置的流程图；

附图4为本发明实施例的智能音箱收到用户语音时的处理流程图；

附图5为本发明实施例一种基于用户语音的响应消息的处理流程图；

附图6为本发明实施例一种装置端应用的示意图。

以上附图中：100、智能音箱；110、网络装置；120、处理器；130、放音装置；140、储存装置；150、收音装置；190、云端服务器；191、用户装置；192、影像输出装置；S201~S204、步骤；S301~S304、步骤；S400~S407、步骤；S500~S506、步骤。

具体实施方式

下面结合附图及实施例对本发明作进一步描述：

实施例：为了使本发明的叙述更加详尽与完备，可参照附图及以下所述各种实施例，附图中相同的号码代表相同或相似的组件。另一方面，众所周知的组件与步骤并未描述于实施例中，以避免对本发明造成不必要的限制。

于实施方式与申请专利范围中，涉及『连接』的描述，其可泛指一组件通过其他组件而间接耦合至另一组件，或是一组件无须通过其他组件而直接链接至另一组件。

于实施方式与申请专利范围中，涉及『连接』的描述，其可泛指一组件通过其他组件而间接与另一组件进行间接链接，或是一组件无须通过其他组件而实体链接至另一组件。

于实施方式与申请专利范围中，除非内文中对于冠词有所特别限定，否则『一』与『该』可泛指单一个或数个。

本文中所使用的『约』、『大约』或『大致』用以修饰任何可些微变化的数量，但这种些微变化并不会改变其本质。于实施方式中若无特别说明，则代表以『约』、『大约』或『大致』所修饰的数值的误差范围一般是容许在百分之二十以内，较佳的是于百分之十以内，而更佳地则是于百分之五以内。

图1是依照本发明一实施例的一种智能音箱100的框图。如图1所示，智能音箱100与云端服务器190有线与/或无线联机，智能音箱100可以与用户装置191及影像输出装置192建立有线与/或无线通信。举例而言，智能音箱100具有语音助理软件，云端服务器190具有人工智能平台做为智能音箱100的云端大脑，用户装置191可为行动装置（如：手机、平板电脑、笔记本电脑…等），影像输出装置192可为电视机、投影机…等。一般而言，智能音箱100与影像输出装置192为固定设置于室内某处且已预先建立联机，但本发明不限于此，举例而言，用户可以移动智能音箱100或影像输出装置192其中之一到其他装置附近，以建立联机。

于图1中，智能音箱100包含网络装置110、处理器120、放音装置130、储存装置140与收音装置150。在架构上，处理器120电性连接网络装置110、放音装置130、储存装置140与收音装置150。举例而言，网络装置110可为有线与/或无线网络卡，放音装置130可为喇叭，处理器120可为中央处理器、微控制器或其他处理电路，储存装置140可为硬盘、闪存或其他储存媒介，收音装置150可为麦克风。

于使用时，储存装置140可预载（预先载入）声纹注册数据、用户信息与用户装置191的播放设定之间的关联性设定；即，储存装置140可预载声纹注册数据、用户信息，以及这两者与用户装置191的播放设定之间的关联性设定。当用户可对智能音箱100说出唤醒词时，收音装置150接收唤醒词，处理器120基于唤醒词设定智能音箱100进入唤醒状态并产生声纹辨识结果。当智能音箱100处于唤醒状态下，在收音装置150接收语音后，处理器120会分析语音将语音转换成语音文字，并比对声纹辨识结果与声纹注册数据，当声纹辨识结果与声纹注册数据匹配时，处理器120通过网络装置110将用户信息与语音文字传送给云端服务器190，使云端服务器190回传响应消息至网络装置110，处理器120依据播放设定通过网络装置110将响应消息推送至用户信息预先登记的用户装置191，藉以将响应消息直接转移到用户装置191上播放。

在本发明的一实施例中，网络装置110与一个或多个影像输出装置192建立联机，当云端服务器190回传响应消息至网络装置110，处理器120依据播放设定通过网络装置110将响应消息推送至一个或多个影像输出装置192，借以在具有较大显示屏幕的影像输出装置192上播放信息，在本发明的一实施例中，多个影像输出装置192可同步显示相同的响应消息内容，或是根据响应消息内容分别显示不同的部分，例如将不同图表分别显示，或是将图表、影像、影音视讯等不同内容在不同影像输出装置192上显示，若是响应消息包含多个音频或含音频的视讯，具有声音播放装置的影像输出装置192可同步播放响应消息内容的音频内容，借由影像输出装置192播放响应消息内容，响应消息内容会公开给影像输出装置192附近的所有用户。

在本发明的一实施例中，云端服务器190设有词汇字典文件，若云端服务器190依据词汇字典文件分析语音文字与/或响应消息中涉及私人信息（如：出现「我的」之类的字词），云端服务器190会在响应消息中自动标注私人标记；或者或再者，若云端服务器190分析语音文字与/或响应消息关联于上述用户个人信息（如：姓名、账户数据、信用卡或健保卡数据…等），云端服务器190亦会在响应消息（如：个人账单、健康检查报告…等）中自动标注私人标记。接下来，当网络装置110已与用户装置191及影像输出装置192建立通讯时，若云端服务器110所回传的响应消息具有私人标记，处理器120仅通过网络装置110将响应消息推送至用户装置191，而不通过网络装置110将响应消息推送至影像输出装置191，避免一般设置于公共空间的影像输出装置191公开显示涉及用户个人信息的响应消息，同时智能音箱100根据响应消息产生的合成语音也会避开具有私人标记的信息，避免泄漏个人隐私信息。

在本发明的一实施例中，云端服务器190会在响应消息中自动标注内容分级信息，智能音箱100的储存装置140预载权限设定与影像输出装置192的播放设定之间的关联性设定，处理器120会判断响应消息的内容分级信息是否符合权限设定。若是响应消息的内容分级信息（如：含普遍级影片连结）符合权限设定（如：禁播限制级内容），处理器120通过网络装置110将响应消息推送至用户装置191与影像输出装置192，借以将响应消息直接转移到用户装置191与影像输出装置192上播放。反之，若响应消息的内容分级信息（如：含限制级影片连结）不符合权限设定（如：禁播限制级内容），处理器120不会通过网络装置110将响应消息推送至影像输出装置192，避免让一般设置于公共空间的影像输出装置191公开播出被权限设定禁播的内容，处理器120亦会根据用户信息与用户装置191的播放设定，决定是否将具有特定内容分级信息的响应消息推送至用户装置191，处理器仅会通过网络装置110将响应消息推送至符合具有可观看权限的用户装置191。

为了对上述智能音箱100的操作方法做更进一步的阐述，请同时参照图1～5。应了解到，以下所提及的步骤，除特别叙明其顺序外，均可依实际需要调整其前后顺序，甚至可同时或部分同时执行。

图2是依照本发明一实施例的一种用户装置191注册的流程图。如图1所示，于步骤S201，用户直接通过智能音箱100或间接通过用户装置191上的音箱应用程序连上智能音箱100去注册用户信息，用户可通过关键词或特定按键来启动用户注册程序，注册程序中会登记用户的各种信息，包括用户名称、年龄等等，用户可以使用各种方式输入注册信息，包括语音或是文字输入，之后智能音箱100管理者可以决定是否同意或是修改注册用户的权限、或是否禁止用户修改权限等等。于步骤S202，用户直接通过智能音箱100或间接通过用户装置191上的音箱应用程序连上智能音箱100去注册声纹注册数据，在用户注册程序中，要注册的用户最少需要提供关键词的声纹，智能音箱100会分析其特征加以记录。于步骤S203，智能音箱100开始用户装置登记程序，智能音箱100会搜寻位于周边的用户装置191进行登记，并让用户进行播放设定；在本发明一实施例中，智能音箱100会列出找到的所有装置，由用户指定后登记被指定的装置为对应该用户的用户装置，在本发明一实施例中，用户指定用户装置后，智能音箱100可发送认证信息给用户装置191，由用户通过语音或用户装置191答复智能音箱100，以确认该装置为属于该用户的用户装置；在本发明一实施例中，用户通过用户装置191上的音箱应用程序连接智能音箱100进行装置登记，登记过程中用户提供语音供智能音箱100比对声纹，由此智能音箱100登记用户装置191属于提供声纹的用户；在本发明一实施例中，用户或智能音箱100管理者可通过其所属的用户装置上的音箱应用程序连接智能音箱100，进行该用户装置的播放设定；在本发明一实施例中，用户或智能音箱100管理者可在用户的权限之外，对用户装置191另外设定权限，更细部来说，设定权限除了是否可以取得不同内容的信息之外，也可以包含设定用户装置191在不同时段有不同权限、用户装置191打开或显示不同权限的数据时是否需要输入密码或是其他任何可能的权限设定方式。于步骤S204，判断用户是否还要设定其他用户装置。若是用户还要设定其他用户装置，回到步骤S203重复执行用户装置登记程序；若是用户不需要设定其他用户装置，则结束注册程序。之后，智能音箱100的储存装置140会加载更新过的声纹注册数据、用户信息与用户装置191的播放设定之间的关联性设定，以备使用。在本发明一实施例中，除了用户注册程序以外，用户在其他时候也可以通过关键词来呼叫智能音箱100，或是通过用户装置191上的音箱应用程序连接智能音箱100，以启动用户装置登记程序，登记新的用户装置或是修改用户个人所属的用户装置和播放设定。

图3是依照本发明一实施例的一种智能音箱100登记影像输出装置192的流程图。如图3所示，于步骤S301，用户可直接通过智能音箱100、间接通过用户装置191或影像输出装置192上的音箱应用程序连上智能音箱100，启动装置登记程序登记影像输出装置192的信息，在本发明一实施例中，用户可填写要登记的影像输出装置192的信息或要搜寻的装置条件，例如位置、装置厂牌、类别、型号...等。于步骤S302，用户设定影像输出装置的权限设定（如：是否允许播放成人级别或保护级别的影像内容、是否允许播放隐私内容或其他权限），更具体来说，设定权限除了是否可以取得不同内容的信息之外，也可以包含设定影像输出装置192在不同时段有不同权限、影像输出装置192打开或显示不同权限的数据时是否需要输入密码或是其他任何可能的权限设定方式。于步骤S303，智能音箱100搜寻周边的影像输出装置192并进行播放设定，在本发明一实施例中，智能音箱100会根据用户填写的信息或要搜寻的装置条件搜寻符合的装置，并将用户输入的装置信息与权限设定和找到符合条件的影像输出装置192绑定；在本发明一实施例中，当用户在S302完成影像输出装置的权限设定后，智能音箱100或音箱应用程序会询问用户是否套用到周边所有的影像输出装置，若用户同意则智能音箱100会搜寻周边的影像输出装置，并设定所有搜寻到的影像输出装置具有相同的权限设定，若用户不同意套用到周边所有的影像输出装置，则智能音箱100或音箱应用程序会提示用户搜寻到哪些周边影像输出装置，供用户选择其中的一部份分别进行权限设定。于步骤S304，用户决定是否还要进行其他设定，若还要设定其他影像输出装置，回到步骤S301；相反地，若不需设定其他影像输出装置，则结束装置登记程序。之后，储存装置140会预载更新过的权限设定与影像输出装置192的播放设定之间的关联性设定，以备使用。在本发明一实施例中，智能音箱100管理者可以决定是否同意或是修改影像输出装置的权限、或是否禁止用户修改影像输出装置的权限等等。

在本发明一实施例中，用户直接通过智能音箱100或是间接通过用户装置191或影像输出装置192上的音箱应用程序连上智能音箱100，启动装置搜寻程序，装置搜寻程序中智能音箱100会先搜寻周边的影像输出装置，之后智能音箱100或音箱应用程序会提示用户搜寻到哪些周边影像输出装置，供用户选择其中的一部份分别进行权限设定或输入设备信息，当用户完成设定或输入，智能音箱100会将用户输入的权限设定或装置信息与用户选择的周边影像输出装置绑定并记录，之后，储存装置140会预载更新过的权限设定与影像输出装置192的播放设定之间的关联性设定，以备使用。

图4是依照本发明一实施例的一种智能音箱100收到用户语音时的处理流程图。如图4所示，于步骤S400，智能音箱100等待语音。于步骤S401，用户对智能音箱100说出语音，使收音装置150接收语音。于步骤S402，处理器120判断智能音箱100是否已在唤醒状态。若智能音箱100不在唤醒状态，于步骤S403，处理器120判断该语音是否为唤醒词。若该语音为唤醒词，于步骤S404，处理器120设定智能音箱100进入唤醒状态，并分析该语音产生声纹辨识结果，当声纹辨识结果与某位用户的声纹注册数据匹配时，处理器120在储存装置140中取得当前用户的用户信息、用户装置191、以及装置的播放设定、权限设定等相关数据备用。然后，回到步骤S400以等待语音。

另一方面，在唤醒状态下，在收音装置150接收语音后，于步骤S405，处理器120将语音转换成语音文字。于步骤S406，处理器120通过网络装置110将用户信息与语音文字传送给云端服务器190。然后，于步骤S407，智能音箱100等待云端服务器190回传结果。在本发明一实施例中，在唤醒状态下，在收音装置150接收语音后，处理器120还会分析该语音产生整段语音或部分语音的声纹辨识结果。在本发明一实施例中，处理器120会比对声纹辨识结果与上述唤醒语音的声纹辨识结果是否属于同一用户，以确认上传的语音文字和用户信息匹配，若该语音的声纹辨识结果与唤醒语音的声纹辨识结果不匹配，则处理器120会语有记录的其他声纹辨识结果比对，寻找匹配的用户，若无法找到，则智能音箱100仅上传语音文字而不传送用户信息。在本发明一实施例中，当处理器120比对声纹辨识结果与唤醒语音的声纹辨识结果不匹配时，智能音箱100即上传语音文字而不传送用户信息，不进行其他比对。在本发明一实施例中，当处理器120比对声纹辨识结果与唤醒语音的声纹辨识结果不匹配时，智能音箱100会以合成语音提示用户收到他人的语音，询问用户是否将他人的语音上传云端服务器190处理。

图5是依照本发明一实施例的一种基于用户语音的响应消息的处理流程图。如图5所示，于步骤S500，智能音箱100收到云端服务器190所回传的响应消息，云端服务器190收到上述用户语音所转换成的语音文字后进行语意识别，之后根据语意或是根据语意与用户信息进行处理、搜集与语意相关信息，最终产生响应消息回传智能音箱100；在本发明一实施例中，响应消息内容可能包括给智能音箱100的处理指令、合成语音文字、数据内容、信息标记、分级信息或其他信息。于步骤S501，处理器120依据响应消息内容与推放设定决定是否推放响应消息，当处理器120决定推放响应消息，处理器120根据响应消息响应的语音的声纹辨识结果，决定响应消息对应于发出该语音的用户装置191。于步骤S502，智能音箱100获取联机的装置列表，于本实施例中，当智能音箱100已与用户装置191及影像输出装置192建立通讯时，装置列表可包含用户装置191及影像输出装置192的相关信息；在本发明一实施例中，智能音箱100与用户装置191或影像输出装置192共享同一无线网络节点，例如连到同一无线基地台或其他无线网络设备；在本发明一实施例中，智能音箱100与用户装置191或影像输出装置192可直接或间接联机，例如用户装置191或影像输出装置192以有线方式或无线方式直接联机连接智能音箱100，或是智能音箱100与用户装置191都连接到影像输出装置192，智能音箱100可取得连接到影像输出装置192的装置列表，从中找到发出该语音的用户装置191；在本发明一实施例中，智能音箱100与用户装置191或影像输出装置192通过因特网联机，智能音箱100可根据装置登记记录在因特网寻找用户装置191或影像输出装置192。于步骤S503，处理器120判断云端服务器190所回传的响应消息是否具有私人标记。若云端服务器190所回传的响应消息具有私人标记，于步骤S506，处理器120仅通过网络装置110将响应消息推送至用户装置191，而不通过网络装置110将响应消息推送至影像输出装置192，以此不让一般设置于公共空间的影像输出装置191播放涉及私人的响应消息。

在本发明一实施例中，智能音箱100由云端服务器190收到响应消息后，由处理器120根据响应消息内容进行处理，例如执行云端服务器190给智能音箱100的处理指令、根据合成语音文字合成语音、通过网络或在储存装置140搜寻数据内容或进行其他作业程序等等，最终产生合成语音答复信息与数据答复信息，智能音箱100会发声以合成语音念出合成语音答复信息，并将数据答复信息推送至接收的用户装置191或影像输出装置192；在本发明一实施例中，合成语音答复信息包括提醒用户数据答复信息已推送到用户装置191或影像输出装置192；在本发明一实施例中，处理器120会判断合成语音答复信息或数据答复信息是否具有私人标记或是私人性质信息，私人标记或是私人性质信息可能是云端服务器190或处理器120搜集到的数据内容的一部分，也可能是云端服务器190或处理器120分析处理搜集到的数据内容后加入，处理器120由此决定是否公开念出完整的合成语音答复信息、只念出一部分合成语音答复信息或是不念出合成语音答复信息，以及决定是否将数据答复信息推送到用户装置191与影像输出装置192，或是仅推送到用户装置191，避免私人信息被公开。

若云端服务器190所回传的响应消息不具有私人标记，于步骤S504，处理器120判断响应消息的内容分级信息是否符合用户、用户装置191或影像输出装置192的权限设定。于步骤S505，若响应消息的内容分级信息符合权限设定，处理器120通过网络装置110将响应消息推送至用户装置191与影像输出装置192，若响应消息的内容分级信息不符合权限设定，则响应消息不会被推送至用户装置191与影像输出装置192，或是仅推送响应消息内容中符合权限设定的部分内容。在本发明一实施例中，处理器120依据权限设定比对结果将不同的信息部分推送用户装置191与影像输出装置192，例如将不符合影像输出装置192权限设定但符合用户装置191权限设定的部分数据推送到用户装置191，但不推送到影像输出装置192，或是相反处理；再判断有不符合权限设定的数据后，智能音箱100可依据设定发出合成语音提示用户搜集到不符合权限设定的数据，或是记录此数据与前述的用户语音文字，以备智能音箱100管理者查询。

在本发明一实施例中，云端服务器190所回传的响应消息不具有私人标记或数据权限，智能音箱100由云端服务器190收到响应消息后，由处理器120根据响应消息内容进行处理，例如执行云端服务器190给智能音箱100的处理指令、根据合成语音文字合成语音、通过网络或在储存装置140搜寻数据内容或进行其他作业程序等等，其间处理器120根据搜集到的数据内容判断是否具有私人标记或数据权限，或是处理器120分析搜集到的数据内容决定是否加上私人标记或数据权限；之后处理器120若是判断搜集到的数据内容有私人标记，则处理器120最终产生合成语音答复信息与数据答复信息，智能音箱100会发声以合成语音念出合成语音答复信息，并将数据答复信息推送至接收的用户装置191而不推送至影像输出装置192，在本发明一实施例中，合成语音答复信息包括提醒用户数据答复信息已推送到用户装置191，或是提示不能公开念出或显示用户私人信息。若是处理器120搜集到的数据内容具有数据权限，处理器120依据权限设定比对结果将不同的信息部分推送用户装置191与影像输出装置192，如果处理器120判断数据权限不符合用户、用户装置191或影像输出装置192其中之一的权限设定，智能音箱100不会将数据内容推送到不符合权限的装置，并且会以合成语音提示用户不能显示被权限设定限制的信息，在本发明一实施例中，智能音箱100记录此数据与前述的用户语音文字，以备智能音箱100管理者查询。

在本发明一实施例中，若云端服务器190所回传的响应消息或是智能音箱100产生的数据答复信息具有私人标记，处理器120仍会进行数据权限的判断，判断云端服务器190所回传的响应消息或是智能音箱100产生的数据答复信息所设的数据权限是否符合用户、用户装置191或影像输出装置192的权限设定。在本发明一实施例中，用户可以音箱应用程序临时设定用户装置191的使用状态，例如正在公开使用中或被未成年人使用中，音箱应用程序会立即更新用户装置191播放设定或权限设定，直到用户改变用户装置191的使用状态为止。

图6是依照本发明一实施例的一种装置端应用示意图。于本实施例中，用户装置191与/或影像输出装置192可通过将人工智能（AI）管家应用程序（APP）或音箱应用程序以语音文字对话记录的形式呈现语音所转换成的语音文字（如：用户A、B的提问）及响应消息（如：AI管家的回答），以便于用户通过前述语音文字对话记录记录及查询历史及当前问答，响应消息内可包含各类数据，包括语音文字、表格、图片、影像、视讯、音频、链接或其他各类数据，在本发明一实施例中，应用程序会记录各类数据，并在显示语音文字对话记录的用户接口中随用户点选或滑动画面显示或播放这些数据。

综上所述，本发明的技术方案与现有技术相比具有明显的优点和有益效果。本发明的技术方案，智能音箱100可无需显示屏幕，而是将信息直接转移到用户装置191与/或影像输出装置192上播放，即使是现有显示屏幕的智能音箱100，借由本发明的技术方案，信息亦可直接转移到用户装置191与/或影像输出装置192上播放，由用户携带移动或通过更大尺寸的显示画面展示给他人。

上述实施例只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种智能音箱，其特征在于：包含：

一网络装置；

一处理器；

一放音装置，电性连接所述处理器；

2.根据权利要求1所述的智能音箱，其特征在于：当所述网络装置已与所述用户装置及一影像输出装置建立通讯时，若所述云端服务器所回传的所述响应消息具有一私人标记，所述处理器仅通过所述网络装置将该响应消息推送至所述用户装置，而不通过网络装置将该响应消息推送至所述影像输出装置。

3.根据权利要求2所述的智能音箱，其特征在于：所述储存装置预载一权限设定与所述影像输出装置的播放设定之间的关联性设定，所述处理器会判断所述响应消息的内容分级信息是否符合所述权限设定。

4.根据权利要求3所述的智能音箱，其特征在于：若所述响应消息的内容分级信息符合所述权限设定，所述处理器通过所述网络装置将该响应消息推送至所述用户装置与所述影像输出装置。

5.根据权利要求3所述的智能音箱，其特征在于：若所述响应消息的内容分级信息不符合所述权限设定，所述处理器不会通过所述网络装置将该响应消息推送至所述影像输出装置。

6.一种智能音箱的操作方法，其特征在于：包含：

依据所述播放设定，将所述响应消息推送至所述用户装置。

7.根据权利要求6所述的操作方法，其特征在于：更包含：

8.根据权利要求7所述的操作方法，其特征在于：更包含：

判断所述响应消息的内容分级信息是否符合所述权限设定。

9.根据权利要求8所述的操作方法，其特征在于：更包含：

10.根据权利要求8所述的操作方法，其特征在于：更包含：