CN110706682A

CN110706682A - 智能音箱的输出音频的方法、装置、设备和存储介质

Info

Publication number: CN110706682A
Application number: CN201910969032.5A
Authority: CN
Inventors: 雷艳兵; 陈维扬
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2019-10-12
Filing date: 2019-10-12
Publication date: 2020-01-17

Abstract

本发明实施例提供的一种智能音箱的输出音频的方法、装置、设备和存储介质，本发明一种智能音箱的输出音频的方法，包括：获取唱歌模式启动指令，进入唱歌模式后采集人声数据，并接收终端设备输入的音乐数据；对所述人声数据以及所述音乐数据进行混频处理，得到效果音频；输出所述效果音频。本发明实施例实现了使用智能音箱进行K歌的功能，提高了智能音箱的娱乐性，增强了用户体验。

Description

智能音箱的输出音频的方法、装置、设备和存储介质

技术领域

本公开涉及智能音箱领域，尤其涉及一种智能音箱的输出音频的方法、装置、设备和存储介质。

背景技术

随着智能音箱的快速发展，围绕智能音箱的一些周边应用开始逐步出现和完善。智能音箱作为家用消费级的产品形态，其中的一个发展方向是低成本，小体积的演进方向。另一方面，互联网直播等技术的发展也带动了全民娱乐，家用卡拉OK系统也出现了很多简化的形态。

根据这两个市场的发展趋势，目前现有技术中的智能音箱均不具备唱歌模式，例如卡拉OK模式，用户不能通过智能音箱K歌。对用户来说智能音箱的娱乐性显得不够高，功能不够完善，因此，娱乐性也不足。

发明内容

为克服相关技术中存在的问题，本公开提供一种智能音箱的输出音频的方法、装置、设备和存储介质。

根据本发明实施例的第一方面，提供一种智能音箱的输出音频的方法，所述方法包括：

获取唱歌模式启动指令；

进入唱歌模式后采集人声数据，并接收终端设备输入的音乐数据；

对所述人声音频数据以及所述音乐音频数据进行混频处理，得到效果音频；

输出所述效果音频。

本发明实施例提供的方案中，智能音箱获取唱歌模式启动指令，并获取用户的人声数据，以及终端设备输入的音乐数据，通过对人声音频数据以及音乐音频数据进行混频处理，得到效果音频，最后输出效果音效，实现了使用智能音箱进行K歌的功能。

在一种具体的实现方式中，所述获取唱歌模式启动指令，包括：

接收用户通过设置在智能音箱上的物理按键输入的所述唱歌模式启动指令；

或者，

接收终端设备发送的所述唱歌模式启动指令；

或者，

采集用户的语音数据，根据所述语音数据获取唱歌模式启动指令。

本发明实施例提供的方案中，可以通过智能音箱上的物理按键输入，可以通过终端设备发送，也可以通过采集用户的语音数据来获取唱歌模式启动指令，通过多种方式启动K歌模式，提高用户体验。

在一种具体的实现方式中，所述获取唱歌模式启动指令之后，所述方法还包括：

关闭所述智能音箱的语音唤醒功能。

本发明实施例提供的方案中，在K歌模式启动后，将关闭智能音箱的语音唤醒功能，避免语音唤醒功能对K歌的过程和生成效果音频造成影响。

在一中具体的实现方式中，所述方法还包括：

将所述效果音频发送至服务器进行存储。

进一步地，所述方法还包括：

接收所述服务器返回的对所述效果音频的评分，并输出所述评分。

本发明实施例提供的方案中，智能音箱将效果音频发送至服务器进行存储，并接收服务器返回的对该效果音频的评分，最终将该评分输出，便于数据收集和后期进行大数据分析，以及为用户显示K歌的评分增强了娱乐性。

根据本公发明实施例的第二方面，提供一种智能音箱的输出音频装置，包括：

获取模块，用于获取唱歌模式启动指令；

所述获取模块还用于进入唱歌模式后采集人声数据，并接收终端设备输入的音乐数据；

第一处理模块，用于对所述人声音频数据以及所述音乐音频数据进行混频处理，得到效果音频；

输出模块，用于输出所述效果音频。

可选的，所述获取模块具体用于：

第一接收子模块，用于接收用户通过设置在智能音箱上的物理按键输入的所述唱歌模式启动指令；

或者，

第二接收子模块，用于接收终端设备发送的所述唱歌模式启动指令；

或者，

获取子模块，用于采集用户的语音数据，根据所述语音数据获取唱歌模式启动指令。

可选的，所述装置还包括：

第二处理模块，用于关闭所述智能音箱的语音唤醒功能。

在一种具体的实现方式中，所述装置还包括：

发送模块，用于将所述效果音频发送至服务器进行存储。

可选的，所述获取模块还包括：

第三接收子模块，用于接收所述服务器返回的对所述效果音频的评分，并输出所述评分。

根据本发明实施例的第三方面，提供一种智能音箱，包括：音频输入接口、MIC阵列、处理器、存储器、计算机程序以及输出装置；

所述存储器用于存储所述计算机程序，所述处理器通过执行所述计算机程序，获取唱歌模式启动指令；

所述MIC阵列用于采集用户的人声数据；

所述音频输入接口用于获取终端设备输入的音乐数据；

所述处理器还用于对所述人声音频数据以及所述音乐音频数据进行混频处理，得到效果音频；

所述输出装置用于输出所述效果音频。

在一种具体的实现方式中，所述输出装置包括：

扬声器，用于播放所述效果音频；

或者，

音频输出接口，用于与外接音箱连接，将所述效果音频输出至所述外接音箱进行播放。

在一种具体的实现方式中，所述智能音箱还包括：手持装置，和电池供电装置；

所述手持装置用于握持所述智能音箱；

所述电池供电装置用于为智能音箱提供电能。

根据本发明实施例的第四方面，提供一种服务器，其特征在于，包括：接收器、发送器、存储器、处理器以及计算机程序，所述处理器运行所述计算机程序以执行：

接收智能音箱发送的效果音频；

根据曲库存储的音频文件和效果音频的匹配结果，得到效果音频的歌唱评分。

根据本发明实施例的第五方面，提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当处理器执行所述计算机程序时，实现如第一方面所述的智能音箱的输出音频的方法。

本发明实施例提供的一种智能音箱的输出音频的方法、装置、设备和存储介质，通过获取唱歌模式启动指令，并在进入唱歌模式后采集人声数据，接收终端设备输入的音乐数据，对人声音频数据以及音乐音频数据进行混频处理，得到效果音频，最终输出效果音效，实现了使用智能音箱进行K歌的功能。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的智能音箱实施例一的结构示意图。

图2是根据一示例性实施例示出的智能音箱实施例二的结构示意图。

图3是根据一示例性实施例示出的智能音箱的输出音频的方法实施例一的流程图。

图4是根据一示例性实施例示出的智能音箱的输出音频的方法实施例二的流程图。

图5是根据一示例性实施例示出的智能音箱的输出音频装置实施例一的示意图。

图6是根据一示例性实施例示出的智能音箱的输出音频装置实施例二的示意图。

图7是根据一示例性实施例示出的智能音箱的输出音频装置实施例三的示意图。

图8是根据一示例性实施例示出的智能音箱的输出音频装置实施例四的示意图。

图9是根据一示例性实施例示出的智能音箱的输出音频装置实施例五的示意图。

图10是根据一示例性实施例示出的服务器实体的框图。

图11是根据一示例性实施例示出的一种智能音箱1200的框图。

图12是根据一示例性实施例示出的一种服务器1600的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

随着人工智能(Artificial Intelligence，AI)音箱发展进入快车道，围绕智能音箱的一些周边应用开始逐步出现和完善。智能音箱作为家用消费级的产品形态，其发展方向一方面是低成本，小体积，另一方面，是多功能的融合，互联网直播等技术的发展也带动了全民娱乐，家用卡拉OK系统也出现了很多简化的形态。基于这两个市场的发展趋势，利用智能音箱现有产品的特点，在这个产品上开发出支持卡拉OK的功能，可以让智能音箱更具娱乐性，提高产品的市场竞争力。

然而，目前本领域内没有能够支持卡拉OK功能合入智能音箱的现有技术，对此，本方案提供了一种方法，该方法能够使智能音箱具备唱歌模式，即卡拉OK模式，增强了智能音箱的娱乐性。以下将通过几个具体的实施例进行详细说明。

图1是根据一示例性实施例示出的智能音箱实施例一的结构示意图，如图1所示，该智能音箱包括：音频输入接口、麦克风(Microphone，MIC)阵列、处理器、存储器、计算机程序以及输出装置。

其中，存储器用于存储所述计算机程序，处理器通过执行计算机程序，获取唱歌模式启动指令，唱歌模式启动指令用于指示智能音箱进入唱歌模式，MIC阵列用于采集用户的人声数据，音频输入接口用于获取终端设备输入的音乐数据，处理器还用于对所述人声音频数据以及所述音乐音频数据进行混频处理，得到效果音频，输出装置用于输出效果音频。

可选的，该输出装置可以是扬声器或者音频输出接口，或者是包括扬声器和音频输出接口。

可选的，MIC阵列包括一个或者多个麦克风。

在一种具体的实现方式中，音频输入接口与终端设备连接，以获取音乐数据，可选的，终端设备可以是手机、平板、电视、电脑等，本方案对此不做要求。

本实施例提供的一种智能音箱，包括：音频输入接口、MIC阵列、处理器、存储器、计算机程序以及输出装置，音频输入接口获取音乐数据，MIC阵列获取人声数据，通过处理器运行计算机程序启动唱歌模式并将人声数据与音乐数据进行混频处理，最终得到并经输出装置输出效果音频，实现了使用智能音箱进行K歌的功能。

在一种具体的实现方式中，图2是根据一示例性实施例示出的智能音箱实施例二的结构示意图，在图1所示实施例的基础上，该智能音箱10具体包括：

音频输入接口、MIC阵列、音频采集装置、数字模拟转换器(Digital to analogconverter，DAC)/功放装置、中央处理器(Central Processing Unit，CPU)、蓝牙装置、WIFI装置、扬声器、音频输出接口、手持装置以及电池供电装置。

其中，音频输入接口、MIC阵列与图1所示实施例方案中的技术效果相同，不再赘述。

音频采集装置用于实时采集MIC阵列获取的人声数据与音频输入接口获取的音乐数据，该音频采集装置可以共用现有技术中智能音箱中具备的多路模拟数字转换器(Analog-to-Digital Converter，ADC)装置。

CPU用于将获取到的音频采集装置采集的人生数据和音乐数据，并根据该人声数据和该音乐数据进行混频处理，得到最终的效果音频，并将效果音频发送给DAC装置。

DAC/功放装置用于接收CPU发送的效果音频，将效果音频的数字音频信号转换成模拟音频信号，并将音频信号放大，最后将经过模数转换和信号放大的效果音频发送给扬声器或者音频输出接口所连接的外接音箱。

蓝牙装置用于与终端设备连接，以获取音乐数据，可选的，终端设备可以是手机、平板、电视、电脑等，本方案对此不做要求。

WIFI装置用于连接互联网中的服务器，以使智能音箱和服务器建立连接，智能音箱可以将效果音频发送到服务器进行存储，也可以读取服务器中存储的数据。

手持装置的设计可以使用户方便握持智能音箱，而通过电池供电装置为智能音箱提供电能，则可省去电源线，更加配合了手持装置的设计。

图3是根据一示例性实施例示出的智能音箱的输出音频的方法实施例一的流程图。在图1和图2所示智能音箱实施例的基础上，如图3所示，该智能音箱的输出音频的方法包括以下步骤：

S101：获取唱歌模式启动指令。

在本步骤中，该唱歌模式启动指令用于指示所述智能音箱进入唱歌模式，智能音箱首先通过获取该唱歌模式启动指令，以使智能音箱进入唱歌模式。

获取唱歌模式启动指令的方式，可以是通过智能音箱采集用户的语音数据，例如“K歌”或者“开始K歌”等语音指令。

也可以通过接收终端设备发送的唱歌模式启动指令，以终端设备是手机为例，手机在通过智能音箱的应用程序接收到用户在界面选择的“K歌”选项后，生成唱歌模式启动指令，并将该唱歌模式启动指令发送给智能音箱。

还可以接收通过智能音箱上的物理按键输入唱歌模式启动指令，例如，在智能音箱上设置有用于启动K歌模式的机械按键，通过接收用户按压物理按键来启动智能音箱的K歌模式。

S102：进入唱歌模式后采集人声数据，并接收终端设备输入的音乐数据。

在本步骤中，智能音箱进入唱歌模式后，将关闭语音唤醒以及其他语音交互功能，只对输入的人声数据和音乐数据进行采集并完成相应处理。

例如，终端设备(例如手机、平板以及电脑等智能设备)通过蓝牙装置或者音频输入接口与智能音箱连接，向其输入音乐数据，即伴奏音乐，同时，终端设备将同步播放该伴奏音乐并显示该伴奏音乐对应的歌曲信息(例如歌名、歌词、原唱、以及音乐短片等)。

同时，智能音箱通过MIC阵列对人声数据进行收集，该人声数据即用户根据终端设备播放的伴奏音乐和滚动显示的歌词演唱的歌声。

可选的，MIC阵列可以用于完成人声数据的模拟信号转换为数字信号。

可选的，终端设备通过音频输入接口输入的音乐数据可以是通过音乐应用程序输入的，例如：QQ音乐、酷我音乐等。

S103：对人声数据以及音乐数据进行混频处理，得到效果音频。

在本步骤中，通过智能音箱中的音频采集装置实时采集MIC阵列的人声数据和终端设备通过音频输入接口输入的音乐数据，智能音箱中的CPU从音频采集装置获取人声数据和音乐数据，并对人声数据和音乐数据进行混频处理，得到效果音频。

S104：输出效果音频。

在本步骤中，智能音箱实时输出效果音频，将效果音频通过智能音箱的扬声器或者外接的音箱实时播放出来。

在一种具体的实现方式中，在智能音箱输出效果音频之前，可以将对人声数据和音乐数据混频处理得到的效果音频由CPU发送给DAC/功放装置，对该效果音效进行数字信号到模拟信号的转换，以及对该效果音效进行音频信号放大后，再将处理过的效果音频输出。

可选的，效果音频可以通过智能音箱的扬声器播放，也可以通过外接音箱播放。

本实施例提供的智能音箱的输出音频的方法，通过获取唱歌模式启动指令，智能音箱进入唱歌模式后采集人声数据，并接收终端设备输入的音乐数据，并对人声数据以及音乐数据进行混频处理，得到效果音频，最终输出效果音频，实现了使用智能音箱进行K歌的功能，提高了智能音箱的娱乐性，增强了用户体验。

图4是根据一示例性实施例示出的智能音箱的输出音频的方法实施例二的流程图，如图4所示，该智能音箱的输出音频的方法还包括：

S201：将效果音频发送至服务器进行存储。

在本步骤中，智能音箱将效果音频发送给服务器，在服务器中存储效果音频。智能音箱通过WIFI装置连接至互联网，与服务器建立通信，将效果音频发送到服务器进行存储。

可选的，存储于服务器中的效果音频可以被读取和下载，也可以用于数据分析。

S202：接收服务器返回的对效果音频的评分，并输出评分。

在本步骤中，服务器收到智能音箱的效果音频后对效果音频评分并返回评分给智能音箱，智能音箱接收服务器返回的评分，并输出评分。输出评分的方式可以是通过扬声器或者外接音箱播放的，也可以是通过终端设备显示的。

可选的，该评分可以存储于服务器中，可以被读取和下载，也可以用于数据分析。

本实施例提供的一种智能设备的输出音频的方法，智能音箱将效果音频发送至服务器进行存储，并接收服务器返回的对该效果音频的评分，最终将该评分输出，便于数据收集和后期进行大数据分析，以及为用户显示K歌的评分增强了娱乐性。

本发明提供一种智能音箱的输出音频装置，该装置可以用于执行图3和图4所示的方法中的技术方案。

图5是根据一示例性实施例示出的智能音箱的输出音频装置实施例一的示意图，如图5所示，该智能音箱的输出音频装置10包括：

获取模块101：用于获取唱歌模式启动指令；

进一步地，所述获取模块101还用于进入唱歌模式后采集人声数据，并接收终端设备输入的音乐数据；

第一处理模块102：用于对所述人声音频数据以及所述音乐音频数据进行混频处理，得到效果音频；

输出模块103：用于输出所述效果音频。

本实施例提供的智能音箱的输出音频装置，用于执行前述任一方法实施例中智能音箱的输出音频的方法的技术方案，其实现原理和技术效果类似，通过获取唱歌模式启动指令，智能音箱进入唱歌模式，采集人声数据，并接收终端设备输入的音乐数据，并对人声数据以及音乐数据进行混频处理，得到效果音频，最终输出效果音频，实现了使用智能音箱进行K歌的功能，提高了智能音箱的娱乐性，增强了用户体验。

图6是根据一示例性实施例示出的智能音箱的输出音频装置实施例二的示意图，在图5所示实施例的基础上，如图6所示，获取模块101具体包括：第一接收子模块1011，用于接收用户通过设置在智能音箱上的物理按键输入的所述唱歌模式启动指令；

或者，第二接收子模块1012，用于接收终端设备发送的所述唱歌模式启动指令；

或者，获取子模块1013，用于采集用户的语音数据，根据所述语音数据获取唱歌模式启动指令。

图7是根据一示例性实施例示出的智能音箱的输出音频装置实施例三的示意图，在图5所示实施例的基础上，如图7所示，该智能音箱的输出音频装置还包括：

第二处理模块104：用于关闭智能音箱的语音唤醒功能。

在上述装置实施例的基础上，图8是根据一示例性实施例示出的智能音箱的输出音频装置实施例四的示意图。参照图8，该智能设备的状态提醒装置10还包括：

发送模块105：用于将所述效果音频发送至服务器进行存储。

图9是根据一示例性实施例示出的智能音箱的输出音频装置实施例五的示意图，获取模块101还包括：

第三接收子模块1014：用于接收所述服务器返回的对所述效果音频的评分，并输出所述评分。

上述任一发明实施例提供的智能音箱的输出音频装置，用于执行前述任一方法实施例中的技术方案，其实现原理和技术效果类似，在此不用赘述。

图10是根据一示例性实施例示出的服务器实体的框图。参考图10，本公开实施例提供的服务器，包括：接收器、发送器、存储器、处理器以及计算机程序，所述处理器运行所述计算机程序以执行：

接收智能音箱发送的效果音频；

在上述服务器的实施例中，应理解，处理器可以是中央处理单元(英文：CentralProcessing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：DigitalSignal Processor，简称：DSP)、专用集成电路(英文：Application Specific IntegratedCircuit，简称：ASIC)等。通用处理器可以是微处理器或者处理器也可以是任何常规的处理器等，而前述的存储器可以是只读存储器(英文：read-only memory，缩写：ROM)、随机存取存储器(英文：random access memory，简称：RAM)、快闪存储器、硬盘或者固态硬盘。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现前述任一方案提供的智能音箱的K歌实现方法的技术方案。

请参考图11，图11是根据一示例性实施例示出的一种智能音箱1200的框图。

参照图11，智能音箱1200可以包括以下一个或多个组件：处理组件1202，存储器1204，电源组件1206，多媒体组件1208，音频组件1210，输入/输出(I/O)的接口1212，传感器组件1214，以及通信组件1216。

处理组件1202通常控制智能音箱1200的整体操作，诸如与显示，数据通信，多媒体操作和记录操作相关联的操作。处理组件1202可以包括一个或多个处理器1220来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1202可以包括一个或多个模块，便于处理组件1202和其他组件之间的交互。例如，处理组件1202可以包括多媒体模块，以方便多媒体组件1208和处理组件1202之间的交互。

存储器1204被配置为存储各种类型的数据以支持在智能音箱1200的操作。这些数据的示例包括用于在智能音箱1200上操作的任何应用程序或方法的指令，各类数据，消息，图片，视频等。存储器1204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1206为智能音箱1200的各种组件提供电力。电源组件1206可以包括电源管理系统，一个或多个电源，及其他与为智能音箱1200生成、管理和分配电力相关联的组件。

多媒体组件1208包括在智能音箱1200和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。

音频组件1210被配置为输出和/或输入音频信号。例如，音频组件1210包括一个麦克风(MIC)，当智能音箱1200处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1204或经由通信组件1216发送。在一些实施例中，音频组件1210还包括一个扬声器，用于输出音频信号。

I/O接口1212为处理组件1202和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。

传感器组件1214包括一个或多个传感器，用于为智能音箱1200提供各个方面的状态评估。例如，传感器组件1214可以检测到智能音箱1200的打开/关闭状态，组件的相对定位，例如组件为智能音箱1200的显示器和小键盘，传感器组件1214还可以检测智能音箱1200或智能音箱1200一个组件的位置改变，用户与智能音箱1200接触的存在或不存在，智能音箱1200方位或加速/减速和智能音箱1200的温度变化。传感器组件1214可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1214还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，传感器组件1214还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1216被配置为便于智能音箱1200和其他设备之间有线或无线方式的通信。智能音箱1200可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件1216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件1216还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，智能音箱1200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现。用于执行智能音箱的输出音频的方法，包括：

获取唱歌模式启动指令，；

获取用户的人声数据，以及终端设备输入的音乐数据；

对所述人声数据以及所述音乐数据进行混频处理，得到效果音频；

输出所述效果音频。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1204，上述指令可由智能音箱1200的处理器1220执行以完成上述方法。例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图12是根据一示例性实施例示出的一种服务器1600的框图。参照图12，服务器1600包括处理组件1622，其进一步包括一个或多个处理器，以及由存储器1632所代表的存储器资源，用于存储可由处理组件1622的执行的指令，例如应用程序。存储器1632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1622被配置为执行指令，以执行上述服务器侧的智能音箱的输出音频的方法，包括：

接收智能音箱发送的效果音频；

服务器1600还可以包括一个电源组件1626被配置为执行服务器1600的电源管理，一个有线或无线网络接口1650被配置为将服务器1600连接到网络，和一个输入输出(I/O)接口1658。服务器1600可以操作基于存储在存储器1632的操作系统，例如WindowsServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由权利要求书指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求书来限制。

Claims

1.一种智能音箱的输出音频的方法，其特征在于，所述方法包括：

获取唱歌模式启动指令；

输出所述效果音频。

2.根据权利要求1所述的方法，其特征在于，所述获取唱歌模式启动指令，包括：

接收通过设置在智能音箱上的物理按键输入的所述唱歌模式启动指令；

或者，

接收终端设备发送的所述唱歌模式启动指令；

或者，

采集语音数据，根据所述语音数据获取唱歌模式启动指令。

3.根据权利要求1所述的方法，其特征在于，所述获取唱歌模式启动指令之后，所述方法还包括：关闭所述智能音箱的语音唤醒功能。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：将所述效果音频发送至服务器进行存储。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.一种智能音箱的输出音频装置，其特征在于，包括：

获取模块，用于获取唱歌模式启动指令；

输出模块，用于输出所述效果音频。

7.根据权利要求6所述的装置，其特征在于，所述获取模块具体包括：

或者，

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：

第二处理模块，用于关闭所述智能音箱的语音唤醒功能。

9.根据权利要求6至8任一项所述的装置，其特征在于，所述装置还包括：

发送模块，用于将所述效果音频发送至服务器进行存储。

10.根据权利要求9所述的装置，其特征在于，所述获取模块还包括：

11.一种智能音箱，其特征在于，包括：音频输入接口、MIC阵列、处理器、存储器、计算机程序以及输出装置；

所述MIC阵列用于采集用户的人声数据；

所述音频输入接口用于获取终端设备输入的音乐数据；

所述输出装置用于输出所述效果音频。

12.根据权利要求11所述的设备，其特征在于，所述输出装置包括：

扬声器，用于播放所述效果音频；

或者，

13.根据权利要求11所述的设备，其特征在于，所述智能音箱还包括：手持装置，和电池供电装置；

所述手持装置用于握持所述智能音箱；

所述电池供电装置用于为智能音箱提供电能。

14.一种服务器，其特征在于，包括：接收器、发送器、存储器、处理器以及计算机程序，所述处理器运行所述计算机程序以执行：

接收智能音箱发送的效果音频；

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当处理器执行所述计算机程序时，实现如权利要求1至6任一项所述的智能音箱的输出音频的方法。