CN115374305A

CN115374305A - 智能音箱的音效调整方法及装置

Info

Publication number: CN115374305A
Application number: CN202211061001.8A
Authority: CN
Inventors: 张义春
Original assignee: Shenzhen Royqueen Audio Technology Co ltd
Current assignee: Shenzhen Royqueen Audio Technology Co ltd
Priority date: 2022-09-01
Filing date: 2022-09-01
Publication date: 2022-11-22

Abstract

本发明涉及人工智能领域，公开了一种智能音箱的音效调整方法及装置，用于提高智能音箱的音效调整的准确率。所述方法包括：根据音乐播放指令匹配待播放的音乐数据，并对音乐数据进行音乐播放，以及调用传感器采集用户数据；对视频数据进行用户行为分析，得到用户行为分析结果，并对音频数据进行用户音频分析，得到用户音频分析结果，以及对操作数据进行用户操作分析，得到用户操作分析结果；根据用户行为分析结果、用户音频分析结果和用户操作分析结果生成情绪分析结果：根据情绪类别设置目标音效模式，并根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，以及根据音效参数对音乐数据进行播放。

Description

智能音箱的音效调整方法及装置

技术领域

本发明涉及人工智能领域，尤其涉及一种智能音箱的音效调整方法及装置。

背景技术

随着物联网技术的高速发展，智能家居已经逐渐成熟并且存在于日常生活中的方方面面，智能音箱作为一种智能家居，可以进行智能音乐播放，智能音箱最核心的功能仍是作为音源发出声音。目前智能音箱包括音频播放模块和可视化功能模块。

为了让智能音箱的音乐播放更加的智能，需要在智能音箱音乐播放的过程中对智能音箱进行智能音效调整，现有方案通常是通过外部人工对智能音箱进行音效调整，而这种方式通常容易受到人工经验的影响，进而导致现有方案的准确率低。

发明内容

本发明提供了一种智能音箱的音效调整方法及装置，用于提高智能音箱的音效调整的准确率。

本发明第一方面提供了一种智能音箱的音效调整方法，所述智能音箱的音效调整方法包括：从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据；根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号；根据所述音乐播放指令从所述音乐自动播放列表中匹配待播放的音乐数据，并通过所述智能音箱对所述音乐数据进行音乐播放，以及调用预设的传感器采集所述目标用户对应的用户数据，其中，所述用户数据用于指示所述目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果；根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别；根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放。

可选的，在本发明第一方面的第一种实现方式中，所述从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据，包括：从预置的数据库中获取目标用户在预设周期内的历史音乐播放数据；对所述历史音乐播放数据进行音乐类型识别，得到多个音乐类型，并对所述历史音乐播放数据中的曲目进行播放频率计算，得到播放频率数据；将所述多个音乐类型和所述播放频率数据作为音乐特征数据并输出。

可选的，在本发明第一方面的第二种实现方式中，所述根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号，包括：根据所述音乐特征数据从所述数据库中匹配与所述多个音乐类型对应的多个候选音乐；根据所述播放频率数据对所述多个候选音乐进行播放概率排序，得到播放概率排序结果；根据所述播放概率排序结果生成所述目标用户的音乐自动播放列表；通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，其中，所述音乐播放信号包括以下至少一种：语音信号、用户行为信号和终端控制信号；通过所述智能音箱根据所述音乐播放信号生成音乐播放指令。

可选的，在本发明第一方面的第三种实现方式中，所述对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果，包括：对所述视频数据进行肢体行为识别，得到肢体行为，并对所述肢体行为进行用户行为分析，得到用户行为分析结果；对所述音频数据进行音频内容和音调识别，得到音频内容和音调，并根据所述音频内容和音调进行用户音频分析，得到用户音频分析结果；对所述操作数据进行操作方式和操作频率识别，得到操作方式和操作频率，并根据所述操作方式和所述操作频率进行用户操作分析，得到用户操作分析结果。

可选的，在本发明第一方面的第四种实现方式中，所述根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别，包括：对所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果进行向量转换，得到初始向量；将所述初始向量输入情绪概率分析模型进行情绪概率预测，得到情绪概率预测值，其中门锁是情绪概率分析模型包括：嵌入层、门限循环网络和全连接层；根据所述情绪概率预测值匹配所述目标用户对应的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别。

可选的，在本发明第一方面的第五种实现方式中，所述根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放，包括：根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式；根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数；获取所述智能音箱的空间位置参数，并对所述空间位置参数进行处理，得到音效补偿参数；根据所述音效参数和所述音效补偿参数对所述音乐数据进行播放。

可选的，在本发明第一方面的第六种实现方式中，所述智能音箱的音效调整方法还包括：根据所述情绪分析结果对所述音乐自动播放列表进行列表重排，得到更新播放列表；从所述更新播放列表中确定下一个待播放的音乐数据；通过所述智能音箱按照所述音效参数对所述下一个待播放的音乐数据进行播放。

本发明第二方面提供了一种智能音箱的音效调整装置，所述智能音箱的音效调整装置包括：获取模块，用于从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据；处理模块，用于根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号；采集模块，用于根据所述音乐播放指令从所述音乐自动播放列表中匹配待播放的音乐数据，并通过所述智能音箱对所述音乐数据进行音乐播放，以及调用预设的传感器采集所述目标用户对应的用户数据，其中，所述用户数据用于指示所述目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；分析模块，用于对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果；生成模块，用于根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别；播放模块，用于根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放。

可选的，在本发明第二方面的第一种实现方式中，所述获取模块具体用于：从预置的数据库中获取目标用户在预设周期内的历史音乐播放数据；对所述历史音乐播放数据进行音乐类型识别，得到多个音乐类型，并对所述历史音乐播放数据中的曲目进行播放频率计算，得到播放频率数据；将所述多个音乐类型和所述播放频率数据作为音乐特征数据并输出。

可选的，在本发明第二方面的第二种实现方式中，所述处理模块具体用于：根据所述音乐特征数据从所述数据库中匹配与所述多个音乐类型对应的多个候选音乐；根据所述播放频率数据对所述多个候选音乐进行播放概率排序，得到播放概率排序结果；根据所述播放概率排序结果生成所述目标用户的音乐自动播放列表；通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，其中，所述音乐播放信号包括以下至少一种：语音信号、用户行为信号和终端控制信号；通过所述智能音箱根据所述音乐播放信号生成音乐播放指令。

可选的，在本发明第二方面的第三种实现方式中，所述分析模块具体用于：对所述视频数据进行肢体行为识别，得到肢体行为，并对所述肢体行为进行用户行为分析，得到用户行为分析结果；对所述音频数据进行音频内容和音调识别，得到音频内容和音调，并根据所述音频内容和音调进行用户音频分析，得到用户音频分析结果；对所述操作数据进行操作方式和操作频率识别，得到操作方式和操作频率，并根据所述操作方式和所述操作频率进行用户操作分析，得到用户操作分析结果。

可选的，在本发明第二方面的第四种实现方式中，所述生成模块具体用于：对所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果进行向量转换，得到初始向量；将所述初始向量输入情绪概率分析模型进行情绪概率预测，得到情绪概率预测值，其中门锁是情绪概率分析模型包括：嵌入层、门限循环网络和全连接层；根据所述情绪概率预测值匹配所述目标用户对应的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别。

可选的，在本发明第二方面的第五种实现方式中，所述播放模块具体用于：根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式；根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数；获取所述智能音箱的空间位置参数，并对所述空间位置参数进行处理，得到音效补偿参数；根据所述音效参数和所述音效补偿参数对所述音乐数据进行播放。

可选的，在本发明第二方面的第六种实现方式中，所述智能音箱的音效调整装置还包括：更新模块，用于根据所述情绪分析结果对所述音乐自动播放列表进行列表重排，得到更新播放列表；从所述更新播放列表中确定下一个待播放的音乐数据；通过所述智能音箱按照所述音效参数对所述下一个待播放的音乐数据进行播放。

本发明第三方面提供了一种智能音箱的音效调整设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述智能音箱的音效调整设备执行上述的智能音箱的音效调整方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的智能音箱的音效调整方法。

本发明提供的技术方案中，通过对目标用户的历史音乐播放数据进行特征提取，得到多个音乐类型和播放频率数据，对目标用户进行历史数据分析可以更加准确的构建目标用户的音乐自动播放列表，其次，通过在音乐数据播放的过程中对目标用户进行音频数据、视频数据和操作数据分析，判断目标用户的情绪类别，通过智能分析目标用户的情绪，对智能音箱的音效进行适应性调整，并且通过目标用户的情绪类别对智能音箱进行音效模式设置，得到目标音效模式，并根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，以及根据音效参数对所述音乐数据进行播放，实现了智能音箱的自适应控制和音效的自动调整，并且提高了智能音箱的音效调整的准确率。

附图说明

图1为本发明实施例中智能音箱的音效调整方法的一个实施例示意图；

图2为本发明实施例中智能音箱的音效调整方法的另一个实施例示意图；

图3为本发明实施例中智能音箱的音效调整装置的一个实施例示意图；

图4为本发明实施例中智能音箱的音效调整装置的另一个实施例示意图；

图5为本发明实施例中智能音箱的音效调整设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种智能音箱的音效调整方法及装置，用于提高智能音箱的音效调整的准确率。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中智能音箱的音效调整方法的一个实施例包括：

101、从预置的数据库中获取目标用户的历史音乐播放数据，并对历史音乐播放数据进行特征提取，得到音乐特征数据，其中，音乐特征数据包括：多个音乐类型和播放频率数据；

可以理解的是，本发明的执行主体可以为智能音箱的音效调整装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

具体的，获取历史音乐播放数据，基于预置的事件定义方法，将历史音乐播放数据转化为基于事件的离散表示数据，进而服务器对离散表示数据进行向量转换，得到初始音乐特征向量，将初始音乐特征向量输入预置的音乐类型识别模型进行识别，得到音乐特征数据，其中，音乐特征数据包括：多个音乐类型和播放频率数据，本实施例通过音乐类型识别模型进行类型识别，识别速度快，准确率高。

102、根据音乐特征数据构建目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收目标用户发送的音乐播放信号，以及通过智能音箱根据音乐播放信号生成音乐播放指令，其中，音乐播放信号包括：语音信号、用户行为信号和终端控制信号；

具体的，服务器获取音乐特征数据，需要说明的是，该音乐特征数据包括历史特征数据和实时特征数据，实时特征数据具体为实时播放行为数据，其中，服务器根据音乐特征数据并通过预设的推荐模型得到每首候选音乐的播放概率，播放概率用于表征每首候选音乐被完整播放的概率，根据预设推荐策略以及每首候选音乐的播放概率得到目标音乐集合，进而服务器构建目标用户的音乐自动播放列表，最后服务器通过预置的智能音箱识别并接收目标用户发送的音乐播放信号，以及通过智能音箱根据音乐播放信号生成音乐播放指令，其中，音乐播放信号包括：语音信号、用户行为信号和终端控制信号。

103、根据音乐播放指令从音乐自动播放列表中匹配待播放的音乐数据，并通过智能音箱对音乐数据进行音乐播放，以及调用预设的传感器采集目标用户对应的用户数据，其中，用户数据用于指示目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；

具体的，在预置的数据库中建立音乐数据与播放控制指令的关联关系，将接收到的音乐播放指令导入预置的数据库进行匹配，根据匹配结果生成与检测到的音乐播放指令相关联的音乐数据及播放控制指令，根据生成的播放控制指令进行音乐播放控制，然后用预设的传感器采集目标用户对应的用户数据。本发明通过指令输入来实现对智能音箱音乐播放应用的播放控制，减少了智能音箱的电量消耗和硬件损耗。

104、对视频数据进行用户行为分析，得到用户行为分析结果，并对音频数据进行用户音频分析，得到用户音频分析结果，以及对操作数据进行用户操作分析，得到用户操作分析结果；

具体的，服务器获取与目标用户行为对应的目标参数的统计信息，其中，该目标参数包括该目标用户行为的至少一个参数，并且该目标参数的统计信息是根据多个其它用户设备分别对应的该目标用户行为的行为识别中该目标参数的值确定的，该服务器根据该目标参数的统计信息，建立并保存该服务器对应的该目标用户行为的行为识别模型，以用于识别该目标用户行为，得到用户行为分析结果，并对音频数据进行用户音频分析，得到用户音频分析结果，以及对操作数据进行用户操作分析，得到用户操作分析结果，能够提高行为识别模型的建立效率和准确性，从而提升后续对音效调整的准确度。

105、根据用户行为分析结果、用户音频分析结果和用户操作分析结果生成目标用户的情绪分析结果，其中，情绪分析结果用于指示目标用户的情绪类别；

具体的，获取待分析用户的行为分析结果，并对用户的情绪特征进行分析，得到情绪分析结果，根据情绪分析结果，分析对应的个性特征，具体的，提取目标用户的视频中的全身图像，通过情绪表情识别模型识别全身图像中的情绪表情、肢体动作识别模型识别全身图像中的肢体动作及行为识别模型识别全身图像中的情绪特征行为，将情绪表情、肢体动作及情绪特征行为分别与情绪特征分析数据库进行匹配来识别目标用户的情绪分析结果。

106、根据情绪类别对智能音箱进行音效模式设置，得到目标音效模式，并根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，以及根据音效参数对音乐数据进行播放。

具体的，本发明中通过对用户的情绪类别进行分类，其中，用户的情绪类别可以反映用户当前的心情，为了满足用户不同的情绪需求，可以设定不同的音效模式。在确定出情绪类别之后，可以基于用户的情绪需求确定出音效模式，依据选定的音效模式以及情绪类别，可以确定出匹配的音效参数。音效参数可以影响音乐播放效果。通过基于音效模式和用户的情绪类别，匹配音效参数，按照该音效参数播放音乐，可以使得播放的音效更加贴合用户的实际情感需求，达到了智能调节音效的效果。

本发明实施例中，通过对目标用户的历史音乐播放数据进行特征提取，得到多个音乐类型和播放频率数据，对目标用户进行历史数据分析可以更加准确的构建目标用户的音乐自动播放列表，其次，通过在音乐数据播放的过程中对目标用户进行音频数据、视频数据和操作数据分析，判断目标用户的情绪类别，通过智能分析目标用户的情绪，对智能音箱的音效进行适应性调整，并且通过目标用户的情绪类别对智能音箱进行音效模式设置，得到目标音效模式，并根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，以及根据音效参数对音乐数据进行播放，实现了智能音箱的自适应控制和音效的自动调整，并且提高了智能音箱的音效调整的准确率。

请参阅图2，本发明实施例中智能音箱的音效调整方法的另一个实施例包括：

201、从预置的数据库中获取目标用户的历史音乐播放数据，并对历史音乐播放数据进行特征提取，得到音乐特征数据，其中，音乐特征数据包括：多个音乐类型和播放频率数据；

具体的，从预置的数据库中获取目标用户在预设周期内的历史音乐播放数据；对历史音乐播放数据进行音乐类型识别，得到多个音乐类型，并对历史音乐播放数据中的曲目进行播放频率计算，得到播放频率数据；将多个音乐类型和播放频率数据作为音乐特征数据并输出。

本实施例中，获取用户的历史音乐播放数据的音乐类型，用户的历史音乐播放数据是用户在音乐播放软件上下载的音乐文件，选取一定量的音乐家创作的音乐和人工智能算法生成的音乐生成音乐文件库，设置数字音乐格式转化，转化生成原始音乐数据的数字音乐格式，数字音乐格式是将音乐片段中的每个音符记录为一个数字，所以相比原始文件要小得多，可以满足长时间音乐的需要。从音乐文件库中读取历史音乐播放数据，用于转换成辨别模型的输入。本实施例中，基于预置的事件定义，将音乐文件中的数字音乐数据转化为基于事件的离散表示数据，并对离散表示数据进行向量转换，得到初始音乐特征向量。将音乐文件中的音符起始、音符结束、时间移动、唱词起始、唱词结束均转化为整数型数据，生成一个整数向量，需要说明的是，数据处理的目的是将音乐文件中的音乐信息有效的转换成离散的序列，并作为预置音乐类型识别模型的输入。将音乐文件中的全部时间组成一个数值向量，生成一个整数向量，得到初始音乐特征向量，进而服务器对历史音乐播放数据进行音乐类型识别，得到多个音乐类型，并对历史音乐播放数据中的曲目进行播放频率计算，得到播放频率数据，将多个音乐类型和播放频率数据作为音乐特征数据并输出，本发明能够以较高的准确率得到多个音乐类型和播放频率数据。

202、根据音乐特征数据构建目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收目标用户发送的音乐播放信号，以及通过智能音箱根据音乐播放信号生成音乐播放指令，其中，音乐播放信号包括：语音信号、用户行为信号和终端控制信号；

具体的，根据音乐特征数据从数据库中匹配与多个音乐类型对应的多个候选音乐；根据播放频率数据对多个候选音乐进行播放概率排序，得到播放概率排序结果；根据播放概率排序结果生成目标用户的音乐自动播放列表；通过预置的智能音箱识别并接收目标用户发送的音乐播放信号，其中，音乐播放信号包括以下至少一种：语音信号、用户行为信号和终端控制信号；通过智能音箱根据音乐播放信号生成音乐播放指令。

其中，播放概率用于表征每首候选音乐被完整播放的概率。在获取到特征数据之后，将音乐特征数据作为输入数据输入至预设的推荐模型，利用预设推荐模型得到所输入的特征数据对应的输出结果。其中，预设推荐模型为提前训练的能够对输入数据进行预测得到对应目标数据的训练模型，根据播放频率数据对多个候选音乐进行播放概率排序，得到播放概率排序结果，根据播放概率排序结果生成目标用户的音乐自动播放列表，通过预置的智能音箱识别并接收目标用户发送的音乐播放信号。

203、根据音乐播放指令从音乐自动播放列表中匹配待播放的音乐数据，并通过智能音箱对音乐数据进行音乐播放，以及调用预设的传感器采集目标用户对应的用户数据，其中，用户数据用于指示目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；

具体的，在本实施例中，步骤203的具体实施方式与上述步骤103类似，此处不再赘述。

204、对视频数据进行用户行为分析，得到用户行为分析结果，并对音频数据进行用户音频分析，得到用户音频分析结果，以及对操作数据进行用户操作分析，得到用户操作分析结果；

具体的，对视频数据进行肢体行为识别，得到肢体行为，并对肢体行为进行用户行为分析，得到用户行为分析结果；对音频数据进行音频内容和音调识别，得到音频内容和音调，并根据音频内容和音调进行用户音频分析，得到用户音频分析结果；对操作数据进行操作方式和操作频率识别，得到操作方式和操作频率，并根据操作方式和操作频率进行用户操作分析，得到用户操作分析结果。

其中，提取目标用户的视频中的全身图像，通过情绪表情识别模型识别全身图像中的情绪表情、肢体动作识别模型识别全身图像中的肢体动作及情绪特征行为识别模型识别全身图像中的情绪特征行为，将情绪表情、肢体动作及情绪特征行为分别与情绪特征数据库进行匹配来识别目标用户存在情绪特征时，识别存在情绪特征的情绪类型并分析出情绪等级，进而服务器对音频数据进行音频内容和音调识别，得到音频内容和音调，并根据音频内容和音调进行用户音频分析，得到用户音频分析结果，对操作数据进行操作方式和操作频率识别，得到操作方式和操作频率，并根据操作方式和操作频率进行用户操作分析，得到用户操作分析结果，本实施例能够精确的识别出目标用户是否有情绪特征，并给出情绪特征的情绪类型及对应的情绪等级。

205、根据用户行为分析结果、用户音频分析结果和用户操作分析结果生成目标用户的情绪分析结果，其中，情绪分析结果用于指示目标用户的情绪类别；

具体的，对用户行为分析结果、用户音频分析结果和用户操作分析结果进行向量转换，得到初始向量；将初始向量输入情绪概率分析模型进行情绪概率预测，得到情绪概率预测值，其中门锁是情绪概率分析模型包括：嵌入层、门限循环网络和全连接层；根据情绪概率预测值匹配目标用户对应的情绪分析结果，其中，情绪分析结果用于指示目标用户的情绪类别。

可选的，本发明还可以通过情绪识别算法从该实时图像中提取一张实时脸部图像，将实时脸部图像输入预先确定的AU分类器，得到从该实时脸部图像中识别出的每个AU的概率，将该实时脸部图像中所有AU的概率组成该实时脸部图像的特征向量，进而服务器将特征向量输入预先确定的情绪分类器，得到从该实时情绪图像中识别出每种情绪的概率，取概率最大的情绪作为从该实时情绪图像中识别出的情绪，利用本发明识别出实时脸部图像中的AU特征及概率，根据每个AU特征及概率识别出实时脸部图像中的人物情绪，有效提高人物情绪识别的效率。

206、根据情绪类别对智能音箱进行音效模式设置，得到目标音效模式，并根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，以及根据音效参数对音乐数据进行播放；

具体的，根据情绪类别对智能音箱进行音效模式设置，得到目标音效模式；根据目标音效模式和情绪类别匹配智能音箱对应的音效参数；获取智能音箱的空间位置参数，并对空间位置参数进行处理，得到音效补偿参数；根据音效参数和音效补偿参数对音乐数据进行播放。

其中，获取智能音箱的音效参数，并将音效参数确定为初始音效参数，在通过音频播放软件播放音频文件时，检测播放音频文件的音效参数是否与初始音效参数一致，若检测播放音频文件的音效参数与初始音效参数不一致，则根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，获取智能音箱的空间位置参数，并对空间位置参数进行处理，得到音效补偿参数，根据音效参数和音效补偿参数对音乐数据进行播放，具体的，在对空间位置参数进行处理时，空间可以是用户的客厅、卧室等，在进行空间位置参数测定时，服务器以智能音箱为中心、面向所在空间各个面的距离方向确定对应的空间未知参数，并计算得到音效补偿参数，可以提升智能音箱播放时音效调节的准确度。

207、根据情绪分析结果对音乐自动播放列表进行列表重排，得到更新播放列表；

208、从更新播放列表中确定下一个待播放的音乐数据；

209、通过智能音箱按照音效参数对下一个待播放的音乐数据进行播放。

需要说明的是，本发明还可以通过用户传感器数据提取情绪图像的数据特征；基于设定的情绪类别和数据特征的对应关系，确定出情绪图像对应的情绪类别，情绪图像的数据特征可以包括情绪的五官所呈现的形状，进而服务器根据情绪分析结果对音乐自动播放列表进行列表重排，得到更新播放列表，并从更新播放列表中确定下一个待播放的音乐数据，具体的，音效模式可以包括普通音效模式、适应模式和调节模式；在普通音效模式下无需对音效参数进行调整，音效参数可以包括音量、频宽、低频、中频、高频和场景音的任一或任意组合，本发明实施例中，在确定出情绪类别之后，便可以按照对应方式确定出情绪类别对应的音效模式，到达自动化选定音效模式的目的。

上面对本发明实施例中智能音箱的音效调整方法进行了描述，下面对本发明实施例中智能音箱的音效调整装置进行描述，请参阅图3，本发明实施例中智能音箱的音效调整装置一个实施例包括：

获取模块301，用于从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据；

处理模块302，用于根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号；

采集模块303，用于根据所述音乐播放指令从所述音乐自动播放列表中匹配待播放的音乐数据，并通过所述智能音箱对所述音乐数据进行音乐播放，以及调用预设的传感器采集所述目标用户对应的用户数据，其中，所述用户数据用于指示所述目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；

分析模块304，用于对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果；

生成模块305，用于根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别；

播放模块306，用于根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放。

本发明实施例中，通过对目标用户的历史音乐播放数据进行特征提取，得到多个音乐类型和播放频率数据，对目标用户进行历史数据分析可以更加准确的构建目标用户的音乐自动播放列表，其次，通过在音乐数据播放的过程中对目标用户进行音频数据、视频数据和操作数据分析，判断目标用户的情绪类别，通过智能分析目标用户的情绪，对智能音箱的音效进行适应性调整，并且通过目标用户的情绪类别对智能音箱进行音效模式设置，得到目标音效模式，并根据目标音效模式和情绪类别匹配智能音箱对应的音效参数，以及根据音效参数对所述音乐数据进行播放，实现了智能音箱的自适应控制和音效的自动调整，并且提高了智能音箱的音效调整的准确率。

请参阅图4，本发明实施例中智能音箱的音效调整装置另一个实施例包括：

可选的，所述获取模块301具体用于：从预置的数据库中获取目标用户在预设周期内的历史音乐播放数据；对所述历史音乐播放数据进行音乐类型识别，得到多个音乐类型，并对所述历史音乐播放数据中的曲目进行播放频率计算，得到播放频率数据；将所述多个音乐类型和所述播放频率数据作为音乐特征数据并输出。

可选的，所述处理模块302具体用于：根据所述音乐特征数据从所述数据库中匹配与所述多个音乐类型对应的多个候选音乐；根据所述播放频率数据对所述多个候选音乐进行播放概率排序，得到播放概率排序结果；根据所述播放概率排序结果生成所述目标用户的音乐自动播放列表；通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，其中，所述音乐播放信号包括以下至少一种：语音信号、用户行为信号和终端控制信号；通过所述智能音箱根据所述音乐播放信号生成音乐播放指令。

可选的，所述分析模块304具体用于：对所述视频数据进行肢体行为识别，得到肢体行为，并对所述肢体行为进行用户行为分析，得到用户行为分析结果；对所述音频数据进行音频内容和音调识别，得到音频内容和音调，并根据所述音频内容和音调进行用户音频分析，得到用户音频分析结果；对所述操作数据进行操作方式和操作频率识别，得到操作方式和操作频率，并根据所述操作方式和所述操作频率进行用户操作分析，得到用户操作分析结果。

可选的，所述生成模块305具体用于：对所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果进行向量转换，得到初始向量；将所述初始向量输入情绪概率分析模型进行情绪概率预测，得到情绪概率预测值，其中门锁是情绪概率分析模型包括：嵌入层、门限循环网络和全连接层；根据所述情绪概率预测值匹配所述目标用户对应的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别。

可选的，所述播放模块306具体用于：根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式；根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数；获取所述智能音箱的空间位置参数，并对所述空间位置参数进行处理，得到音效补偿参数；根据所述音效参数和所述音效补偿参数对所述音乐数据进行播放。

可选的，所述智能音箱的音效调整装置还包括：

更新模块307，用于根据所述情绪分析结果对所述音乐自动播放列表进行列表重排，得到更新播放列表；从所述更新播放列表中确定下一个待播放的音乐数据；通过所述智能音箱按照所述音效参数对所述下一个待播放的音乐数据进行播放。

上面图3和图4从模块化功能实体的角度对本发明实施例中的智能音箱的音效调整装置进行详细描述，下面从硬件处理的角度对本发明实施例中智能音箱的音效调整设备进行详细描述。

图5是本发明实施例提供的一种智能音箱的音效调整设备的结构示意图，该智能音箱的音效调整设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（central processing units，CPU）510（例如，一个或一个以上处理器）和存储器520，一个或一个以上存储应用程序533或数据532的存储介质530（例如一个或一个以上海量存储设备）。其中，存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对智能音箱的音效调整设备500中的一系列指令操作。更进一步地，处理器510可以设置为与存储介质530通信，在智能音箱的音效调整设备500上执行存储介质530中的一系列指令操作。

智能音箱的音效调整设备500还可以包括一个或一个以上电源540，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口560，和/或，一个或一个以上操作系统531，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5示出的智能音箱的音效调整设备结构并不构成对智能音箱的音效调整设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种智能音箱的音效调整设备，所述智能音箱的音效调整设备包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行上述各实施例中的所述智能音箱的音效调整方法的步骤。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述智能音箱的音效调整方法的步骤。

进一步地，计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（read-only memory，ROM）、随机存取存储器（random access memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种智能音箱的音效调整方法，其特征在于，所述智能音箱的音效调整方法包括：

从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据；

根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号；

根据所述音乐播放指令从所述音乐自动播放列表中匹配待播放的音乐数据，并通过所述智能音箱对所述音乐数据进行音乐播放，以及调用预设的传感器采集所述目标用户对应的用户数据，其中，所述用户数据用于指示所述目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；

对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果；

根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别；

根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放。

2.根据权利要求1所述的智能音箱的音效调整方法，其特征在于，所述从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据，包括：

从预置的数据库中获取目标用户在预设周期内的历史音乐播放数据；

对所述历史音乐播放数据进行音乐类型识别，得到多个音乐类型，并对所述历史音乐播放数据中的曲目进行播放频率计算，得到播放频率数据；

将所述多个音乐类型和所述播放频率数据作为音乐特征数据并输出。

3.根据权利要求1所述的智能音箱的音效调整方法，其特征在于，所述根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号，包括：

根据所述音乐特征数据从所述数据库中匹配与所述多个音乐类型对应的多个候选音乐；

根据所述播放频率数据对所述多个候选音乐进行播放概率排序，得到播放概率排序结果；

根据所述播放概率排序结果生成所述目标用户的音乐自动播放列表；

通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，其中，所述音乐播放信号包括以下至少一种：语音信号、用户行为信号和终端控制信号；

通过所述智能音箱根据所述音乐播放信号生成音乐播放指令。

4.根据权利要求1所述的智能音箱的音效调整方法，其特征在于，所述对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果，包括：

对所述视频数据进行肢体行为识别，得到肢体行为，并对所述肢体行为进行用户行为分析，得到用户行为分析结果；

对所述音频数据进行音频内容和音调识别，得到音频内容和音调，并根据所述音频内容和音调进行用户音频分析，得到用户音频分析结果；

对所述操作数据进行操作方式和操作频率识别，得到操作方式和操作频率，并根据所述操作方式和所述操作频率进行用户操作分析，得到用户操作分析结果。

5.根据权利要求1所述的智能音箱的音效调整方法，其特征在于，所述根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别，包括：

对所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果进行向量转换，得到初始向量；

将所述初始向量输入情绪概率分析模型进行情绪概率预测，得到情绪概率预测值，其中门锁是情绪概率分析模型包括：嵌入层、门限循环网络和全连接层；

根据所述情绪概率预测值匹配所述目标用户对应的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别。

6.根据权利要求1所述的智能音箱的音效调整方法，其特征在于，所述根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放，包括：

根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式；

根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数；

获取所述智能音箱的空间位置参数，并对所述空间位置参数进行处理，得到音效补偿参数；

根据所述音效参数和所述音效补偿参数对所述音乐数据进行播放。

7.根据权利要求1-6中任一项所述的智能音箱的音效调整方法，其特征在于，所述智能音箱的音效调整方法还包括：

根据所述情绪分析结果对所述音乐自动播放列表进行列表重排，得到更新播放列表；

从所述更新播放列表中确定下一个待播放的音乐数据；

通过所述智能音箱按照所述音效参数对所述下一个待播放的音乐数据进行播放。

8.一种智能音箱的音效调整装置，其特征在于，所述智能音箱的音效调整装置包括：

获取模块，用于从预置的数据库中获取目标用户的历史音乐播放数据，并对所述历史音乐播放数据进行特征提取，得到音乐特征数据，其中，所述音乐特征数据包括：多个音乐类型和播放频率数据；

处理模块，用于根据所述音乐特征数据构建所述目标用户的音乐自动播放列表，并通过预置的智能音箱识别并接收所述目标用户发送的音乐播放信号，以及通过所述智能音箱根据所述音乐播放信号生成音乐播放指令，其中，所述音乐播放信号包括：语音信号、用户行为信号和终端控制信号；

采集模块，用于根据所述音乐播放指令从所述音乐自动播放列表中匹配待播放的音乐数据，并通过所述智能音箱对所述音乐数据进行音乐播放，以及调用预设的传感器采集所述目标用户对应的用户数据，其中，所述用户数据用于指示所述目标用户在音乐播放过程中产生的音频数据、视频数据和操作数据；

分析模块，用于对所述视频数据进行用户行为分析，得到用户行为分析结果，并对所述音频数据进行用户音频分析，得到用户音频分析结果，以及对所述操作数据进行用户操作分析，得到用户操作分析结果；

生成模块，用于根据所述用户行为分析结果、所述用户音频分析结果和所述用户操作分析结果生成所述目标用户的情绪分析结果，其中，所述情绪分析结果用于指示所述目标用户的情绪类别；

播放模块，用于根据所述情绪类别对所述智能音箱进行音效模式设置，得到目标音效模式，并根据所述目标音效模式和所述情绪类别匹配所述智能音箱对应的音效参数，以及根据所述音效参数对所述音乐数据进行播放。

9.一种智能音箱的音效调整设备，其特征在于，所述智能音箱的音效调整设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述智能音箱的音效调整设备执行如权利要求1-7中任一项所述的智能音箱的音效调整方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-7中任一项所述的智能音箱的音效调整方法。