CN111859008B - 一种推荐音乐的方法及终端 - Google Patents
一种推荐音乐的方法及终端 Download PDFInfo
- Publication number
- CN111859008B CN111859008B CN201910356783.XA CN201910356783A CN111859008B CN 111859008 B CN111859008 B CN 111859008B CN 201910356783 A CN201910356783 A CN 201910356783A CN 111859008 B CN111859008 B CN 111859008B
- Authority
- CN
- China
- Prior art keywords
- music
- target
- control information
- information
- voice control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000008451 emotion Effects 0.000 claims description 106
- 238000001228 spectrum Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 7
- 238000009432 framing Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 description 12
- 230000008909 emotion recognition Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000011435 rock Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000029058 respiratory gaseous exchange Effects 0.000 description 3
- 206010003805 Autism Diseases 0.000 description 2
- 208000020706 Autistic disease Diseases 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052573 porcelain Inorganic materials 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
- G06F16/636—Filtering based on additional data, e.g. user or group profiles by using biological or physiological data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用于计算机技术领域,提供了一种推荐音乐的方法及终端,该方法包括:获取目标用户的语音控制信息;提取所述语音控制信息中的目标音色特征;从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;根据所述目标音乐偏好信息,向所述目标用户推荐音乐。本发明实施例中,基于用户的音色特征可以准确的找到与该用户音色特征关联的音乐偏好信息,根据所述音乐偏好信息向用户推荐音乐,减少了音乐误推荐,提高了音乐推荐的准确率。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种推荐音乐的方法及终端。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代,单就歌曲而言,时至今日歌曲的积累量已经达到亿级,在这样的背景下,音乐推荐显得尤其重要。
然而,传统的音乐推荐模式如:传统智能音箱推荐、音乐播放器推荐等,都是根据个人播放音乐的历史记录来分析个人音乐喜好,从而实现个性化的音乐推荐。这种音乐推荐方式没有考虑到智能音箱、音乐播放器可能是家人、朋友、同事等共享使用,因此这些历史播放数据并不能够精准体现个人主体的音乐喜好,导致出现误推荐。
发明内容
有鉴于此,本发明实施例提供了一种推荐音乐的方法及终端,以解决现有技术中,传统的音乐推荐方法由于没有考虑到音乐播放终端可能是家人、朋友、同事等共享使用,使得音乐播放终端依据历史播放数据推荐音乐时,出现音乐误推荐的问题。
本发明实施例的第一方面提供了一种推荐音乐的方法,包括:
获取目标用户的语音控制信息;
提取所述语音控制信息中的目标音色特征;
从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;
根据所述目标音乐偏好信息,向所述目标用户推荐音乐。
本发明实施例的第二方面提供了一种终端,该终端包括:
获取单元,用于获取目标用户的语音控制信息;
提取单元,用于提取所述语音控制信息中的目标音色特征;
查找单元,用于从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;
推荐单元,用于根据所述目标音乐偏好信息,向所述目标用户推荐音乐。
本发明实施例的第三方面提供了另一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持设备执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行以下步骤:
获取目标用户的语音控制信息;
提取所述语音控制信息中的目标音色特征;
从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;
根据所述目标音乐偏好信息,向所述目标用户推荐音乐。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标用户的语音控制信息;
提取所述语音控制信息中的目标音色特征;
从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;
根据所述目标音乐偏好信息,向所述目标用户推荐音乐。
本发明实施例提供的一种推荐音乐的方法及终端具有以下有益效果:
本发明实施例,通过获取目标用户的语音控制信息;提取所述语音控制信息中的目标音色特征;从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;根据所述目标音乐偏好信息,向所述目标用户推荐音乐。本发明实施例中,基于用户的音色特征可以准确的找到与该用户音色特征关联的音乐偏好信息,根据所述音乐偏好信息向用户推荐音乐,减少了音乐误推荐,提高了音乐推荐的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种推荐音乐的方法的实现流程图;
图2是本发明另一实施例提供的一种推荐音乐的方法的实现流程图;
图3是本发明再一实施例提供的一种推荐音乐的方法的实现流程图;
图4是本发明又一实施例提供的一种推荐音乐的方法的实现流程图;
图5是本发明一实施例提供的一种终端的示意图;
图6是本发明另一实施例提供的一种终端的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参见图1,图1是本发明实施例提供的一种推荐音乐的方法的示意流程图。本实施例中推荐音乐的方法的执行主体为终端,包括但不限于智能手机、平板电脑、智能音箱、蓝牙音箱、智能音乐播放器、音视频播放器、个人数字助理(Personal Digital Assistant,PDA)等移动终端,还可以包括台式电脑等终端。如图1所示的推荐音乐的方法可包括:
S101:获取目标用户的语音控制信息。
终端获取目标用户的语音控制信息。具体地,终端在检测到用户的语音信息时,可以通过内置的拾音装置(例如,麦克风、声卡等)获取目标用户发出的语音控制信息;语音控制信息可以包括搜索音乐、收藏音乐、播放音乐、切换音乐、推荐音乐以及暂停音乐等关键词。例如,语音控制信息可以为:随机播放一首歌、收藏正在播放的歌曲、播放下一首歌曲等。需要说明的是,上述语音控制信息仅为示例性说明,对此不做限定。
S102:提取所述语音控制信息中的目标音色特征。
终端可以通过预设的神经网络模型对语音控制信息进行处理,提取语音控制信息中的目标音色特征。其中,神经网络模型是通过使用机器学习算法对声音样本集进行训练得到,在训练过程中,神经网络模型的输入为声音样本集中的语音控制信息,神经网络模型的输出为语音控制信息对应的音色特征。
终端也可以通过梅尔频率倒谱系数(Mel-FrequencyCepstraloefficients,MFCC)、线性预测分析(LinearPredictionCoefficients,LPC)或者感知线性预测系数(PerceptualLinearPredictive,PLP)等方法提取语音控制信息中的目标音色特征。以MFCC为例,终端通过MFCC对语音控制信息进行预处理,得到目标语音控制信息;获取目标语音控制信息中的频谱信息;分析频谱信息,获取频谱信息中的关键特征参数;基于关键特征参数生成目标音色特征。
进一步地,S102可以包括S1021-S1023,具体如下:
S1021:对所述语音控制信息进行预处理,得到目标语音控制信息。
对语音控制信息进行预处理,得到目标语音控制信息。预处理是指预加重、分帧和加窗处理。具体地,终端使用高通滤波器对语音控制信息进行预加重处理,预加重处理是指对语音控制信息中包含的原始音频信号的高频分量进行补偿,增大原始音频信号跳变边沿后第一个跳变比特位的幅度。预加重处理有助于提高原始音频信号里的高频分量,使原始音频信号的频谱变得平坦,增加原始音频信号的高频分辨率,有利于对语音控制信息的频谱以及声道参数进行分析。终端对预处理后的语音控制信息进行分帧处理,得到多个分析帧;对每个分析帧进行加窗处理得到目标语音控制信息。
S1022:获取所述目标语音控制信息中的频谱信息。
终端采用傅里叶变换(fast Fourier transform,FFT)对经过加窗处理得到的目标语音控制信息进行处理,获取目标语音控制信息中的频谱信息。具体地,采用傅里叶变换对每个窗中的分析帧进行频谱分析,提取目标语音控制信息中的频谱信息。
S1023:分析所述频谱信息,获取所述频谱信息中的目标音色特征。
分析频谱信息,获取频谱信息中的关键特征参数。具体地,通过滤波器处理频谱信息,得到处理后的频谱;对该频谱进行倒谱分析,如对该频谱进行对数运算;再通过离散余弦变化处理经过对数运算之后的频谱;提取经过离散余弦变化处理后的频谱中的频谱特征,组成特征向量;该特征向量即为所述语音控制信息中的目标音色特征。
S103:从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征关联的音乐偏好信息。
数据库中存储有多个用户的音色特征,以及与每个用户的音色特征匹配的音乐偏好信息。其中,不同的用户具有与之对应的唯一的音色特征。终端根据目标音色特征在数据库中查找与目标音色特征匹配的目标音乐偏好信息。目标音乐偏好信息可以包括古典音乐、流行音乐、歌剧、混合古典、流行音乐、摇滚音乐、爵士音乐、乡村音乐、民歌、民谣、管弦乐队音乐、现代音乐等音乐类型中的任意一种,或者其中两种及以上的任意组合。目标音乐偏好信息的存储方式可以为音乐播放列表、音乐播放链接(可通过跳转链接播放音乐)、音乐MV等。即目标音乐偏好信息中包含任意一种或多种类型的音乐形式,都能以音乐播放列表、音乐播放链接、音乐MV等方式存储。
S104:根据所述目标音乐偏好信息,向所述目标用户推荐音乐。
根据目标音乐偏好信息,向目标用户推荐音乐。获取目标音乐偏好信息中的音乐类型及其存储方式,如古典音乐、流行音乐、歌剧、混合古典、流行音乐、摇滚音乐、爵士音乐、乡村音乐、民歌、民谣、管弦乐队音乐、现代音乐等音乐类型中的任意一种,或者其中两种及以上的任意组合。再获取其存储方式,如音乐播放列表、音乐播放链接、音乐MV等。其中,音乐播放列表中可包含一首或多首歌曲;音乐播放链接可包括一个或多个链接;音乐MV可包括一个或多个MV。
例如,目标音乐偏好信息为:流行音乐,其存储方式为音乐播放列表,音乐播放列表中包括10首歌。终端可按音乐播放列表中存储歌曲的顺序向用户推荐第一首歌,待第一首歌播放完毕后再推荐第二首歌,以此类推,循环推荐;终端也可在音乐播放列表中随机选取歌曲向用户推荐;终端还可根据用户对音乐的操作如收藏歌曲、重复收听等,循环推荐一首歌曲。
同理,对于存储形式为音乐播放链接、音乐MV等的目标音乐偏好信息,终端在向用户推荐音乐时,可按照音乐播放链接、音乐MV中存储链接以及MV的顺序依次向用户推荐歌曲;也可在音乐播放链接、音乐MV中随机选取链接或者MV向用户推荐;还可以根据用户对音乐的操作如收藏歌曲、重复收听等,循环推荐。
当目标偏好信息中包含的音乐类型至少为两种时,终端可以根据音乐类型存储的顺序选取其中一个类型,获取该音乐类型的存储方式,按照上述推荐歌曲的方式向用户推荐音乐;终端也可以随机选择其中一个音乐类型,获取该音乐类型的存储方式,按照上述推荐歌曲的方式向用户推荐音乐。
本发明实施例,通过获取目标用户的语音控制信息;提取所述语音控制信息中的目标音色特征;从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;根据所述目标音乐偏好信息,向所述目标用户推荐音乐。本发明实施例中,基于用户的音色特征可以准确的找到与该用户音色特征关联的音乐偏好信息,根据所述音乐偏好信息向用户推荐音乐,减少了音乐误推荐,提高了音乐推荐的准确率。
请参见图2,图2是本发明另一实施例提供的一种推荐音乐的方法的示意流程图。本实施例中推荐音乐的方法的执行主体为终端,包括但不限于智能手机、平板电脑、智能音箱、蓝牙音箱、智能音乐播放器、音视频播放器、个人数字助理等移动终端,还可以包括台式电脑等终端。
本实施例与上一实施例的区别为,在S202之后还可以包括S203-S205。本实施例中S201-S202与图1对应的实施例中的S101-S102完全相同,具体请参阅图1对应的实施例中S101-S102的相关描述,此处不赘述。
数据库中存储有多个音色特征、多个情感特征、与每个所述音色特征以及每个所述情感特征均匹配的音乐推荐信息。其中,每个用户都具有与之唯一对应的音色特征,每个用户的情感特征可以为一个,也可以为多个。如某个用户的情感特征可以包括愉快、悲伤、高兴、难过、沮丧、孤独等。值得说明的是,用户的音色特征与每一个情感特征都对应一个目标音乐推荐信息。当某个用户有多个情感特征时,关于该用户可以有多个音乐推荐信息,每个音乐推荐信息包括该用户的音色特征以及其中一个情感特征。
在S202之后还可以包括S203-S205,S203-S205具体如下:
S203:从所述语音控制信息中获取目标情感特征。
终端可以通过预设的情感识别网络模型对语音控制信息进行处理,提取语音控制信息中的目标情感特征。其中,情感识别网络模型是通过机器学习算法对语音样本集进行训练得到,在训练过程中,情感识别网络模型的输入为语音样本集中的语音控制信息,情感识别网络模型的输出为语音控制信息对应的情感特征。具体地,将语音控制信息输入情感识别网络模型,情感识别网络模型对该语音控制信息进行预处理,提取所述语音控制信息中的语音信号;基于所述语音信号绘制语谱图;对语谱图进行特征提取,获取语音信号特征图;通过情感识别网络模型对语音信号特征图进行识别,输出情感特征分类结果,即输出该语音控制信息对应的目标情感特征。
终端也可以通过获取语音控制信息中目标用户的情绪特征信息,对所述情绪特征信息进行处理、分析,得到目标情感特征。其中,情绪特征信息可以为用户的语速、音量、呼吸、语调等信息。
进一步地,S203可以包括S2031-S2032,具体如下:
S2031:从所述语音控制信息中获取所述目标用户的情绪特征信息。
终端获取语音控制信息中目标用户的情绪特征信息。其中,情绪特征信息可以用户的语速、音量、呼吸、语调等信息。具体地,终端可以通过预先训练好的识别模型识别语音控制信息中用户表达的语气。终端可以预先训练对应的识别模型,如语速识别模型、音量识别模型、语调识别模型等。将语音控制信息输入语速识别模型、音量识别模型、语调识别模型等模型中,语速识别模型、音量识别模型、语调识别模型对应的输出用户的语速特征、用户的音量特征以及用户的音调特征。
S2032:基于所述情绪特征信息确定所述目标情感特征。
根据情绪特征信息确定用户的目标情感特征。具体地,终端对基于各个识别模型获取到的情绪特征信息中的语速特征、音量特征以及音调特征,进行分析、特征叠加处理,得到目标情感特征。
S204:从所述数据库中查找与所述目标音色特征以及所述目标情感特征均匹配的目标音乐推荐信息。
数据库中存储有多个音色特征、多个情感特征、与每个所述音色特征以及每个所述情感特征均匹配的音乐推荐信息。其中,每个用户都具有与之唯一对应的音色特征,每个用户的情感特征可以为一个,也可以为多个。如某个用户的情感特征可以包括愉快、悲伤、高兴、难过、沮丧、孤独等。值得说明的是,用户的音色特征与每一个情感特征都对应一个目标音乐推荐信息。当某个用户有多个情感特征时,关于该用户可以有多个音乐推荐信息,每个音乐推荐信息包括该用户的音色特征以及其中一个情感特征。
基于语音控制信息中的目标音色特征以及目标情感特征,在数据库中查找与目标音色特征以及目标情感特征均匹配的目标音乐推荐信息。例如,当在语音控制信息中获取到的目标音色特征为A,目标情感特征为愉快时,在数据库中查找与目标音色特征为A以及目标情感特征愉快均匹配的目标音乐推荐信息;当在语音控制信息中获取到的目标音色特征为A,目标情感特征为难过时,在数据库中查找与目标音色特征为A以及目标情感特征难过均匹配的目标音乐推荐信息。在上述举例说明中,目标音色特征均为A,表示为同一用户(每个用户具有唯一的音色特征),在不同时刻用户的情感会发生变化,如第一次获取到目标情感特征为愉快,第二次获取到目标情感特征为难过,终端会根据用户的音色特征以及不同的情感特征在数据库中查找对应的目标推荐信息。
需要说明的是,在本实施例中,S203以及S204可以同时执行,也可以先执行S203再执行S204,还可以先执行S204再执行S203,对此不做限制。
S205:根据所述目标音乐推荐信息,向所述目标用户推荐音乐。
根据目标音乐推荐信息,向目标用户推荐音乐。目标音乐推荐信息可以包括用户音色特征以及与之关联的用户情感特征对应的音乐。如情感特征为愉快时对应的音乐;情感特征为难过时对应的音乐;情感特征为沮丧时对应的音乐等。其中,情感特征对应的音乐的存储方式可以为音乐播放列表、音乐播放链接(可通过跳转链接播放音乐)、音乐MV等。
例如,当在语音控制信息中获取到的目标音色特征为A,目标情感特征为愉快时,在数据库中查找与目标音色特征为A以及目标情感特征愉快均匹配的目标音乐推荐信息a,根据目标音乐推荐信息a中包括的情感特征为愉快时对应的音乐,按照音乐的存储顺序向用户推荐音乐,或者随机选取一首向用户推荐。
本发明实施例,通过获取目标用户的语音控制信息;提取所述语音控制信息中的目标音色特征;从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;根据所述目标音乐偏好信息,向所述目标用户推荐音乐。本发明实施例中,基于用户的音色特征以及用户的情感特征可以准确的找到与该用户音色特征以及情感特征均匹配的音乐推荐信息,根据音乐推荐信息向用户推荐音乐,使得终端可以向用户更准确的推荐符合用户当前心情的音乐,提升了用户的体验感以及满意度,提高了音乐推荐的准确率。
请参见图3,图3是本发明再一实施例提供的一种推荐音乐的方法的示意流程图。本实施例中推荐音乐的方法的执行主体为终端,包括但不限于智能手机、平板电脑、智能音箱、蓝牙音箱、智能音乐播放器、音视频播放器、个人数字助理等移动终端,还可以包括台式电脑等终端。
本实施例与图1对应的实施例的区别为,在S304之前还可以包括S301-S303。本实施例中S304-S307与图1对应的实施例中的S101-S104完全相同,具体请参阅图1对应的实施例中S101-S104的相关描述,此处不赘述。
S301:获取用户的音乐播放控制信息;所述音乐播放控制信息包括音乐名称。
终端获取一个或多个用户的音乐播放控制信息。具体地,终端在检测到用户的音乐播放控制信息时,可以通过内置的拾音装置(例如,麦克风、声卡等)获取用户发出的音乐播放控制信息;音乐播放控制信息可以包括音乐名称、歌手名称、歌词等信息。对音乐的控制可以为搜索音乐、收藏音乐、播放音乐、切换音乐、推荐音乐以及暂停音乐等。例如,音乐播放控制信息可以为:播放青花瓷、收藏爱笑的眼睛、播放告白气球等。需要说明的是,上述音乐播放控制信息仅为示例性说明,对此不做限定。
S302:确定所述音乐名称对应的音乐所属的音乐类型。
终端根据音乐播放控制信息中的音乐名称,在本地数据库、云端数据库、网络服务器等中查找所述音乐名称对应的音乐,获取该音乐的相关信息,如该音乐的时长、基调、表达的情感、所属的分类等信息,根据这些信息确定该音乐所属的音乐类型。音乐类型可包括两种分类方式,按照音乐表达的情感进行分类,或者按照音乐本身所属的分类信息进行分类。其中,按照音乐表达的情感进行分类时,音乐类型可以为欢快、高兴、难过、悲伤、孤独等类型;按照音乐本身所属的分类信息进行分类时,音乐类型可以为古典音乐、流行音乐、歌剧、混合古典、流行音乐、摇滚音乐、爵士音乐、乡村音乐、民歌、民谣、管弦乐队音乐、现代音乐等类型。
具体地,在按照音乐表达的情感进行分类时,终端根据所述音乐名称获取到对应的音乐时,提取该音乐的波形、歌词关键词;获取所述波形对应的波形情感向量以及歌词关键词对应的歌词情感向量,将所述波形情感向量和所述歌词情感向量进行向量加权叠加计算,获取该音乐的情感特征,基于所述音乐的情感特征确定音乐类型。
S303:提取所述音乐播放控制信息中的音色特征,基于所述音色特征以及所述音乐类型,生成音乐偏好信息。
终端获取音乐播放控制信息中用户的音色特征。具体地,终端可以通过预设的神经网络模型对音乐播放控制信息进行处理,提取音乐播放控制信息中用户的音色特征。提取音乐播放控制信息中的音色特征使用的神经网络模型可与提取语音控制信息中的目标音色特征使用的神经网络模型一样,也可单独针对提取音乐播放控制信息中的音色特征训练模型,对此不做限定。终端也可以通过梅尔频率倒谱系数(Mel-FrequencyCepstraloefficients,MFCC)、线性预测分析(LinearPredictionCoefficients,LPC)或者感知线性预测系数(PerceptualLinearPredictive,PLP)等方法提取音乐播放控制信息中的目标音色特征。
终端基于用户的音色特征以及音乐名称对应的音乐所属的音乐类型,生成音乐偏好信息。具体地,终端根据音乐名称对应的音乐所属的音乐类型在本地、云端或者网络端中获取与所述音乐类型相同的音乐,并将获取到的同类型的音乐关联起来。此时,音乐类型可按照音乐本身所属的分类信息进行分类,如音乐类型可以为古典音乐、流行音乐、歌剧、混合古典、流行音乐、摇滚音乐、爵士音乐、乡村音乐、民歌、民谣、管弦乐队音乐、现代音乐等类型。终端将获取到的这些同类型的音乐分类在一个类别内,将用户的音色特征以及音乐类型相同的音乐关联起来生成音乐偏好信息。
本发明实施例,通过获取目标用户的语音控制信息;提取所述语音控制信息中的目标音色特征;从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;根据所述目标音乐偏好信息,向所述目标用户推荐音乐。本发明实施例中,基于用户的音色特征可以准确的找到与该用户音色特征关联的音乐偏好信息,根据所述音乐偏好信息向用户推荐音乐,减少了音乐误推荐,提高了音乐推荐的准确率。
请参见图4,图4是本发明又一实施例提供的一种推荐音乐的方法的示意流程图。本实施例中推荐音乐的方法的执行主体为终端,包括但不限于智能手机、平板电脑、智能音箱、蓝牙音箱、智能音乐播放器、音视频播放器、个人数字助理等移动终端,还可以包括台式电脑等终端。
本实施例与图2对应的实施例的区别为S401-S404。本实施例中S405-S409与图2对应的实施例中的S201-S205完全相同,具体请参阅图2对应的实施例中S201-S205的相关描述,此处不赘述。
S401:获取用户的音乐播放控制信息;所述音乐播放控制信息包括音乐名称。
本实施例中S401与图3对应的实施例中的S301完全相同,具体请参阅图3对应的实施例中S301的相关描述,此处不赘述。
S402:确定所述音乐名称对应的音乐所属的音乐类型。
本实施例中S402与图3对应的实施例中的S302完全相同,具体请参阅图3对应的实施例中S302的相关描述,此处不赘述。
进一步地,终端可以通过获取用户语音信息中表现出的情感特征,向用户更准确的推荐音乐,在S402之后S405之前还可以包括S403-S404,S403-S404具体如下:
S403:确定所述音乐播放控制信息对应的情感特征。
终端可以通过预设的情感识别网络模型对音乐播放控制信息进行处理,提取音乐播放控制信息中的情感特征。将音乐播放控制信息输入情感识别网络模型,情感识别网络模型对该音乐播放控制信息进行预处理,提取所述音乐播放控制信息中的语音信号;基于所述语音信号绘制语谱图;对语谱图进行特征提取,获取语音信号特征图;通过情感识别网络模型对语音信号特征图进行识别,输出情感特征分类结果,即输出该音乐播放控制信息对应的情感特征。提取音乐播放控制信息中的情感特征使用的神经网络模型可与提取语音控制信息中的情感特征使用的神经网络模型一样,也可单独针对提取音乐播放控制信息中的情感特征训练模型,对此不做限定。
终端也可以通过获取音乐播放控制信息中用户的情绪特征信息,对所述情绪特征信息进行处理、分析,得到情感特征。其中,情绪特征信息可以为用户的语速、音量、呼吸、语调等信息。
S404:基于所述音乐类型、所述音乐播放控制信息对应的音色特征以及情感特征,生成音乐推荐信息。
终端获取音乐播放控制信息中用户的音色特征。具体地,终端可以通过预设的神经网络模型对音乐播放控制信息进行处理,提取音乐播放控制信息中用户的音色特征。终端也可以通过梅尔频率倒谱系数、线性预测分析或者感知线性预测系数等方法提取音乐播放控制信息中的目标音色特征。
终端根据音乐播放控制信息对应的情感特征在本地、云端或者网络端中获取与所述音乐类型相同的音乐,并将获取到的同类型的音乐关联起来。此时,音乐类型可按照音乐表达的情感进行分类,如音乐类型可以为欢快、高兴、难过、悲伤、孤独等类型。终端将获取到的这些同类型的音乐分类在一个类别内,将用户的音色特征、情感特征以及音乐类型相同的音乐关联起来生成音乐推荐信息。
本发明实施例,通过获取目标用户的语音控制信息;提取所述语音控制信息中的目标音色特征;从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;根据所述目标音乐偏好信息,向所述目标用户推荐音乐。本发明实施例中,基于用户的音色特征以及用户的情感特征可以准确的找到与该用户音色特征以及情感特征均匹配的音乐推荐信息,根据音乐推荐信息向用户推荐音乐,使得终端可以向用户更准确的推荐符合用户当前心情的音乐,提升了用户的体验感以及满意度,提高了音乐推荐的准确率。
请参见图5,图5是本发明一实施例提供的一种终端的示意图。终端包括的各单元用于执行图1、图2、图3、图4对应的实施例中的各步骤。具体请参阅图1、图2、图3、图4各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图5,终端5包括:
获取单元510,用于获取目标用户的语音控制信息;
提取单元520,用于提取所述语音控制信息中的目标音色特征;
查找单元530,用于从数据库中查找与所述目标音色特征匹配的目标音乐偏好信息;所述数据库中存储有多个音色特征以及与每个所述音色特征匹配的音乐偏好信息;
推荐单元540,用于根据所述目标音乐偏好信息,向所述目标用户推荐音乐。
进一步地,提取单元520具体用于:
对所述语音控制信息进行预处理,得到目标语音控制信息;
获取所述目标语音控制信息中的频谱信息;
分析所述频谱信息,获取所述频谱信息中的目标音色特征。
进一步地,当所述数据库中存储有多个音色特征、多个情感特征、与每个所述音色特征以及每个所述情感特征均匹配的音乐推荐信息时,终端还包括:
情感特征获取单元,用于从所述语音控制信息中获取目标情感特征;
推荐信息查找单元,用于从所述数据库中查找与所述目标音色特征以及所述目标情感特征均匹配的目标音乐推荐信息;
音乐推荐单元,用于根据所述目标音乐推荐信息,向所述目标用户推荐音乐。
进一步地,情感特征获取单元具体用于:
从所述语音控制信息中获取所述目标用户的情绪特征信息;
基于所述情绪特征信息确定所述目标情感特征。
进一步地,终端还包括:
控制信息获取单元,用于获取用户的音乐播放控制信息;所述音乐播放控制信息包括音乐名称;
第一确定单元,用于确定所述音乐名称对应的音乐所属的音乐类型;
第一生成单元,用于提取所述音乐播放控制信息中的音色特征,基于所述音色特征以及所述音乐类型,生成音乐偏好信息。
进一步地,终端还包括:
第二确定单元,用于确定所述音乐播放控制信息对应的情感特征;
第二生成单元,用于基于所述音乐类型、所述音乐播放控制信息对应的音色特征以及情感特征,生成音乐推荐信息。
请参见图6,图6是本发明另一实施例提供的一种终端的示意图。如图6所示,该实施例的终端6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述各个终端的推荐音乐的方法实施例中的步骤,例如图1所示的S101至S104。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各单元的功能,例如图5所示单元510至540功能。
示例性的,所述计算机程序62可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端6中的执行过程。例如,所述计算机程序62可以被分割成获取单元、提取单元、查找单元以及推荐单元,各单元具体功能如上所述。
所述终端可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端6的示例,并不构成对终端6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出终端、网络接入终端、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端6的内部存储单元,例如终端6的硬盘或内存。所述存储器61也可以是所述终端6的外部存储终端,例如所述终端6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端6的内部存储单元也包括外部存储终端。所述存储器61用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (7)
1.一种推荐音乐的方法,其特征在于,包括:
获取目标用户的语音控制信息;
提取所述语音控制信息中的目标音色特征;所述提取所述语音控制信息中的目标音色特征,包括:对所述语音控制信息进行预处理,得到目标语音控制信息;获取所述目标语音控制信息中的频谱信息;分析所述频谱信息,获取所述频谱信息中的目标音色特征;所述目标音色特征包括特征向量;所述预处理包括预加重处理、分帧处理以及加窗处理;其中,所述预加重处理用于提高所述语音控制信息中的原始音频信号的高频分量;
从所述语音控制信息中获取目标情感特征;从数据库中查找与所述目标音色特征以及所述目标情感特征均匹配的目标音乐推荐信息,所述数据库中存储有多个用户的音色特征、与每个用户的音色特征匹配的音乐偏好信息、多个情感特征、与每个音色特征以及每个情感特征均匹配的音乐推荐信息;其中,不同的用户具有各自对应的唯一的音色特征;
根据所述目标音乐推荐信息,向所述目标用户推荐音乐。
2.如权利要求1所述的方法,其特征在于,所述从所述语音控制信息中获取目标情感特征,包括:
从所述语音控制信息中获取所述目标用户的情绪特征信息;
基于所述情绪特征信息确定所述目标情感特征。
3.如权利要求1或2所述的方法,其特征在于,所述获取目标用户的语音控制信息之前,还包括:
获取用户的音乐播放控制信息;所述音乐播放控制信息包括音乐名称;
确定所述音乐名称对应的音乐所属的音乐类型;
提取所述音乐播放控制信息中的音色特征,基于所述音色特征以及所述音乐类型,生成音乐偏好信息。
4.如权利要求3所述的方法,其特征在于,所述确定所述音乐名称对应的音乐所属的音乐类型之后,所述获取目标用户的语音控制信息之前,还包括:
确定所述音乐播放控制信息对应的情感特征;
基于所述音乐类型、所述音乐播放控制信息对应的音色特征以及情感特征,生成音乐推荐信息。
5.一种终端,其特征在于,包括:
获取单元,用于获取目标用户的语音控制信息;
提取单元,用于提取所述语音控制信息中的目标音色特征;所述提取所述语音控制信息中的目标音色特征,包括:对所述语音控制信息进行预处理,得到目标语音控制信息;获取所述目标语音控制信息中的频谱信息;分析所述频谱信息,获取所述频谱信息中的目标音色特征;所述目标音色特征包括特征向量;所述预处理包括预加重处理、分帧处理以及加窗处理;其中,所述预加重处理用于提高所述语音控制信息中的原始音频信号的高频分量;
查找单元,用于从所述语音控制信息中获取目标情感特征;从数据库中查找与所述目标音色特征以及所述目标情感特征均匹配的目标音乐推荐信息,所述数据库中存储有多个用户的音色特征、与每个用户的音色特征匹配的音乐偏好信息、多个情感特征、与每个音色特征以及每个情感特征均匹配的音乐推荐信息;其中,不同的用户具有各自对应的唯一的音色特征;
推荐单元,用于根据所述目标音乐推荐信息,向所述目标用户推荐音乐。
6.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910356783.XA CN111859008B (zh) | 2019-04-29 | 2019-04-29 | 一种推荐音乐的方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910356783.XA CN111859008B (zh) | 2019-04-29 | 2019-04-29 | 一种推荐音乐的方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859008A CN111859008A (zh) | 2020-10-30 |
CN111859008B true CN111859008B (zh) | 2023-11-10 |
Family
ID=72966399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910356783.XA Active CN111859008B (zh) | 2019-04-29 | 2019-04-29 | 一种推荐音乐的方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859008B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331223A (zh) * | 2020-11-09 | 2021-02-05 | 合肥名阳信息技术有限公司 | 一种给配音添加背景音乐的方法 |
CN114722234A (zh) * | 2022-04-07 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于人工智能的音乐推荐方法、装置、存储介质 |
CN114999611B (zh) * | 2022-07-29 | 2022-12-20 | 支付宝(杭州)信息技术有限公司 | 一种模型训练和信息推荐的方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302678A (zh) * | 2016-08-08 | 2017-01-04 | 北京谱思科技有限公司 | 一种音乐推荐方法及装置 |
CN107507612A (zh) * | 2017-06-30 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 一种声纹识别方法及装置 |
CN107623614A (zh) * | 2017-09-19 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN107885816A (zh) * | 2017-11-06 | 2018-04-06 | 广东欧珀移动通信有限公司 | 音乐推荐的方法、装置、存储介质及终端设备 |
CN108197185A (zh) * | 2017-12-26 | 2018-06-22 | 努比亚技术有限公司 | 一种音乐推荐方法、终端及计算机可读存储介质 |
CN108597509A (zh) * | 2018-03-30 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 智能语音交互实现方法、装置、计算机设备及存储介质 |
CN109240639A (zh) * | 2018-08-30 | 2019-01-18 | Oppo广东移动通信有限公司 | 音频数据的获取方法、装置、存储介质及终端 |
CN109299318A (zh) * | 2018-11-13 | 2019-02-01 | 百度在线网络技术(北京)有限公司 | 音乐推荐的方法、装置、存储介质和终端设备 |
CN109582822A (zh) * | 2018-10-19 | 2019-04-05 | 百度在线网络技术(北京)有限公司 | 一种基于用户语音的音乐推荐方法及装置 |
-
2019
- 2019-04-29 CN CN201910356783.XA patent/CN111859008B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302678A (zh) * | 2016-08-08 | 2017-01-04 | 北京谱思科技有限公司 | 一种音乐推荐方法及装置 |
CN107507612A (zh) * | 2017-06-30 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 一种声纹识别方法及装置 |
CN107623614A (zh) * | 2017-09-19 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN107885816A (zh) * | 2017-11-06 | 2018-04-06 | 广东欧珀移动通信有限公司 | 音乐推荐的方法、装置、存储介质及终端设备 |
CN108197185A (zh) * | 2017-12-26 | 2018-06-22 | 努比亚技术有限公司 | 一种音乐推荐方法、终端及计算机可读存储介质 |
CN108597509A (zh) * | 2018-03-30 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 智能语音交互实现方法、装置、计算机设备及存储介质 |
CN109240639A (zh) * | 2018-08-30 | 2019-01-18 | Oppo广东移动通信有限公司 | 音频数据的获取方法、装置、存储介质及终端 |
CN109582822A (zh) * | 2018-10-19 | 2019-04-05 | 百度在线网络技术(北京)有限公司 | 一种基于用户语音的音乐推荐方法及装置 |
CN109299318A (zh) * | 2018-11-13 | 2019-02-01 | 百度在线网络技术(北京)有限公司 | 音乐推荐的方法、装置、存储介质和终端设备 |
Non-Patent Citations (2)
Title |
---|
康筱骏.浅析家庭智能音箱中的语音识别技术.2019,(第07期),274-275. * |
语音信号的前期处理;罗海涛;《福建电脑》;第34卷(第05期);91-92 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859008A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11461388B2 (en) | Generating a playlist | |
US11705096B2 (en) | Autonomous generation of melody | |
Tagliasacchi et al. | Pre-training audio representations with self-supervision | |
US9576050B1 (en) | Generating a playlist based on input acoustic information | |
Richard et al. | An overview on perceptually motivated audio indexing and classification | |
CN111859008B (zh) | 一种推荐音乐的方法及终端 | |
WO2019137392A1 (zh) | 文件分类处理方法、装置及终端、服务器、存储介质 | |
CN111147871B (zh) | 直播间歌唱识别方法、装置及服务器、存储介质 | |
Mounika et al. | Music genre classification using deep learning | |
Retta et al. | Kiñit classification in Ethiopian chants, Azmaris and modern music: A new dataset and CNN benchmark | |
Foucard et al. | Multi-scale temporal fusion by boosting for music classification. | |
CN114125506B (zh) | 语音审核方法及装置 | |
CN111462775B (zh) | 音频相似度确定方法、装置、服务器及介质 | |
US11410706B2 (en) | Content pushing method for display device, pushing device and display device | |
Ntalampiras | Directed acyclic graphs for content based sound, musical genre, and speech emotion classification | |
Yeh et al. | Popular music representation: chorus detection & emotion recognition | |
CN111737515A (zh) | 音频指纹提取方法、装置、计算机设备和可读存储介质 | |
WO2019053544A1 (en) | IDENTIFICATION OF AUDIOS COMPONENTS IN AN AUDIO MIX | |
Chimthankar | Speech Emotion Recognition using Deep Learning | |
Groenbroek | A Machine Learning Approach to Automatic Language Identification of Vocals in Music | |
Yue et al. | Equilibrium Optimizer for Emotion Classification From English Speech Signals | |
Mirza et al. | Residual LSTM neural network for time dependent consecutive pitch string recognition from spectrograms: a study on Turkish classical music makams | |
CN113806586B (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN113744721B (zh) | 模型训练方法、音频处理方法、设备及可读存储介质 | |
Hason Rudd et al. | Leveraged Mel spectrograms using Harmonic and Percussive Components in Speech Emotion Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |