CN114722234A - 基于人工智能的音乐推荐方法、装置、存储介质 - Google Patents
基于人工智能的音乐推荐方法、装置、存储介质 Download PDFInfo
- Publication number
- CN114722234A CN114722234A CN202210360368.3A CN202210360368A CN114722234A CN 114722234 A CN114722234 A CN 114722234A CN 202210360368 A CN202210360368 A CN 202210360368A CN 114722234 A CN114722234 A CN 114722234A
- Authority
- CN
- China
- Prior art keywords
- information
- music
- acquiring
- recommendation
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Abstract
本发明公开了一种基于人工智能的音乐推荐方法、装置、存储介质,方法包括:获取目标用户的历史音乐信息,历史音乐信息包括关键词信息和音频信息;对音频信息进行特征提取,得到MFCC特征信息;根据关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;获取预先训练好的第一图卷积模型,将MFCC特征信息输入至第一图卷积模型,得到音乐偏好信息;根据音乐偏好信息确定至少两个目标推荐结果的排序,并输出排序结果。本发明利用历史音乐信息对应的MFCC特征信息作为图卷积模型的输入,相较于现有技术通过对音乐信息随机初始化作为图卷积网络的学习嵌入的方案,本方案能够保留不同音乐的特征信息,从而提高通过图卷积模型实现音乐推荐的准确性。
Description
技术领域
本发明涉及但不限于人工智能技术领域,尤其涉及一种基于人工智能的音乐推荐方法、装置、存储介质。
背景技术
随着互联网科技和数字音乐的不断发展和普及,音乐成为人们生活中重要的存在,人们也逐渐从音乐匮乏的时代走入音乐过载的时代,但是,音乐过载带来一个问题:人们往往需要从海量的乐库中搜索自己喜欢的音乐,从而花费大量的时间,基于此,音乐推荐装置应运而生。现有的音乐推荐装置通过图卷积网络实现音乐推荐,但是在使用音乐文件对图卷积网络进行学习嵌入的时候,对图节点的初始化嵌入仅采用了随机初始化设置,忽略了不同的音乐文件的有效特征信息,从而导致音乐推荐的准确性较低,无法满足用户对音乐的个性化需求。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种基于人工智能的音乐推荐方法、装置、存储介质,能够有效提高音乐推荐的准确性,满足用户对音乐的个性化需求。
第一方面,本发明实施例提供了一种基于人工智能的音乐推荐方法,该音乐推荐方法包括:
获取目标用户的历史音乐信息,其中,所述历史音乐信息包括关键词信息和音频信息;
对所述音频信息进行特征提取,得到梅尔频率倒谱系数MFCC特征信息;
根据所述关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;
获取预先训练好的第一图卷积模型,将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息;
根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果。
在一些实施例中,所述第一图卷积模型根据以下步骤获得:
获取预设的关系图谱;
根据所述MFCC特征信息将所述关系图谱划分为多个子图;
获取预设的第二图卷积模型,根据多个所述子图对所述第二图卷积模型进行训练,得到所述第一图卷积模型。
在一些实施例中,所述目标用户的数量为多个,所述历史音乐信息还包括用户标识,所述关系图谱根据以下步骤获得:
获取映射信息,所述映射信息用于表征各个所述MFCC特征信息与各个所述用户标识之间的映射关系;
通过关联所述MFCC特征信息和所述映射信息,得到所述关系图谱。
在一些实施例中,所述第一图卷积模型包括多个依次连接的卷积层,其中,排序位于上一层的卷积层的输出是排序位于下一层的卷积层的输入,所述将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息,包括:
从所述历史音乐信息中获取所述用户标识;
将所述用户标识和所述MFCC特征信息输入至所述第一卷积模型;
获取所述第一卷积模型中的每个卷积层输出的用户标识向量和MFCC特征信息向量,其中,所述用户标识向量与所述用户标识相对应,所述MFCC特征信息向量与所述MFCC特征信息相对应;
获取第一中间向量,所述第一中间值为全部的所述用户标识向量之和;
获取第二中间向量,所述第二中间值为全部的所述MFCC特征信息向量之和;
计算所述第一中间向量与所述第二中间向量的内积,得到所述音乐偏好信息。
在一些实施例中,所述对所述音频信息进行特征提取,得到MFCC特征信息,包括:
对所述音频信息进行预处理,得到预处理后的音频信息;
对所述预处理后的音频信息进行傅里叶变换得到第一频谱;
将所述第一频谱输入至预设的梅尔滤波器组进行滤波转换,得到第二频谱;
对所述第二频谱进行倒谱分析处理,得到所述MFCC特征信息。
在一些实施例中,所述根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序之前,还包括:
根据所述关键词信息和所述目标推荐结果确定匹配数据,所述匹配数据用于表征所述关键词信息与所述目标推荐结果之间的匹配度评分;
根据所述匹配数据对所述目标推荐结果进行排序处理,得到排序后的目标推荐结果。
在一些实施例中,所述根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果之后,还包括:
获取预设的过滤规则;
根据所述过滤规则对所述排序结果进行过滤处理,得到过滤后的排序结果。
第二方面,本发明实施例还提供了一种音乐推荐装置,包括:
数据采集模块,所述数据采集模块用于获取目标用户的历史音乐信息,其中,所述历史音乐信息包括关键词信息和音频信息;
特征提取模块,所述特征提取模块用于对所述音频信息进行特征提取,得到MFCC特征信息;
目标推荐结果获取模块,所述目标推荐结果获取模块用于根据所述关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;
音乐偏好信息获取模块,所述音乐偏好信息获取模块用于获取预先训练好的第一图卷积模型,将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息;
目标推荐结果排序模块,所述目标推荐结果排序模块用于根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果。
第三方面,本发明实施例还提供了一种音乐推荐装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于人工智能的音乐推荐方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序用于执行如第一方面所述的基于人工智能的音乐推荐方法。
本发明实施例包括一种基于人工智能的音乐推荐方法、装置、存储介质,其中,基于人工智能的音乐推荐方法包括:获取目标用户的历史音乐信息,其中,所述历史音乐信息包括关键词信息和音频信息;对所述音频信息进行特征提取,得到梅尔频率倒谱系数MFCC特征信息;根据所述关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;获取预先训练好的第一图卷积模型,将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息;根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果。本发明利用历史音乐信息对应的MFCC特征信息作为图卷积模型的输入,相较于现有技术中通过对音乐信息进行随机初始化作为图卷积网络的学习嵌入的方案,本发明实施例提供的方案能够保留不同音乐的有效特征信息,从而提高通过图卷积模型实现音乐推荐的准确性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明一个实施例提供的基于人工智能的音乐推荐方法的步骤流程图;
图2是本发明另一个实施例提供的获取第一图卷积模型的步骤流程图;
图3是本发明另一个实施例提供的构建关系图谱的步骤流程图;
图4是本发明另一个实施例提供的确定音乐偏好信息的步骤流程图;
图5是本发明另一个实施例提供的从音频信息中提取MFCC特征信息的步骤流程图;
图6是本发明另一个实施例提供的在根据音乐偏好信息确定至少两个目标推荐结果的排序之前,对目标推荐结果进行排序的步骤流程图;
图7是本发明另一个实施例提供的对目标推荐结果进行过滤处理的步骤流程图;
图8是本发明另一个实施例提供的音乐推荐装置的模块示意图;
图9是本发明另一个实施例提供的音乐推荐装置的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例可以基于人工智能技术对相关的数据进行编译、获取和处理。其中,人工智能(Artificial Intelligence,Al)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用装置。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互装置、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本发明实施例所提及的终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、车载计算机、智能家居、可穿戴电子设备、VR(Virtual Reality,虚拟现实)/AR(AugmentedReality,增强现实)设备等等;服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
需要说明的是,本发明实施例的数据可以保存在服务器中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本发明提供了一种基于人工智能的音乐推荐方法、装置、存储介质,其中,基于人工智能的音乐推荐方法包括:获取目标用户的历史音乐信息,其中,所述历史音乐信息包括关键词信息和音频信息;对所述音频信息进行特征提取,得到梅尔频率倒谱系数MFCC特征信息;根据所述关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;获取预先训练好的第一图卷积模型,将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息;根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果。本发明利用历史音乐信息对应的MFCC特征信息作为图卷积模型的输入,相较于现有技术中通过对音乐信息进行随机初始化作为图卷积网络的学习嵌入的方案,本发明实施例提供的方案能够保留不同音乐的有效特征信息,从而提高通过图卷积模型实现音乐推荐的准确性。
下面结合附图,对本发明实施例作进一步阐述。
如图1所示,图1是本发明一个实施例提供的基于人工智能的音乐推荐方法的步骤流程图,该音乐推荐方法包括但不限于有以下步骤:
步骤S110,获取目标用户的历史音乐信息,其中,历史音乐信息包括关键词信息和音频信息;
步骤S120,对音频信息进行特征提取,得到梅尔频率倒谱系数MFCC特征信息;
步骤S130,根据关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;
步骤S140,获取预先训练好的第一图卷积模型,将MFCC特征信息输入至第一图卷积模型,得到音乐偏好信息;
步骤S150,根据音乐偏好信息确定至少两个目标推荐结果的排序,并输出排序结果。
可以理解的是,在用户登录并使用音乐应用后,音乐应用会对应保存每个用户的历史音乐信息,历史音乐信息包括关键词信息以及音频信息;关键词信息能够表征对应目标用户的音乐喜好的有效数据,例如在预设时间段内,播放频率超过预设阈值的音乐的关键词(歌手名称、音乐类型等);音频信息可以是选取对应目标用户的播放频率超过预设阈值的音乐文件的整个音频段或部分音频段,从而能够更好地为获取目标用户的音乐偏好信息提供有效的数据基础,进而能够提高音乐推荐结果准确性。
需要说明的是,本申请实施例并不对获取历史音乐信息的具体方式做限制,可以通过确定目标用户的标识信息,根据标识信息从日志中心中提取历史音乐播放记录,从历史音乐播放记录中提取关键词信息以及音乐标识,再通过音乐标识从音乐文件数据库中获取目标音频信息,在此不多做赘述。
可以理解的是,梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)是基于声音频率的非线性梅尔刻度(Mel Scale)的对数能量频谱的线性变换,梅尔频率倒谱的频带划分是在梅尔刻度上等距划分的,它比用于正常的对数倒频谱中的线性间隔的频带更能近似人类的听觉系统,这样的非线性表示,使得对应的音频信号在声音处理领域中有更好的表示。由于音频信息为目标用户的播放频率超过预设阈值的音乐文件的整个音频段或部分音频段,因此,对音频信息进行特征提取,得到梅尔频率倒谱系数MFCC特征信息,能够为获取目标用户的音乐偏好信息提供有效的数据基础。
需要说明的是,本申请实施例并不对根据关键词从预设的推荐结果池中获取至少两个目标推荐结果的具体方式做限制,目标推荐结果可以是根据关键词信息从推荐结果池中获取,该推荐结果池中的每个候选推荐结果与关键词信息存在映射关系,当获取到新的关键词信息,根据映射关系从推荐结果池中获取到新的关键词信息相对应的目标推荐结果;还可以是将关键词信息与推荐结果池中的所有候选推荐结果进行匹配查询,从而获取到与关键词信息匹配的目标推荐结果,可以理解的是,关键词信息与候选推荐结果的匹配方式为本领域技术人员所熟知,可以是通过文本匹配方式实现,本申请实施例在此不多做限制。
需要说明的是,本申请实施例并不涉及对模型的改进,本领域技术人员可以根据实际情况选择具体的图卷积模型,可以是基于谱域的图卷积模型或者是基于空间的图卷积模型。可以理解的是,将MFCC特征信息作为图卷积模型的输入,相较于现有技术中通过对音乐信息进行随机初始化作为图卷积网络的学习嵌入的方案,能够保留不同音乐的有效特征信息,从而提高通过图卷积模型实现音乐推荐的准确性。
可以理解的是,音乐偏好信息能够表征目标用户对音乐文件的兴趣信息,将音乐偏好信息作为对目标推荐结果进行排序处理的考虑参数,能够使得呈现给目标用户的目标推荐结果的排序更符合用户的个性化需求。
另外,参照图2,在一实施例中,图1所示实施例中的第一图卷积模型根据以下步骤获得:
步骤S210,获取预设的关系图谱;
步骤S220,根据MFCC特征信息将关系图谱划分为多个子图;
步骤S230,获取预设的第二图卷积模型,根据多个子图对第二图卷积模型进行训练,得到第一图卷积模型。
可以理解的是,关系图谱表征用户与偏好的音乐特征(即MFCC特征信息)之间的关联关系,由于不同的用户具有不同的音乐喜好,根据MFCC特征信息将关系图谱划分为多个子图,能够将具有相同音乐喜好的用户划分到同一个子图中,获取预设的第二图卷积模型,根据多个子图对第二图卷积模型进行训练,得到第一图卷积模型,能够使得第一图卷积模型能够更准确的得到与目标用户对应的音乐偏好信息,从而能够更好地实现对相同音乐喜好的多个目标用户实现同质化的音乐推荐。
需要说明的是,本申请实施例中对关系图谱划分子图的具体方式不做限制,可以是通过以下方式实现:
U0=W3Uh+b3;
其中,Fu为通过特征融合获得的用户特征,具体计算公式如下:
其中,为MFCC特征信息初始嵌入图卷积网络的特征;为经过图卷积网络第一层卷积层后对应的MFCC特征信息嵌入特征;u为用户标识在关系图谱中对应的节点数量;i为MFCC特征信息在关系图谱中对应的节点数量;Ni为关系图谱中与MFCC特征信息交互的用户标识集合;Nu为关系图谱中与用户标识交互的MFCC特征信息集合;σ为预设的激活函数;W1和b1分别是特征融合方法的权重矩阵和偏置向量,其中,W1∈Rd×d,b1∈R1×d;W2和W3分别是聚合子图方法(即通过注意力机制对具有相同音乐喜好的用户标识进行聚合)中的权重矩阵1和权重矩阵2;b2和b3是聚合子图方法中偏置向量1和偏置向量2,其中,W2∈Rd×d,W3∈Rd×d,b2∈R1×d,b3∈R1×d,本申请实施例的W1、W2、W3、b1、b2、b3的具体取值在第二图卷积模型训练过程中随机初始化生成,然后通过反向传播进行更新迭代;G为预设的关系图谱;s∈{1,...,Ns}为G中的子图;Uh为注意力预测向量;U0为预测向量,其中,U0中最大值的位置用于表示用户标识所归属的子图标识。
需要说明的是,本申请实施例并不对激活函数σ做限制,可以采用LeakyReLu激活函数、PReLu激活函数、RReLu激活函数等,本领域技术人员可以根据实际情况进行选用。
另外,参照图3,在一实施例中,图2所示实施例中的关系图谱根据以下步骤获得:
步骤S310,获取映射信息,映射信息用于表征各个MFCC特征信息与各个用户标识之间的映射关系;
步骤S320,通过关联MFCC特征信息和映射信息,得到关系图谱。
可以理解的是,不同用户的音乐喜好不同,一个用户对应唯一的音乐喜好标识,即一个用户标识对应唯一一个MFCC特征信息,而多个用户可能具有相同音乐喜好,即一个MFCC特征信息可以对应有多个用户标识,映射信息MFCC特征信息用于表征MFCC特征信息与不同用户标识之间的映射关系的映射信息,通过关联MFCC特征信息和映射信息,得到关系图谱,能够为第二图卷积模型的训练提供有效的数据基础。
另外,参照图4,在一实施例中,第一图卷积模型包括多个依次连接的卷积层,其中,排序位于上一层的卷积层的输出是排序位于下一层的卷积层的输入,图1所示实施例中的步骤140、包括但不限于有以下步骤:
步骤S410,从历史音乐信息中获取用户标识;
步骤S420,将用户标识和MFCC特征信息输入至第一图卷积模型;
步骤S430,获取第一卷积模型中的每个卷积层输出的用户标识向量和MFCC特征信息向量,其中,用户标识向量与用户标识相对应,MFCC特征信息向量与MFCC特征信息相对应;
步骤S440,获取第一中间向量,第一中间值为全部的用户标识向量之和;
步骤S450,获取第二中间向量,第二中间值为全部的MFCC特征信息向量之和;
步骤S460,计算第一中间向量与第二中间向量的内积,得到音乐偏好信息。
需要说明的是,获取音乐偏好信息的具体实现方式如下:
其中,r^uv为音乐偏好信息,通过计算eu和ei的内积得到;eu为第一中间向量,为全部的用户标识向量之和,即用户标识在经过每一层卷积层后对应输出所有特征向量的和,eu的计算公式如下:
可以理解的是,将音乐偏好信息作为对目标推荐结果进行排序处理的考虑参数,能够使得呈现给目标用户的目标推荐结果的排序更符合用户的个性化需求。并且,由于具有了更能反映实际喜好的初始化嵌入表示(即MFCC特征信息),使得关系图谱能够按照音乐喜好将用户进行分类,使得子图分割成为可能,在之后的图卷积模型训练过程中,由于不同音乐喜好的用户被分割在不同的子图中,可以有效地防止过平滑现象,即在高阶平滑操作中,由于与不同喜好的高阶邻居的互相关联,使得所有具有相同音乐喜好的目标用户最终具有相似的嵌入表示,得到同质化的推荐,从而提高音乐推荐的效率。
另外,参照图5,在一实施例中,图1所示实施例中的步骤120包括但不限于有以下步骤:
步骤S510,对音频信息进行预处理,得到预处理后的音频信息;
步骤S520,对预处理后的音频信息进行傅里叶变换得到第一频谱;
步骤S530,将第一频谱输入至预设的梅尔滤波器组进行滤波转换,得到第二频谱;
步骤S540,对第二频谱进行倒谱分析处理,得到MFCC特征信息。
需要说明的是,本申请实施例并不对音频信息进行预处理的具体方式做限制,可以是通过对音频信息进行预加重、分帧或加窗处理。
可以理解的是,通过对音频信息进行预处理,得到预处理后的音频信息;对预处理后的音频信息进行傅里叶变换得到第一频谱;将第一频谱输入至预设的梅尔滤波器组进行滤波转换,得到第二频谱;对第二频谱进行倒谱分析处理,得到MFCC特征信息,能够为提高音乐推荐的准确性提供数据基础,并且,MFCC特征信息使得相似音乐的特征矩阵相似性较高,风格相迥异的音乐的特征矩阵偏差较大,将其作为音乐的初始嵌入进行图卷积模型训练,可以有效地使得具有相同音乐品味的用户之间具有相似的一阶音乐邻居嵌入,从而能够更好地实现对相同音乐喜好的多个目标用户实现同质化的音乐推荐。
另外,参照图6,在一实施例中,在图1所示实施例中的步骤150之前,还包括但不限于有以下步骤:
步骤S610,根据关键词信息和目标推荐结果确定匹配数据,匹配数据用于表征关键词信息与目标推荐结果之间的匹配度评分;
步骤S620,根据匹配数据对目标推荐结果进行排序处理,得到排序后的目标推荐结果。
可以理解的是,在根据音乐偏好信息确定至少两个目标推荐结果的排序,并输出排序结果之前,根据关键词信息和目标推荐结果确定匹配数据,匹配数据用于表征关键词信息与目标推荐结果之间的匹配度评分,根据匹配数据对目标推荐结果进行排序处理,得到排序后的目标推荐结果能够使得经过最终呈现给目标用户的排序结果更符合用户的个性化需求,提高用户对音乐推荐的满意度。
另外,参照图7,在一实施例中,在图1所示实施例中的步骤150之后,还包括但不限于有以下步骤:
步骤S710,获取预设的过滤规则;
步骤S720,根据所述过滤规则对所述排序结果进行过滤处理,得到过滤后的排序结果。
可以理解的是,在获取到目标推荐结果的排序结果之后,本申请实施例提出对排序结果进行过滤处理,能够有效避免目标推荐结果列表中存在重复数据,或者排序后的目标推荐结果列表中的音乐文件无法播放,或者存在用户标识所对应的用户没有播放权限的音乐文件的情况发生,从而能够提高排序结果与目标用户的音乐推荐需求的匹配度,从而能够满足用户的个性化音乐推荐需求。
需要说明的是,本申请实施例并不对过滤规则做限制,过滤规则根据实际需求进行定义,获取每个目标推荐结果之间的匹配度评分,根据匹配度评分对目标推荐结果进行过滤筛选,例如,目标推荐结果A与目标推荐结果B之间的匹配度评分大于预设的阈值,在呈现的目标推荐结果列表中删除目标推荐结果A或目标推荐结果B;或者,获取每个目标推荐结果的权限验证信息,权限验证信息包括对该目标推荐结果具有播放权限的用户标识,根据当前用户标识与每个目标推荐结果的权限验证信息进行匹配筛选,得到符合当前用户标识播放权限的目标推荐结果。
另外,参考图8,图8是本发明另一个实施例提供的音乐推荐装置的模块示意图,本发明的一个实施例还提供了一种音乐推荐装置800,该音乐推荐装置800包括:
数据采集模块810,数据采集模块810用于获取目标用户的历史音乐信息,其中,历史音乐信息包括关键词信息和音频信息;
特征提取模块820,特征提取模块820用于对音频信息进行特征提取,得到MFCC特征信息;
目标推荐结果获取模块830,目标推荐结果获取模块830用于根据关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;
音乐偏好信息获取模块840,音乐偏好信息获取模块840用于获取预先训练好的第一图卷积模型,将MFCC特征信息输入至第一图卷积模型,得到音乐偏好信息;
目标推荐结果排序模块850,目标推荐结果排序模块850用于根据音乐偏好信息确定至少两个目标推荐结果的排序,并输出排序结果。
另外,参考图9,图9是本发明另一个实施例提供的音乐推荐装置的结构图,本发明的一个实施例还提供了一种音乐推荐装置900,该音乐推荐装置900包括:存储器910、处理器920及存储在存储器910上并可在处理器920上运行的计算机程序。
处理器920和存储器910可以通过总线或者其他方式连接。
实现上述实施例的基于人工智能的音乐推荐方法所需的非暂态软件程序以及指令存储在存储器910中,当被处理器920执行时,执行上述实施例中的基于人工智能的音乐推荐方法,例如,执行以上描述的图1中的方法步骤S110至方法步骤S150、图2中的方法步骤S210至方法步骤S230、图3中的方法步骤S310至方法步骤S320、图4中的方法步骤S410至方法步骤S460、图5中的方法步骤S510至方法步骤S540、图6中的方法步骤S610至方法步骤S620、图7中的方法步骤S710至方法步骤S720。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述音乐推荐方法实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的基于人工智能的音乐推荐方法,例如,执行以上描述的图1中的方法步骤S110至方法步骤S150、图2中的方法步骤S210至方法步骤S230、图3中的方法步骤S310至方法步骤S320、图4中的方法步骤S410至方法步骤S460、图5中的方法步骤S510至方法步骤S540、图6中的方法步骤S610至方法步骤S620、图7中的方法步骤S710至方法步骤S720。本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本实施例可用于众多通用或专用的计算机装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、基于微处理器的装置、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何装置或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机程序的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的各个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的程序。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的各个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本实施例的终端可以包括:射频(Radio Frequency,简称RF)电路、存储器、输入单元、显示单元、传感器、音频电路、无线保真(wireless fidelity,简称WiFi)模块、处理器、以及电源等部件。RF电路可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称LNA)、双工器等。此外,RF电路还可以通过无线通信与网络和其他装置通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,简称GSM)、通用分组无线服务(General Packet RadioService,简称GPRS)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、长期演进(Long TermEvolution,简称LTE)、电子邮件、短消息服务(Short Messaging Service,简称SMS)等。存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行终端的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入单元可用于接收输入的数字或字符信息,以及产生与终端的设置以及功能控制有关的键信号输入。具体地,输入单元可包括触控面板以及其他输入装置。触控面板,也称为触摸屏,可收集在其上或附近的触摸操作(比如使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器,并能接收处理器发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类别实现触控面板。除了触控面板,输入单元还可以包括其他输入装置。具体地,其他输入装置可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元可用于显示输入的信息或提供的信息以及终端的各种菜单。显示单元可包括显示面板,可选的,可以采用液晶显示器(Liquid Crystal Display,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类别,随后处理器根据触摸事件的类别在显示面板上提供相应的视觉输出。触控面板与显示面板是作为两个独立的部件来实现终端的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成而实现终端的输入和输出功能。终端还可包括至少一种传感器,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。音频电路、扬声器、传声器可提供音频接口。音频电路可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路接收后转换为音频数据,再将音频数据输出处理器处理后,经RF电路以发送给比如另一终端,或者将音频数据输出至存储器以便进一步处理。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
Claims (10)
1.一种基于人工智能的音乐推荐方法,其特征在于,包括:
获取目标用户的历史音乐信息,其中,所述历史音乐信息包括关键词信息和音频信息;
对所述音频信息进行特征提取,得到梅尔频率倒谱系数MFCC特征信息;
根据所述关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;
获取预先训练好的第一图卷积模型,将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息;
根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果。
2.根据权利要求1所述的方法,其特征在于,所述第一图卷积模型根据以下步骤获得:
获取预设的关系图谱;
根据所述MFCC特征信息将所述关系图谱划分为多个子图;
获取预设的第二图卷积模型,根据多个所述子图对所述第二图卷积模型进行训练,得到所述第一图卷积模型。
3.根据权利要求2所述的方法,其特征在于,所述目标用户的数量为多个,所述历史音乐信息还包括用户标识,所述关系图谱根据以下步骤获得:
获取映射信息,所述映射信息用于表征各个所述MFCC特征信息与各个所述用户标识之间的映射关系;
通过关联所述MFCC特征信息和所述映射信息,得到所述关系图谱。
4.根据权利要求3所述的方法,其特征在于,所述第一图卷积模型包括多个依次连接的卷积层,其中,排序位于上一层的卷积层的输出是排序位于下一层的卷积层的输入,所述将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息,包括:
从所述历史音乐信息中获取所述用户标识;
将所述用户标识和所述MFCC特征信息输入至所述第一图卷积模型;
获取所述第一卷积模型中的每个卷积层输出的用户标识向量和MFCC特征信息向量,其中,所述用户标识向量与所述用户标识相对应,所述MFCC特征信息向量与所述MFCC特征信息相对应;
获取第一中间向量,所述第一中间值为全部的所述用户标识向量之和;
获取第二中间向量,所述第二中间值为全部的所述MFCC特征信息向量之和;
计算所述第一中间向量与所述第二中间向量的内积,得到所述音乐偏好信息。
5.根据权利要求1所述的方法,其特征在于,所述对所述音频信息进行特征提取,得到MFCC特征信息,包括:
对所述音频信息进行预处理,得到预处理后的音频信息;
对所述预处理后的音频信息进行傅里叶变换得到第一频谱;
将所述第一频谱输入至预设的梅尔滤波器组进行滤波转换,得到第二频谱;
对所述第二频谱进行倒谱分析处理,得到所述MFCC特征信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序之前,还包括:
根据所述关键词信息和所述目标推荐结果确定匹配数据,所述匹配数据用于表征所述关键词信息与所述目标推荐结果之间的匹配度评分;
根据所述匹配数据对所述目标推荐结果进行排序处理,得到排序后的目标推荐结果。
7.根据权利要求1所述的方法,其特征在于,所述根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果之后,还包括:
获取预设的过滤规则;
根据所述过滤规则对所述排序结果进行过滤处理,得到过滤后的排序结果。
8.一种音乐推荐装置,其特征在于,包括:
数据采集模块,所述数据采集模块用于获取目标用户的历史音乐信息,其中,所述历史音乐信息包括关键词信息和音频信息;
特征提取模块,所述特征提取模块用于对所述音频信息进行特征提取,得到MFCC特征信息;
目标推荐结果获取模块,所述目标推荐结果获取模块用于根据所述关键词信息从预设的推荐结果池中获取至少两个目标推荐结果;
音乐偏好信息获取模块,所述音乐偏好信息获取模块用于获取预先训练好的第一图卷积模型,将所述MFCC特征信息输入至所述第一图卷积模型,得到音乐偏好信息;
目标推荐结果排序模块,所述目标推荐结果排序模块用于根据所述音乐偏好信息确定至少两个所述目标推荐结果的排序,并输出排序结果。
9.一种音乐推荐装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的基于人工智能的音乐推荐方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至7中任意一项所述的基于人工智能的音乐推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210360368.3A CN114722234A (zh) | 2022-04-07 | 2022-04-07 | 基于人工智能的音乐推荐方法、装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210360368.3A CN114722234A (zh) | 2022-04-07 | 2022-04-07 | 基于人工智能的音乐推荐方法、装置、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114722234A true CN114722234A (zh) | 2022-07-08 |
Family
ID=82241754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210360368.3A Pending CN114722234A (zh) | 2022-04-07 | 2022-04-07 | 基于人工智能的音乐推荐方法、装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114722234A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116595428A (zh) * | 2023-07-18 | 2023-08-15 | 天翼云科技有限公司 | 一种基于cnn使用日志频谱分析的用户分类方法及系统 |
-
2022
- 2022-04-07 CN CN202210360368.3A patent/CN114722234A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116595428A (zh) * | 2023-07-18 | 2023-08-15 | 天翼云科技有限公司 | 一种基于cnn使用日志频谱分析的用户分类方法及系统 |
CN116595428B (zh) * | 2023-07-18 | 2023-10-13 | 天翼云科技有限公司 | 一种基于cnn使用日志频谱分析的用户分类方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241431B (zh) | 一种资源推荐方法和装置 | |
TWI684148B (zh) | 聯絡人的分組處理方法及裝置 | |
CN108228270B (zh) | 启动资源加载方法及装置 | |
US7853582B2 (en) | Method and system for providing information services related to multimodal inputs | |
CN110853617B (zh) | 一种模型训练的方法、语种识别的方法、装置及设备 | |
WO2014113347A2 (en) | Accumulation of real-time crowd sourced data for inferring metadata about entities | |
CN110164415A (zh) | 一种基于语音识别的推荐方法、装置及介质 | |
US9639633B2 (en) | Providing information services related to multimodal inputs | |
CN110096611A (zh) | 一种歌曲推荐方法、移动终端及计算机可读存储介质 | |
CN105531701A (zh) | 个性化趋势图像搜索建议 | |
CN111491123A (zh) | 视频背景处理方法、装置及电子设备 | |
CN111159338A (zh) | 一种恶意文本的检测方法、装置、电子设备及存储介质 | |
CN111813910A (zh) | 客服问题的更新方法、系统、终端设备及计算机存储介质 | |
WO2019101099A1 (zh) | 视频节目识别方法、设备、终端、系统和存储介质 | |
CN111414512A (zh) | 一种基于语音搜索的资源推荐方法、装置及电子设备 | |
CN111428078B (zh) | 音频指纹编码方法、装置、计算机设备及存储介质 | |
CN112995757B (zh) | 视频剪裁方法及装置 | |
CN114722234A (zh) | 基于人工智能的音乐推荐方法、装置、存储介质 | |
CN111314771B (zh) | 一种视频播放方法及相关设备 | |
CN116957678A (zh) | 一种数据处理方法和相关装置 | |
KR102405896B1 (ko) | 위치 기반의 로컬 검색어 제공 방법 및 시스템 | |
CN111222011B (zh) | 一种视频向量确定方法和装置 | |
US20140257791A1 (en) | Apparatus and method for auto-generation of journal entries | |
CN112307254B (zh) | 一种音乐标签的向量确定方法和相关装置 | |
CN112632222B (zh) | 一种终端设备和确定数据所属领域的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |