CN116955692A - 一种音频播放方法、装置、车载终端及存储介质 - Google Patents
一种音频播放方法、装置、车载终端及存储介质 Download PDFInfo
- Publication number
- CN116955692A CN116955692A CN202310722107.6A CN202310722107A CN116955692A CN 116955692 A CN116955692 A CN 116955692A CN 202310722107 A CN202310722107 A CN 202310722107A CN 116955692 A CN116955692 A CN 116955692A
- Authority
- CN
- China
- Prior art keywords
- audio
- played
- user
- representing
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000013139 quantization Methods 0.000 claims abstract description 42
- 239000011159 matrix material Substances 0.000 claims abstract description 37
- 239000013598 vector Substances 0.000 claims description 39
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000000691 measurement method Methods 0.000 claims description 16
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 235000019640 taste Nutrition 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241001131927 Placea Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种音频播放方法、装置、车载终端及存储介质,属于音频处理技术领域,方法包括:获取用户对音频信息的偏好信息,利用多级划分方法将偏好信息进行量化;构建量化矩阵,计算目标用户与其他用户之间的用户相似性值,当前播放音频与各待播放音频之间的音频相似性值;确定目标用户的多个相似用户,确定当前播放音频的多个相似音频;根据用户相似性值和相似用户对待播放音频的评分值,计算目标用户对待播放音频的第一预测评分值,根据音频相似性值和相似音频的评价得分值,计算待播放音频的第二预测评分值;融合第一预测评分和第二预测评分,计算目标用户对待播放音频的预测总评分;根据预测总评分,自动调整待播放音频的播放顺序。
Description
技术领域
本发明属于音频处理技术领域,具体涉及一种音频播放方法、装置、车载终端及存储介质。
背景技术
音频播放是指通过音频设备(如扬声器、耳机等)将录制的声音或音乐传达给听众的过程。随着手机的普及度的上升和人们日常生活中对手机的依赖度的提高,一款有意思的音乐手机应用能给人们的生活带来不少乐趣。对音乐的有效分析能够提升人们整体的娱乐生活质量但是随着人们生活水平的提高,电子产品日趋智能化,人们越来越多的追求更加智能化的体验。
目前对于音频播放的方法有很多种,有些通过深度学习收集客户的偏好信息,然后不断的对模型进行矫正,以使得推送的音频播放顺序符合客户的审美,但是,这种方法往往需要大量的初始数据,并且未考虑因收集到的数据信息不足导致的音频播放顺序不符合客户审美的情况,此外,由于目前的音频播放方法往往只考虑用户偏好音频与其他音频之间的相似性,这种情况容易使得使用者产生审美疲劳,音频播放方法单一,对使用者的吸引力不足。
发明内容
为了解决现有技术存在的音频播放方法需要大量的初始数据,并且未考虑因收集到的数据信息不足导致的音频播放顺序不符合客户审美的情况,此外,由于目前的音频播放方法往往只考虑用户偏好音频与其他音频之间的相似性,这种情况容易使得使用者产生审美疲劳,音频播放方法单一,对使用者的吸引力不足的技术问题,本发明提供一种音频播放方法、装置、车载终端及存储介质。
第一方面
本发明提供一种音频播放方法,包括:
S101:获取用户对音频信息的偏好信息,利用多级划分方法将偏好信息进行量化;
S102:基于量化后的偏好信息,构建量化矩阵,其中,量化矩阵的行表示不同的用户,量化矩阵的列表示不同的待播放音频,量化矩阵中的元素表示了用户对待播放音频的评分信息;
S103:基于量化矩阵,利用余弦向量相似性度量方法,计算目标用户与其他用户之间的用户相似性值以及当前播放音频与各待播放音频之间的音频相似性值;
S104:以用户相似性值作为选取标准,确定目标用户的多个相似用户,以音频相似性值作为选取标准,确定当前播放音频的多个相似音频;
S105:根据用户相似性值和相似用户对待播放音频的评分值,计算目标用户对待播放音频的第一预测评分值:
其中,R1表示所述第一预测评分值,sim(u,a)表示所述用户相似性值,表示所述目标用户对全部的所述待播放音频的评分均值,/>表示所述相似用户对全部的所述待播放音频的评分均值,Iu表示与所述目标用户相似的所述相似用户的集合,Ra,i表示所述相似用户对所述待播放音频的评分值;
根据音频相似性值和相似音频的评价得分值,计算待播放音频的第二预测评分值:
其中,R2表示所述第二预测评分值,sim(i,j)表示所述待播放音频i和j的音频相似性值,表示全部用户对所述待播放音频i的评分均值,/>表示全部用户对所述待播放音频j的评分均值,Ii表示与所述待播放音频相似的所述待播放音频的集合,Ru,j表示所述目标用户对所述待播放音频i的评分值;
S106:根据用户相似性值和音频相似性值分别计算用户影响因子和音频影响因子;
S107:结合用户影响因子和音频影响因子,融合第一预测评分和第二预测评分,计算目标用户对待播放音频的预测总评分;
S108:根据预测总评分,自动调整待播放音频的播放顺序。
第二方面
本发明提供一种音频播放装置,包括:
获取模块,用于获取用户对音频信息的偏好信息,利用多级划分方法将偏好信息进行量化;
构建模块,用于基于量化后的偏好信息,构建量化矩阵,其中,量化矩阵的行表示不同的用户,量化矩阵的列表示不同的待播放音频,量化矩阵中的元素表示了用户对待播放音频的评分信息;
第一计算模块,用于基于量化矩阵,利用余弦向量相似性度量方法,计算目标用户与其他用户之间的用户相似性值以及当前播放音频与各待播放音频之间的音频相似性值;
确定模块,用于以用户相似性值作为选取标准,确定目标用户的多个相似用户,以音频相似性值作为选取标准,确定当前播放音频的多个相似音频;
第二计算模块,用于根据用户相似性值和相似用户对待播放音频的评分值,计算目标用户对待播放音频的第一预测评分值:
其中,R1表示所述第一预测评分值,sim(u,a)表示所述用户相似性值,表示所述目标用户对全部的所述待播放音频的评分均值,/>表示所述相似用户对全部的所述待播放音频的评分均值,Iu表示与所述目标用户相似的所述相似用户的集合,Ra,i表示所述相似用户对所述待播放音频的评分值;
根据音频相似性值和相似音频的评价得分值,计算待播放音频的第二预测评分值:
其中,R2表示所述第二预测评分值,sim(i,j)表示所述待播放音频i和j的音频相似性值,表示全部用户对所述待播放音频i的评分均值,/>表示全部用户对所述待播放音频j的评分均值,Ii表示与所述待播放音频相似的所述待播放音频的集合,Ru,j表示所述目标用户对所述待播放音频i的评分值;
第三计算模块,用于根据用户相似性值和音频相似性值分别计算用户影响因子和音频影响因子;
第四计算模块,用于结合用户影响因子和音频影响因子,融合第一预测评分和第二预测评分,计算目标用户对待播放音频的预测总评分;
调整模块,用于根据预测总评分,自动调整待播放音频的播放顺序。
第三方面
本发明提供一种车载终端,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述车载终端执行上述的音频播放方法。
第四方面
本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的音频播放方法。
与现有技术相比,本发明至少具有以下有益效果:
在本发明中,利用获取到的用户偏好信息,采用多级划分方法将用户偏好信息进行量化,以对用户的偏好进行更精准的量化划分,进而使得基于该量化方法划分出的结果更具有代表性和差异性。利用余弦向量相似性度量方法计算与目标用户相似的其他用户和各个音频之间的相似性,在采集到的用户数据不足的情况下,也可以根据相似用户的偏好推送音频进行播放,播放类别丰富,避免长时间的播放同一类型音频引起的审美疲劳。引入用户影响因子和音频影响因子,结合相似性求取相应的预测评分值,提升预测准确率,即使采集的数据不足的情况下,也能够通过简单的计算方式准确的预测出目标用户的偏好信息,避免采集大量数据的繁琐过程,预测响应速度快,根据预测结果调整音频播放顺序,更好地管理和享受音频内容,提升用户体验。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对本发明的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明提供的一种音频播放方法的流程示意图;
图2是本发明提供的一种音频播放装置的结构示意图;
图3是本发明提供的一种车载终端的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
另外,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1:在一个实施例中,参考说明书附图1,本发明提供的一种音频播放方法的流程示意图。
本发明提供的一种音频播放方法,包括:
S101:获取用户对音频信息的偏好信息,利用多级划分方法将偏好信息进行量化。
需要说明的是,目前的音频播放软件有很多种,音频播放软件基本都会采集用户对特定音频信息的偏好程度或者要求用户对音频进行打分,对于直接采集到的分值信息可以按照音频播放软件设定的分值信息进行归一化后再进行量化。对于采集到的偏好程度如标签,评价信息等定性的指标,可以根据音频播放软件设定的偏好程度级别,按照多级划分方法对用户的偏好程度进行量化,以将用户的偏好进行更加细致的划分,多层划分有助于提高后续对用户推荐音频的推荐准确性。
通过更好地理解用户的兴趣和喜好,从而为用户提供个性化的音频推荐服务。通过将偏好信息进行量化,可以将用户对不同音频的喜爱程度用数字表示,方便后续的计算和分析。这样就可以根据用户的兴趣和喜好,精准地推荐符合其口味的音频,提升用户的满意度和粘性。
S102:基于量化后的偏好信息,构建量化矩阵,其中,量化矩阵的行表示不同的用户,量化矩阵的列表示不同的待播放音频,量化矩阵中的元素表示了用户对待播放音频的评分信息。
S103:基于量化矩阵,利用余弦向量相似性度量方法,计算目标用户与其他用户之间的用户相似性值以及当前播放音频与各待播放音频之间的音频相似性值。
其中,余弦相似度是一种常用的向量相似度度量方法,通常用于计算两个向量之间的相似性。在计算用户相似性和音频相似性时,可以使用余弦相似度度量方法。余弦相似度计算两个向量之间的夹角余弦值,它的值越大,表示两个向量越相似。具体来说,计算方法是将两个向量点乘后再除以它们的模的乘积。这个值的取值范围是[-1,1],当两个向量完全相同时,余弦相似度为1;当两个向量完全相反时,余弦相似度为-1;当两个向量正交时,余弦相似度为0。余弦相似度是一种对数据的幅度不敏感的方法,它相比于其它计算相似度的方法,对数据维度的增加不会影响计算结果的准确性,而且计算方法简单、快速,适用于大规模数据的相似性计算
需要说明的是,量化矩阵在音频推荐系统中具有重要作用。通过构建量化矩阵,可以形成用户和音频之间的关系模型,帮助系统理解用户的偏好和喜好。基于量化矩阵,系统可以进行进一步的计算和分析,如计算用户之间的相似性、音频之间的相似性以及预测用户对待播放音频的评分。这样,系统可以根据用户的兴趣和喜好,提供个性化的音频推荐,增加用户的满意度和使用体验。通过构建量化矩阵,音频推荐系统可以利用用户的评分信息进行推荐算法的训练和优化,提高推荐的准确性和精度。同时,量化矩阵还可以用于用户相似性和音频相似性的计算,为系统提供更全面的信息基础。通过建立的量化矩阵,为个性化的音频推荐提供支持和依据。
在一种可能的实施方式中,S103具体为:
S1031:利用余弦向量相似性度量方法,计算用户相似性值与音频相似性值的计算方法具体为:
其中,sim(i,j)表示向量i和j之间的相似性值,Ri,c表示向量i的元素c,Rj,c表示向量j的元素c,表示所有向量中元素c的平均值。
S104:以用户相似性值作为选取标准,确定目标用户的多个相似用户,以音频相似性值作为选取标准,确定当前播放音频的多个相似音频。
需要说明的是,通过计算用户相似性值,可以找到与目标用户兴趣相似的其他用户。这些相似用户可能有类似的音乐偏好,对相似音频的评分和喜好可能与目标用户相近。通过与这些相似用户的行为和喜好进行比较,可以更好地了解目标用户的偏好和兴趣,在音频推荐系统中选择与目标用户兴趣相似的其他用户以及与目标音频相似的其他音频,以提供更加个性化和相关性更强的音频推荐。
在实际使用过程中,计算音频相似性值可以找到与目标音频相似的其他音频。这些相似音频可能在风格、曲风、艺术家等方面与目标音频相近。通过推荐这些相似音频给目标用户,可以扩展他们的音乐选择范围,提供更多符合他们口味的选项,通过选择相似用户和相似音频,可以增加用户对推荐内容的接受度,提高推荐的准确性和效果。这有助于增强用户的满意度,促使他们更偏好于使用相应的音频推荐系统,并探索新的音频内容。
S105:根据用户相似性值和相似用户对待播放音频的评分值,计算目标用户对待播放音频的第一预测评分值:
其中,R1表示所述第一预测评分值,sim(u,a)表示所述用户相似性值,表示所述目标用户对全部的所述待播放音频的评分均值,/>表示所述相似用户对全部的所述待播放音频的评分均值,Iu表示与所述目标用户相似的所述相似用户的集合,Ra,i表示所述相似用户对所述待播放音频的评分值;
根据音频相似性值和相似音频的评价得分值,计算待播放音频的第二预测评分值:
其中,R2表示所述第二预测评分值,sim(i,j)表示所述待播放音频i和j的音频相似性值,表示全部用户对所述待播放音频i的评分均值,/>表示全部用户对所述待播放音频j的评分均值,Ii表示与所述待播放音频相似的所述待播放音频的集合,Ru,j表示所述目标用户对所述待播放音频i的评分值。
需要说明的是,基于相似用户的行为和喜好,以及目标用户与相似用户之间的相似性来预测目标用户对待播放音频的评分,通过考虑相似用户的评分行为,可以推测目标用户可能会给予待播放音频的评分,系统可以根据用户的兴趣和喜好,对待播放音频进行排序和推荐,将最符合用户口味的音频放在前面。这有助于提高音频推荐的准确性和个性化程度,增加用户对推荐内容的满意度,提升用户体验。
S106:根据用户相似性值和音频相似性值分别计算用户影响因子和音频影响因子。
需要说明的是,根据用户相似性值和音频相似性值分别计算用户影响因子和音频影响因子,基于此确定对于每个待播放音频,哪些用户的评分和哪些相似音频的评分对目标用户的最终评分影响更大,以便更准确地预测目标用户的评分。用户影响因子和音频影响因子可以被视为是用于加权目标用户对待播放音频的预测评分的因素,可以更好地反映目标用户的兴趣和偏好。
在一种可能的实施方式中,S106具体为:
S1061:根据用户相似性值计算用户影响因子,根据音频相似性值计算音频影响因子:
其中,λu表示用户影响因子,λi表示音频影响因子,w表示范围(0,1)的常量,ux表示相似用户,iy表示相似音频,N表示相似用户的数目,M表示相似音频的数目。
在实际使用过程中,通过实验测试发现,常量w对预测结果的影响大小有一定的规律性,实验过程中将取0.1~1区间的值,每次增加0.1,在不断增加的过程中,利用平均绝对误差来确定w对预测结果的变化过程,平均绝对误差的值随着w的增加而增加,也就意味着w值越小,平均绝对误差值越小,即预测的评分值最接近于真实值,即预测结果的精度最高。
S107:结合用户影响因子和音频影响因子,融合第一预测评分和第二预测评分,计算目标用户对待播放音频的预测总评分。
可以理解的是,根据用户影响因子和第一预测评分,计算用户对待播放音频的加权评分。用户影响因子反映了相似用户对目标用户的影响程度,较高的影响因子意味着相似用户的评分对目标用户的评分有更大的影响,通过将用户影响因子与相应的第一预测评分相乘,可以计算用户对待播放音频的加权评分。接下来,根据音频影响因子和第二预测评分,计算待播放音频的加权评分。音频影响因子反映了相似音频对待播放音频的影响程度,较高的影响因子意味着相似音频的评分对待播放音频的评分有更大的影响。通过将音频影响因子与相应的第二预测评分相乘,可以计算待播放音频的加权评分。最后,将用户对待播放音频的加权评分和待播放音频的加权评分相加,得到目标用户对待播放音频的预测总评分。这个预测总评分综合了用户的偏好以及音频的相似性,用于衡量目标用户对待播放音频的兴趣程度和评分期望。这个预测总评分可以作为音频推荐系统最终的依据,用于确定待播放音频的播放顺序和推荐优先级。通过结合用户影响因子和音频影响因子,可以更准确地预测目标用户对待播放音频的喜好程度,提供更加个性化和符合用户口味的音频推荐。
在一种可能的实施方式中,S107具体为:
S1071:预测总评分的计算方式为:
Ru,i=λuR1+λiR2
λu+λi=1
其中,Ru,i表示预测总评分。
S108:根据预测总评分,自动调整待播放音频的播放顺序。
在一种可能的实施方式中,S108具体包括:
S1081:将各待播放音频的预测总评分按分值大小进行倒序排列;
S1082:依据排列结果,依次播放待播放音频。
可以理解的是,得到的预测总评分是目标用户对未点击过的待播放音频的一个预测结果,根据预测总评分的分值,可以将目标用户可能会喜欢的待播放音频进行从最感兴趣向下依次排列的一个待播放音频表,音频播放器根据这个待播放音频表对待播放音频进行自动播放,或者将待播放音频表通过交互界面推送至目标用户,以此形成一个良性循环,增加目标用户的收听体验,提升音频播放软件的用户粘度。
与现有技术相比,本发明至少具有以下有益效果:
在本发明中,利用获取到的用户偏好信息,采用多级划分方法将用户偏好信息进行量化,以对用户的偏好进行更精准的量化划分,进而使得基于该量化方法划分出的结果更具有代表性和差异性。利用余弦向量相似性度量方法计算与目标用户相似的其他用户和各个音频之间的相似性,在采集到的用户数据不足的情况下,也可以根据相似用户的偏好推送音频进行播放,播放类别丰富,避免长时间的播放同一类型音频引起的审美疲劳。引入用户影响因子和音频影响因子,结合相似性求取相应的预测评分值,提升预测准确率,即使采集的数据不足的情况下,也能够通过简单的计算方式准确的预测出目标用户的偏好信息,避免采集大量数据的繁琐过程,预测响应速度快,根据预测结果调整音频播放顺序,更好地管理和享受音频内容,提升用户体验。
实施例2:在一个实施例中,参考说明书附图2,本发明提供的一种音频播放装置的结构示意图。
本发明提供的一种音频播放装置20,包括:
获取模块201,用于获取用户对音频信息的偏好信息,利用多级划分方法将偏好信息进行量化;
构建模块202,用于基于量化后的偏好信息,构建量化矩阵,其中,量化矩阵的行表示不同的用户,量化矩阵的列表示不同的待播放音频,量化矩阵中的元素表示了用户对待播放音频的评分信息;
第一计算模块203,用于基于量化矩阵,利用余弦向量相似性度量方法,计算目标用户与其他用户之间的用户相似性值以及当前播放音频与各待播放音频之间的音频相似性值;
确定模块204,用于以用户相似性值作为选取标准,确定目标用户的多个相似用户,以音频相似性值作为选取标准,确定当前播放音频的多个相似音频;
第二计算模块205,用于根据用户相似性值和相似用户对待播放音频的评分值,计算目标用户对待播放音频的第一预测评分值:
其中,R1表示所述第一预测评分值,sim(u,a)表示所述用户相似性值,表示所述目标用户对全部的所述待播放音频的评分均值,/>表示所述相似用户对全部的所述待播放音频的评分均值,Iu表示与所述目标用户相似的所述相似用户的集合,Ra,i表示所述相似用户对所述待播放音频的评分值;
根据音频相似性值和相似音频的评价得分值,计算待播放音频的第二预测评分值:
其中,R2表示所述第二预测评分值,sim(i,j)表示所述待播放音频i和j的音频相似性值,表示全部用户对所述待播放音频i的评分均值,/>表示全部用户对所述待播放音频j的评分均值,Ii表示与所述待播放音频相似的所述待播放音频的集合,Ru,j表示所述目标用户对所述待播放音频i的评分值;
第三计算模块206,用于根据用户相似性值和音频相似性值分别计算用户影响因子和音频影响因子;
第四计算模块207,用于结合用户影响因子和音频影响因子,融合第一预测评分和第二预测评分,计算目标用户对待播放音频的预测总评分;
调整模块208,用于根据预测总评分,自动调整待播放音频的播放顺序。
在一种可能的实施方式中,第一计算模块203具体包括:
第一计算子模块,用于利用余弦向量相似性度量方法,计算用户相似性值与音频相似性值的计算方法具体为:
其中,sim(i,j)表示向量i和j之间的相似性值,Ri,c表示向量i的元素c,Rj,c表示向量j的元素c,表示所有向量中元素c的平均值。
在一种可能的实施方式中,第三计算模块206具体包括:
第四计算子模块,用于根据用户相似性值计算用户影响因子,根据音频相似性值计算音频影响因子:
其中,λu表示用户影响因子,λi表示音频影响因子,w表示范围(0,1)的常量,ux表示相似用户,iy表示相似音频,N表示相似用户的数目,M表示相似音频的数目。
在一种可能的实施方式中,,第四计算模块207具体包括:
第五计算子模块,用于预测总评分的计算方式为:
Ru,i=λuR1+λiR2
λu+λi=1
其中,Ru,i表示预测总评分。
在一种可能的实施方式中,调整模块208具体包括:
排列子模块,用于将各待播放音频的预测总评分按分值大小进行倒序排列;
播放子模块,用于依据排列结果,依次播放待播放音频。
本发明提供的音频播放装置20能够实现上述方法实施例中实现的各个过程,为避免重复,这里不再赘述。
本发明提供的虚拟系统可以是系统,也可以是终端中的部件、集成电路、或芯片。
与现有技术相比,本发明至少具有以下有益效果:
在本发明中,利用获取到的用户偏好信息,采用多级划分方法将用户偏好信息进行量化,以对用户的偏好进行更精准的量化划分,进而使得基于该量化方法划分出的结果更具有代表性和差异性。利用余弦向量相似性度量方法计算与目标用户相似的其他用户和各个音频之间的相似性,在采集到的用户数据不足的情况下,也可以根据相似用户的偏好推送音频进行播放,播放类别丰富,避免长时间的播放同一类型音频引起的审美疲劳。引入用户影响因子和音频影响因子,结合相似性求取相应的预测评分值,提升预测准确率,即使采集的数据不足的情况下,也能够通过简单的计算方式准确的预测出目标用户的偏好信息,避免采集大量数据的繁琐过程,预测响应速度快,根据预测结果调整音频播放顺序,更好地管理和享受音频内容,提升用户体验。
实施例3:参照图3,示出了本发明提供的一种车载终端的结构示意图。
本发明还提供一种车载终端400,所述计算机设备包括处理器401和与处理器401耦合的存储器402,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述音频播放方法的步骤。
在本发明中,利用获取到的用户偏好信息,采用多级划分方法将用户偏好信息进行量化,以对用户的偏好进行更精准的量化划分,进而使得基于该量化方法划分出的结果更具有代表性和差异性。利用余弦向量相似性度量方法计算与目标用户相似的其他用户和各个音频之间的相似性,在采集到的用户数据不足的情况下,也可以根据相似用户的偏好推送音频进行播放,播放类别丰富,避免长时间的播放同一类型音频引起的审美疲劳。引入用户影响因子和音频影响因子,结合相似性求取相应的预测评分值,提升预测准确率,即使采集的数据不足的情况下,也能够通过简单的计算方式准确的预测出目标用户的偏好信息,避免采集大量数据的繁琐过程,预测响应速度快,根据预测结果调整音频播放顺序,更好地管理和享受音频内容,提升用户体验。
实施例4:本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述音频播放方法的步骤。
在本发明中,利用获取到的用户偏好信息,采用多级划分方法将用户偏好信息进行量化,以对用户的偏好进行更精准的量化划分,进而使得基于该量化方法划分出的结果更具有代表性和差异性。利用余弦向量相似性度量方法计算与目标用户相似的其他用户和各个音频之间的相似性,在采集到的用户数据不足的情况下,也可以根据相似用户的偏好推送音频进行播放,播放类别丰富,避免长时间的播放同一类型音频引起的审美疲劳。引入用户影响因子和音频影响因子,结合相似性求取相应的预测评分值,提升预测准确率,即使采集的数据不足的情况下,也能够通过简单的计算方式准确的预测出目标用户的偏好信息,避免采集大量数据的繁琐过程,预测响应速度快,根据预测结果调整音频播放顺序,更好地管理和享受音频内容,提升用户体验。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是——但不限于——电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++等,以及常规的过程式编程语言-诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种音频播放方法,其特征在于,包括:
S101:获取用户对音频信息的偏好信息,利用多级划分方法将所述偏好信息进行量化;
S102:基于量化后的所述偏好信息,构建量化矩阵,其中,所述量化矩阵的行表示不同的用户,所述量化矩阵的列表示不同的待播放音频,所述量化矩阵中的元素表示了所述用户对所述待播放音频的评分信息;
S103:基于所述量化矩阵,利用余弦向量相似性度量方法,计算目标用户与其他用户之间的用户相似性值以及当前播放音频与各所述待播放音频之间的音频相似性值;
S104:以所述用户相似性值作为选取标准,确定所述目标用户的多个相似用户,以所述音频相似性值作为选取标准,确定所述当前播放音频的多个相似音频;
S105:根据所述用户相似性值和所述相似用户对所述待播放音频的评分值,计算所述目标用户对所述待播放音频的第一预测评分值:
其中,R1表示所述第一预测评分值,sim(u,a)表示所述用户相似性值,表示所述目标用户对全部的所述待播放音频的评分均值,/>表示所述相似用户对全部的所述待播放音频的评分均值,Iu表示与所述目标用户相似的所述相似用户的集合,Ra,i表示所述相似用户对所述待播放音频的评分值;
根据所述音频相似性值和所述相似音频的评价得分值,计算所述待播放音频的第二预测评分值:
其中,R2表示所述第二预测评分值,sim(i,j)表示所述待播放音频i和j的音频相似性值,表示全部用户对所述待播放音频i的评分均值,/>表示全部用户对所述待播放音频j的评分均值,Ii表示与所述待播放音频相似的所述待播放音频的集合,Ru,j表示所述目标用户对所述待播放音频i的评分值;
S106:根据所述用户相似性值和所述音频相似性值分别计算用户影响因子和音频影响因子;
S107:结合所述用户影响因子和所述音频影响因子,融合所述第一预测评分和所述第二预测评分,计算所述目标用户对所述待播放音频的预测总评分;
S108:根据所述预测总评分,自动调整所述待播放音频的播放顺序。
2.根据权利要求1所述的音频播放方法,其特征在于,所述S103具体为:
S1031:利用余弦向量相似性度量方法,计算所述用户相似性值与所述音频相似性值的计算方法具体为:
其中,sim(i,j)表示向量i和j之间的相似性值,Ri,c表示向量i的元素c,Rj,c表示向量j的元素c,表示所有向量中元素c的平均值。
3.根据权利要求1所述的音频播放方法,其特征在于,所述S106具体为:
S1061:根据所述用户相似性值计算用户影响因子,根据所述音频相似性值计算所述音频影响因子:
其中,λu表示所述用户影响因子,λi表示所述音频影响因子,w表示范围(0,1)的常量,ux表示所述相似用户,iy表示所述相似音频,N表示所述相似用户的数目,M表示所述相似音频的数目。
4.根据权利要求1所述的音频播放方法,其特征在于,所述S107具体为:
S1071:所述预测总评分的计算方式为:
Ru,i=λuR1+λiR2
λu+λi=1
其中,Ru,i表示所述预测总评分。
5.根据权利要求1所述的音频播放方法,其特征在于,所述S108具体包括:
S1081:将各所述待播放音频的预测总评分按分值大小进行倒序排列;
S1082:依据排列结果,依次播放所述待播放音频。
6.一种音频播放装置,其特征在于,包括:
获取模块,用于获取用户对音频信息的偏好信息,利用多级划分方法将所述偏好信息进行量化;
构建模块,用于基于量化后的所述偏好信息,构建量化矩阵,其中,所述量化矩阵的行表示不同的用户,所述量化矩阵的列表示不同的待播放音频,所述量化矩阵中的元素表示了所述用户对所述待播放音频的评分信息;
第一计算模块,用于基于所述量化矩阵,利用余弦向量相似性度量方法,计算目标用户与其他用户之间的用户相似性值以及当前播放音频与各所述待播放音频之间的音频相似性值;
确定模块,用于以所述用户相似性值作为选取标准,确定所述目标用户的多个相似用户,以所述音频相似性值作为选取标准,确定所述当前播放音频的多个相似音频;
第二计算模块,用于根据所述用户相似性值和所述相似用户对所述待播放音频的评分值,计算所述目标用户对所述待播放音频的第一预测评分值:
其中,R1表示所述第一预测评分值,sim(u,a)表示所述用户相似性值,表示所述目标用户对全部的所述待播放音频的评分均值,/>表示所述相似用户对全部的所述待播放音频的评分均值,Iu表示与所述目标用户相似的所述相似用户的集合,Ra,i表示所述相似用户对所述待播放音频的评分值;
根据所述音频相似性值和所述相似音频的评价得分值,计算所述待播放音频的第二预测评分值:
其中,R2表示所述第二预测评分值,sim(i,j)表示所述待播放音频i和j的音频相似性值,表示全部用户对所述待播放音频i的评分均值,/>表示全部用户对所述待播放音频j的评分均值,Ii表示与所述待播放音频相似的所述待播放音频的集合,Ru,j表示所述目标用户对所述待播放音频i的评分值;
第三计算模块,用于根据所述用户相似性值和所述音频相似性值分别计算用户影响因子和音频影响因子;
第四计算模块,用于结合所述用户影响因子和所述音频影响因子,融合所述第一预测评分和所述第二预测评分,计算所述目标用户对所述待播放音频的预测总评分;
调整模块,用于根据所述预测总评分,自动调整所述待播放音频的播放顺序。
7.根据权利要求6所述的音频播放装置,其特征在于,所述第一计算模块具体包括:
第一计算子模块,用于利用余弦向量相似性度量方法,计算所述用户相似性值与所述音频相似性值的计算方法具体为:
其中,sim(i,j)表示向量i和j之间的相似性值,Ri,c表示向量i的元素c,Rj,c表示向量j的元素c,表示所有向量中元素c的平均值。
8.一种车载终端,其特征在于,所述车载终端包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述车载终端设备执行如权利要求1-5中任意一项所述的音频播放方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现如权利要求1-5中任一项所述音频播放方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722107.6A CN116955692A (zh) | 2023-06-16 | 2023-06-16 | 一种音频播放方法、装置、车载终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722107.6A CN116955692A (zh) | 2023-06-16 | 2023-06-16 | 一种音频播放方法、装置、车载终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116955692A true CN116955692A (zh) | 2023-10-27 |
Family
ID=88453896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310722107.6A Pending CN116955692A (zh) | 2023-06-16 | 2023-06-16 | 一种音频播放方法、装置、车载终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955692A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971161A (zh) * | 2014-05-09 | 2014-08-06 | 哈尔滨工程大学 | 基于柯西分布量子粒子群的混合推荐方法 |
CN110287373A (zh) * | 2019-07-02 | 2019-09-27 | 齐鲁工业大学 | 基于评分预测和用户特征的协同过滤电影推荐方法及系统 |
-
2023
- 2023-06-16 CN CN202310722107.6A patent/CN116955692A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971161A (zh) * | 2014-05-09 | 2014-08-06 | 哈尔滨工程大学 | 基于柯西分布量子粒子群的混合推荐方法 |
CN110287373A (zh) * | 2019-07-02 | 2019-09-27 | 齐鲁工业大学 | 基于评分预测和用户特征的协同过滤电影推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Prey | Musica analytica: The datafication of listening | |
US10088978B2 (en) | Country-specific content recommendations in view of sparse country data | |
CN109147807B (zh) | 一种基于深度学习的音域平衡方法、装置及系统 | |
US10055493B2 (en) | Generating a playlist | |
US11210338B2 (en) | Systems, methods and apparatus for generating music recommendations based on combining song and user influencers with channel rule characterizations | |
US20170164049A1 (en) | Recommending method and device thereof | |
US8543529B2 (en) | Content selection based on consumer interactions | |
CN107729578B (zh) | 一种音乐推荐方法及装置 | |
JP4179341B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
US20170169040A1 (en) | Method and electronic device for recommending video | |
CN108540860B (zh) | 一种视频召回方法和装置 | |
CN105049882A (zh) | 一种视频推荐方法及装置 | |
CN109147816B (zh) | 对音乐进行音量调节的方法及设备 | |
KR101804967B1 (ko) | 사용자 맥락, 추천 음악, 이용 행태로 구성된 데이터베이스를 활용한 음악 콘텐츠 추천 방법 및 시스템 | |
CN108628886B (zh) | 一种音频文件推荐方法及装置 | |
CN110991476A (zh) | 决策分类器的训练、音视频的推荐方法、装置及存储介质 | |
CN109242592A (zh) | 一种应用的推荐方法和装置 | |
CN101292241A (zh) | 用于计算第一特征矢量和第二特征矢量之间相似性度量的方法和设备 | |
CN111125428B (zh) | 基于评分预测函数拟合结构的时间相关电影推荐方法 | |
CN109255049A (zh) | 一种智慧音乐推荐系统 | |
CN112632318A (zh) | 一种音频推荐方法、装置、系统及存储介质 | |
CN112182281B (zh) | 一种音频推荐方法、装置及存储介质 | |
CN115618024A (zh) | 多媒体推荐方法、装置及电子设备 | |
US9502017B1 (en) | Automatic audio remixing with repetition avoidance | |
CN111477248B (zh) | 一种音频噪声检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |