CN112883282A - 一种基于麻雀搜索优化聚类的组推荐方法 - Google Patents
一种基于麻雀搜索优化聚类的组推荐方法 Download PDFInfo
- Publication number
- CN112883282A CN112883282A CN202110340661.9A CN202110340661A CN112883282A CN 112883282 A CN112883282 A CN 112883282A CN 202110340661 A CN202110340661 A CN 202110340661A CN 112883282 A CN112883282 A CN 112883282A
- Authority
- CN
- China
- Prior art keywords
- members
- group
- value
- similarity
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000287127 Passeridae Species 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000005457 optimization Methods 0.000 title claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 238000000691 measurement method Methods 0.000 claims abstract description 4
- 230000006978 adaptation Effects 0.000 claims description 6
- 238000002789 length control Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000004927 fusion Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于麻雀搜索优化聚类的组推荐方法,该方法包括以下步骤:S1、收集用户对项目进行评分的数据,使用麻雀搜索优化的密度峰值聚类算法对用户项目评分矩阵进行相似度划分,形成群体;选用皮尔逊相关性度量方法计算群体中成员之间的相似度,得到成员与成员的相似度矩阵;根据成员间的相似度值和信任度值设计公式计算成员相互的影响权重,得到成员与成员的权重值矩阵;通过得到成员相互影响的权重后估算成员对项目的新评分,根据平均策略估算群体中成员对每个项目的评分和排序,并推荐评分最高的Top‑k项目进行组推荐。本发明通过均值融合策略,将预测评分融合并排序完成top‑k推荐,解决推荐系统面向单一用户推荐的局限,提高推荐的准确度。
Description
技术领域
本发明属于组推荐的技术领域,尤其涉及一种基于麻雀搜索优化聚类的组推荐方法。
背景技术
在大数据时代,随着互联网的不断壮大,信息数据的查找变得越来越艰难,用户很难在这种情况下节省时间去找到自己合适的商品或者电影,推荐系统运营而生。目前的大多数的推荐系统都单独向用户推荐,对于群体的活动,如一群人看电影,旅游,吃饭,健身等是需要照顾到群体中每个人的兴趣偏好,这时推荐系统就要根据成员的兴趣来向群组推荐项目。
个人推荐系统的不足是无法向一群人进行推荐,在对组进行推荐时,也会面临如数据稀疏、推荐准确度低等问题。组推荐的第一步就是通过聚类、相似度计算等方法创建相似度群组,在已有的创建群组的方法中,大多使用聚类的方法,但单一聚类形成的群组在推荐时的准确率和成员的满意度都偏低。智能算法可以对聚类算法进行优化,实现近似最优,从而改善聚类敏感问题,提高推荐的准确度。现有的智能算法如粒子群算法、鱼群算法等虽然再改善聚类这方面有着很大的进步,但是算法本身容易陷入局部最优。
发明内容
基于以上现有技术的优化目标单一用户推荐的不足,本发明所解决的技术问题在于提供一种基于麻雀搜索优化聚类的组推荐方法,解决密度峰值聚类截断距离选取问题导致的聚类效果不佳和群组推荐精确度低的问题。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明提供的基于麻雀搜索优化聚类的组推荐方法,包括以下步骤:
S1、收集用户对项目进行评分的数据,使用麻雀搜索优化的密度峰值聚类算法对用户项目评分矩阵进行相似度划分,形成群体;
S2、选用皮尔逊相关性度量方法计算群体中成员之间的相似度,得到成员与成员的相似度矩阵;群体内成员间根据社会关系不同导致信任度是不对称的,计算成员之间非对称的信任值,得到成员与成员的信任度矩阵;
S3、根据成员间的相似度值和信任度值设计公式计算成员相互的影响权重,得到成员与成员的权重值矩阵;
S4、通过得到成员相互影响的权重后估算成员对项目的新评分,根据平均策略估算群体中成员对每个项目的评分和排序,并推荐评分最高的Top-k项目进行组推荐。
优选的,步骤S1的具体步骤如下:
步骤1.1:设置SSA算法的种群规模S,当前迭代次数t和最大迭代次数T,发现者数量Pm,意识到危险的麻雀数量Sn,报警值R2,麻雀的数量D;
步骤1.2:当t<T时,排名适应度值并找到当前最佳麻雀和当前最差麻雀:
步骤1.3:根据更新发现者位置,其中,j=1,2,…,d;表示种群中第t代中第i个麻雀的第j维位置;itermax为迭代次数最多的常数;α是一个随机数;R2和ST分别代表报警值和安全阈值;Q为一个标准正态分布随机数:
步骤1.5:根据每代随时选择个体进行预警行为;Xt best是当前的全局最优位置;β是步长控制参数,取值是平均值为0、方差为1的随机数的正态分布;K是一个随机数表示麻雀移动的方向,也是步长控制系数;fi是目前麻雀的适应值,fg和fworst分别是当前的全局最佳适应值和最差适应值,ε是最小常数;
步骤1.6判断SSA是否满足迭代终止条件,若是,则结束迭代并将最优截断距离dc *所对应的聚类结果进行除噪,得到最终聚类结果,完成群组的形成,否则,继续优化寻优。
进一步的,根据皮尔逊相关性计算群体内成员与成员的相似度,构建成员相似度矩阵:
式中,ru,rv分别表示用户u和用户v的评分向量;ru,i表示用户u对项目i的评分,rv,i表示用户v对项目i的评分;
通过群内成员与成员间的距离和社会关系确定成员信任度矩阵:
其中,rela表示成员的社会关系,Iu∩Iv表示用户u和用户v共同评分过的项目集,Iu表示用户u已评分项目集,dist表示为成员的距离。
进一步的,步骤S3中,通过成员相似度值和信任度值计算其在群体内的影响权重,构建权重矩阵,公式如下:
其中,Tru为信任度,Sim为成员的相似度。
可选的,步骤S4中,通过得到用户的权重值,计算权重影响后成员对项目的评分公式如下式所示:
通过均值策略融合成员评分如下式,评分最高的top-k推荐给该组;
其中,N表示所有评分的用户总个数,所有项目都分组评分后,得分最高的前k个项目推荐给组。
由上,本发明的基于麻雀搜索优化聚类的组推荐方法通过麻雀搜索优化算法SSA改进了密度峰值聚类DPC,解决了dc人工选取问题,构建高相似度群体,提高了聚类的效果从而提高后续推荐准确度;同时,在计算用户偏好上使用相似度与信任度结合的方式,通过均值融合策略,将预测评分融合并排序完成top-k推荐,解决了推荐系统面向单一用户推荐的局限,并提高了推荐的准确度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1为本发明的麻雀搜索优化密度峰值聚类算法的流程图;
图2为本发明的基于麻雀搜索优化聚类的组推荐方法的流程图。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
如图1所示,本发明的基于麻雀搜索优化聚类的组推荐方法,该方法包括如下步骤:
S1、收集用户对项目进行评分的数据,使用麻雀搜索优化的密度峰值聚类算法对用户项目评分矩阵进行相似度划分,形成群体;
S2、选用皮尔逊相关性度量方法计算群体中成员之间的相似度,得到成员与成员的相似度矩阵;群体内成员间根据社会关系不同导致信任度是不对称的,计算成员之间非对称的信任值,得到成员与成员的信任度矩阵;
S3、根据成员间的相似度值和信任度值设计公式计算成员相互的影响权重,得到成员与成员的权重值矩阵;
S4、通过得到成员相互影响的权重后估算成员对项目的新评分,根据平均策略估算群体中成员对每个项目的评分和排序,并推荐评分最高的Top-k项目进行组推荐。
通过麻雀搜索算法(SSA)有效地寻优能力对目标函数进行优化,寻找最佳的截断距离dc,改善聚类结果对dc敏感问题,提高聚类效果。根据改进的密度峰值聚类(SSA-DPC)创建高相似度群组从而提高组推荐的准确度。聚类中心通过样本点局部密度ρi和相对距离δi计算确定,局部密度计算公式如下:
式中,dij表示样本点i到样本点j之间的距离,本发明采用皮尔逊相关性的度量方式;dc表示截断距离。
相对距离δi表示的样本点i与局部密度更高的样本点之间的距离,计算公式如下:
计算数据集X={x1,x2,…,xn}种样本点之间的欧氏距离确定dc范围,初始化dc带入上面两个公式中计算出所有点的局部密度和相对距离。根据ρi和δi绘制决策图,在决策图中选取簇的聚类中心,通常选取ρi和δi均为较大的点作为簇的聚类中心。
ACC指标能对聚类结果能够产生准确的评判,ACC指标的计算公式如下:
式中,Pj表示已知人工标注的簇,Cj表示经过聚类后的簇,将评价指标ACC作为SSA的目标函数,记ACC指标最大时所对应的dc为dc*,利用SSA算法更新dc,步骤如下:
步骤1.1:设置SSA算法的种群规模S,当前迭代次数t和最大迭代次数T,发现者数量Pm,意识到危险的麻雀数量Sn,报警值R2,麻雀的数量D;
步骤1.2:当t<T时,排名适应度值并找到当前最佳麻雀和当前最差麻雀:
步骤1.3:根据更新发现者位置,其中,j=1,2,…,d;表示种群中第t代中第i个麻雀的第j维位置;itermax为迭代次数最多的常数;α是一个随机数;R2和ST分别代表报警值和安全阈值;Q为一个标准正态分布随机数:
步骤1.5:根据每代随时选择个体进行预警行为;Xt best是当前的全局最优位置;β是步长控制参数,取值是平均值为0、方差为1的随机数的正态分布;K是一个随机数表示麻雀移动的方向,也是步长控制系数;fi是目前麻雀的适应值,fg和fworst分别是当前的全局最佳适应值和最差适应值,ε是最小常数;
步骤1.6:判断SSA是否满足迭代终止条件,若是,则结束迭代并将最优截断距离dc *所对应的聚类结果进行除噪,得到最终聚类结果,完成群组的形成,否则,继续优化寻优。
在步骤S2中,根据皮尔逊相关性计算群体内成员与成员的相似度,构建成员相似度矩阵:
式中,ru,rv分别表示用户u和用户v的评分向量;ru,i表示用户u对项目i的评分,rv,i表示用户v对项目i的评分;
通过群内成员与成员间的距离和社会关系确定成员信任度矩阵:
其中,rela表示成员的社会关系,Iu∩Iv表示用户u和用户v共同评分过的项目集,Iu表示用户u已评分项目集,dist表示为成员的距离。
在步骤S3中,通过成员相似度值和信任度值计算其在群体内的影响权重,构建权重矩阵,公式如下:
其中,Tru为信任度,Sim为成员的相似度。
在步骤S4中,通过得到用户的权重值,计算权重影响后成员对项目的评分公式如下式所示:
通过均值策略融合成员评分如下式,评分最高的top-k推荐给该组;
其中,N表示所有评分的用户总个数,所有项目都分组评分后,得分最高的前k个项目推荐给组。
本发明基于麻雀搜索优化聚类的组推荐方法,其流程如图2所示。
改进的密度峰值聚类SSA-DPC根据用户评分相似度划分生成群体,其中,该算法的局部密度ρi计算是将原本需要人工选取的截断距离dc经过SSA优化成非人工选取,无需计算样本点到所有其他样本点的距离,解决了人工选取截断距离的缺陷,提高了聚类的效果。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。
Claims (5)
1.一种基于麻雀搜索优化聚类的组推荐方法,其特征在于,包括以下步骤:
S1、收集用户对项目进行评分的数据,使用麻雀搜索优化的密度峰值聚类算法对用户项目评分矩阵进行相似度划分,形成群体;
S2、选用皮尔逊相关性度量方法计算群体中成员之间的相似度,得到成员与成员的相似度矩阵;群体内成员间根据社会关系不同导致信任度是不对称的,计算成员之间非对称的信任值,得到成员与成员的信任度矩阵;
S3、根据成员间的相似度值和信任度值设计公式计算成员相互的影响权重,得到成员与成员的权重值矩阵;
S4、通过得到成员相互影响的权重后估算成员对项目的新评分,根据平均策略估算群体中成员对每个项目的评分和排序,并推荐评分最高的Top-k项目进行组推荐。
2.如权利要求1所述的基于麻雀搜索优化聚类的组推荐方法,其特征在于,步骤S1的具体步骤如下:
步骤1.1:设置SSA算法的种群规模S,当前迭代次数t和最大迭代次数T,发现者数量Pm,意识到危险的麻雀数量Sn,报警值R2,麻雀的数量D;
步骤1.2:当t<T时,排名适应度值并找到当前最佳麻雀和当前最差麻雀:
步骤1.3:根据更新发现者位置,其中,j=1,2,…,d;Xt i,j表示种群中第t代中第i个麻雀的第j维位置;itermax为迭代次数最多的常数;α是一个随机数;R2和ST分别代表报警值和安全阈值;Q为一个标准正态分布随机数:
步骤1.5:根据每代随时选择个体进行预警行为;Xt best是当前的全局最优位置;β是步长控制参数,取值是平均值为0、方差为1的随机数的正态分布;K是一个随机数表示麻雀移动的方向,也是步长控制系数;fi是目前麻雀的适应值,fg和fworst分别是当前的全局最佳适应值和最差适应值,ε是最小常数;
步骤1.6:判断SSA是否满足迭代终止条件,若是,则结束迭代并将最优截断距离dc *所对应的聚类结果进行除噪,得到最终聚类结果,完成群组的形成,否则,继续优化寻优。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110340661.9A CN112883282B (zh) | 2021-03-30 | 2021-03-30 | 一种基于麻雀搜索优化聚类的组推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110340661.9A CN112883282B (zh) | 2021-03-30 | 2021-03-30 | 一种基于麻雀搜索优化聚类的组推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112883282A true CN112883282A (zh) | 2021-06-01 |
CN112883282B CN112883282B (zh) | 2023-12-22 |
Family
ID=76040408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110340661.9A Active CN112883282B (zh) | 2021-03-30 | 2021-03-30 | 一种基于麻雀搜索优化聚类的组推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112883282B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113434768A (zh) * | 2021-07-07 | 2021-09-24 | 辽宁工程技术大学 | 一种融合磷虾群算法和fcm的个性化推荐方法 |
CN113723551A (zh) * | 2021-09-06 | 2021-11-30 | 辽宁工程技术大学 | 一种麻雀算法优化模糊聚类的推荐方法 |
CN114154079A (zh) * | 2021-12-06 | 2022-03-08 | 中电万维信息技术有限责任公司 | 一种融合置信度的信任影响群组推荐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462597A (zh) * | 2014-12-31 | 2015-03-25 | 湖南大学 | 一种综合用户正负性评分和评分偏好因子的协同过滤算法 |
CN106570090A (zh) * | 2016-10-20 | 2017-04-19 | 杭州电子科技大学 | 基于兴趣变化和信任关系的协同过滤推荐方法 |
KR20190060632A (ko) * | 2017-11-24 | 2019-06-03 | 주식회사 시소앤팜토리 | 머신 러닝에 기반한 여행 상품 추천 방법 및 장치 |
CN109902235A (zh) * | 2019-03-06 | 2019-06-18 | 太原理工大学 | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 |
CN112507248A (zh) * | 2020-09-18 | 2021-03-16 | 西北大学 | 一种基于用户评论数据和信任关系的旅游景点推荐方法 |
-
2021
- 2021-03-30 CN CN202110340661.9A patent/CN112883282B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462597A (zh) * | 2014-12-31 | 2015-03-25 | 湖南大学 | 一种综合用户正负性评分和评分偏好因子的协同过滤算法 |
CN106570090A (zh) * | 2016-10-20 | 2017-04-19 | 杭州电子科技大学 | 基于兴趣变化和信任关系的协同过滤推荐方法 |
KR20190060632A (ko) * | 2017-11-24 | 2019-06-03 | 주식회사 시소앤팜토리 | 머신 러닝에 기반한 여행 상품 추천 방법 및 장치 |
CN109902235A (zh) * | 2019-03-06 | 2019-06-18 | 太原理工大学 | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 |
CN112507248A (zh) * | 2020-09-18 | 2021-03-16 | 西北大学 | 一种基于用户评论数据和信任关系的旅游景点推荐方法 |
Non-Patent Citations (1)
Title |
---|
聂晓明;高鹏翔: "基于用户偏好和麻雀搜索聚类的协同过滤算法", 青岛大学学报(自然科学版), vol. 34, no. 001, pages 70 - 76 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113434768A (zh) * | 2021-07-07 | 2021-09-24 | 辽宁工程技术大学 | 一种融合磷虾群算法和fcm的个性化推荐方法 |
CN113723551A (zh) * | 2021-09-06 | 2021-11-30 | 辽宁工程技术大学 | 一种麻雀算法优化模糊聚类的推荐方法 |
CN114154079A (zh) * | 2021-12-06 | 2022-03-08 | 中电万维信息技术有限责任公司 | 一种融合置信度的信任影响群组推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112883282B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112883282A (zh) | 一种基于麻雀搜索优化聚类的组推荐方法 | |
CN109902235B (zh) | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 | |
CN107885778B (zh) | 一种基于动态临近点谱聚类的个性化推荐方法 | |
CN109241203B (zh) | 一种融合时间因素的用户偏好和距离加权的聚类方法 | |
CN107016122B (zh) | 基于时间迁移的知识推荐方法 | |
Eswaraprasad et al. | Improved intelligent transport system for reliable traffic control management by adapting internet of things | |
Al-Hadi et al. | Review of the temporal recommendation system with matrix factorization | |
CN111143699B (zh) | 基于相似性与置信度聚类的推荐系统 | |
CN112613953A (zh) | 一种商品选品方法、系统及计算机可读存储介质 | |
CN113326432A (zh) | 一种基于决策树与推荐方法的模型优选方法 | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
CN108491477B (zh) | 基于多维云和用户动态兴趣的神经网络推荐方法 | |
CN116738072B (zh) | 一种结合人因信息的多维推荐方法 | |
CN106991122B (zh) | 一种基于粒子群算法的电影推荐方法 | |
CN108280548A (zh) | 基于网络传输的智能处理方法 | |
CN112818238A (zh) | 一种自适应在线推荐方法及系统 | |
CN109460474A (zh) | 用户偏好趋势挖掘方法 | |
Mahmood et al. | A trust-based recommender system by integration of graph clustering and ant colony optimization | |
CN114662595A (zh) | 大数据融合处理方法及系统 | |
CN113392319B (zh) | 基于网络表示和辅助信息嵌入的学术论文推荐方法 | |
CN108182273A (zh) | 基于云存储的网络数据处理方法 | |
CN111339428B (zh) | 基于受限玻尔兹曼机驱动的交互式个性化搜索方法 | |
CN115221390A (zh) | 融合用户偏好和信任关系的混合群组餐厅推荐 | |
CN116977034B (zh) | 一种基于大数据的互联网品牌用户管理方法及系统 | |
CN108280181A (zh) | 网络数据的快速处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |