CN117078359B - 基于用户群分类的产品推荐方法、系统、设备及介质 - Google Patents
基于用户群分类的产品推荐方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117078359B CN117078359B CN202311329096.1A CN202311329096A CN117078359B CN 117078359 B CN117078359 B CN 117078359B CN 202311329096 A CN202311329096 A CN 202311329096A CN 117078359 B CN117078359 B CN 117078359B
- Authority
- CN
- China
- Prior art keywords
- grain
- clustering
- data
- membership
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000011159 matrix material Substances 0.000 claims abstract description 94
- 239000013598 vector Substances 0.000 claims abstract description 80
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 230000003595 spectral effect Effects 0.000 claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 239000002245 particle Substances 0.000 claims description 58
- 230000015654 memory Effects 0.000 claims description 16
- 239000008187 granular material Substances 0.000 claims description 13
- 238000005469 granulation Methods 0.000 claims description 12
- 230000003179 granulation Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 238000003064 k means clustering Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Accounting & Taxation (AREA)
- Mathematical Optimization (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据分析技术领域,公开了基于用户群分类的产品推荐方法、系统、设备及介质,从所述投资交易平台中获取目标用户群的混合信息数据;根据目标用户群的混合信息数据,确定目标用户群的聚类标签:对混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签。可以有效处理混合信息,提高用户分类精度。
Description
技术领域
本发明涉及数据分析技术领域,特别是涉及基于用户群分类的产品推荐方法、系统、设备及介质。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
随着技术的发展,在给不同用户群体推荐一些事物之前,例如在给不同用户推荐工作、电影、音乐、文章、理财产品等事物之前,通过了解每个用户的属性,有针对性地为不同用户推荐符合其个体属性特质的事物。
为了了解每个用户的属性特质,可通过调查问卷填写的形式,对每个用户进行调研,用户对调查问卷的问题一一进行回答,相关人员将填写完毕的调查问卷进行回收,然后基于问卷问题的答案,对用户进行分类,属于同一分类类别的用户,具有相似的属性特质。进而,后续有针对性地为不同用户推荐符合其个体属性特质的事物。
在实现本公开的过程中,发明人发现至少存在以下问题:
现有技术中用户填写的问卷答案可能不是用户真实想法,也可能因为用户的疏忽存在漏写和错写的情形,也有一些用户对调查问卷的问题不愿意配合一一回答,导致问卷不能准确划分用户的类型,进而相应产品的广告会没有针对性的发放,对产品不感兴趣的用户来说,无效广告信息会造成干扰,降低用户对产品的体验度。对产品感兴趣的用户来说,由于广告分类不够精准,导致用户自己需要对所有的产品再次进行梳理和挑选,需要大的精力和专业的识别能力;导致服务平台为客户提供的产品与客户需求匹配度降低的情况发生。
发明内容
为了解决现有技术的不足,本发明提供了基于用户群分类的产品推荐方法、系统、设备及介质,可以有效处理混合信息,提高用户分类精度。
一方面,提供了基于用户群分类的产品推荐方法;
基于用户群分类的产品推荐方法,应用于服务器,所述方法包括:
响应于终端发送的用户群分类请求,通过向投资交易平台发送数据获取请求,从所述投资交易平台中获取目标用户群的混合信息数据;
根据目标用户群的混合信息数据,确定目标用户群的聚类标签,所述聚类标签包括:保守型、稳健型和积极型;
根据目标用户群的聚类标签类型,向用户移动终端发送推荐的产品;
其中,根据目标用户群的混合信息数据,确定目标用户群的聚类标签,具体包括:对目标用户群的混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签。
另一方面,提供了基于用户群分类的产品推荐系统;
基于用户群分类的产品推荐系统,应用于服务器,所述系统包括:
发送模块,其被配置为:响应于终端发送的用户群分类请求,通过向投资交易平台发送数据获取请求,从所述投资交易平台中获取目标用户群的混合信息数据;
分类模块,其被配置为:根据目标用户群的混合信息数据,确定目标用户群的聚类标签,所述聚类标签包括:保守型、稳健型和积极型;
推荐模块,其被配置为:根据目标用户群的聚类标签类型,向用户移动终端发送推荐的产品;
其中,根据目标用户群的混合信息数据,确定目标用户群的聚类标签,具体包括:对目标用户群的混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签。
再一方面,还提供了一种电子设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
再一方面,还提供了一种存储介质,非暂时性存储计算机可读指令,其中,当非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
再一方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法。
上述技术方案中的一个技术方案具有如下优点或有益效果:
通过本公开实施例提供的方法,即使在用户拒绝填写调查问卷的情况下,仍能够通过获取目标用户群的行为数据确定目标用户对应的用户群聚类标签,进而实现产品的精准推荐,和产品广告的精准投放。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明一种基于粒计算的混合信息聚类方法的结构示意图;
图2是本发明实施例一提供的系统框架示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
随着社会经济的高速发展,经济水平不断提高,全民理财意识提升,虽然众多投资平台相继涌现,但却很少有为每一位注册的用户量身定制理财方案的服务,这项技术背后需要对投资意向人群有精准的分析与归类,因此,找到一种更为高效的聚类方法成为了当务之急。
目前,较为有效的针对混合数据的聚类算法有K均值聚类、模糊C均值聚类、高斯混合模型、基于密度的聚类算法和谱聚类,但上述聚类方法无法解决混合数据的数据异构性、纬度不同、数据空间尺度不同等难题。现有技术有人结合粒计算理论提出了一种样本粒化方法,提高了K均值聚类的收敛速度以及聚类效果,然而,上述聚类方法仅适用于数值型样本数据,无法用于混合数据,而且考虑到K均值聚类方法对噪声和异常值非常敏感的固有缺陷,该方法对投资平台用户混合信息的聚类效果并不精准。
本发明通过对全部用户的混合信息进行粒化,更好地表示了用户信息的不确定性和模糊性,克服了模糊C均值聚类对噪声和异常值敏感的固有缺陷。本发明得到的粒隶属度矩阵能够初步反映全部用户混合信息的归属类别,将从粒隶属度矩阵出发进行粒化得到的新的粒向量集用于构建粒邻接矩阵,能够更全面地反映全部用户混合信息间的相似性,提高谱聚类的结果精度。
实施例一
本实施例提供了基于用户群分类的产品推荐方法;
如图1所示,基于用户群分类的产品推荐方法,应用于服务器,所述方法包括:
响应于终端发送的用户群分类请求,通过向投资交易平台发送数据获取请求,从所述投资交易平台中获取目标用户群的混合信息数据;
根据目标用户群的混合信息数据,确定目标用户群的聚类标签,所述聚类标签包括:保守型、稳健型和积极型;
根据目标用户群的聚类标签类型,向用户移动终端发送推荐的产品;
其中,根据目标用户群的混合信息数据,确定目标用户群的聚类标签,具体包括:对目标用户群的混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签。
示例性地,如图2所示,所述服务器为银行平台使用,所述终端为银行的理财经理使用,所述投资交易平台为各种理财平台。
进一步地,所述对目标用户群的混合信息数据进行预处理,包括:
获取目标用户群的混合信息数据;所述混合信息数据,包括:性别、城市、职业、月平均收入、年收入预计增长率、投资记录、理财记录、贷款记录和消费记录;
对所述混合信息数据进行数据转换,转换为数值型数据;
对数据转换后的数据进行归一化处理。
进一步地,所述获取目标用户群的混合信息数据;对所述混合信息数据进行预处理,具体包括:
从投资平台获取全部用户的混合信息,其中,/>和/>分别表示用户混合信息的特征维数及投资平台的用户量,所述全部用户的混合信息的特征集合为,将所述全部用户的混合信息转换为数值型数据并按行归一化处理为全部用户的混合数据/>,将所述全部用户的混合数据按行逐用户排列形成预处理后的全部用户的混合数据集/>作为模糊/>均值聚类的输入,其中,/>表示一位用户的混合数据。
具体地,,/>。
具体地,所述混合信息的特征包含性别、城市、职业、月平均收入、月平均消费额、年收入预计增长率、存款额、投资金额、每月应还贷款等,将特征集合中的百分比型数据除以100转换为数值型数据,类别型数据进行离散赋值,文本型数据按聚类目的进行简单分类并打分赋值,城市文本以城市人均收入额为评价指标进行打分赋值,具体标准为:一线城市10分,新一线9分,二线城市8分,三线城市6分,四线城市4分,五线城市2分,职业文本以职业月平均收入(元)为评价指标进行赋值,具体标准为:学生1376,医生11268,教师10035,护士7000,事业单位6000,公务员5000,it行业18368,职员7343,白领9000,工人5753,无工作0,个体户18155,工程师10296,律师10680,金融12490,高管25000。
进一步地,所述对预处理后的混合信息数据进行粒化处理,生成第一粒向量集,包括:
将任意一位用户的混合数据在特征集合上进行粒化,形成其在特征集合上的粒向量/>,将预处理后的全部用户的混合数据集转换为粒向量集,其中,/>表示第/>位用户的混合数据/>在特征集合上进行粒化形成的粒向量。
进一步地,所述对预处理后的混合信息数据进行粒化处理,生成第一粒向量集,具体包括:
S102-1:任意两位用户的混合数据和/>在单特征/>上的相似度用/>表示,公式为:
,
其中,表示一位用户的混合数据,/>表示一个单特征,/>表示一位用户的混合数据/>在单特征/>上的值;
S102-2:任意一位用户的混合数据在单特征/>上进行粒化形成的粒子为:
,
其中,表示任意两位用户的混合数据/>和/>在单特征/>上的距离;
S102-3:任意一位用户的混合数据在特征集合/>上进行粒化形成的粒向量为:
,
其中,表示任意一位用户的混合数据/>在单特征/>上的粒子,为方便计,特征集合用整数标记为/>,粒向量表示为:
;
S102-4:预处理后的全部用户的混合数据集在特征集合/>上进行粒化形成粒向量集为:
,
其中,表示任意一位用户的混合数据/>在特征集合/>上的粒向量。
进一步地,所述通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式,具体包括:
S103-1:任意两位用户的混合数据和/>在单特征/>上的粒子和/>的加减运算公式为:
,
其中,和/>分别表示所述预处理后的全部用户的混合数据集/>中第/>位和第/>位用户的混合数据,它们在单特征/>上的粒子分别用/>和表示;
距离公式为:
,
其中,和/>分别表示所述预处理后的全部用户的混合数据集/>中第/>位和第/>位用户的混合数据,它们在单特征/>上的粒子分别用/>和表示,并且这两个粒子间的距离用/>表示;
S103-2:任意两个粒向量为和/>的距离/>公式为:
,
其中,和/>分别表示所述预处理后的全部用户的混合数据集/>中第/>位和第/>位用户的混合数据,它们在单特征/>上的粒子分别用/>和表示,在特征集合/>上进行粒化形成的粒向量分别用和/>表示,并且/>表示两个粒子/>和/>间的距离,/>表示两个粒向量/>和/>间的距离;
S103-3:初始化粒隶属度矩阵:
,
其中,表示粒向量/>隶属于粒聚类中心的初始化粒隶属度,/>为粒模糊/>均值聚类时输入的聚类数目;作为一种可实施方式,本实施例中,/>;
S103-4:构造粒聚类中心=/>,其更新公式为:
,
,
其中,表示第/>次更新后的粒聚类中心,/>表示第/>次更新后的粒向量隶属于粒聚类中心的粒隶属度,/>为粒模糊/>均值聚类时输入的模糊指数,/>;作为一种可实施方式,本实施例中,/>;
S103-5:构造粒隶属度矩阵的更新公式为:
,
,
其中,表示粒向量/>隶属于粒聚类中心的粒隶属度,/>表示粒向量/>和粒聚类中心/>间的距离。
进一步地,所述对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵,具体包括:
S104-1:将预处理后的全部用户的混合数据集,特征集合/>,聚类数目/>,模糊指数/>,迭代终止条件误差阈值/>和最大迭代次数/>作为模糊/>均值聚类的输入;作为一种可实施方式,本实施例中,/>,/>,/>,/>;
S104-2:模糊均值聚类通过在特征集合上粒化所述预处理后的全部用户的混合数据集形成粒向量集/>和通过粒向量集/>构造粒聚类中心/>及粒隶属度矩阵/>的更新公式,得到粒聚类中心/>及粒隶属度矩阵/>,其中,粒隶属度是投资平台借助模糊/>均值聚类得到的用户分类程度。
进一步地,所述在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集,包括:
将粒隶属度矩阵按行逐用户排列形成粒隶属度数据集,其中,表示一位用户的粒隶属度数据,将任意一位用户的粒隶属度数据/>在粒聚类中心上进行粒化形成其在粒聚类中心上的粒向量/>,粒隶属度数据集转换为新的粒向量集/>。
进一步地,所述在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集,具体包括:
S105-1:将粒隶属度矩阵按行逐用户排列形成粒隶属度数据集,其中,/>表示一位用户的粒隶属度数据;
S105-2:任意两位用户的粒隶属度数据和/>在单粒聚类中心上的相似度为:
,
其中,表示一位用户的粒隶属度数据/>在单粒聚类中心/>上的值;
S105-3:任意一位用户的粒隶属度数据在单粒聚类中心/>上进行粒化形成的粒子为:
,
其中,表示任意两位用户的粒隶属度数据/>和/>在单粒聚类中心/>上的距离;
S105-4:任意一位用户的粒隶属度数据在粒聚类中心/>上进行粒化形成的粒向量为:
,
其中,表示任意一位用户的粒隶属度数据/>在单粒聚类中心/>上的粒子,粒聚类中心用整数标记为/>,粒向量表示为:
;
S105-5:粒隶属度数据集在粒聚类中心/>上进行粒化形成新的粒向量集为:
,
其中,表示任意一位用户的粒隶属度数据/>在粒聚类中心/>上的粒向量。
进一步地,所述通过第二粒向量集,构建粒邻接矩阵,具体包括:
S106-1:任意两位用户的粒隶属度数据和/>在单粒聚类中心上的粒子/>和/>的加减运算公式和距离公式分别为:
,
;
S106-2:任意两个粒向量为和/>的距离公式为:
;
S106-3:通过新的粒向量集计算粒邻接矩阵和粒相似矩阵,计算公式为:
,
其中,粒邻接矩阵和粒相似矩阵完全相同,代表所述投资平台用户之间的相似程度,以便通过谱聚类获得用户的聚类标签。
上式定义粒邻接矩阵的方法是全连接法,且表示此时粒邻接矩阵和粒相似矩阵完全相同,代表所述投资平台用户之间的相似程度,以便通过谱聚类获得用户的聚类标签。
进一步地,所述对粒邻接矩阵进行谱聚类,得到最终的聚类标签,具体包括:
S107-1:通过粒邻接矩阵计算粒拉普拉斯矩阵:
,
其中,粒度矩阵是顶点的度的对角矩阵,是顶点的度;
S107-2:将粒拉普拉斯矩阵最小的个特征值所各自对应的特征向量组成的特征矩阵/>;作为一种可实施方式,本实施例中,/>;
S107-3:将粒隶属度矩阵作为谱聚类的输入,将个用户的混合数据聚成/>类,得到最终类别标签向量/>。作为一种可实施方式,本实施例中,/>。
本发明克服了原有聚类方法相似度矩阵构建不准确的不足,有效提高了聚类结果的目标针对性和分类精确度。
具体的聚类标签如表1所示:
表1 最终类别标签
其中,1,2,3,4,5,6代表每个用户所属的类别(通过该算法将338位用户分成了6类)。1和2表示保守型用户;3和4表示稳健型用户;5和6表示积极型用户。将投资产品或理财产品也分成保守型、稳健型和积极型,根据用户的分类分配给不同的用户群体,实现广告的精准投放,避免给用户产生信息干扰。
实施例二
本实施例提供了基于用户群分类的产品推荐系统;
基于用户群分类的产品推荐系统,应用于服务器,所述系统包括:
发送模块,其被配置为:响应于终端发送的用户群分类请求,通过向投资交易平台发送数据获取请求,从所述投资交易平台中获取目标用户群的混合信息数据;
分类模块,其被配置为:根据目标用户群的混合信息数据,确定目标用户群的聚类标签,所述聚类标签包括:保守型、稳健型和积极型;
推荐模块,其被配置为:根据目标用户群的聚类标签类型,向用户移动终端发送推荐的产品;
其中,根据目标用户群的混合信息数据,确定目标用户群的聚类标签,具体包括:对目标用户群的混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签。
此处需要说明的是,上述发送模块和分类模块对应于实施例一中的步骤S101至S102,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤能够通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.基于用户群分类的产品推荐方法,其特征是,应用于服务器,所述方法包括:
响应于终端发送的用户群分类请求,通过向投资交易平台发送数据获取请求,从所述投资交易平台中获取目标用户群的混合信息数据;
根据目标用户群的混合信息数据,确定目标用户群的聚类标签,所述聚类标签包括:保守型、稳健型和积极型;
根据目标用户群的聚类标签类型,向用户移动终端发送推荐的产品;
其中,根据目标用户群的混合信息数据,确定目标用户群的聚类标签,具体包括:对目标用户群的混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签;
所述混合信息数据,包括:性别、城市、职业、月平均收入、月平均消费额、年收入预计增长率、存款额、投资金额、每月应还贷款、投资记录、理财记录、贷款记录和消费记录;
所述对预处理后的混合信息数据进行粒化处理,生成第一粒向量集,具体包括:
2-1:任意两位用户的混合数据和/>在单特征/>上的相似度用表示,公式为:
,
其中,表示一位用户的混合数据,/>表示一个单特征,/>表示一位用户的混合数据/>在单特征/>上的值;
2-2:任意一位用户的混合数据在单特征/>上进行粒化形成的粒子为:
,
其中,表示任意两位用户的混合数据/>和/>在单特征/>上的距离;
2-3:任意一位用户的混合数据在特征集合/>上进行粒化形成的粒向量为:
,
其中,表示任意一位用户的混合数据/>在单特征/>上的粒子,为方便计,特征集合用整数标记为/>,粒向量表示为:
;
2-4:预处理后的全部用户的混合数据集在特征集合/>上进行粒化形成粒向量集为:
,
其中,表示任意一位用户的混合数据/>在特征集合/>上的粒向量;
所述通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式,具体包括:
3-1:任意两位用户的混合数据和/>在单特征/>上的粒子和/>的加减运算公式为:
,
其中,和/>分别表示所述预处理后的全部用户的混合数据集/>中第/>位和第/>位用户的混合数据,它们在单特征/>上的粒子分别用/>和表示;
距离公式为:
,
其中,和/>分别表示所述预处理后的全部用户的混合数据集/>中第/>位和第/>位用户的混合数据,它们在单特征/>上的粒子分别用/>和表示,并且这两个粒子间的距离用/>表示;
3-2:任意两个粒向量为和/>的距离/>公式为:
,
其中,和/>分别表示所述预处理后的全部用户的混合数据集/>中第/>位和第/>位用户的混合数据,它们在单特征/>上的粒子分别用/>和表示,在特征集合/>上进行粒化形成的粒向量分别用和/>表示,并且/>表示两个粒子/>和/>间的距离,/>表示两个粒向量/>和/>间的距离;
3-3:初始化粒隶属度矩阵:
,
其中,表示粒向量/>隶属于粒聚类中心的初始化粒隶属度,/>为粒模糊/>均值聚类时输入的聚类数目;
3-4:构造粒聚类中心=/>,其更新公式为:
,
,
其中,表示第/>次更新后的粒聚类中心,/>表示第/>次更新后的粒向量/>隶属于粒聚类中心的粒隶属度,/>为粒模糊/>均值聚类时输入的模糊指数,/>;
3-5:构造粒隶属度矩阵的更新公式为:
,
,
其中,表示粒向量/>隶属于粒聚类中心的粒隶属度,/>表示粒向量和粒聚类中心/>间的距离;
所述对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵,具体包括:
4-1:将预处理后的全部用户的混合数据集,特征集合/>,聚类数目/>,模糊指数/>,迭代终止条件误差阈值/>和最大迭代次数/>作为模糊/>均值聚类的输入;
4-2:模糊均值聚类通过在特征集合上粒化所述预处理后的全部用户的混合数据集形成粒向量集/>和通过粒向量集/>构造粒聚类中心/>及粒隶属度矩阵/>的更新公式,得到粒聚类中心/>及粒隶属度矩阵/>,其中,粒隶属度是投资平台借助模糊/>均值聚类得到的用户分类程度;
所述在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集,具体包括:
5-1:将粒隶属度矩阵按行逐用户排列形成粒隶属度数据集,其中,表示一位用户的粒隶属度数据;
5-2:任意两位用户的粒隶属度数据和/>在单粒聚类中心/>上的相似度为:
,
其中,表示一位用户的粒隶属度数据/>在单粒聚类中心/>上的值;
5-3:任意一位用户的粒隶属度数据在单粒聚类中心/>上进行粒化形成的粒子为:
,
其中,表示任意两位用户的粒隶属度数据/>和/>在单粒聚类中心/>上的距离;
5-4:任意一位用户的粒隶属度数据在粒聚类中心/>上进行粒化形成的粒向量为:
,
其中,表示任意一位用户的粒隶属度数据/>在单粒聚类中心/>上的粒子,粒聚类中心用整数标记为/>,粒向量表示为:
;
5-5:粒隶属度数据集在粒聚类中心/>上进行粒化形成新的粒向量集为:
,
其中,表示任意一位用户的粒隶属度数据/>在粒聚类中心/>上的粒向量;
所述通过第二粒向量集,构建粒邻接矩阵,具体包括:
6-1:任意两位用户的粒隶属度数据和/>在单粒聚类中心/>上的粒子/>和/>的加减运算公式和距离公式分别为:
,
;
6-2:任意两个粒向量为和/>的距离公式为:
;
6-3:通过新的粒向量集计算粒邻接矩阵和粒相似矩阵/>,计算公式为:
,
其中,粒邻接矩阵和粒相似矩阵完全相同,代表所述投资平台用户之间的相似程度,以便通过谱聚类获得用户的聚类标签;
所述对粒邻接矩阵进行谱聚类,得到最终的聚类标签,具体包括:
7-1:通过粒邻接矩阵计算粒拉普拉斯矩阵:
,
其中,粒度矩阵是顶点的度的对角矩阵,/>是顶点的度;
7-2:将粒拉普拉斯矩阵最小的个特征值所各自对应的特征向量组成的特征矩阵;
7-3:将粒隶属度矩阵作为谱聚类的输入,将个用户的混合数据聚成/>类,得到最终类别标签向量/>。
2.如权利要求1所述的基于用户群分类的产品推荐方法,其特征是,对目标用户群的混合信息数据进行预处理,包括:
对所述混合信息数据进行数据转换,转换为数值型数据;
对数据转换后的数据进行归一化处理。
3.如权利要求1所述的基于用户群分类的产品推荐方法,其特征是,一种基于用户群分类的产品推荐系统,应用于服务器,所述系统包括:
发送模块,其被配置为:响应于终端发送的用户群分类请求,通过向投资交易平台发送数据获取请求,从所述投资交易平台中获取目标用户群的混合信息数据;
分类模块,其被配置为:根据目标用户群的混合信息数据,确定目标用户群的聚类标签,所述聚类标签包括:保守型、稳健型和积极型;
推荐模块,其被配置为:根据目标用户群的聚类标签类型,向用户移动终端发送推荐的产品;
其中,根据目标用户群的混合信息数据,确定目标用户群的聚类标签,具体包括:对目标用户群的混合信息数据进行预处理;对预处理后的混合信息数据进行粒化处理,生成第一粒向量集;通过第一粒向量集,构造粒聚类中心和粒隶属度矩阵的更新公式;对粒聚类中心和粒隶属度矩阵的更新公式,采用模糊C均值聚类算法,得到粒聚类中心和粒隶属度矩阵;在粒聚类中心上粒化所述粒隶属度矩阵,生成第二粒向量集;通过第二粒向量集,构建粒邻接矩阵;对粒邻接矩阵进行谱聚类,得到最终的聚类标签。
4.一种电子设备,其特征是,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求1-2任一项所述的方法。
5.一种存储介质,其特征是,非暂时性存储计算机可读指令,其中,当非暂时性计算机可读指令由计算机执行时,执行权利要求1-2任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311329096.1A CN117078359B (zh) | 2023-10-16 | 2023-10-16 | 基于用户群分类的产品推荐方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311329096.1A CN117078359B (zh) | 2023-10-16 | 2023-10-16 | 基于用户群分类的产品推荐方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117078359A CN117078359A (zh) | 2023-11-17 |
CN117078359B true CN117078359B (zh) | 2024-01-12 |
Family
ID=88717463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311329096.1A Active CN117078359B (zh) | 2023-10-16 | 2023-10-16 | 基于用户群分类的产品推荐方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117078359B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117574286B (zh) * | 2024-01-11 | 2024-05-24 | 阿里健康科技(杭州)有限公司 | 标签值的确定方法、装置、设备和存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150610A (zh) * | 2013-02-28 | 2013-06-12 | 哈尔滨工业大学 | 基于模糊信息粒化与支持向量机的供热负荷预报方法 |
CN107633444A (zh) * | 2017-08-29 | 2018-01-26 | 南京理工大学紫金学院 | 基于信息熵与模糊c均值聚类的推荐系统噪声过滤方法 |
CN109165383A (zh) * | 2018-08-09 | 2019-01-08 | 四川政资汇智能科技有限公司 | 一种基于云平台的数据汇聚、分析、挖掘与共享方法 |
CN109840530A (zh) * | 2017-11-24 | 2019-06-04 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
WO2020133398A1 (zh) * | 2018-12-29 | 2020-07-02 | 深圳市欢太科技有限公司 | 应用推荐方法、装置、服务器和计算机可读存储介质 |
CN112560921A (zh) * | 2020-12-10 | 2021-03-26 | 百维金科(上海)信息科技有限公司 | 一种基于模糊c-均值的互联网金融平台申请欺诈行为检测方法 |
CN112632373A (zh) * | 2020-12-14 | 2021-04-09 | 华东师范大学 | 一种基于概率矩阵分解的个性化推荐方法、设备、计算机可读存储介质 |
CN113034246A (zh) * | 2021-04-29 | 2021-06-25 | 中国工商银行股份有限公司 | 理财产品推荐方法及装置 |
CN114611004A (zh) * | 2022-03-22 | 2022-06-10 | 平安普惠企业管理有限公司 | 内容信息的推荐方法、装置、计算机设备及存储介质 |
CN114817741A (zh) * | 2022-05-09 | 2022-07-29 | 中国工商银行股份有限公司 | 一种理财产品精准推荐方法及装置 |
CN115392975A (zh) * | 2022-08-30 | 2022-11-25 | 桂林理工大学 | 一种基于Canopy模糊聚类和奇异值分解的个性化推荐方法 |
CN115731054A (zh) * | 2022-11-30 | 2023-03-03 | 泰康保险集团股份有限公司 | 待推荐对象组合的确定方法、装置及存储介质 |
CN116361677A (zh) * | 2023-04-10 | 2023-06-30 | 北京工业大学 | 一种基于差分隐私保护机制的粒子群模糊c均值聚类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021007744A1 (zh) * | 2019-07-15 | 2021-01-21 | 广东工业大学 | 一种集成空间约束的核模糊c均值快速聚类算法 |
-
2023
- 2023-10-16 CN CN202311329096.1A patent/CN117078359B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150610A (zh) * | 2013-02-28 | 2013-06-12 | 哈尔滨工业大学 | 基于模糊信息粒化与支持向量机的供热负荷预报方法 |
CN107633444A (zh) * | 2017-08-29 | 2018-01-26 | 南京理工大学紫金学院 | 基于信息熵与模糊c均值聚类的推荐系统噪声过滤方法 |
CN109840530A (zh) * | 2017-11-24 | 2019-06-04 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN109165383A (zh) * | 2018-08-09 | 2019-01-08 | 四川政资汇智能科技有限公司 | 一种基于云平台的数据汇聚、分析、挖掘与共享方法 |
WO2020133398A1 (zh) * | 2018-12-29 | 2020-07-02 | 深圳市欢太科技有限公司 | 应用推荐方法、装置、服务器和计算机可读存储介质 |
CN112560921A (zh) * | 2020-12-10 | 2021-03-26 | 百维金科(上海)信息科技有限公司 | 一种基于模糊c-均值的互联网金融平台申请欺诈行为检测方法 |
CN112632373A (zh) * | 2020-12-14 | 2021-04-09 | 华东师范大学 | 一种基于概率矩阵分解的个性化推荐方法、设备、计算机可读存储介质 |
CN113034246A (zh) * | 2021-04-29 | 2021-06-25 | 中国工商银行股份有限公司 | 理财产品推荐方法及装置 |
CN114611004A (zh) * | 2022-03-22 | 2022-06-10 | 平安普惠企业管理有限公司 | 内容信息的推荐方法、装置、计算机设备及存储介质 |
CN114817741A (zh) * | 2022-05-09 | 2022-07-29 | 中国工商银行股份有限公司 | 一种理财产品精准推荐方法及装置 |
CN115392975A (zh) * | 2022-08-30 | 2022-11-25 | 桂林理工大学 | 一种基于Canopy模糊聚类和奇异值分解的个性化推荐方法 |
CN115731054A (zh) * | 2022-11-30 | 2023-03-03 | 泰康保险集团股份有限公司 | 待推荐对象组合的确定方法、装置及存储介质 |
CN116361677A (zh) * | 2023-04-10 | 2023-06-30 | 北京工业大学 | 一种基于差分隐私保护机制的粒子群模糊c均值聚类方法 |
Non-Patent Citations (4)
Title |
---|
"基于差分隐私保护的模糊C均值聚类推荐";蒋宗礼 等;《计算机系统应用》;第27卷(第10期);第189-195页 * |
"基于模糊C均值聚类的环境感知推荐算法";张付志 等;《计算机研究与发展》;第50卷(第10期);第2185-2194页 * |
"基于用户模糊聚类的个性化推荐研究";胡朝举 等;《软件导刊》;第17卷(第2期);第31-34页 * |
Rahul Katarya,et al.."Recommender system with grey wolf optimizer and FCM".《Neural Comput & Applic》.2016,第30卷第1679-1687页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117078359A (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021114974A1 (zh) | 用户风险评估方法及装置、电子设备、存储介质 | |
CN117078359B (zh) | 基于用户群分类的产品推荐方法、系统、设备及介质 | |
WO2022105525A1 (zh) | 预测用户概率的方法、装置和计算机设备 | |
US20160342750A1 (en) | Dynamic topological system and method for efficient claims processing | |
CN110751286A (zh) | 神经网络模型的训练方法和训练系统 | |
CN113781139B (zh) | 物品推荐方法、物品推荐装置、设备和介质 | |
CN112950347B (zh) | 资源数据处理的优化方法及装置、存储介质、终端 | |
Yue et al. | Enterprise financial risk management using information fusion technology and big data mining | |
CN110097287A (zh) | 一种物流司机的群体画像方法 | |
Lu et al. | Credit rating change modeling using news and financial ratios | |
CN111259931A (zh) | 一种用户分组以及活跃度确定方法及系统 | |
CN112102006A (zh) | 基于大数据分析的目标客户获取方法、搜索方法及装置 | |
CN113159213A (zh) | 一种业务分配方法、装置及设备 | |
CN115115369A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111652708A (zh) | 一种应用于房屋抵押贷款产品中的风险评估方法及装置 | |
Tu et al. | A novel grey relational clustering model under sequential three-way decision framework | |
Mu et al. | Internet financial interest rate risk measure based on genetic rough set reduction | |
Chen et al. | Quantum Optimized Cost Based Feature Selection and Credit Scoring for Mobile Micro-financing | |
Shah et al. | A Three-Way Clustering Mechanism to Handle Overlapping Regions | |
Qi et al. | Recommendations based on social relationships in mobile services | |
CN113436001A (zh) | 信用卡的推送方法、装置、设备、存储介质和程序产品 | |
Le et al. | A weighted centroids approach based trapezoidal interval type-2 fuzzy TOPSIS method for evaluating agricultural risk management tools | |
Zong et al. | A SOM‐Based Customer Stratification Model | |
Railiene | Comparison of borrower default factors in online lending | |
Haupert | Racial and spatial disparities in fintech mortgage lending in the United States |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |