CN111581503A - 模糊k邻近的推荐方法和装置、电子设备以及存储介质 - Google Patents
模糊k邻近的推荐方法和装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN111581503A CN111581503A CN202010338355.7A CN202010338355A CN111581503A CN 111581503 A CN111581503 A CN 111581503A CN 202010338355 A CN202010338355 A CN 202010338355A CN 111581503 A CN111581503 A CN 111581503A
- Authority
- CN
- China
- Prior art keywords
- user
- similarity
- fuzzy
- matrix
- personal information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 239000011159 matrix material Substances 0.000 claims abstract description 196
- 238000005516 engineering process Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 21
- 238000005259 measurement Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 19
- 238000011524 similarity measure Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供的模糊K邻近的推荐方法和装置、电子设备以及存储介质,该方法包括:根据预获取的个人信息矩阵得到用户‑用户个人信息相似度矩阵;根据预获取的用户‑项目评分矩阵获取用户‑用户相似度权重系数矩阵以及用户‑用户模糊相似度矩阵;根据所述用户‑用户个人信息相似度矩阵、所述用户‑用户相似度权重系数矩阵以及所述用户‑用户模糊相似度矩阵获取用户‑用户综合相似度矩阵;将所述用户‑用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品,提高了推荐准确度。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种模糊K邻近的推荐方法和装置、电子设备以及存储介质。
背景技术
随着信息技术的发展,数据信息呈几何级的增长,大量数据信息经常会导致用户迷失,无法顺利找到自己需要的信息,造成很多不便。推荐系统基于数据挖掘、协同过滤等技术,帮助用户推荐需要的信息,一经提出,便成为研究热点。多年来,技术人员研发出多种不同的推荐系统。
推荐系统常用的推荐算法有基于内容的推荐、协同过滤推荐、基于管理规则推荐等,但是,现有推荐算法往往考虑的因素比较片面,导致推荐的准确度不高。
发明内容
针对现有技术中的问题,本发明提供一种模糊K邻近的推荐方法和装置、电子设备以及存储介质,能够至少部分地解决现有技术中存在的问题。
为了实现上述目的,本发明采用如下技术方案:
第一方面,提供一种模糊K邻近的推荐方法,包括:
根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;
根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;
根据该用户-用户个人信息相似度矩阵、该用户-用户相似度权重系数矩阵以及该用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;
将该用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与该被推荐用户相似度满足预设条件的用户;
根据与该被推荐用户相似度满足预设条件的用户的评分信息向该被推荐用户推荐产品。
进一步地,模糊K邻近的推荐方法还包括:
根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
进一步地,该根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵,包括:
对该用户-项目评分矩阵进行相似度权重系数计算得到该用户-用户相似度权重系数矩阵;
对该用户-项目评分矩阵进行模糊化和模糊相似度处理得到该用户-用户模糊相似度矩阵。
进一步地,该对该用户-项目评分矩阵进行模糊化和模糊相似度处理得到该用户-用户模糊相似度矩阵,包括:
将该用户-项目评分矩阵中的原始评分模糊成一组三角模糊数,得到模糊用户-项目评分矩阵;
利用模糊相似度度量技术对该模糊用户-项目评分矩阵进行计算得到该用户-用户模糊相似度矩阵。
进一步地,该模糊相似度度量技术为模糊均方差相似度度量技术、模糊余弦相似度度量技术或模糊Pearson相似度度量技术。
进一步地,该对该用户-项目评分矩阵进行相似度权重系数计算得到该用户-用户相似度权重系数矩阵采用相似度权重系数计算公式实现,该相似度权重系数计算公式为:
其中,Jaccard(u1,u2)为用户u1和用户u2之间的相似度权重系数,表示用户u1评价过的产品,表示用户u2评价过的产品,表示用户u1和用户u2均评价过的产品的种类;表示用户u1和用户u2评价过的所有产品的种类。
进一步地,该根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵,采用如下公式:
其中,Uinf_sim(u1,u2)为用户u1和用户u2之间的个人信息相似度,A12为用户u1和用户u2之间的年龄差,k为常数,G12为用户u1和用户u2之间的性别差,用户u1和用户u2性别相同取0,用户u1和用户u2性别不同取1,P12为用户u1和用户u2之间的职业差,用户u1和用户u2职业相同取0,用户u1和用户u2职业不同取1,O12为其他信息差。
进一步地,该根据该用户-用户个人信息相似度矩阵、该用户-用户相似度权重系数矩阵以及该用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵,采用如下公式:
u_sim(u1,u2)=(1-α)fuzzy_sim(u1,u2)+α·Uinf_sim(u1,u2)
U_sim(u1,u2)=Jaccrad(u1,u2)·u_sim(u1,u2)
其中,α为常数,且α∈[0,1],代表模糊相似度和个人信息相似度在综合相似度里所占比例;Jaccrad(u1,u2)为用户u1和用户u2之间的相似度权重系数,u_sim(u1,u2)表示用户u1和用户u2之间的加权相似度,fuzzy_sim(u1,u2)表示用户u1和用户u2之间的模糊相似度,Uinf_sim(u1,u2)为用户u1和用户u2之间的综合相似度。
第二方面,提供一种模糊K邻近的推荐装置,包括:
个人相似度获取模块,根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;
模糊相似度和系数获取模块,根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;
加权计算模块,根据该用户-用户个人信息相似度矩阵、该用户-用户相似度权重系数矩阵以及该用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;
聚类模块,将该用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与该被推荐用户相似度满足预设条件的用户;
推荐模块,根据与该被推荐用户相似度满足预设条件的用户的评分信息向该被推荐用户推荐产品。
进一步地,该模糊K邻近的推荐装置还包括:
数据预处理模块,根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
进一步地,该模糊相似度和系数获取模块包括:
权重系数计算单元,对该用户-项目评分矩阵进行相似度权重系数计算得到该用户-用户相似度权重系数矩阵;
模糊相似度计算单元,对该用户-项目评分矩阵进行模糊化和模糊相似度处理得到该用户-用户模糊相似度矩阵。
进一步地,该模糊相似度计算单元包括:
模糊处理子单元,将该用户-项目评分矩阵中的原始评分模糊成一组三角模糊数,得到模糊用户-项目评分矩阵;
模糊相似度计算子单元,利用模糊相似度度量技术对该模糊用户-项目评分矩阵进行计算得到该用户-用户模糊相似度矩阵。
进一步地,该模糊相似度度量技术为模糊均方差相似度度量技术、模糊余弦相似度度量技术或模糊Pearson相似度度量技术。
第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的模糊K邻近的推荐方法的步骤。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的模糊K邻近的推荐方法的步骤。
本发明提供的模糊K邻近的推荐方法和装置、电子设备以及存储介质,该方法包括:根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;将所述用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品,其中,综合考虑了用户个人信息相似度、用户相似度权重系数以及用户模糊相似度,并结合了K邻近算法,提高了推荐准确度。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中的服务器S1与客户端设备B1之间的架构示意图;
图2为本发明实施例中的服务器S1、客户端设备B1及数据库服务器S2之间的架构示意图;
图3是本发明实施例中的模糊K邻近的推荐方法的流程示意图一;
图4是本发明实施例中的模糊K邻近的推荐方法的流程示意图二;
图5示出图3或图4中步骤S200的具体步骤;
图6示出了图5中步骤S220的具体步骤;
图7是本发明实施例中的模糊K邻近的推荐装置的结构框图;
图8为本发明实施例电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
推荐系统常用的推荐算法有基于内容的推荐、协同过滤推荐、基于管理规则推荐等,但是,现有推荐算法往往考虑的因素比较片面,导致推荐的准确度不高。
为至少部分解决现有技术中的上述技术问题,本发明实施例提供了一种模糊K邻近的推荐方法,综合考虑了用户个人信息相似度、用户相似度权重系数以及用户模糊相似度,并结合了K邻近算法,提高了推荐准确度。
有鉴于此,本申请提供了一种模糊K邻近的推荐装置,该装置可以为一种服务器S1,参见图1,该服务器S1可以与至少一个客户端设备B1通信连接,所述客户端设备B1可以将被推荐用户标识发送至所述服务器S1,所述服务器S1可以在线接收被推荐用户标识。所述服务器S1可以在线或者离线对获取的被推荐用户标识进行预处理,根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;将所述用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品。而后,所述服务器S1可以将推荐的产品在线发送至所述客户端设备B1。所述客户端设备B1可以在线接收所述推荐的产品。
另外,参见图2,所述服务器S1还可以与至少一个数据库服务器S2通信连接,所述数据库服务器S2用于存储用户个人信息以及评分信息。所述数据库服务器S2在线将所述用户个人信息以及评分信息发送至所述服务器S1,所述服务器S1可以在线接收所述用户个人信息以及评分信息,而后根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
基于上述内容,所述客户端设备B1可以具有显示界面,使得用户能够根据界面查看所述服务器S1发送的所述推荐的产品。
可以理解的是,所述客户端设备B1可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,进行模糊K邻近的推荐的部分可以在如上述内容所述的服务器S1侧执行,即,如图1所示的架构,也可以所有的操作都在所述客户端设备B1中完成,且该所述客户端设备B1可以直接与数据库服务器S2进行通信连接。具体可以根据所述客户端设备B1的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备B1中完成,所述客户端设备B1还可以包括处理器,用于进行模糊K邻近的推荐的具体处理。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
图3是本发明实施例中的模糊K邻近的推荐方法的流程示意图一;如图3所示,该模糊K邻近的推荐方法可以包括以下内容:
步骤S100:根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;
其中,个人信息矩阵由海量的用户个人信息得到,个人信息可以包括用户的性别、年龄、职业、学历以及居住地等。
具体地:个人信息矩阵有用户个人信息组成,具体可如表1所示:
表1
用户标识 | 性别 | 年龄 | 职业 |
A | …… | …… | …… |
B | …… | …… | …… |
C | …… | …… | …… |
另外,用户-用户个人信息相似度矩阵表示用户之间的个人信息的相似度,可如表2所示:
表2
步骤S200:根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;
具体地,用户-项目评分矩阵由用户的对项目或产品的评价信息得到。
其中,用户-项目评分矩阵表示了用户对多个项目的评分情况,可如表3所示:
表3
用户标识 | 项目1 | 项目2 | 项目3 |
A | A对项目1的评分 | A对项目2的评分 | A对项目3的评分 |
B | B对项目1的评分 | B对项目2的评分 | B对项目3的评分 |
C | C对项目1的评分 | C对项目2的评分 | C对项目3的评分 |
值得说明的是,若用户对某一项目没有进行评分,则对应位置的数值为空或者为0。
另外,用户-用户相似度权重系数矩阵表示用户之间评价信息的相似度,可如表4所示:
表4
步骤S300:根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;
具体地,用户-用户综合相似度矩阵由各个用户之间的综合相似度组成,具体可如表5所示:
表5
A | B | C | |
A | 1 | A和B的综合相似度 | A和C的综合相似度 |
B | B和A的综合相似度 | 1 | B和C的综合相似度 |
C | C和A的综合相似度 | C和B的综合相似度 | 1 |
步骤S400:将所述用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;
具体地,KNN模型实现K邻近算法,具体是基于被推荐用户标识,以用户-用户综合相似度矩阵作为用户之间的距离,对用户进行聚类,以便得到与所述被推荐用户相似度满足预设条件的用户,KNN模型可通过PYTHON调用。
步骤S500:根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品。
具体地,根据与所述被推荐用户相似度满足预设条件的用户的评分信息,将评分信息中评分靠前的一些项目或产品推荐给被推荐用户。
综上所述,本发明实施例提供的模糊K邻近的推荐方法,综合考虑了用户个人信息相似度、用户相似度权重系数以及用户模糊相似度,并结合了K邻近算法,很好地解决现有模型少有利用用户本身的一些自然属性或者社会属性的问题,有效避免了单一推荐因素导致的推荐结果不准确问题。特别的,该推荐系统相对其他推荐系统来说拥有更高的可解释性,在实际应用中能更好地服务于理财经验不足的用户或者销售经理,推荐原理也是非常浅显易懂的。
在一个可选的实施例,参见图4,该模糊K邻近的推荐方法还可以包括:
步骤S10:根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
具体地,评分信息是与个人信息对应的评分情况。
另外,海量的用户个人信息以及评分信息可由产品业务系统得到。
在一个可选的实施例中,参见图5,该步骤S200可以包括以下内容:
步骤S210:对所述用户-项目评分矩阵进行相似度权重系数计算得到所述用户-用户相似度权重系数矩阵;
具体地,采用相似度权重系数计算公式实现,该相似度权重系数计算公式为:
其中,Jaccard(u1,u2)为用户u1和用户u2之间的相似度权重系数,表示用户u1评价过的产品,表示用户u2评价过的产品,表示用户u1和用户u2均评价过的产品的种类;表示用户u1和用户u2评价过的所有产品的种类。
步骤S220:对所述用户-项目评分矩阵进行模糊化和模糊相似度处理得到所述用户-用户模糊相似度矩阵。
其中,通过采用上述技术方案,能够准确得到用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵,进一步提高了推荐准确度。
在一个可选的实施例中,参见图6,该步骤S220可以包括以下内容:
步骤S221:将所述用户-项目评分矩阵中的原始评分模糊成一组三角模糊数,得到模糊用户-项目评分矩阵。
即:用模糊学数学中三角模糊数(如表6所示)转化用户-项目评分矩阵,将用户-项目评分矩阵中用户对项目的原始评分rui模糊成一组三角模糊数Frui=(lui,mui,uui),其中,u表示用户u,使用三角模糊数代替原始评分进行用户-项目评分相似度计算。
表6三角模糊数对应表
步骤S222:利用模糊相似度度量技术对所述模糊用户-项目评分矩阵进行计算得到所述用户-用户模糊相似度矩阵。
其中,模糊相似度度量技术为模糊均方差相似度度量技术、模糊余弦相似度度量技术或模糊Pearson相似度度量技术。
具体采用如下公式实现:
模糊均方差相似度度量公式如下:
M1和M2分别表示用户1和用户2的三角模糊评分,fuzzy_msd_sim(M1,M2)表示M1和M2之间的模糊均方差相似度,l1i和l2i、u1i和u2i表示M1和M2中的三角模糊数。
模糊余弦相似度度量公式如下:
其中,M1和M2分别表示用户1和用户2的三角模糊评分,fuzzy_cos_sim(M1,M2)表示M1和M2之间的模糊余弦相似度,l1i和l2i、u1i和u2i表示M1和M2中的三角模糊数。
模糊Pearson相似度度量公式如下:
M1i=(l1i,m1i,u1i)为M1中第i个模糊数,M2i=(l2i,m2i,u2i)为M2中第i个模糊数,其中,第i个是指第i个项目,相应的,M1i是指M1给第i个项目的三角模糊评分,分别为M1和M2的所有过渡点平均数,fuzzy_pesrson_sim(M1,M2)表示M1和M2之间的模糊Pearson相似度。
其中,通过采用上述技术方案,能够准确得到用户-用户模糊相似度矩阵,进一步提高推荐准确度。
在一个可选的实施例中,所述根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵,采用如下公式:
其中,Uinf_sim(u1,u2)为用户u1和用户u2之间的个人信息相似度,A12为用户u1和用户u2之间的年龄差,k为常数,G12为用户u1和用户u2之间的性别差,用户u1和用户u2性别相同取0,用户u1和用户u2性别不同取1,P12为用户u1和用户u2之间的职业差,用户u1和用户u2职业相同取0,用户u1和用户u2职业不同取1,O12为其他信息差,值得说明的是,其他信息差O12是一个可拓展的项,例如:地域、收入、结婚状况、健康状况等,设置其他信息差,主要是为了实际应用时能运用到相应的有效的个人信息项。如果有,则取值;没有,则为0。
通过采用上述技术方案,能够准确得到用户-用户个人信息相似度矩阵,进一步提高推荐准确度。
在一个可选的实施例中,所述根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵,采用如下公式:
u_sim(u1,u2)=(1-α)fuzzy_sim(u1,u2)+α·Uinf_sim(u1,u2)
U_sim(u1,u2)=Jaccrad(u1,u2)·u_sim(u1,u2)
其中,α为常数,且α∈[0,1],代表模糊相似度和个人信息相似度在综合相似度里所占比例;Jaccrad(u1,u2)为用户u1和用户u2之间的相似度权重系数,u_sim(u1,u2)表示用户u1和用户u2之间的加权相似度,fuzzy_sim(u1,u2)表示用户u1和用户u2之间的模糊相似度,Uinf_sim(u1,u2)为用户u1和用户u2之间的综合相似度。
通过采用上述技术方案,能够准确得到用户-用户综合相似度矩阵,进一步提高推荐准确度。
综上所述,本发明实施例提供的模糊K邻近的推荐方法,可用于银行理财产品进行个性化推荐等,对用户历史数据(包括评分信息、购买记录和浏览记录)和用户个人信息(包括性别、年龄、职业等等)进行分析,通过模糊数学对用户-项目评分矩阵进行模糊化处理,利用模糊相似度度量公式计算获取用户-用户模糊相似度矩阵,利用用户个人信息计算得到用户-用户个人信息相似度矩阵,结合用户-用户Jaccard系数矩阵,进行加权计算,得到用户-用户综合相似度矩阵,用于减少稀疏性问题,通过K邻近算法得出推荐的产品,实现更可靠和准确的最终推荐。其中,不仅仅是从用户的历史数据来分析用户与用户之间的相似度,还利用用户本身的自然属性或社会属性,在保证准确性的同时,增加相似度的可靠性,解决传统协同过滤算法往往忽略用户本身的个人信息问题和K邻近算法因数据类别不规范导致算法不稳定的问题,从利用用户本体的个人信息和评分模糊入手,结合人口学和模糊数学,实现模糊K邻近的产品推荐,提升了算法鲁棒性及稳定性。
基于同一发明构思,本申请实施例还提供了一种模糊K邻近的推荐装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于模糊K邻近的推荐装置解决问题的原理与上述方法相似,因此模糊K邻近的推荐装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是本发明实施例中的模糊K邻近的推荐装置的结构框图。如图7所示,该模糊K邻近的推荐装置具体包括:个人相似度获取模块10、模糊相似度和系数获取模块20、加权计算模块30、聚类模块40以及推荐模块50。
个人相似度获取模块10根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;
模糊相似度和系数获取模块20根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;
加权计算模块30根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;
聚类模块40将所述用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;
推荐模块50根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品。
本发明实施例提供的模糊K邻近的推荐装置,综合考虑了用户个人信息相似度、用户相似度权重系数以及用户模糊相似度,并结合了K邻近算法,很好地解决现有模型少有利用用户本身的一些自然属性或者社会属性的问题,有效避免了单一推荐因素导致的推荐结果不准确问题。特别的,该推荐系统相对其他推荐系统来说拥有更高的可解释性,在实际应用中能更好地服务于理财经验不足的用户或者销售经理,推荐原理也是非常浅显易懂的。
在一个可选的实施例中,该模糊K邻近的推荐装置还可以包括:数据预处理模块,根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
在一个可选的实施例中,所述模糊相似度和系数获取模块包括:权重系数计算单元以及模糊相似度计算单元。
权重系数计算单元对所述用户-项目评分矩阵进行相似度权重系数计算得到所述用户-用户相似度权重系数矩阵;
模糊相似度计算单元对所述用户-项目评分矩阵进行模糊化和模糊相似度处理得到所述用户-用户模糊相似度矩阵。
在一个可选的实施例中,所述模糊相似度计算单元包括:模糊处理子单元以及模糊相似度计算子单元。
模糊处理子单元将所述用户-项目评分矩阵中的原始评分模糊成一组三角模糊数,得到模糊用户-项目评分矩阵;
模糊相似度计算子单元利用模糊相似度度量技术对所述模糊用户-项目评分矩阵进行计算得到所述用户-用户模糊相似度矩阵。
在一个可选的实施例中,所述模糊相似度度量技术为模糊均方差相似度度量技术、模糊余弦相似度度量技术或模糊Pearson相似度度量技术。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模糊K邻近的推荐方法。
下面参考图8,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。
如图8所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的模糊K邻近的推荐方法。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (12)
1.一种模糊K邻近的推荐方法,其特征在于,包括:
根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;
根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;
根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;
将所述用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;
根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品。
2.根据权利要求1所述的模糊K邻近的推荐方法,其特征在于,还包括:
根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
3.根据权利要求1所述的模糊K邻近的推荐方法,其特征在于,所述根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵,包括:
对所述用户-项目评分矩阵进行相似度权重系数计算得到所述用户-用户相似度权重系数矩阵;
对所述用户-项目评分矩阵进行模糊化和模糊相似度处理得到所述用户-用户模糊相似度矩阵。
4.根据权利要求3所述的模糊K邻近的推荐方法,其特征在于,所述对所述用户-项目评分矩阵进行模糊化和模糊相似度处理得到所述用户-用户模糊相似度矩阵,包括:
将所述用户-项目评分矩阵中的原始评分模糊成一组三角模糊数,得到模糊用户-项目评分矩阵;
利用模糊相似度度量技术对所述模糊用户-项目评分矩阵进行计算得到所述用户-用户模糊相似度矩阵。
5.根据权利要求4所述的模糊K邻近的推荐方法,其特征在于,所述模糊相似度度量技术为模糊均方差相似度度量技术、模糊余弦相似度度量技术或模糊Pearson相似度度量技术。
6.一种模糊K邻近的推荐装置,其特征在于,包括:
个人相似度获取模块,根据预获取的个人信息矩阵得到用户-用户个人信息相似度矩阵;
模糊相似度和系数获取模块,根据预获取的用户-项目评分矩阵获取用户-用户相似度权重系数矩阵以及用户-用户模糊相似度矩阵;
加权计算模块,根据所述用户-用户个人信息相似度矩阵、所述用户-用户相似度权重系数矩阵以及所述用户-用户模糊相似度矩阵获取用户-用户综合相似度矩阵;
聚类模块,将所述用户-用户综合相似度矩阵以及被推荐用户标识输入预获取的KNN模型得到与所述被推荐用户相似度满足预设条件的用户;
推荐模块,根据与所述被推荐用户相似度满足预设条件的用户的评分信息向所述被推荐用户推荐产品。
7.根据权利要求6所述的模糊K邻近的推荐装置,其特征在于,还包括:
数据预处理模块,根据海量的用户个人信息以及评分信息获取个人信息矩阵和用户-项目评分矩阵。
8.根据权利要求6所述的模糊K邻近的推荐装置,其特征在于,所述模糊相似度和系数获取模块包括:
权重系数计算单元,对所述用户-项目评分矩阵进行相似度权重系数计算得到所述用户-用户相似度权重系数矩阵;
模糊相似度计算单元,对所述用户-项目评分矩阵进行模糊化和模糊相似度处理得到所述用户-用户模糊相似度矩阵。
9.根据权利要求8所述的模糊K邻近的推荐装置,其特征在于,所述模糊相似度计算单元包括:
模糊处理子单元,将所述用户-项目评分矩阵中的原始评分模糊成一组三角模糊数,得到模糊用户-项目评分矩阵;
模糊相似度计算子单元,利用模糊相似度度量技术对所述模糊用户-项目评分矩阵进行计算得到所述用户-用户模糊相似度矩阵。
10.根据权利要求9所述的模糊K邻近的推荐装置,其特征在于,所述模糊相似度度量技术为模糊均方差相似度度量技术、模糊余弦相似度度量技术或模糊Pearson相似度度量技术。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5任一项所述的模糊K邻近的推荐方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5任一项所述的模糊K邻近的推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010338355.7A CN111581503A (zh) | 2020-04-26 | 2020-04-26 | 模糊k邻近的推荐方法和装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010338355.7A CN111581503A (zh) | 2020-04-26 | 2020-04-26 | 模糊k邻近的推荐方法和装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111581503A true CN111581503A (zh) | 2020-08-25 |
Family
ID=72111712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010338355.7A Pending CN111581503A (zh) | 2020-04-26 | 2020-04-26 | 模糊k邻近的推荐方法和装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581503A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077357A (zh) * | 2014-05-31 | 2014-10-01 | 浙江工商大学 | 基于用户的协同过滤组合推荐方法 |
CN104239496A (zh) * | 2014-09-10 | 2014-12-24 | 西安电子科技大学 | 一种结合模糊权重相似性度量和聚类协同过滤的方法 |
CN104899246A (zh) * | 2015-04-12 | 2015-09-09 | 西安电子科技大学 | 基于模糊机制用户评分邻域信息的协同过滤推荐方法 |
JP2017027480A (ja) * | 2015-07-24 | 2017-02-02 | 大学共同利用機関法人情報・システム研究機構 | アイテム推薦システム及びアイテム推薦方法 |
-
2020
- 2020-04-26 CN CN202010338355.7A patent/CN111581503A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077357A (zh) * | 2014-05-31 | 2014-10-01 | 浙江工商大学 | 基于用户的协同过滤组合推荐方法 |
CN104239496A (zh) * | 2014-09-10 | 2014-12-24 | 西安电子科技大学 | 一种结合模糊权重相似性度量和聚类协同过滤的方法 |
CN104899246A (zh) * | 2015-04-12 | 2015-09-09 | 西安电子科技大学 | 基于模糊机制用户评分邻域信息的协同过滤推荐方法 |
JP2017027480A (ja) * | 2015-07-24 | 2017-02-02 | 大学共同利用機関法人情報・システム研究機構 | アイテム推薦システム及びアイテム推薦方法 |
Non-Patent Citations (1)
Title |
---|
聂文俊: "基于深度 BLSTM 和多准则候选的个性化推荐系统研究" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359244B (zh) | 一种个性化信息推荐方法和装置 | |
US20240062271A1 (en) | Recommendations Based Upon Explicit User Similarity | |
US20190295114A1 (en) | Digital banking platform and architecture | |
JP5960887B1 (ja) | 算出装置、算出方法及び算出プログラム | |
US20180101591A1 (en) | Methods and Systems for Cluster-Based Historical Data | |
CN112948695A (zh) | 基于用户画像的普惠金融快贷产品推荐方法和装置 | |
CN112037026A (zh) | 自动化异常交易工单处理方法、装置和系统 | |
EP3103089A1 (en) | Interaction support processor | |
JP2019091355A (ja) | 判定装置、判定方法及び判定プログラム | |
CN113343101A (zh) | 一种对象排序方法及系统 | |
CN113761379B (zh) | 商品推荐方法及装置、电子设备和介质 | |
CN111581503A (zh) | 模糊k邻近的推荐方法和装置、电子设备以及存储介质 | |
CN115375434A (zh) | 一种界面布局的调整方法及相关装置 | |
CN111815204A (zh) | 风险评估方法、装置以及系统 | |
JP6067169B2 (ja) | 算出装置、算出方法及び算出プログラム | |
CN110968771A (zh) | 一种基于朋友关系的职位推荐冷启动方法及系统 | |
Chen et al. | Visualizing the clustering of financial networks and profitability of stocks | |
JP7453120B2 (ja) | 選択装置、選択方法及び選択プログラム | |
US20240185255A1 (en) | Method, system, and non-transitory computer-readable recording medium for recommending payment means | |
US11989243B2 (en) | Ranking similar users based on values and personal journeys | |
JP2017054554A (ja) | 算出装置、算出方法及び算出プログラム | |
CN118229339A (zh) | 产品消耗数据的处理方法、装置、介质及电子设备 | |
CN115619516A (zh) | 一种基于客户标签属性的银行产品智能推荐方法及系统 | |
CN114240027A (zh) | 一种基于供应链大数据的资源分配方法、装置及电子设备 | |
CN117132343A (zh) | 产品推荐方法、装置、电子设备、介质和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |
|
RJ01 | Rejection of invention patent application after publication |