CN115470414B - 一种联名人推荐方法及推荐系统 - Google Patents
一种联名人推荐方法及推荐系统 Download PDFInfo
- Publication number
- CN115470414B CN115470414B CN202211365239.XA CN202211365239A CN115470414B CN 115470414 B CN115470414 B CN 115470414B CN 202211365239 A CN202211365239 A CN 202211365239A CN 115470414 B CN115470414 B CN 115470414B
- Authority
- CN
- China
- Prior art keywords
- proposal
- participant
- portrait
- data
- participants
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种联名人推荐方法及推荐系统,所述方法包括:获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。本发明在参与人员完成一篇提案或者建议时,智能化推荐出一些候选参与人员供提交参与人员选择。
Description
技术领域
本发明属于智能推荐技术领域,尤其涉及一种联名人推荐方法及推荐系统。
背景技术
参会人员在提交提案或者建议时会有联名人联名提交的需求,目前联名人的选择都是提案或建议提交人员自己人为从同届参会人员中查找,这样一来对于参会人员选择联名人来说主观意识强并且选择查找比较繁琐。
因此,有必要提供一种新的基于参会人员画像的联名人推荐方法及推荐系统解决上述技术问题。
发明内容
本发明的目的就在于为了解决上述问题而提供一种联名人推荐方法及推荐系统。
本发明通过以下技术方案来实现上述目的:一种联名人推荐的方法,包括以下步骤:
获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;
将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;
基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。
优选地,通过对所有参与人员的提案进行提取处理获取到所有参与人员的画像数据;通过参与人员画像字典对所述画像数据进行存储和更新,参与人员画像字典的关键值key为参与人员ID,属性值value为参与人员的画像数据。
优选地,获取所述参与人员提案类别画像向量数据包括:
构建N维的全0数组,其中N为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1。
优选地,获取所述参与人员提案内容画像向量数据包括:
将参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;
基于提案内容画像向量数据计算参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:
member Pr o Vecnew=(member Pr o Vecold×countold+temp Pr o Vec)/countnewcountnew=countold+1
其中,memberProVec表示平均提案内容向量数据,memberProVecnew表示更新后的平均提案内容向量数据,memberProVecold表示更新前的平均提案内容向量数据,countold表示更新前的当前参与人员提案总数目,countnew表示更新后的当前参与人员提案总数目,tempProVec表示当前提案的文档向量。
优选地,获取所述参与人员历史联名人画像统计数据的包括:
统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,,最终得到所述参与人员历史联名人画像统计数据。
优选地,所述相似度数据包括当前提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据和当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据。
优选地,计算得到所述当前提案内容画像与其他参与人员提案内容画像相似度数据包括:
对当前提案内容进行文本向量化得到当前提案内容画像向量数据;
遍历当前届次的所有其他参与人员,获取其他参与人员的提案内容画像向量数据,计算当前提案内容向量数据与其他参与人员的提案内容画像向量数据的相似度,相似度采用余弦相似度,计算公式如下:
pro_other Pr o_sim=cos(pro Vec,other Pr o Vec);
其中,pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,proVec表示当前提案内容画像向量数据,otherProVec表示其他参与人员的提案内容画像向量数据。
优选地,计算得到所述当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据包括:
获取当前参与人员的参与人员提案内容画像向量数据,遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:
own Pro_other Pr osim=cos(own Pr o Vec,other Pr o Vec);
其中,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,ownProVec表示当前参与人员的参与人员提案内容画像向量数据,otherProVec表示其他参与人员的参与人员提案内容画像向量数据。
优选地,计算得到所述当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据包括:
获取当前参与人员的参与人员历史联名人画像统计数据,根据所述参与人员历史联名人画像统计数据中得到当前参与人员联名过的联名人,再获取这些联名人的参与人员提案内容画像向量数据,并求其均值作为当前参与人员的历史联名人提案内容画像向量数据;
遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:
link Pro_other Pro_sim=cos(link Pr o Vec,other Pro Vec);
其中,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,linkProVec表示当前参与人员的历史联名人提案内容画像向量数据,otherProVec表示其他参与人员的参与人员提案内容画像向量数据。
优选地,计算得到所述当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据包括:
获取当前参与人员的参与人员提案类别画像向量数据,遍历当前届次的所有其他参与人员获取其他参与人员的参与人员提案类别画像向量数据,对当前参与人员的参与人员提案类别画像向量数据和其他参与人员的参与人员提案类别画像向量数据进行归一化计算得到当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据,再计算当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据的相似度,计算公式如下:
ownField_otherField_sim=cos(scaleOwnFieldVec,scaleOtherFieldVec)
scaleField Vec=fieldVec/sum(fieldVec);
其中,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;scaleOwnFieldVec、scaleOtherFieldVec分别表示当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据;scaleFieldVec表示参与人员提案类别画像向量数据的归一化方式;fieldVec表示参与人员提案类别画像向量数据。
优选地,基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人包括:
联名人推荐重要度数据的计算公式为:
otherMemberScore=(log(linkNum+1)+1)×(θ1×pro_other Pr o_sim+θ2×ownPro_other Pro_sim+θ3×link Pr o_other Pr o_sim+θ4×ownField_otherField_sim);
其中,linkNum表示当前参与人员与其他参与人员之间联名过的次数,如果未曾发生过联名,linkNum为0;θ1、θ2、θ3、θ4分别为各个相似度的权重且各个相似度的权重之和为1,即θ1、θ2、θ3、θ4之和为1;pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;
遍历当前届次的其他参与人员,获取与其他参与人员的联名人推荐重要度数据,按照得分从大到小排序,取出得分最高的K个其他参与人员作为最终推荐的联名人。
本发明还提供一种联名人推荐系统,包括参与人员画像模型和联名人推荐模块;所述参与人员画像模型包括参与人员画像提取器和参与人员画像储存器;
所述参与人员画像提取器和参与人员画像储存器,分别用于获取和存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;
所述联名人推荐模块,用于将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及当前届次的所有参与人员的所述画像数据计算出相似度数据;
所述联名人推荐模块,还用于基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。
本发明的有益效果在于:本发明基于参与人员画像,在参与人员完成一篇提案或者建议时,智能化推荐出一些候选参与人员并同时展示出候选参与人员相关信息及参与人员画像,供提交参与人员选择,提高联名人的相关性,同时减低参与人员自身选择查找的时间,大大提高了工作效率。
附图说明
图1是本发明的方法流程框图;
图2是本发明的系统结构框图;
图3是本发明的参与人员画像模型的结构框图;
图4是本发明的联名人推荐模块的结构框图。
具体实施方式
下面结合附图对本申请作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本申请进行进一步的说明,不能理解为对本申请保护范围的限制,该领域的技术人员可以根据上述申请内容对本申请作出一些非本质的改进和调整。
如图1所示,本发明提出一种联名人推荐的方法,包括以下步骤:
获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;其中,参与人员指参加会议的人员。
将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;
基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。
通过对所有参与人员的提案进行提取处理获取到所有参与人员的画像数据;通过参与人员画像字典对所述画像数据进行存储和更新,参与人员画像字典的key值为参与人员ID,value值为该参与人员的所述画像数据。
如图2所示,提取得到所述参与人员提案类别画像向量数据的过程如下:
构建N维的全0数组,其中N为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1。
提取得到所述参与人员提案内容画像向量数据的过程如下:
将该参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;
基于提案内容画像向量数据计算该参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:
member Pr o Vecnew=(member Pr o Vecold×countold+temp Pr o Vec)/countnew
countnew=countold+1;
其中,memberProVec表示平均提案内容向量数据,即所述参与人员提案内容画像向量数据,memberProVecnew表示更新后的平均提案内容向量数据,memberProVecold表示更新前的平均提案内容向量数据,countold表示更新前的当前参与人员提案总数目,countnew表示更新后的当前参与人员提案总数目,tempProVec表示当前提案的文档向量。
提取得到所述参与人员历史联名人画像统计数据的过程如下:
统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当该参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,最终得到所述参与人员历史联名人画像统计数据。
所述相似度数据包括当前提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据、当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据和当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据。
计算得到所述当前提案内容画像与其他参与人员提案内容画像相似度数据的过程如下:
对当前提案内容进行文本向量化得到当前提案内容画像向量数据;
遍历当前届次的所有其他参与人员,获取其他参与人员的提案内容画像向量数据,计算当前提案内容向量数据与其他参与人员的提案内容画像向量数据的相似度,相似度采用余弦相似度,具体计算公式如下:
pro_other Pr o_sim=cos(pro Vec,other ProVec);
其中,pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,proVec表示当前提案内容画像向量数据,otherProVec表示其他参与人员的提案内容画像向量数据。
计算得到所述当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据的过程如下:
获取当前参与人员的参与人员提案内容画像向量数据,遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:
own Pro_other Pro_sim=cos(own Pr o Vec,other Pr o Vec);
其中,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,ownProVec表示当前参与人员的参与人员提案内容画像向量数据,otherProVec表示其他参与人员的参与人员提案内容画像向量数据。
计算得到所述当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据的过程如下:
获取当前参与人员的参与人员历史联名人画像统计数据,根据所述参与人员历史联名人画像统计数据中得到当前参与人员联名过的联名人,再获取这些联名人的参与人员提案内容画像向量数据,并求其均值作为当前参与人员的历史联名人提案内容画像向量数据;
遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:
link Pr o_other Pr o_sim=cos(link Pr o Vec,other Pr o Vec);
其中,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,linkProVec表示当前参与人员的历史联名人提案内容画像向量数据,otherProVec表示其他参与人员的参与人员提案内容画像向量数据。
计算得到所述当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据的过程如下:
获取当前参与人员的参与人员提案类别画像向量数据,遍历当前届次的所有其他参与人员获取其他参与人员的参与人员提案类别画像向量数据,对当前参与人员的参与人员提案类别画像向量数据和其他参与人员的参与人员提案类别画像向量数据进行归一化计算得到当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据,再计算当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据的相似度,具体计算公式如下:
其中,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;scaleOwnFieldVec、scaleOtherFieldVec分别表示当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据;scaleFieldVec表示参与人员提案类别画像向量数据的归一化方式;fieldVec表示参与人员提案类别画像向量数据。
基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人的具体过程如下:
联名人推荐重要度数据的计算公式如下:
otherMemberScore=(log(linkNum+1)+1)×(θ1×pro_other Pro_sim+θ2×ownPro_other Pro_sim+θ3×link Pro_other Pro_sim+θ4×ownField_otherField_sim);
其中,linkNum表示当前参与人员与其他参与人员之间联名过的次数,如果未曾发生过联名,linkNum为0;θ1、θ2、θ3、θ4分别为各个相似度的权重且各个相似度的权重之和为1,即θ1、θ2、θ3、θ4和为1;pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据;ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;
遍历当前届次的其他参与人员,获取与其他参与人员的联名人推荐重要度数据,按照得分从大到小排序,取出得分最高的K个其他参与人员作为最终推荐的联名人。
如图3-图4所示,本发明还提供一种联名人推荐系统,包括参与人员画像模型和联名人推荐模块。
所述参与人员画像模型有两个部分,一个是基于历史提案数据进行遍历生成参与人员画像,二是当有新的提案立案时需要据此更新参与人员画像,这两个部分在处理时使用同一种参与人员画像提取规则,具体提取规则如下:
使用一个members_portrait_dict字典用来存储和更新每一个参与人员的画像,其中members_portrait_dict的key值为参与人员ID(member_id),,value值为该参与人员的画像。每个参与人员的画像包括三个部分:参与人员提案类别向量、参与人员提案内容向量、参与人员历史联名人统计,具体步骤如下:
参与人员提案类别向量提取:
使用类似词袋法的模式,将所有提案类别当做一个词,然后对每个参与人员对应的提案类别数目进行统计,当该参与人员的提案出现某个类别,对应的数目增加1。
例如:假设一共有10个类别,初始化的时候我们构建一个10维的全0数组,当该参与人员的提案属于第n个类别时,对应的在这个数组的第n维度加1;同样的,当该参与人员新增了提案,对应类别维度上的数目加1。
参与人员提案内容画像提取:
参与人员提案内容画像根据提案内容进行文档向量化,可以使用LDA、LSI等主题模型,也可以使用其他文档向量化方式,比如word2vec求均值、doc2vec等方式;LDA(latentdirichlet allocation)模型的本质是包含词(Word)、话题(Topic)和语料库(有时候也称文档集)(Corpus)三层结构的生成式贝叶斯概率模型;LSI(Latent Semantic Indexing)模型是自然语言处理模型,通过海量文献找出词汇之间的关系。
为了在遍历过程或者新增提案时方便计算该参与人员的平均提案内容向量,我们在处理提案内容向量时,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1。具体的计算参与人员平均提案内容向量的方式如下:
当该参与人员第一次出现在members_portrait_dict时,直接保存当前提案内容向量作为参与人员提案内容向量,同时记录参与人员提案总数目(count)为1;其他时候更新参与人员提案内容向量,并对参与人员提案总数目(count)加1,更新公式如下:
member Pr o Vecnew=(member Pr o Vecold×countold+temp Pr o Vec)/countnewcountnew=countold+1
其中,memberProVec表示平均提案内容向量数据,memberProVecnew表示更新后的平均提案内容向量数据,memberProVecold表示更新前的平均提案内容向量数据,countold表示更新前的当前参与人员提案总数目,countnew表示更新后的当前参与人员提案总数目,tempProVec表示当前提案的文档向量。
参与人员联名人画像提取:
参与人员联名人画像即统计每个参与人员历史提案中进行过的联名人及联名次数,每次遍历或者新增提案时,当该参与人员的联名人画像中存在当前提案的联名人就将联名次数加1;不存在的话就新增联名人,并且联名次数为1。
届次与参与人员映射字典:
由于不同届次,参与人员会有变动更新,所以在处理过程中需要存储每个届次对应的所有参与人员,便于在进行联名人推荐的时候仅选择当前届次的参与人员进行推荐。
联名人推荐模块是指基于已经构建好的参与人员画像,当参与人员提出新的提案时,根据当前提案内容为参与人员推荐出可供选择的联名人。其主要步骤如下:
当前提案内容与其他参与人员提案内容画像相似度:
对当前提案内容进行文本向量化,遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案内容画像的向量,计算当前提案内容向量与其他参与人员提案内容画像的向量的相似度,这里相似度采用余弦相似度,具体计算公式如下:
pro_otherPro_sim=cos(pro Vec,other Pr o Vec);
其中,proVec表示当前提案的内容向量,otherProVec表示其他参与人员的提案内容画像向量,pro_otherPro_sim表示前提案内容向量与其他参与人员提案内容画像的向量的相似度。
当前参与人员提案内容画像与其他参与人员提案内容画像相似度:
从参与人员画像字典members_portrait_dict获取当前参与人员的提案内容画像,遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案内容画像的向量,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度,计算公式如下:
own Pr o_other Pr o_sim=cos(own Pr o Vec,other Pr o Vec);
其中,ownProVec表示当前参与人员的提案内容画像向量,otherProVec表示其他参与人员的提案内容画像向量,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度。
当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度:
从参与人员画像字典members_portrait_dict获取当前参与人员的历史联名人画像,根据联名过的联名人从参与人员画像字典members_portrait_dict中获取历史联名人提案内容画像,并求其均值作为当前参与人员历史联名人提案内容画像向量;遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案内容画像的向量,计算当前参与人员历史联名人提案内容画像向量与其他参与人员的提案内容画像的向量的相似度,计算公式如下:
link Pr o_other Pr o_sim=cos(link Pr o Vec,other Pr o Vec);
其中,linkProVec表示当前参与人员历史联名人提案内容画像向量,otherProVec表示其他参与人员的提案内容画像向量,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像向量与其他参与人员的提案内容画像的向量的相似度。
当前参与人员提案类别画像与其他参与人员提案类别画像相似度:
从参与人员画像字典members_portrait_dict获取当前参与人员的提案类别画像向量,遍历当前届次的所有其他参与人员,从参与人员画像字典members_portrait_dict获取其他参与人员的提案类别容画像的向量,对提案类别向量进行归一化,在计算归一化后的当前参与人员提案类别画像向量和其他参与人员的提案类别画像向量的相似度,具体计算公式如下:
ownField_otherField_sim=cos(scaleOwnFieldVec,scaleOtherFieldVec)
scaleFieldVec=fieldVec/sum(fieldVec)
其中,scaleOwnFieldVec、scaleOtherFieldVec分别表示当前参与人员提案类别画像归一化向量和其他参与人员的提案类别画像归一化向量,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度;scaleFieldVec表示提案类别向量归一化方式。
联名人推荐重要度计算:
经过上述步骤可以得到当前提案及提案参与人员与其他参与人员的一些相似度,基于此相似度,对当前参与人员提案进行联名人推荐,先计算其重要度,然后根据重要度排名,推荐前K个作为最终的推荐联名人。其中重要度的计算公式如下:
otherMemberScore=(log(linkNum+1)+1)×(θ1×pro_other Pr o_sim+θ2×ownPr o_other Pr o_sim+θ3×link Pr o_other Pr o_sim+θ4×ownField_otherField_sim);
其中,pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;linkNum表示当前参与人员与其他参与人员之间联名过的次数,可以直接从参与人员画像字典中获取,如果未曾发生过联名,linkNum为0;θ1、θ2、θ3、θ4分别为各种相似度的权重且他们的权重和为1,一般使用等权重,当然可以基于需求调整,比如注重当前提案内容则将θ1权重增大,
基于上述五个部分,可以根据遍历当前届次的其他参与人员,获取与其他参与人员的otherMemberScore,按照得分从大到小排序,取出得分最高的K个其他参与人员作为最终推荐的联名人。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (8)
1.一种联名人推荐的方法,其特征在于,包括以下步骤:
获取并存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;
其中,获取所述参与人员提案类别画像向量数据包括:
构建N维的全0数组,其中N为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1;
获取所述参与人员提案内容画像向量数据包括:
将参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;基于提案内容画像向量数据计算参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:
memberProVecnew=(memberProVecold×countold+tempProVec)/countnew
countnew=countold+1;
其中,memberProVec表示平均提案内容向量数据,memberProVecnew表示更新后的平均提案内容向量数据,memberProVecold表示更新前的平均提案内容向量数据,countold表示更新前的当前参与人员提案总数目,countnew表示更新后的当前参与人员提案总数目,tempProVec表示当前提案的文档向量;
获取所述参与人员历史联名人画像统计数据的包括:
统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,最终得到所述参与人员历史联名人画像统计数据;
将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及同届次的所有参与人员的所述画像数据计算出相似度数据;
所述计算出相似度数据包括:计算得到当前提案内容画像与其他参与人员提案内容画像相似度数据,计算得到当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算得到当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算得到当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;
基于四个相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。
2.根据权利要求1所述的一种联名人推荐的方法,其特征在于,通过对所有参与人员的提案进行提取处理获取到所有参与人员的画像数据;通过参与人员画像字典对所述画像数据进行存储和更新,参与人员画像字典的关键值key为参与人员ID,属性值value为参与人员的画像数据。
3.根据权利要求1所述的一种联名人推荐的方法,其特征在于:计算得到所述当前提案内容画像与其他参与人员提案内容画像相似度数据包括:
对当前提案内容进行文本向量化得到当前提案内容画像向量数据;
遍历当前届次的所有其他参与人员,获取其他参与人员的提案内容画像向量数据,计算当前提案内容向量数据与其他参与人员的提案内容画像向量数据的相似度,相似度采用余弦相似度,计算公式如下:
pro_otherPro_sim=cos(proVec,otherProVec);
其中,pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,proVec表示当前提案内容画像向量数据,otherProVec表示其他参与人员的提案内容画像向量数据。
4.根据权利要求3所述的一种联名人推荐的方法,其特征在于:计算得到所述当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据包括:
获取当前参与人员的参与人员提案内容画像向量数据,遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:
ownPro_otherPro_Sin=cos(ownProVec,otherProVec);
其中,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,ownProVec表示当前参与人员的参与人员提案内容画像向量数据,otherProVec表示其他参与人员的参与人员提案内容画像向量数据。
5.根据权利要求4所述的一种联名人推荐的方法,其特征在于:计算得到所述当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据包括:
获取当前参与人员的参与人员历史联名人画像统计数据,根据所述参与人员历史联名人画像统计数据中得到当前参与人员联名过的联名人,再获取这些联名人的参与人员提案内容画像向量数据,并求其均值作为当前参与人员的历史联名人提案内容画像向量数据;
遍历当前届次的所有其他参与人员,获取其他参与人员的参与人员提案内容画像向量数据,计算当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算公式如下:
linkPro_otherPro_sim=cos(linkProVec,otherProVec);
其中,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,linkProVec表示当前参与人员的历史联名人提案内容画像向量数据,otherProVec表示其他参与人员的参与人员提案内容画像向量数据。
6.根据权利要求5所述的一种联名人推荐的方法,其特征在于:计算得到所述当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据包括:
获取当前参与人员的参与人员提案类别画像向量数据,遍历当前届次的所有其他参与人员获取其他参与人员的参与人员提案类别画像向量数据,对当前参与人员的参与人员提案类别画像向量数据和其他参与人员的参与人员提案类别画像向量数据进行归一化计算,得到当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据,再计算当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据的相似度,当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据的计算公式如下:
ownField_otherField_sim=cos(scaleOwnFieldVec,scaleOther,FieldVec)
scaleFieldVec=fieldVec/sum(fieldVec);
其中,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;scaleOwnFieldVec、scaleOtherFieldVec分别表示当前参与人员的归一化后的参与人员提案类别画像向量数据和其他参与人员的归一化后的参与人员提案类别画像向量数据;scaleFieldVec表示参与人员提案类别画像向量数据的归一化方式;fieldVec表示参与人员提案类别画像向量数据。
7.根据权利要求6所述的一种联名人推荐的方法,其特征在于,基于所述相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人包括:
联名人推荐重要度数据的计算公式为:
otherMemberScore=(log(linkNum+1)+1)×(θ1×pro_otherPro_sim+θ2×ownPro_otherPro_sim+θ3×linkPro_otherPro_sim+θ4×ownField_otherField_sim);
其中,otherMemberScore表示联名人推荐重要度数据;linkNum表示当前参与人员与其他参与人员之间联名过的次数,如果未曾发生过联名,linkNum为0;θ1、θ2、θ3、θ4分别为各个相似度的权重且各个相似度的权重之和为1,即θ1、θ2、θ3、θ4之和为1;pro_otherPro_sim表示当前提案内容画像与其他参与人员提案内容画像相似度数据,ownPro_otherPro_sim表示当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,linkPro_otherPro_sim表示当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,ownField_otherField_sim表示当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;
遍历当前届次的其他参与人员,获取与其他参与人员的联名人推荐重要度数据,按照得分从大到小排序,取出得分最高的K个其他参与人员作为最终推荐的联名人。
8.一种联名人推荐系统,其特征在于,包括参与人员画像模型和联名人推荐模块;所述参与人员画像模型包括参与人员画像提取器和参与人员画像储存器;
所述参与人员画像提取器和参与人员画像储存器,分别用于获取和存储所有参与人员的画像数据,所述画像数据包括参与人员提案类别画像向量数据、参与人员提案内容画像向量数据和参与人员历史联名人画像统计数据;
其中,获取所述参与人员提案类别画像向量数据包括:
构建N维的全0数组,其中N为提案类别的总数,当参与人员的提案属于第a个类别时,对应的在这个数组的第a维度加1;
获取所述参与人员提案内容画像向量数据包括:
将参与人员所有提案的内容进行文档向量化得到对应的提案内容画像向量数据;基于提案内容画像向量数据计算参与人员的平均提案内容向量数据,同时记录统计参与人员提案总数目,每个参与人员每次遍历或新增了一条提案,总数目加1,计算参与人员的平均提案内容向量数据的公式如下:
memberProVecnew=(memberProVecold×countold+tempProVec)/countnew
countnew=countold+1;
其中,memberProVec表示平均提案内容向量数据,memberProVecnew表示更新后的平均提案内容向量数据,memberProVecold表示更新前的平均提案内容向量数据,countold表示更新前的当前参与人员提案总数目,countnew表示更新后的当前参与人员提案总数目,tempProVec表示当前提案的文档向量;
获取所述参与人员历史联名人画像统计数据的包括:
统计每个参与人员历史提案中的联名人及联名次数,每次遍历或者新增提案时,当参与人员的联名人中存在当前提案的联名人则将联名次数加1;不存在当前提案的联名人则新增联名人,并且设置联名次数为1,最终得到所述参与人员历史联名人画像统计数据;
所述联名人推荐模块,用于将待提交提案的内容进行文本向量化处理得到当前提案内容画像向量数据,基于所述当前提案内容画像向量数据及当前届次的所有参与人员的所述画像数据计算出相似度数据;
所述计算出相似度数据包括:计算得到当前提案内容画像与其他参与人员提案内容画像相似度数据,计算得到当前参与人员提案内容画像与其他参与人员提案内容画像相似度数据,计算得到当前参与人员历史联名人提案内容画像与其他参与人员提案内容画像相似度数据,计算得到当前参与人员提案类别画像与其他参与人员提案类别画像相似度数据;
所述联名人推荐模块,还用于基于四个相似度数据计算出联名人推荐重要度数据,根据所述联名人推荐重要度数据的大小将对应的参与人员进行排名,输出前K个参与人员作为最终的推荐联名人。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211365239.XA CN115470414B (zh) | 2022-11-03 | 2022-11-03 | 一种联名人推荐方法及推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211365239.XA CN115470414B (zh) | 2022-11-03 | 2022-11-03 | 一种联名人推荐方法及推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115470414A CN115470414A (zh) | 2022-12-13 |
CN115470414B true CN115470414B (zh) | 2023-05-12 |
Family
ID=84338159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211365239.XA Active CN115470414B (zh) | 2022-11-03 | 2022-11-03 | 一种联名人推荐方法及推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115470414B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299994B (zh) * | 2018-07-27 | 2021-09-24 | 北京三快在线科技有限公司 | 推荐方法、装置、设备及可读存储介质 |
CN111581368A (zh) * | 2019-02-19 | 2020-08-25 | 中国科学院信息工程研究所 | 一种基于卷积神经网络的面向智能专家推荐的用户画像方法 |
JP7478575B2 (ja) * | 2020-03-31 | 2024-05-07 | 本田技研工業株式会社 | レコメンドシステム、及びレコメンド方法 |
CN114491296B (zh) * | 2022-04-18 | 2022-07-12 | 湖南正宇软件技术开发有限公司 | 提案联名人推荐方法、系统、计算机设备及可读存储介质 |
-
2022
- 2022-11-03 CN CN202211365239.XA patent/CN115470414B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115470414A (zh) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840287B (zh) | 一种基于神经网络的跨模态信息检索方法和装置 | |
CN104765769B (zh) | 一种基于词矢量的短文本查询扩展及检索方法 | |
CN110209897B (zh) | 智能对话方法、装置、存储介质及设备 | |
US7860347B2 (en) | Image-based face search | |
CN106970910B (zh) | 一种基于图模型的关键词提取方法及装置 | |
CN111897967A (zh) | 一种基于知识图谱和社交媒体的医疗问诊推荐方法 | |
CN111708873A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
CN111966917A (zh) | 一种基于预训练语言模型的事件检测与摘要方法 | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN106940726B (zh) | 一种基于知识网络的创意自动生成方法与终端 | |
Liu et al. | A multi-modal chinese poetry generation model | |
CN110866089A (zh) | 基于同义多语境分析的机器人知识库构建系统及方法 | |
CN111858940A (zh) | 一种基于多头注意力的法律案例相似度计算方法及系统 | |
Tiwari et al. | Ensemble approach for twitter sentiment analysis | |
CN110597968A (zh) | 一种回复选择方法及装置 | |
CN113204674A (zh) | 基于局部-整体图推理网络的视频-段落检索方法及系统 | |
CN111723571A (zh) | 一种文本信息审核方法及系统 | |
CN115761753A (zh) | 一种融合知识图谱的检索式知识前缀引导视觉问答方法 | |
CN114048354B (zh) | 基于多元表征和度量学习的试题检索方法、装置及介质 | |
CN111339338A (zh) | 基于深度学习的文本图片匹配推荐方法 | |
CN113032550B (zh) | 一种基于预训练语言模型的观点摘要评价系统 | |
CN110347812A (zh) | 一种面向司法文本的搜索排序方法及系统 | |
CN115470414B (zh) | 一种联名人推荐方法及推荐系统 | |
CN113761887A (zh) | 基于文本处理的匹配方法、装置、计算机设备和存储介质 | |
CN112507097B (zh) | 一种提高问答系统泛化能力的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |