CN106097204A - 一种面向冷启动学生用户的工作推荐系统及推荐方法 - Google Patents

一种面向冷启动学生用户的工作推荐系统及推荐方法 Download PDF

Info

Publication number
CN106097204A
CN106097204A CN201610474388.8A CN201610474388A CN106097204A CN 106097204 A CN106097204 A CN 106097204A CN 201610474388 A CN201610474388 A CN 201610474388A CN 106097204 A CN106097204 A CN 106097204A
Authority
CN
China
Prior art keywords
user
scoring
prediction
employment
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610474388.8A
Other languages
English (en)
Inventor
刘睿
荣文戈
唐翠
欧阳元新
熊璋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201610474388.8A priority Critical patent/CN106097204A/zh
Publication of CN106097204A publication Critical patent/CN106097204A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向冷启动学生用户的工作推荐系统及推荐方法。针对新学生用户没有历史评分的情况,系统以用户属性为基础计算用户之间相似度,然后根据近邻用户对用人单位的评分预测该新用户对用人单位的评分,预测评分在一定程度上反映了新用户对这些用人单位的兴趣度,基于该预测评分即可对新用户进行工作推荐。考虑到新用户对用人单位的预测评分可能来自于不同数量的近邻用户对该用人单位的评分,系统引入评分支持度评价预测评分的可信度,以达到优化推荐效果的目的。在工作推荐领域,用户的兴趣并不能直接转化成对用人单位的录用行为,系统又引入的兴趣效能参数,以进一步优化推荐效果。

Description

一种面向冷启动学生用户的工作推荐系统及推荐方法
技术领域
本发明属于数据挖掘的技术领域,具体涉及一种面向冷启动学生用户的工作推荐系统及推荐方法,适用于工作推荐结果的优化。
背景技术
个性化推荐技术在电子商务领域已经得到了成功的应用,在人力资源领域,工作推荐系统可以帮助建立求职者和招聘者之间的联系。当面向高校毕业生的时候,工作推荐系统面临着一些新的挑战。例如:学生通常没有工作经历,缺乏工作培训,有时他们也缺乏明确的求职目标。高校需要一种引导性的工作推荐系统,将学生可能的潜在就业单位在学生开始求职之前推荐给学生,以帮助学生明晰求职目标,做好求职准备。在这种情况下,学生用户没有行为信息,属于冷启动的情况。因此,传统的基于内容或基于协同过滤的推荐模型无法应对这种情况。高校拥有大量历史的就业信息和人才培养数据。
文献《A Hybrid Job Recommendation Framework for University Students》给出了一种基于学生用户属性相似度进行工作推荐的方法,该方法通过计算待就业学生用户与已就业学生用户的属性相似度,基于相似度将已就业学生用户的就业单位直接推荐给待就业学生用户,并进行了推荐优化。该方法未考虑学生用户对用人单位的兴趣评分和投递简历的过程。本发明的学生用户属性相似度计算部分只是利用了该文献的过程,但基于相似度的评分预测及推荐优化该文献未涉及,也不具有本发明的优点。
发明内容
本发明要解决的技术问题:克服现有技术的不足,提供一种面向冷启动学生用户的工作推荐系统及推荐方法,基于兴趣效能的工作推荐优化针对工作推荐双向选择的特点,提高了推荐效率。
本发明通过学生用户属性计算待就业学生用户与已就业学生用户之间的相似度,并基于近邻模型预测待就业学生用户对某用人单位的评分。鉴于工作推荐系统的双向推荐,及已就业学生用户对用人单位评分数量分布不均等特点,提出了评分支持度和兴趣效能优化参数,提供了更好的工作推荐效果。
本发明解决上述技术问题采用的技术方案:一种面向冷启动学生用户的工作推荐系统,包括:学生用户属性模块、学生用户属性相似度计算模块、基于近邻模型的预测评分模块、基于评分支持度的工作推荐优化模块和基于兴趣效能的工作推荐优化模块;其中:
学生用户属性模块,用于存储学生用户属性,学生属性为就业密切相关的各类信息,包括专业、生源地、性别、课程和成绩多种;
学生用户属性相似度计算模块,利用学生用户属性,计算学生用户属性相似度;所述学生用户属性相似度为学生用户间各属性相似度加权之和,如公式1所示,其中X和Y代表两个学生,ai代表学生用户的某一种属性,wi是代表该属性的权重,wi取值在0-1之间,并且∑wi=1,即各个属性权重之和为1,
S ( X , Y ) = Σ i = 1 n w i · s i m ( X a i , Y a i ) - - - ( 1 ) ;
基于近邻模型的预测评分模块,根据属性相似的已就业学生用户对用人单位的评分,预测待就业学生用户对用人单位的评分;基于具有相似属性的学生用户具有相似的求职兴趣的思想,根据学生用户属性相似度计算结果,选取与待就业学生用户相似度大于某一阈值的近邻已就业学生用户,并计算待就业学生对近邻已就业学生用户已评分的用人单位的预测评分,预测评分计算如公式2所示,代表学生用户u对用人单位e的预测评分,KNN(u)代表与待就业学生u的属性相似度大于某一阈值的已就业学生集,sim(u,v)代表学生用户u和v的相似度,rve代表学生用户v对用人单位e的评分;获得待就业学生用户对所有近邻已就业学生用户已评分用人单位的预测评分后,则根据预测评分的大小进行工作推荐;
r ^ u , e = Σ v ∈ K N N ( u ) a s i m ( u , v ) · r v e Σ v ∈ K N N ( u ) a | s i m ( u , v ) | - - - ( 2 )
基于评分支持度的工作推荐优化模块,用于对基于预测评分的工作推荐效果的优化,使待就业学生用户获得更多的感兴趣的推荐;预测评分可能来源于多个近邻已就业学生用户对项目的评分,也有可能仅来自一个近邻已就业学生用户对项目的评分,来自多个近邻已就业学生用户的评分的预测评分可信度高,来自少量已就业学生用户的预测评分的可信度低;为了降低数据稀疏对预测评分的影响,采用预测评分支持度,定义如公式3所示,其中sn表示生成预测评分的近邻已就业学生用户数,snmax表示所有预测评分的最大近邻已就业学生用户数,snmin表示所有预测评分的最小近邻已就业学生用户数,sn的数值在计算预测评分时同时获得,
S u p p o r t = s n - sn m i n sn m a x - sn m i n - - - ( 3 )
获得预测评分支持度后,将推荐排序依据定义为预测评分与评分支持度乘积,如公式4所示,
S o r t = r ^ u , e * S u p p o r t - - - ( 4 ) ;
基于兴趣效能的工作推荐优化模块,用于提升系统的推荐效率,使待就业学生用户获得更大的被录用的几率;工作推荐系统是一类双向推荐系统,学生用户在选择用人单位的同时,用人单位也在选择学生用户,将某用人单位实际录用的人数noffer与收到学生用户投递简历的数量ninterest的比值定义为用人单位的兴趣效能,如公式5所示,
E f f i c i e n c y = n o f f e r n int e r e s t - - - ( 5 )
基于兴趣效能的工作推荐优化模块可与基于评分支持度的工作推荐优化模块组合使用,进行用人单位推荐时,将排序依据定义为基于近邻模型的预测评分模块的预测评分、基于评分支持度的工作推荐优化模块的评分支持度、基于兴趣效能的工作推荐优化模块的兴趣效能三者的乘积,如公式6所示,
Sort ′ = r ^ u , e * S u p p o r t * E f f i c i e n c y - - - ( 6 ) .
一种面向冷启动学生用户的工作推荐方法,步骤如下:
(1)首先需计算学生用户属性的相似度,并预测评分,学生用户属性包括多种数据类型,学生用户属性相似度可定义为学生用户间各属性相似度加权之和,如公式1所示,其中X和Y代表两个学生用户,wi是学生第i个属性的权重,ai代表第i个属性。
S ( X , Y ) = Σ i = 1 n w i · s i m ( X a i , Y a i ) - - - ( 1 )
(2)获得了学生用户之间的属性相似度后,则可利用近邻模型计算待就业学生用户对某用人单位的预测评分;预测评分计算如公式2所示,代表待就业学生用户u对用人单位e的预测评分,sim(u,v)代表学生用户u和v的相似度,rve代表已就业学生用户v对用人单位e的评分,计算预测评分的同时,可以获得用于计算预测评分的近邻用户数sn,
r ^ u , e = Σ v ∈ K N N ( u ) a s i m ( u , v ) · r v e Σ v ∈ K N N ( u ) a | s i m ( u , v ) | - - - ( 2 )
(3)根据用于生成预测评分的近邻用户数sn,计算预测评分的支持度,如公式3所示,其中sn表示生成预测评分的近邻学生用户数,snmax表示所有预测评分的最大近邻学生用户数,snmin表示所有预测评分的最小近邻学生用户数,
S u p p o r t = s n - sn m i n sn m a x - sn m i n - - - ( 3 )
(4)根据用人单位实际录用的人数noffer与收到学生投递简历的数量ninterest的比值计算用人单位的兴趣效能,如公式5所示,
E f f i c i e n c y = n o f f e r n int e r e s t - - - ( 4 )
(5)将预测评分、评分支持度与兴趣效能的乘积作为工作推荐的依据,如公式5所示,进行工作推荐,
Sort ′ = r ^ u , e * S u p p o r t * E f f i c i e n c y - - - ( 5 )
本发明的原理:首先需计算学生用户属性的相似度,并预测评分。学生用户属性包括多种数据类型,学生用户属性相似度可定义为学生间各属性相似度加权之和。如公式1所示,其中X和Y代表两个学生用户,wi是学生第i个属性的权重,ai代表第i个属性。
S ( X , Y ) = Σ i = 1 n w i · s i m ( X a i , Y a i ) - - - ( 1 )
获得了学生用户之间的属性相似度后,则可利用近邻模型计算待就业学生对某用人单位的预测评分。
本发明特征在于对预测评分的优化,以提升推荐效果:具体包括:
(一)基于评分支持度的工作推荐优化
面对新用户冷启动问题,利用用户的属性信息进行推荐是应对冷启动问题的重要方法。本发明利用学生用户的属性信息,计算学生用户的相似度,并基于近邻模型进行评分预测。基于近邻的推荐模型的推荐效果与数据的稠密程度密切相关。预测评分可能来源于多个近邻用户对项目的评分,也有可能仅来自一个近邻用户对项目的评分。若近邻用户对某特定项目给予了较高评分,且仅有该近邻用户对这个项目评分,则待推荐的新用户对这个项目的评分就是该近邻用户对其的评分,这个评分的可信度显然是不高的。在工作推荐领域,由于用人单位的招聘规模及热门程度不同,广泛存在着评分不均匀的情况,有些用人单位获得了大量评分,而有些用人单位仅获得了极少量的评分。
本优化方法在利用近邻模型预测学生用户对用人单位的评分的同时,记录了生成该预测评分的近邻学生用户数sn,然后计算该预测评分的支持度,最后根据预测评分和支持度进行工作推荐。
预测评分支持度参数,定义如下:
S u p p o r t = s n - sn m i n sn m a x - sn m i n - - - ( 2 )
其中sn表示生成预测评分的近邻已就业学生用户数,snmax表示所有预测评分的最大近邻已就业学生用户数,snmin表示所有预测评分的最小近邻已就业学生用户数,将生成预测评分的近邻已就业学生用户数与所有预测评分的最小近邻已就业学生用户数的差值跟所有预测评分的最大近邻已就业学生用户数与最小近邻已就业学生用户数的差值的比值作为预测评分的支持度。
获得预测评分支持度后,将推荐排序依据定义为预测评分与评分支持度乘积,如公式(3)所示。
S o r t = r ^ u , e * S u p p o r t - - - ( 3 )
(二)基于兴趣效能的工作推荐优化
评分预测的最终目的是将符合用户的兴趣的项目推荐给用户,并且用户对该项目产生购买或其他行为,而不是预测评分是否符合用户最终对该项目的评分。在实际推荐过程中,往往会出现用户对推荐列表中的某个项目感兴趣,但由于各种原因最终并没有产生购买等行为。在这种情况下,推荐虽然符合了用户的兴趣,但可能并不满足用户的实际需求,这种推荐可以认为是低效的或者无效的。工作推荐是一类双向推荐系统,这样的问题更为明显。根据学生的特点为学生推荐用人单位,推荐单位若符合学生的兴趣,学生就会投递简历。当学生发生投递简历的行为时,可以认为推荐有效。但是,学生投递简历的最终目的是获得用人单位的录用,若不能获得录用,推荐其实是无效的。由于求职招聘是一类双向选择的过程,学生最终能否获得录用取决于用人单位的需求与学生的能力的匹配程度,而不是学生的主观意愿,因此常常会出现学生投递了大量的简历而没有获得录用的情况。
本优化方法将某用人单位实际录用的人数noffer与收到学生用户投递简历的数量ninterest的比值定义为用人单位的兴趣效能,如公式(4)所示:
E f f i c i e n c y = n o f f e r n int e r e s t - - - ( 4 )
进行用人单位推荐时,将排序依据定义为预测评分、评分支持度和兴趣效能三者的乘积,如公式(5)所示:
Sort ′ = r ^ u , e * S u p p o r t * E f f i c i e n c y - - - ( 5 )
本发明的原理在于:
一种面向冷启动学生用户的工作推荐系统,系统通过计算学生用户属性相似度进行评分预测应对学生用户的冷启动问题。针对预测评分系统给出了两种优化方法:基于评分支持度的工作推荐优化和基于兴趣效能的工作推荐优化。基于评分支持度的工作推荐优化通过评分支持度参数降低了稀疏且分布不均的历史评分数据对推荐的影响,提升了推荐效果。基于兴趣效能的工作推荐优化针对工作推荐双向选择的特点,通过兴趣效能参数考量了应聘某用人单位竞争的激烈程度,提高了推荐效率。
本发明优点及功效在于:
(1)本发明采用学生用户属性计算学生相似度,进行评分预测有效地应对了新学生用户没有历史评分的冷启动问题;
(2)本发明通过评分支持度参数考量了预测评分的可信度,降低了数据稀疏的影响,提升了推荐效果;
(3)本发明通过兴趣效能参数考量学生用户获得用人单位录用的可能性,提高了推荐效率。
本发明优点及功效(1)中,学生用户属性相似度计算方法与文献《A Hybrid JobRecommendation Framework for University Students》中所提及方法相同,但是该文献未使用属性相似度进行待就业学生用户对用人单位的评分预测,优点及功效(2)、(3)该文献未涉及,而且本发明提出的评分支持度和兴趣效能优化参数,提供了更好的工作推荐效果。
附图说明
图1是面向冷启动学生用户工作推荐系统框架图;
图2是基于属性的评分预测模型处理流程。
具体实施方式
基于具有相似属性的用户有着相似的兴趣这一思想,通过分析就业历史数据,并结合求职招聘领域的特点,可以发现具有相似条件的学生就业去向相近。本发明基于学生属性信息构建了一个面向冷启动学生用户的工作推荐系统。
本发明通过针对待就业学生用户没有历史评分的情况,系统以学生属性为基础计算用待就业学生用户与已就业学生用户间相似度,然后根据近邻已就业学生用户对用人单位的评分预测该待就业学生用户对用人单位的评分,基于该预测评分即可对待就业学生用户进行工作推荐。考虑到待就业学生用户对用人单位的预测评分可能来自于不同数量的近邻已就业用户对该用人单位的评分,系统引入评分支持度评价预测评分的可信度,以达到优化推荐效果的目的。在工作推荐领域,学生用户的兴趣并不能直接转化成对用人单位的录用行为,系统又引入的兴趣效能参数,以进一步优化推荐效果。
1.学生用户属性相似度计算
图示如图1所示。系统进行推荐的基础是学生属性相似度的计算,鉴于学生属性包含多种数据类型,学生用户属性相似度可通过学生用户间各属性相似度加权之和计算。如公式1所示,其中X和Y代表两个学生用户,wi是学生第i个属性的权重,ai代表第i个属性。
S ( X , Y ) = Σ i = 1 n w i · s i m ( X a i , Y a i ) - - - ( 1 )
学生用户属性中的相似度定义为若属性值相同相似度为1,如属性值不同相似度为0,形式化定义如下:
s i m ( X a i , Y a i ) = 1 X a i = Y a i 0 X a i ≠ Y a i - - - ( 2 )
学生用户属性中的数字型属性相似度计算公式如下所示,其中代表属性ai取值的最大值和最小值。
s i m ( X a i , Y a i ) = 1 - | X a i - Y a i | a i m a x - a i m i n - - - ( 3 )
本发明系统中使用学生专业、生源地和平均成绩三个属性作为相似度计算依据,专业和生源地为枚举属性,平均成绩为数值属性。
专业是影响学生求职的重要因素。专业相似度如果能准确地体现出专业间的差异,将为工作推荐提供有力的支持。但是专业数据信息为专业的名称,是枚举型的,根据对枚举型数据相似度的定义,两个学生用户的专业名称相同则专业相似度为1,不同则为0。用专业名称衡量专业的相似度太粗粒度了,是不够准确的。例如:计算机应用技术专业与电子信息工程专业之间的相似度明显应大于其与经济管理专业的相似度。同时,对于同专业的学生来说,其研究方向不同,就业的方向也存在着明显的差异。例如,计算机应用技术专业中的虚拟现实方向和工程应用方向,其就业方向也存在着明显的不同。因此,利用专业名称计算专业相似度既不能准确体现出专业之间的差异,也不无法反映专业内部的差异。高校为不同专业的学生提供了不同的培养计划,培养计划中既包括公共基础课,又包含了专业基础课和专业方向课。学生可以根据自己的专业方向和专业兴趣选修相应的课程。本发明使用课程集的相似度作为专业的相似度。课程集相似度计算公式如下所示,其中C(X)和C(Y)代表学生所修课程集。
sim c o u r s e ( X , Y ) = | C ( X ) ∩ C ( Y ) | | C ( X ) ∪ C ( Y ) | - - - ( 4 )
系统分别学生用户之间课程集、生源地和平均成绩的相似度,然后计算学生用户之间的总相似度,各属性权重通过超参数检验,根据推荐效果获得。
2、待就业学生用户对用人单位的评分预测及工作推荐
如图2所示,获得学生用户属性相似度后可进行评分预测。预测评分计算公式如下所示,代表待就业学生用户u对用人单位e的预测评分,sim(u,v)代表待就业学生用户u和已就业学生用户v的相似度,rve代表已就业学生用户v对用人单位e的评分。
r ^ u , e = Σ v ∈ K N N ( u ) a s i m ( u , v ) · r v e Σ v ∈ K N N ( u ) a | s i m ( u , v ) | - - - ( 5 )
获得了待就业学生用户的对用人单位的预测评分后,则可根据评分的大小进行推荐,算法如下。
算法1:基于预测评分的工作推荐算法
输入:待就业学生用户u、已就业学生用户集V
输出:推荐工作单位列表E
a.算法首先计算待就业学生用户u与所有已就业学生用户集V中的每一个学生用户v之间的属性相似度,依据相似度大小对已有用户集V进行排序;
b.选取与待就业学生用户u最相似的K个已就业学生用户,获得K个已就业学生用户的就业单位列表,并汇总为单位列表E;
c.根据K个最相似已就业学生用户对单位列表E中的每个单位e的评分,计算加权平均分,作为待就业学生用户u对单位e的预测评分;
d.根据预测评分对单位列表E进行排序,系统可以根据需要推荐前N个项目。
3、基于评分支持度的工作推荐优化
本系统利用学生用户的属性信息,计算学生用户的相似度,并基于近邻模型进行评分预测。基于近邻的推荐模型的推荐效果与数据的稠密程度密切相关。预测评分可能来源于多个近邻用户对项目的评分,也有可能仅来自一个近邻用户对项目的评分。若近邻用户对某特定项目给予了较高评分,且仅有该近邻用户对这个项目评分,则待推荐的新用户对这个项目的评分就是该近邻用户对其的评分,这个评分的可信度显然是不高的。在工作推荐领域,由于用人单位的招聘规模及热门程度不同,广泛存在着评分不均匀的情况,有些用人单位获得了大量评分,而有些用人单位仅获得了极少量的评分。
本发明方法在利用近邻模型预测学生用户对用人单位的评分的同时,记录了生成该预测评分的近邻已就业学生用户数sn,然后计算该预测评分的支持度,最后根据预测评分和支持度进行工作推荐。
预测评分支持度参数,定义如下:
S u p p o r t = s n - sn m i n sn m a x - sn m i n - - - ( 6 )
其中sn表示生成预测评分的近邻已就业学生用户数,snmax表示所有预测评分的最大近邻已就业学生用户数,snmin表示所有预测评分的最小近邻已就业学生用户数,将生成预测评分的近邻已就业学生用户数与所有预测评分的最小近邻已就业学生用户数的差值跟所有预测评分的最大近邻已就业学生用户数与最小近邻已就业学生用户数的差值的比值作为预测评分的支持度。
获得预测评分支持度后,将推荐排序依据定义为预测评分与评分支持度乘积,公式如下所示。
S o r t = r ^ u , e * S u p p o r t - - - ( 7 )
4、基于兴趣效能的工作推荐优化
评分预测的最终目的是将符合用户的兴趣的项目推荐给用户,并且用户对该项目产生购买或其他行为,而不是预测评分是否符合用户最终对该项目的评分。在实际推荐过程中,往往会出现用户对推荐列表中的某个项目感兴趣,但由于各种原因最终并没有产生购买等行为。在这种情况下,推荐虽然符合了用户的兴趣,但可能并不满足用户的实际需求,这种推荐可以认为是低效的或者无效的。工作推荐是一类双向推荐系统,这样的问题更为明显。根据学生的特点为学生推荐用人单位,推荐单位若符合学生的兴趣,学生就会投递简历。当学生发生投递简历的行为时,可以认为推荐有效。但是,学生投递简历的最终目的是获得用人单位的录用,若不能获得录用,推荐其实是无效的。由于求职招聘是一类双向选择的过程,学生最终能否获得录用取决于用人单位的需求与学生的能力的匹配程度,而不是学生的主观意愿,因此常常会出现学生投递了大量的简历而没有获得录用的情况。
本发明将某用人单位实际录用的人数noffer与收到学生用户投递简历的数量ninterest的比值定义为用人单位的兴趣效能,公式如下所示:
E f f i c i e n c y = n o f f e r n int e r e s t - - - ( 8 )
进行用人单位推荐时,将排序依据定义为预测评分、评分支持度和兴趣效能三者的乘积,公式如下所示:
Sort ′ = r ^ u , e * S u p p o r t * E f f i c i e n c y - - - ( 9 ) .
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (2)

1.一种面向冷启动学生用户的工作推荐系统,其特征在于:包括学生用户属性模块、学生用户属性相似度计算模块、基于近邻模型的预测评分模块、基于评分支持度的工作推荐优化模块和基于兴趣效能的工作推荐优化模块;其中:
学生用户属性模块,用于存储学生用户属性,学生属性为就业密切相关的各类信息,包括专业、生源地、性别、课程和成绩多种;
学生用户属性相似度计算模块,利用学生用户属性,计算学生用户属性相似度;所述学生用户属性相似度为学生用户间各属性相似度加权之和,如公式1所示,其中X和Y代表两个学生,ai代表学生用户的某一种属性,wi是代表该属性的权重,wi取值在0-1之间,并且∑wi=1,即各个属性权重之和为1,
S ( X , Y ) = Σ i = 1 n w i · s i m ( X a i , Y a i ) - - - ( 1 ) ;
基于近邻模型的预测评分模块,根据属性相似的已就业学生用户对用人单位的评分,预测待就业学生用户对用人单位的评分;基于具有相似属性的学生用户具有相似的求职兴趣的思想,根据学生用户属性相似度计算结果,选取与待就业学生用户相似度大于某一阈值的近邻已就业学生用户,并计算待就业学生对近邻已就业学生用户已评分的用人单位的预测评分,预测评分计算如公式2所示,代表学生用户u对用人单位e的预测评分,KNN(u)代表与待就业学生u的属性相似度大于某一阈值的已就业学生集,sim(u,v)代表学生用户u和v的相似度,rve代表学生用户v对用人单位e的评分;获得待就业学生用户对所有近邻已就业学生用户已评分用人单位的预测评分后,则根据预测评分的大小进行工作推荐;
r ^ u , e = Σ v ∈ K N N ( u ) a s i m ( u , v ) · r v e Σ v ∈ K N N ( u ) a | s i m ( u , v ) | - - - ( 2 )
基于评分支持度的工作推荐优化模块,用于对基于预测评分的工作推荐效果的优化,使待就业学生用户获得更多的感兴趣的推荐;预测评分可能来源于多个近邻已就业学生用户对项目的评分,也有可能仅来自一个近邻已就业学生用户对项目的评分,来自多个近邻已就业学生用户的评分的预测评分可信度高,来自少量已就业学生用户的预测评分的可信度低;为了降低数据稀疏对预测评分的影响,采用预测评分支持度,定义如公式3所示,其中sn表示生成预测评分的近邻已就业学生用户数,snmax表示所有预测评分的最大近邻已就业学生用户数,snmin表示所有预测评分的最小近邻已就业学生用户数,sn的数值在计算预测评分时同时获得,
S u p p o r t = s n - sn m i n sn m a x - sn m i n - - - ( 3 )
获得预测评分支持度后,将推荐排序依据定义为预测评分与评分支持度乘积,如公式4所示,
Sort = r ^ u , e * Support - - - ( 4 ) ;
基于兴趣效能的工作推荐优化模块,用于提升系统的推荐效率,使待就业学生用户获得更大的被录用的几率;工作推荐系统是一类双向推荐系统,学生用户在选择用人单位的同时,用人单位也在选择学生用户,将某用人单位实际录用的人数noffer与收到学生用户投递简历的数量ninterest的比值定义为用人单位的兴趣效能,如公式5所示,
E f f i c i e n c y = n o f f e r n int e r e s t - - - ( 5 )
基于兴趣效能的工作推荐优化模块可与基于评分支持度的工作推荐优化模块组合使用,进行用人单位推荐时,将排序依据定义为基于近邻模型的预测评分模块的预测评分、基于评分支持度的工作推荐优化模块的评分支持度、基于兴趣效能的工作推荐优化模块的兴趣效能三者的乘积,如公式6所示,
Sort ′ = r ^ u , e * Support * Efficiency - - - ( 6 )
2.一种面向冷启动学生用户的工作推荐方法,其特征在于步骤如下:
(1)首先需计算学生用户属性的相似度,并预测评分,学生用户属性包括多种数据类型,学生用户属性相似度可定义为学生用户间各属性相似度加权之和,如公式1所示,其中X和Y代表两个学生用户,wi是学生第i个属性的权重,ai代表第i个属性。
S ( X , Y ) = Σ i = 1 n w i · s i m ( X a i , Y a i ) - - - ( 1 )
(2)获得了学生用户之间的属性相似度后,则可利用近邻模型计算待就业学生用户对某用人单位的预测评分;预测评分计算如公式2所示,代表待就业学生用户u对用人单位e的预测评分,sim(u,v)代表学生用户u和v的相似度,rve代表已就业学生用户v对用人单位e的评分,计算预测评分的同时,可以获得用于计算预测评分的近邻用户数sn,
r ^ u , e = Σ v ∈ K N N ( u ) a s i m ( u , v ) · r v e Σ v ∈ K N N ( u ) a | s i m ( u , v ) | - - - ( 2 )
(3)根据用于生成预测评分的近邻用户数sn,计算预测评分的支持度,如公式3所示,其中sn表示生成预测评分的近邻学生用户数,snmax表示所有预测评分的最大近邻学生用户数,snmin表示所有预测评分的最小近邻学生用户数,
S u p p o r t = s n - sn m i n sn m a x - sn m i n - - - ( 3 )
(4)根据用人单位实际录用的人数noffer与收到学生投递简历的数量ninterest的比值计算用人单位的兴趣效能,如公式5所示,
E f f i c i e n c y = n o f f e r n int e r e s t - - - ( 4 )
(5)将预测评分、评分支持度与兴趣效能的乘积作为工作推荐的依据,如公式5所示,进行工作推荐,
Sort ′ = r ^ u , e * S u p p o r t * E f f i c i e n c y - - - ( 5 ) .
CN201610474388.8A 2016-06-24 2016-06-24 一种面向冷启动学生用户的工作推荐系统及推荐方法 Pending CN106097204A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610474388.8A CN106097204A (zh) 2016-06-24 2016-06-24 一种面向冷启动学生用户的工作推荐系统及推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610474388.8A CN106097204A (zh) 2016-06-24 2016-06-24 一种面向冷启动学生用户的工作推荐系统及推荐方法

Publications (1)

Publication Number Publication Date
CN106097204A true CN106097204A (zh) 2016-11-09

Family

ID=57252780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610474388.8A Pending CN106097204A (zh) 2016-06-24 2016-06-24 一种面向冷启动学生用户的工作推荐系统及推荐方法

Country Status (1)

Country Link
CN (1) CN106097204A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991522A (zh) * 2017-03-16 2017-07-28 西南交通大学 一种基于内容的新车型评分预测方法
CN107038497A (zh) * 2017-03-31 2017-08-11 珠海知未科技有限公司 一种学生成绩预测系统及方法
CN109711482A (zh) * 2019-01-07 2019-05-03 东华大学 一种毕业生去向信息管理及推荐系统
CN109754349A (zh) * 2019-01-07 2019-05-14 上海复岸网络信息科技有限公司 一种在线教育智能师生匹配系统
CN110727788A (zh) * 2019-10-17 2020-01-24 上海乂学教育科技有限公司 基于知识点相似度的自适应教学方案调整方法
CN111475531A (zh) * 2020-04-12 2020-07-31 魏秋云 一种基于学生就业数据的信息分析系统
CN112214670A (zh) * 2020-10-09 2021-01-12 平安国际智慧城市科技股份有限公司 一种在线课程推荐方法、装置、电子设备及存储介质
CN112347348A (zh) * 2020-10-30 2021-02-09 中教云智数字科技有限公司 一种教学资源推荐模型训练方法
CN116523484A (zh) * 2023-06-29 2023-08-01 众科云(北京)科技有限公司 一种用工平台数据优化采集方法及系统
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991522A (zh) * 2017-03-16 2017-07-28 西南交通大学 一种基于内容的新车型评分预测方法
CN107038497A (zh) * 2017-03-31 2017-08-11 珠海知未科技有限公司 一种学生成绩预测系统及方法
CN109711482A (zh) * 2019-01-07 2019-05-03 东华大学 一种毕业生去向信息管理及推荐系统
CN109754349A (zh) * 2019-01-07 2019-05-14 上海复岸网络信息科技有限公司 一种在线教育智能师生匹配系统
CN109754349B (zh) * 2019-01-07 2023-09-05 上海复岸网络信息科技有限公司 一种在线教育智能师生匹配系统
CN110727788B (zh) * 2019-10-17 2020-11-10 上海松鼠课堂人工智能科技有限公司 基于知识点相似度的自适应教学方案调整方法
CN110727788A (zh) * 2019-10-17 2020-01-24 上海乂学教育科技有限公司 基于知识点相似度的自适应教学方案调整方法
CN111475531A (zh) * 2020-04-12 2020-07-31 魏秋云 一种基于学生就业数据的信息分析系统
CN112214670A (zh) * 2020-10-09 2021-01-12 平安国际智慧城市科技股份有限公司 一种在线课程推荐方法、装置、电子设备及存储介质
CN112347348A (zh) * 2020-10-30 2021-02-09 中教云智数字科技有限公司 一种教学资源推荐模型训练方法
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking
CN116523484A (zh) * 2023-06-29 2023-08-01 众科云(北京)科技有限公司 一种用工平台数据优化采集方法及系统
CN116523484B (zh) * 2023-06-29 2023-12-08 众科云(北京)科技有限公司 一种用工平台数据优化采集方法及系统

Similar Documents

Publication Publication Date Title
CN106097204A (zh) 一种面向冷启动学生用户的工作推荐系统及推荐方法
CN105260390B (zh) 一种面向群组的基于联合概率矩阵分解的项目推荐方法
De Steiguer et al. The analytic hierarchy process as a means for integrated watershed management
Chen A signed-distance-based approach to importance assessment and multi-criteria group decision analysis based on interval type-2 fuzzy set
US9654593B2 (en) Discovering signature of electronic social networks
CN107273490A (zh) 一种基于知识图谱的组合错题推荐方法
CN105138624A (zh) 一种基于在线课程用户数据的个性化推荐方法
Williams Predicting completed project cost using bidding data
CN106250438A (zh) 基于随机游走模型的零引用文章推荐方法及系统
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
Tran et al. Performance prediction for students: A multi-strategy approach
Abdelhamid et al. A decision support system for performance evaluation
Shelton et al. Integrated multiple-criteria decision-making method to prioritize transportation projects
CN104598648A (zh) 一种微博用户交互式性别识别方法及装置
Ahkamiraad et al. An agent-based model for zip-code level diffusion of electric vehicles and electricity consumption in New York City
CN104156784A (zh) 一种基于未确知测度综合评价的评标方法
Myšiak Consistency of the results of different MCA methods: a critical review
Omar et al. Team formation model of selecting team leader: An analytic hierarchy process (AHP) approach
Park et al. Exploring promising technology in ICT sector using patent network and promising index based on patent information
CN117455158A (zh) 一种典型场景智能体编组决策方案生成装置及方法
Chen et al. Fuzzy-based decision-making applied to performance evaluation in value engineering
CN107886223A (zh) 民事案件复杂度指标评价方法及系统
CN117093778A (zh) 一种基于词义加权的工程机械软件任务和人员推荐方法及系统
Niemeijer et al. Constructing and predicting school advice for academic achievement: A comparison of item response theory and machine learning techniques
Warnaar et al. The aggregative contingent estimation system: Selecting, rewarding, and training experts in a wisdom of crowds approach to forecasting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161109