CN106933821A - 一种基于相似度计算的个性化职位推荐方法和系统 - Google Patents
一种基于相似度计算的个性化职位推荐方法和系统 Download PDFInfo
- Publication number
- CN106933821A CN106933821A CN201511016094.2A CN201511016094A CN106933821A CN 106933821 A CN106933821 A CN 106933821A CN 201511016094 A CN201511016094 A CN 201511016094A CN 106933821 A CN106933821 A CN 106933821A
- Authority
- CN
- China
- Prior art keywords
- user
- similarity
- interest
- behavior
- sets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于相似度计算的个性化职位推荐方法和系统,涉及数据挖掘中推荐系统领域。其中的方法包括:提取并分析用户行为数据,建立用户兴趣模型;根据用户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。即根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现个性化职位推荐,可以帮助用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
Description
技术领域
本发明涉及数据挖掘中推荐系统领域,尤其涉及一种基于相似度计算的个性化职位推荐方法和系统。
背景技术
随着互联网技术的快速发展,人们面临着信息过载的情况,在琳琅满目的内容面前,用户需要大量的时间才能找到自己想要的信息和商品。因此,推荐系统在这种环境下应运而生。个性化推荐,主要是根据用户的行为兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。目前在电子商务系统、电影、视频网站、个性化音乐电台、个性化广告、个性化阅读等方面得到广泛运用。其中电子商务网站是个性化推荐的一大应用领域,著名的电子商务网站亚马逊是个性化系统的积极应用者和推广者,国内的淘宝和京东商城近年也大力推进推荐系统的发展。此外,在电影和视频中,美国的Netflix非常看重推荐技术的发展,并建立Netflix Prize推荐系统比赛。亚马逊和Netflix是推荐系统领域最具代表性的两家公司,主要运用协同过滤的推荐技术实现个性化的商品和视频电影推荐。
当前推荐系统的主要研究技术,有基于协同过滤的推荐、基于关联规则的推荐、基于内容推荐、基于模型的推荐、基于社会化的推荐、和基于移动位置的推荐等。
本院翼实习系统提供数十万职位,用户在进行选择申报时,尽管通过搜索可以过滤一些信息,但还是需要花费一定的时间才能找到自己满意的职位。
发明内容
本发明要解决的技术问题是现有技术中搜索、申请职位不方便。
根据本发明一方面,提出一种基于相似度计算的个性化职位推荐方法,包括:提取并分析用户行为数据,建立用户兴趣模型;根据用户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。
进一步地,根据用户兴趣模型,计算各用户之间的相似度的步骤包括:获取各用户对各个职位的兴趣值;以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
进一步地,还包括:计算各用户查询职位内容的相似度,并将各用户查询职位内容的相似度作为各用户之间的相似度。
进一步地,计算各用户查询职位内容的相似度的步骤包括:将各用户查询职位内容进行分词处理,将分词处理后的每个字段作为一个集合;计算各集合的交集大小与各集合的并集大小的比值;根据比值计算各用户查询职位内容的相似度。
进一步地,根据用户兴趣模型计算各职位之间的相似度的步骤包括:基于各个用户对各个职位的偏好获得各个职位的用户偏好向量;基于各个职位的用户偏好向量计算各个职位之间的相似度。
进一步地,提取并分析用户行为数据,建立用户兴趣模型的步骤包括:为用户行为数据中的用户申请职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴趣模型。
进一步地,还包括:将当前用户的注册信息与职位数据库中的职位属性进行匹配,职位属性包括薪酬、技能、专业和工作地点要求;将匹配度最高的职位推荐给当前用户。
根据本发明的另一方面,还提出一种基于相似度计算的个性化职位推荐系统,包括:兴趣模型建立单元,用于提取并分析用户行为数据,建立用户兴趣模型;相似度计算单元,用于根据用户兴趣模型,计算各用户之间或各职位之间的相似度;相似度排序单元,用于对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;职位推荐单元,用于将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。
进一步地,相似度计算单元用于获取各用户对各个职位的兴趣值;以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
进一步地,相似度计算单元还用于计算各用户查询职位内容的相似度,并将各用户查询职位内容的相似度作为各用户之间的相似度。
进一步地,相似度计算单元还用于将各用户查询职位内容进行分词处理,将分词处理后的每个字段作为一个集合;计算各集合的交集大小与各集合的并集大小的比值;根据比值计算各用户查询职位内容的相似度。
进一步地,相似度计算单元还用于基于各个用户对各个职位的偏好获得各个职位的用户偏好向量;基于各个职位的用户偏好向量计算各个职位之间的相似度。
进一步地,兴趣模型建立单元用于为用户行为数据中的用户申请职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴趣模型。
进一步地,还包括:用户注册信息推荐单元,用于将当前用户的注册信息与职位数据库中的职位属性进行匹配,职位属性包括薪酬、技能、专业和工作地点要求;将匹配度最高的职位推荐给当前用户。
与现有技术相比,本发明从传统单一的基于用户评分的协同过滤推荐技术,提升为基于用户行为信息个性化推荐技术。即根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现个性化职位推荐,可以帮助用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明基于相似度计算的个性化职位推荐方法的一个实施例的流程示意图。
图2为本发明基于用户相似的个性化职位推荐方法的一个实施例的流程示意图。
图3为本发明基于用户相似的个性化职位推荐方法的另一个实施例的流程示意图。
图4为本发明基于职位相似的个性化职位推荐方法的一个实施例的流程示意图。
图5为本发明个性化职位推荐推荐引擎设计示意图。
图6为本发明基于相似度计算的个性化职位推荐系统的一个实施例的流程示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1为本发明基于相似度计算的个性化职位推荐方法的一个实施例的流程示意图。该方法包括以下步骤:
在步骤110,提取并分析用户行为数据,建立用户兴趣模型。
用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览职位行为等,其中,可以为用户申请职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴趣模型。在一个实施例中,可以根据关联性大小调整兴趣模型中各种行为对应的权值。例如,对申请职位行为设置兴趣权值为5,对收藏职位行为设置的兴趣权值为4,对浏览职位行为设置兴趣权值为3。这些兴趣参数值在运用的过程中,可进行适当的微调。除此参数外,还可以设置个性化推荐的职位数,例如用户推荐职位数设置为5。
在步骤120,根据用户兴趣模型,计算各用户之间或各职位之间的相似度。
可以以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度,或者基于各个用户对各个职位的偏好获得各个职位的用户偏好向量,然后基于各个职位的用户偏好向量计算各个职位之间的相似度。
在步骤130,对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集。
在步骤140,将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给所述当前用户。
例如,根据用户行为历史数据,推荐和当前用户职位兴趣相似的用户所喜欢的职位,或者推荐和当前职位相似的职位。
本发明可以应用于翼实习项目的职位推荐模块,根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现了基于用户相似的和职位相似的个性化职位推荐的方法,可以帮助用户更快更好地发现和找到自己感兴趣以及适合自己的职位。
图2为本发明基于用户相似的个性化职位推荐方法的一个实施例的流程示意图。该方法包括以下步骤:
在步骤210,在用户行为数据库进行行为提取和分析,建立用户兴趣模型。
用户行为数据库中包括用户申请职位行为、用户收藏职位行为、用户浏览职位行为、用户职位查询内容行为等。
在步骤220,根据用户兴趣模型,获取各用户对各个职位的兴趣值。
在步骤230,以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
例如,用户A和B都申请了职位1、2,用户C申请了职位1、3,则用户A和B的相似度高于用户A和C的相似度。
在步骤240,对相似度的值排序,获取与当前用户相似度最高的前N个用户集。
根据用户对职位的行为数据,包括申请、收藏、浏览职位行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,基于用户对职位的兴趣值找到最相似的邻居用户集。
在步骤250,将前N个用户集中相似用户申请的职位推荐给当前用户。
即根据邻居的相似度权重以及他们对职位的偏好,推荐当前用户未涉及职位(推荐的职位,相似用户之前没有申请),计算得到一个排序的职位列表作为推荐。
例如,如表1所示,对于用户A,申请了职位1和职位3,用户C申请职位1,3,4,而用户B申请了职位2,因此用户A和用户C相似。即根据用户的历史偏好,这里只计算得到一个相似邻居用户C因此将用户C申请的职位4推荐给用户A。
用户/职位 | 职位1 | 职位2 | 职位3 | 职位4 |
用户A | √ | √ | 推荐 | |
用户B | √ | |||
用户C | √ | √ | √ |
表1
在该实施例中,根据用户的对职位的行为数据,包括申请、收藏、浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,基于用户对职位的兴趣值找到最相似的邻居用户集,然后将相似用户申请的职位推荐给当前用户。因此,方便了用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
图3为本发明基于用户相似的个性化职位推荐方法的另一个实施例的流程示意图。
在步骤310,在用户行为数据库进行行为提取和分析,建立用户兴趣模型。
在步骤320,根据用户兴趣模型,计算各用户查询职位内容的相似度,并将各用户查询职位内容的相似度作为各用户之间的相似度。
在一个实施例中,将各用户查询职位内容利用自然语言处理技术进行分词处理,将分词处理后的每个字段作为一个集合,可以将每个集合存在用户行为数据库中。计算各集合的交集大小与各集合的并集大小的比值;根据比值计算各用户查询职位内容的相似度。
例如,利用Jaccard相似度的方法,A,B分别代表查询内容字段的集合,J(A,B)为两个集合交集的大小/两个集合并集的大小。
在步骤330,对相似度的值排序,获取与当前用户相似度最高的前N个用户集。
在步骤340,将前N个用户集中相似用户申请的职位推荐给当前用户。
例如,如表2所示,对于用户A查询了北京,计算机,申请了职位1、2和3,用户B查询了上海,计算机,申请了职位1和4,用户C也查询了北京,计算机,同时申请了职位1和2,此时判断用户A和C相似度高,将职位3推荐给用户C。
用户查询内容/职位 | 职位1 | 职位2 | 职位3 | 职位4 |
用户A:北京计算机 | √ | √ | √ | |
用户B:上海计算机 | √ | √ | ||
用户C:北京计算机 | √ | √ | 推荐 |
表2
由于实习职位业务的特殊性,地点作为职位的关键要素受用户关注度较高,因此在此增加针对地点的修正算法,提高实习位置信息内容在相似度计算中的占比。
在该实施例中,将用户职位查询内容字段,用自然语言处理技术中的分词后,分词后存在用户行为数据库中。然后通过计算用户查询内容相似性,作为用户之间的相似性,将相似用户申请的职位,推荐给未申请该职位的相似用户。因此,方便了用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
图4为本发明基于职位相似的个性化职位推荐方法的一个实施例的流程示意图。该方法包括以下步骤:
在步骤410,提取并分析用户行为数据,建立用户兴趣模型。
用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览职位行为等。
在步骤420,基于各个用户对各个职位的偏好获得各个职位的用户偏好向量。
在步骤430,基于各个职位的用户偏好向量计算各个职位之间的相似度。
例如,申请职位A的用户大部分都申请职位B,则职位A和职位B为相似职位。
在步骤440,对相似度的值排序,获取与当前职位相似度最高的前N个职位集。
在步骤450,将前N个职位集中相似职位推荐给当前用户。
例如,如表3所示,对于职位1,根据各个用户的历史偏好,喜欢职位1的用户都喜欢职位3,得出职位1和职位3比较相似,而用户C喜欢职位1,那么可以推断出用户C可能也喜欢职位3。
用户/职位 | 职位1 | 职位2 | 职位3 |
用户A | √ | √ | |
用户B | √ | √ | √ |
用户C | √ | 推荐 |
表3
在该实施例中,根据用户对职位的行为数据,包括申请、收藏、浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,基于用户对职位的兴趣找到相似的职位,然后根据用户的历史偏好,推荐相似的职位给该用户。因此,方便了用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
本发明的另一个实施例,针对系统初始阶段用户数据行为数据稀缺这一问题,采用利用用户注册信息进行推荐的方法,根据用户注册时的信息,其中包括用户研究方向、专业、学历、所选行业、兴趣职位等进行相应的职位推荐。
例如,在翼实习系统中,用户注册信息包含了对实习感兴趣的在校大学生的用户基本画像属性,包括:性别、高校、专业、年龄、技能、工作地点等;对应的职位描述属性中也有一些职位要求的标签,诸如岗位、薪酬、技能、专业、工作地点的要求,将职位要求与用户基本属性进行比对,从而实现向用户推荐对应的职位。此外还可以增加用户订阅器,根据用户的要求向其推荐职位。
在该实施例中,增加了基于用户注册信息的推荐方法,可以有效地解决初始阶段用户行为数据稀缺的冷启动问题。随着用户和系统行为交互的增加,系统个性化职位推荐的效果会显著提高。
图5为本发明个性化职位推荐推荐引擎设计示意图。
510为业务数据满足时进行推荐的过程。即用户数据行为数据足够多时,在用户行为数据库进行行为提取和分析,建立用户兴趣特征。离线计算用户相似度和职位相似度表,产生初步推荐结果。进一步,根据用户反馈,对初步的推荐结果进行过滤和排名,产生最终的推荐结果。
520为冷启动机制,即在系统初始阶段用户数据行为数据稀缺时,启动冷启动机制。基本属性推荐模型指的就是510标准相似度计算之外,根据用户数据模型中的基本属性以及用户的期望属性值和职位的数据模型中的属性进行属性匹配,从而达到推荐给用户有效职位的目的。属于相似度模型的一个补充模式。
由于实习职位业务的特殊性,地点作为职位的关键要素受用户关注度较高,因此可以增加针对地点的修正算法,提高实习位置信息内容在相似度计算中的占比。
本发明应用于翼实习项目的职位推荐模块,使用本发明的个性化推荐技术,并结合具体的应用环境进行改进。从传统单一的基于用户评分的协同过滤推荐技术,提升为基于用户行为信息个性化推荐技术,包括用户申请职位、收藏职位、浏览职位等行为信息,建立用户职位兴趣模型,实现个性化推荐职位。此外,在此基础上又整合了基于用户查询内容的推荐技术,有效地提升了推荐的效果。在推荐的设计过程中,还增加了基于用户注册信息的推荐,可以有效地解决初始阶段用户行为数据稀缺的冷启动问题,另外还可以提升业务主体(职位、用户)关键属性(如地点)在相似度算法模型中的占比,提升算法精确度。随着用户和系统行为交互的增加,系统个性化职位推荐的效果会显著提高。
图6为本发明基于相似度计算的个性化职位推荐系统的一个实施例的流程示意图。该系统包括:兴趣模型建立单元610、相似度计算单元620、相似度排序单元630和职位推荐单元640。
兴趣模型建立单元610用于提取并分析用户行为数据,建立用户兴趣模型。
用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览职位行为等,其中,可以为用户申请职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三兴趣权值;根据第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴趣模型。在一个实施例中,可以根据关联性大小调整兴趣模型中各种行为对应的权值。例如,对申请职位行为设置兴趣权值为5,对收藏职位行为设置的兴趣权值为4,对浏览职位行为设置兴趣权值为3。这些兴趣参数值在运用的过程中,可进行适当的微调。除此参数外,个性化推荐的职位数可进行设置,例如用户推荐职位数设置为5。
相似度计算单元620用于根据用户兴趣模型,计算各用户之间或各职位之间的相似度。
可以以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度,或者基于各个用户对各个职位的偏好获得各个职位的用户偏好向量,然后基于各个职位的用户偏好向量计算各个职位之间的相似度。
相似度排序单元630用于对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集。
职位推荐单元640用于将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给所述当前用户。
例如,根据用户行为历史数据,推荐和当前用户职位兴趣相似的用户所喜欢的职位,或者推荐和当前职位相似的职位。
本发明可以应用于翼实习项目的职位推荐模块,根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现了基于用户相似的和职位相似的个性化职位推荐的方法,可以帮助用户更快更好地发现和找到自己感兴趣以及适合自己的职位。
本发明的另一个实施例,兴趣模型建立单元610用于在用户行为数据库进行行为提取和分析,建立用户兴趣模型。
用户行为数据库中包括用户申请职位行为、用户收藏职位行为、用户浏览职位行为、用户职位查询内容行为等。
相似度计算单元620用于根据用户兴趣模型,获取各用户对各个职位的兴趣值,以各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
例如,用户A和B都申请了职位1、2,用户C申请了职位1、3,则用户A和B的相似度高于用户A和C的相似度。
相似度排序单元630用于对相似度的值排序,获取与当前用户相似度最高的前N个用户集。
根据用户对职位的行为数据,包括申请、收藏、浏览职位行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,基于用户对职位的兴趣值找到最相似的邻居用户集。
职位推荐单元640用于将前N个用户集中相似用户申请的职位推荐给当前用户。
即根据邻居的相似度权重以及他们对职位的偏好,推荐当前用户未涉及职位(推荐的职位,相似用户之前没有申请),计算得到一个排序的职位列表作为推荐。
例如,如表1所示,对于用户A,申请了职位1和职位3,用户C申请职位1,3,4,而用户B申请了职位2,因此用户A和用户C相似。即根据用户的历史偏好,这里只计算得到一个相似邻居用户C因此将用户C申请的职位4推荐给用户A。
在该实施例中,根据用户的对职位的行为数据,包括申请、收藏、浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,基于用户对职位的兴趣值找到最相似的邻居用户集,然后将相似用户申请的职位推荐给当前用户。因此,方便了用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
本发明的另一个实施例,兴趣模型建立单元610用于在用户行为数据库进行行为提取和分析,建立用户兴趣模型。
相似度计算单元620用于根据用户兴趣模型,计算各用户查询职位内容的相似度,并将各用户查询职位内容的相似度作为各用户之间的相似度。
在一个实施例中,将各用户查询职位内容利用自然语言处理技术进行分词处理,将分词处理后的每个字段作为一个集合,可以将每个集合存在用户行为数据库中。计算各集合的交集大小与各集合的并集大小的比值;根据比值计算各用户查询职位内容的相似度。
例如,利用Jaccard相似度的方法,A,B分别代表查询内容字段的集合,J(A,B)为两个集合交集的大小/两个集合并集的大小。
相似度排序单元630用于对相似度的值排序,获取与当前用户相似度最高的前N个用户集。
职位推荐单元640用于将前N个用户集中相似用户申请的职位推荐给当前用户。
例如,如表2所示,对于用户A查询了北京,计算机,申请了职位1、2和3,用户B查询了上海,计算机,申请了职位1和4,用户C也查询了北京,计算机,同时申请了职位1和2,此时判断用户A和C相似度高,将职位3推荐给用户C。
由于实习职位业务的特殊性,地点作为职位的关键要素受用户关注度较高,因此在此增加针对地点的修正算法,提高实习位置信息内容在相似度计算中的占比。
在该实施例中,将用户职位查询内容字段,用自然语言处理技术中的分词后,分词后存在用户行为数据库中。然后通过计算用户查询内容相似性,作为用户之间的相似性,将相似用户申请的职位,推荐给未申请该职位的相似用户。因此,方便了用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
本发明的另一个实施例,兴趣模型建立单元610用于提取并分析用户行为数据,建立用户兴趣模型。
用户行为包括用户申请职位行为、用户收藏职位行为、用户浏览职位行为等。
相似度计算单元620用于根据用户兴趣模型,基于各个用户对各个职位的偏好获得各个职位的用户偏好向量,基于各个职位的用户偏好向量计算各个职位之间的相似度。
例如,申请职位A的用户大部分都申请职位B,则职位A和职位B为相似职位。
相似度排序单元630用于对相似度的值排序,获取与当前职位相似度最高的前N个职位集。
职位推荐单元640用于将前N个职位集中相似职位推荐给当前用户。
例如,如表3所示,对于职位1,根据各个用户的历史偏好,喜欢职位1的用户都喜欢职位3,得出职位1和职位3比较相似,而用户C喜欢职位1,那么可以推断出用户C可能也喜欢职位3。
在该实施例中,根据用户对职位的行为数据,包括申请、收藏、浏览行为建立用户兴趣模型,然后根据用户兴趣模型产生用户对职位的兴趣值,基于用户对职位的兴趣找到相似的职位,然后根据用户的历史偏好,推荐相似的职位给该用户。因此,方便了用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
本发明的另一个实施例,还可以包括用户注册信息推荐单元,用于将当前用户的注册信息与职位数据库中的职位属性进行匹配。例如,在翼实习系统中,用户注册信息包含了对实习感兴趣的在校大学生的用户基本画像属性,包括:性别、高校、专业、年龄、技能、工作地点等;对应的职位描述属性中也有一些职位要求的标签,诸如岗位、薪酬、技能、专业、工作地点的要求,将职位要求与用户基本属性进行比对,从而实现向用户推荐对应的职位。此外还可以增加用户订阅器,根据用户的要求向其推荐职位。
在该实施例中,增加了基于用户注册信息的推荐方法,可以有效地解决初始阶段用户行为数据稀缺的冷启动问题。随着用户和系统行为交互的增加,系统个性化职位推荐的效果会显著提高。
至此,已经详细描述了本发明。为了避免遮蔽本发明的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本发明的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。
Claims (14)
1.一种基于相似度计算的个性化职位推荐方法,其特征在于,包括:
提取并分析用户行为数据,建立用户兴趣模型;
根据所述用户兴趣模型,计算各用户之间或各职位之间的相似度;
对所述相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;
将所述前N个用户集中相似用户申请的职位或所述前N个职位集中相似职位推荐给所述当前用户。
2.根据权利要求1所述的方法,其特征在于,根据所述用户兴趣模型,计算各用户之间的相似度的步骤包括:
获取各用户对各个职位的兴趣值;
以所述各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
3.根据权利要求2所述的方法,其特征在于,还包括:
计算各用户查询职位内容的相似度,并将所述各用户查询职位内容的相似度作为各用户之间的相似度。
4.根据权利要求3所述的方法,其特征在于,计算各用户查询职位内容的相似度的步骤包括:
将各用户查询职位内容进行分词处理,将分词处理后的每个字段作为一个集合;
计算各集合的交集大小与各集合的并集大小的比值;
根据所述比值计算各用户查询职位内容的相似度。
5.根据权利要求1所述的方法,其特征在于,根据所述用户兴趣模型计算各职位之间的相似度的步骤包括:
基于各个用户对各个职位的偏好获得各个职位的用户偏好向量;
基于各个职位的用户偏好向量计算各个职位之间的相似度。
6.根据权利要求1所述的方法,其特征在于,提取并分析用户行为数据,建立用户兴趣模型的步骤包括:
为所述用户行为数据中的用户申请职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三兴趣权值;
根据所述第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴趣模型。
7.根据权利要求1-6任一所述的方法,其特征在于,还包括:
将当前用户的注册信息与职位数据库中的职位属性进行匹配,所述职位属性包括薪酬、技能、专业和工作地点要求;
将匹配度最高的职位推荐给所述当前用户。
8.一种基于相似度计算的个性化职位推荐系统,其特征在于,包括:
兴趣模型建立单元,用于提取并分析用户行为数据,建立用户兴趣模型;
相似度计算单元,用于根据所述用户兴趣模型,计算各用户之间或各职位之间的相似度;
相似度排序单元,用于对所述相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;
职位推荐单元,用于将所述前N个用户集中相似用户申请的职位或所述前N个职位集中相似职位推荐给所述当前用户。
9.根据权利要求8所述的系统,其特征在于,
所述相似度计算单元用于获取各用户对各个职位的兴趣值;以所述各用户对各个职位的兴趣值为向量,计算各用户之间的相似度。
10.根据权利要求9所述的系统,其特征在于,
所述相似度计算单元还用于计算各用户查询职位内容的相似度,并将所述各用户查询职位内容的相似度作为各用户之间的相似度。
11.根据权利要求10所述的系统,其特征在于,
所述相似度计算单元还用于将各用户查询职位内容进行分词处理,将分词处理后的每个字段作为一个集合;计算各集合的交集大小与各集合的并集大小的比值;根据所述比值计算各用户查询职位内容的相似度。
12.根据权利要求8所述的系统,其特征在于,
所述相似度计算单元还用于基于各个用户对各个职位的偏好获得各个职位的用户偏好向量;基于各个职位的用户偏好向量计算各个职位之间的相似度。
13.根据权利要求8所述的系统,其特征在于,
所述兴趣模型建立单元用于为所述用户行为数据中的用户申请职位行为设置第一兴趣权值,为用户收藏职位行为设置第二兴趣权值,为用户浏览职位行为设置第三兴趣权值;根据所述第一兴趣权值、第二兴趣权值和第三兴趣权值,计算用户对职位的兴趣值,从而建立用户兴趣模型。
14.根据权利要求8-13任一所述的系统,其特征在于,还包括:
用户注册信息推荐单元,用于将当前用户的注册信息与职位数据库中的职位属性进行匹配,所述职位属性包括薪酬、技能、专业和工作地点要求;将匹配度最高的职位推荐给所述当前用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511016094.2A CN106933821A (zh) | 2015-12-29 | 2015-12-29 | 一种基于相似度计算的个性化职位推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511016094.2A CN106933821A (zh) | 2015-12-29 | 2015-12-29 | 一种基于相似度计算的个性化职位推荐方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106933821A true CN106933821A (zh) | 2017-07-07 |
Family
ID=59442233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511016094.2A Pending CN106933821A (zh) | 2015-12-29 | 2015-12-29 | 一种基于相似度计算的个性化职位推荐方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933821A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107515904A (zh) * | 2017-07-31 | 2017-12-26 | 北京拉勾科技有限公司 | 一种职位搜索方法和计算设备 |
CN107704485A (zh) * | 2017-07-31 | 2018-02-16 | 北京拉勾科技有限公司 | 一种职位推荐方法及计算设备 |
CN107844595A (zh) * | 2017-11-21 | 2018-03-27 | 安徽网才信息技术股份有限公司 | 一种求职网站职位智能推荐方法 |
CN108021673A (zh) * | 2017-12-06 | 2018-05-11 | 北京拉勾科技有限公司 | 一种用户兴趣模型生成方法、职位推荐方法及计算设备 |
CN108133357A (zh) * | 2017-12-22 | 2018-06-08 | 北京拉勾科技有限公司 | 一种人才推荐方法及计算设备 |
CN108764838A (zh) * | 2018-05-24 | 2018-11-06 | 佛山市轻遣网络有限公司 | 用于招聘系统的推荐方法及系统 |
CN108876285A (zh) * | 2018-05-24 | 2018-11-23 | 佛山市轻遣网络有限公司 | 向用户推荐职位信息的方法及系统 |
CN109670104A (zh) * | 2018-11-12 | 2019-04-23 | 深圳壹账通智能科技有限公司 | 基于机器学习的信息推送方法、设备、装置及存储介质 |
CN109697629A (zh) * | 2018-11-15 | 2019-04-30 | 平安科技(深圳)有限公司 | 产品数据推送方法及装置、存储介质、计算机设备 |
CN110297981A (zh) * | 2019-07-01 | 2019-10-01 | 江苏漩涡网络科技有限公司 | 职位推荐系统与方法 |
WO2019205795A1 (zh) * | 2018-04-26 | 2019-10-31 | 腾讯科技(深圳)有限公司 | 兴趣推荐方法、计算机设备及存储介质 |
CN110727852A (zh) * | 2018-07-16 | 2020-01-24 | Tcl集团股份有限公司 | 一种推送招聘推荐服务的方法、装置及终端 |
CN110968771A (zh) * | 2018-09-29 | 2020-04-07 | 北京淘友天下技术有限公司 | 一种基于朋友关系的职位推荐冷启动方法及系统 |
CN111192161A (zh) * | 2019-12-19 | 2020-05-22 | 广东电网有限责任公司电力调度控制中心 | 电力市场交易对象推荐方法、装置 |
CN111488531A (zh) * | 2020-03-16 | 2020-08-04 | 山东浪潮通软信息科技有限公司 | 一种基于协同过滤算法的信息推荐方法、设备及介质 |
WO2020215751A1 (zh) * | 2019-04-23 | 2020-10-29 | 北京三快在线科技有限公司 | 一种推荐方法、电子设备及可读存储介质 |
CN111861268A (zh) * | 2020-07-31 | 2020-10-30 | 平安金融管理学院(中国·深圳) | 候选人推荐方法、装置、电子设备及存储介质 |
CN116628340A (zh) * | 2023-06-15 | 2023-08-22 | 中科聚信信息技术(北京)有限公司 | 职位代理人推荐方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136092A (zh) * | 2010-01-26 | 2011-07-27 | 上海美你德软件有限公司 | 跟踪提供用户文件和活动信息的方法及系统 |
CN102651103A (zh) * | 2012-04-09 | 2012-08-29 | 上海勤雨信息科技有限公司 | 一种职位招聘系统 |
CN102708525A (zh) * | 2012-05-22 | 2012-10-03 | 华南理工大学 | 基于gpu加速的招聘职位智能推荐方法 |
CN104834668A (zh) * | 2015-03-13 | 2015-08-12 | 浙江奇道网络科技有限公司 | 基于知识库的职位推荐系统 |
CN104933239A (zh) * | 2015-06-09 | 2015-09-23 | 江苏大学 | 一种基于混合模型的个性化职位信息推荐系统及实现方法 |
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
-
2015
- 2015-12-29 CN CN201511016094.2A patent/CN106933821A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136092A (zh) * | 2010-01-26 | 2011-07-27 | 上海美你德软件有限公司 | 跟踪提供用户文件和活动信息的方法及系统 |
CN102651103A (zh) * | 2012-04-09 | 2012-08-29 | 上海勤雨信息科技有限公司 | 一种职位招聘系统 |
CN102708525A (zh) * | 2012-05-22 | 2012-10-03 | 华南理工大学 | 基于gpu加速的招聘职位智能推荐方法 |
CN104834668A (zh) * | 2015-03-13 | 2015-08-12 | 浙江奇道网络科技有限公司 | 基于知识库的职位推荐系统 |
CN104933239A (zh) * | 2015-06-09 | 2015-09-23 | 江苏大学 | 一种基于混合模型的个性化职位信息推荐系统及实现方法 |
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704485A (zh) * | 2017-07-31 | 2018-02-16 | 北京拉勾科技有限公司 | 一种职位推荐方法及计算设备 |
CN107515904A (zh) * | 2017-07-31 | 2017-12-26 | 北京拉勾科技有限公司 | 一种职位搜索方法和计算设备 |
CN107844595A (zh) * | 2017-11-21 | 2018-03-27 | 安徽网才信息技术股份有限公司 | 一种求职网站职位智能推荐方法 |
CN108021673A (zh) * | 2017-12-06 | 2018-05-11 | 北京拉勾科技有限公司 | 一种用户兴趣模型生成方法、职位推荐方法及计算设备 |
CN108133357A (zh) * | 2017-12-22 | 2018-06-08 | 北京拉勾科技有限公司 | 一种人才推荐方法及计算设备 |
WO2019205795A1 (zh) * | 2018-04-26 | 2019-10-31 | 腾讯科技(深圳)有限公司 | 兴趣推荐方法、计算机设备及存储介质 |
US11593894B2 (en) | 2018-04-26 | 2023-02-28 | Tencent Technology (Shenzhen) Company Limited | Interest recommendation method, computer device, and storage medium |
CN108764838A (zh) * | 2018-05-24 | 2018-11-06 | 佛山市轻遣网络有限公司 | 用于招聘系统的推荐方法及系统 |
CN108876285A (zh) * | 2018-05-24 | 2018-11-23 | 佛山市轻遣网络有限公司 | 向用户推荐职位信息的方法及系统 |
CN110727852A (zh) * | 2018-07-16 | 2020-01-24 | Tcl集团股份有限公司 | 一种推送招聘推荐服务的方法、装置及终端 |
CN110968771B (zh) * | 2018-09-29 | 2024-05-28 | 北京淘友天下技术有限公司 | 一种基于朋友关系的职位推荐冷启动方法及系统 |
CN110968771A (zh) * | 2018-09-29 | 2020-04-07 | 北京淘友天下技术有限公司 | 一种基于朋友关系的职位推荐冷启动方法及系统 |
CN109670104A (zh) * | 2018-11-12 | 2019-04-23 | 深圳壹账通智能科技有限公司 | 基于机器学习的信息推送方法、设备、装置及存储介质 |
CN109697629B (zh) * | 2018-11-15 | 2023-02-24 | 平安科技(深圳)有限公司 | 产品数据推送方法及装置、存储介质、计算机设备 |
CN109697629A (zh) * | 2018-11-15 | 2019-04-30 | 平安科技(深圳)有限公司 | 产品数据推送方法及装置、存储介质、计算机设备 |
WO2020215751A1 (zh) * | 2019-04-23 | 2020-10-29 | 北京三快在线科技有限公司 | 一种推荐方法、电子设备及可读存储介质 |
CN110297981A (zh) * | 2019-07-01 | 2019-10-01 | 江苏漩涡网络科技有限公司 | 职位推荐系统与方法 |
CN111192161A (zh) * | 2019-12-19 | 2020-05-22 | 广东电网有限责任公司电力调度控制中心 | 电力市场交易对象推荐方法、装置 |
CN111488531A (zh) * | 2020-03-16 | 2020-08-04 | 山东浪潮通软信息科技有限公司 | 一种基于协同过滤算法的信息推荐方法、设备及介质 |
CN111488531B (zh) * | 2020-03-16 | 2023-04-18 | 浪潮通用软件有限公司 | 一种基于协同过滤算法的信息推荐方法、设备及介质 |
CN111861268A (zh) * | 2020-07-31 | 2020-10-30 | 平安金融管理学院(中国·深圳) | 候选人推荐方法、装置、电子设备及存储介质 |
CN116628340A (zh) * | 2023-06-15 | 2023-08-22 | 中科聚信信息技术(北京)有限公司 | 职位代理人推荐方法及系统 |
CN116628340B (zh) * | 2023-06-15 | 2024-01-02 | 中科聚信信息技术(北京)有限公司 | 职位代理人推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106933821A (zh) | 一种基于相似度计算的个性化职位推荐方法和系统 | |
CN110162693B (zh) | 一种信息推荐的方法以及服务器 | |
Wang et al. | Semantic-based location recommendation with multimodal venue semantics | |
US9607010B1 (en) | Techniques for shape-based search of content | |
US10469275B1 (en) | Clustering of discussion group participants | |
TWI508011B (zh) | Category information providing method and device | |
CN104111941B (zh) | 信息展示的方法及设备 | |
US10180979B2 (en) | System and method for generating suggestions by a search engine in response to search queries | |
US11687968B1 (en) | Serving advertisements based on partial queries | |
US9727906B1 (en) | Generating item clusters based on aggregated search history data | |
CN103678329B (zh) | 推荐方法及装置 | |
US10402479B2 (en) | Method, server, browser, and system for recommending text information | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
CN106294500B (zh) | 内容项目的推送方法、装置及系统 | |
CN104866554B (zh) | 一种基于社会化标注的个性化搜索方法及系统 | |
WO2020238502A1 (zh) | 物品推荐方法及装置、电子设备及存储介质 | |
CN104036002A (zh) | 一种智能推荐数据的技术方法 | |
WO2016192309A1 (zh) | 推送信息的处理方法、装置、设备及非易失性计算机存储介质 | |
CN103295145A (zh) | 一种基于用户消费特征向量的手机广告投放方法 | |
EP3162016A1 (en) | Automated click type selection for content performance optimization | |
US20210382609A1 (en) | Method and device for displaying multimedia resource | |
CN105824911A (zh) | 基于lda用户主题模型的视频推荐方法 | |
CN102236710A (zh) | 一种用于在查询结果中展现新闻信息的方法与设备 | |
US20130212105A1 (en) | Information processing apparatus, information processing method, and program | |
Dezfouli et al. | Deep neural review text interaction for recommendation systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170707 |
|
RJ01 | Rejection of invention patent application after publication |