CN104834668B - 基于知识库的职位推荐系统 - Google Patents

基于知识库的职位推荐系统 Download PDF

Info

Publication number
CN104834668B
CN104834668B CN201510109074.3A CN201510109074A CN104834668B CN 104834668 B CN104834668 B CN 104834668B CN 201510109074 A CN201510109074 A CN 201510109074A CN 104834668 B CN104834668 B CN 104834668B
Authority
CN
China
Prior art keywords
user
information
module
human resources
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510109074.3A
Other languages
English (en)
Other versions
CN104834668A (zh
Inventor
王飞
白琨
陈文�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Tuogu Information Technology Co Ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510109074.3A priority Critical patent/CN104834668B/zh
Publication of CN104834668A publication Critical patent/CN104834668A/zh
Application granted granted Critical
Publication of CN104834668B publication Critical patent/CN104834668B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于知识库的职位推荐系统,包括人力资源专有知识库构建模块,人才信息爬取模块,信息抽取、融合、比较模块和职位推荐模块;人力资源专有知识库构建模块用于构建与人力资源相关的转有知识库;人才信息爬取模块用于爬取整合与应聘者相关的个人信息;信息抽取、融合、比较模块用于对抓取得到的数据进行分析、处理,对人才需求与职位进行映射和比较,进而对用户需求进行建模分析。职位推荐模块用于对待推荐用户进行职位查询,按照相关度、兴趣、朋友圈信息进行推荐。本发明针对人力资源这一特定领域建立专有知识库,并有效的利用该知识库实现在线的对用户的精准职位推荐。

Description

基于知识库的职位推荐系统
技术领域
本发明涉及人力资源应用领域,具体是一种基于知识库的职位推荐系统。
背景技术
当今的时代是数据的时代,如今大数据分析已经在各行各业产生了广泛的应用和深远的影响。基于企业的大数据分析已经在采购,生产,物流以及营销等一系列环节上有了发挥,优化了企业流程,节省了企业成本。众所周知,人是企业中最重要的因素,为企业寻找合适的人才,为人才提供合适的岗位和待遇已经成为各个企业发展的焦点。人才的竞争也成为了各个企业成败与否的关键因素。不仅是企业,政府机构亦是如此。合理的人力资源调配是优化政府职能,提高政府工作效率的重中之重。因此,如何合理的分析企业的需求以及政府的职能,将企业和政府的需求与市场上人才的需求对接,并为企业及政府已有的人才提供合适的待遇与发展机会,是企业以及政府机构发展的核心问题。
国内外致力于人力资源服务的网站并不鲜见,国内最具有代表性的网络招聘网站三巨头包括前程无忧,智联招聘以及中华英才网。然而,艾瑞数据显示,自2012年以来,该三大网站的人才覆盖量均呈现下滑趋势,这页预示着求职者对网络招聘的看淡。其中一个重要原因是网络招聘市场的同质化现象严重,缺乏创新。与之形成鲜明对比的是,职场社交以及大数据分析类网站却如雨后春笋,生机勃勃。目前市场上已有的具有代表性的网站主要有以下几大类:1)社交类网站。这类网站提供的是一个职业社交平台。在这里用户可以创建简历,接收推荐职位信息,建立好友关系,并接受对他们有兴趣的公司的询问。而企业则可以建立自己的主页,发布招聘广告,搜索用户简历并与之联系。2)企业信息透明化类网站。这类网站提供公司内部情况,薪酬,公司内幕以及工作环境等信息。在此网站注册的求职者通常资历较深,更愿意推广自己并展示自己能够给公司带来利益。3)个人潜力发掘类网站。这类网站提供针对社交网络的职业搜索引擎服务,它收集应聘者在社交网络如Facebook,Twitter,Quora上的信息,整理编辑成为一个以个人为中心的数据库,为招聘方提供人才搜索服务。
综上所述,目前大数据人力资源网站的发展趋势主要有以下几点:
(1) 综合各种数据源,深入挖掘招聘者以及应聘者的相关信息。这其中的数据源包括用户的注册信息,用户社交网络的信息,公司的注册信息,地理信息以及用户与公司在某些专有功能网站(例如PayScale)上的信息等等。
(2) 个性化匹配。这里的“个性化”包括两层含义,一是为根据求职者的特点寻找最合适的招聘企业;二是根据企业的特点寻找最合适的应聘者。成功的个性化匹配是建立在对企业及个人深入了解的基础上的。
(3) 多样化服务。目前流行的人力资源网站大都不局限于单一的服务,而是尽可能的服务多样化,包括求职,人脉关系的建立,公司信息挖掘,职业规划等等。
中国是世界上人口最多的国家,如何有效的管理中国的人力资源是一项非常重要的任务。在大数据时代的今天,有效地利用互联网资源,有效的融合及均衡各方面信息,使得人才与企业达到双赢的最佳匹配,已经成为不可避免的趋势。目前在国内已有一些人力资源以及职位匹配相关的发明专利。
例如,专利公布号CN102236716A公开了一种求职者与招聘职位匹配的系统及匹配方法,该方法要求将求职者终端输入的简历按照预先设定的标准化格式存储入所述简历数据库;将招聘单位终端输入的职位介绍书按照预先设定的标准化格式存储入所述职位介绍书数据库。该方法只是基于最基本的用户简历以及职位要求资料,并未对用户资料以及职位描述进行深度挖掘和理解,已经不能满足当前职位以及用户需求多样化的需求。
例如,专利公布号CN102651103A公开了一种职位招聘系统,包括职位发布模块,职位匹配模块,职位通知模块和职位应聘模块。该专利仅是针对招聘方的系统,同时也并没有对招聘方的需求以及招聘内容进行深度挖掘。
例如,专利公布号CN103294816A公开了一种为求职者推荐职位的方法和职位推荐系统,其中方法可包括:获取求职者的简历信息,所述简历信息包括所述求职者的求职需求;根据所述求职者的简历信息,基于与所述求职需求对应的职位相关联的指标,从测试数据库中调取对应的测试题,生成求职前的测试卷;将所述测试卷呈现给所述求职者,并接收所述求职者对所述测试卷的答复结果;根据岗位胜任度模型中的测试标准,结合所述求职者对所述测试卷的答复结果测评出所述求职者针对所述求职需求的岗位胜任能力;从职位数据库中调取与所述岗位胜任能力相适配的职位信息,生成职位推荐方案,并将所述职位推荐方案提供给所述求职者。该专利通过测试的方式来挖掘用户更深层次的兴趣来和职位进行匹配,需要求职者答复测试试卷,使用麻烦,同时测试试卷与求职者的日常行为可能存在差异,准确性不高。
例如,专利公布号CN103544312A公开了一种基于社交网络的招聘信息匹配方法,其具体步骤包括:1)HR发布招聘信息,并获取招聘信息的关键词;HR即在企业中负责人力资源的发展和规划的工作人员; 2)对得到的关键词集中的关键词进行优先级排序,其中优先级根据关键词与招聘职位信息的相关度决定,相关度越高,优先级越高,并根据优先级的高低对每一个关键词赋以权值;3)通过关键词信息获取于招聘职位所相关的最合适的人选。该方法仅仅根据关键字进行匹配,这样得到的精度往往不高。
目前,现有技术中还没有一种充分挖掘用户和职位信息的推荐系统。
发明内容
本发明克服了现有技术的不足,为解决现有技术问题,本发明提供了一种利用网络上各种信息(社交网络,人力资源网站等)构建专有的人力资源知识库,对用户以及职位进行有效的深度理解,形成一个系统的职位推荐系统。
本发明的技术方案为:一种基于知识库的职位推荐系统,包括人力资源专有知识库构建模块,人才信息爬取模块,信息抽取、融合、比较模块和职位推荐模块;
人力资源专有知识库构建模块通过对人力资源相关知识(指互联网上人力资源相关的数据)进行爬取和实体分析,构建人力资源专有知识库;
人才信息爬取模块在人力资源网站(人力资源相关网站以及知识库网站)上爬取人才简历,获取用户所参与的社交媒体以及用户行为,求职意向的相关信息;
信息抽取、融合、比较模块用于对人才信息爬取模块抓取得到的人才信息数据进行分析、处理,对用户(人才)进行建模分析,并将用户简历与知识库进行比对。
职位推荐模块,将应聘方所需职位描述与知识库进行比对,并计算用户与当前职位的相关性,完成职位推荐;
人力资源专有知识库构建模块,人才信息爬取模块均与信息抽取、融合、比较模块相连接,所述信息抽取、融合、比较模块与职位推荐模块相连接。
人力资源专有知识库构建模块,首先通过网络爬虫从人力资源相关网站以及知识库网站上获取联网上与人力资源相关的数据,得到数据后,通过使用hadoop将多条URL抓取的任务分配给多台计算机,使得每台计算机基于负载均衡的调度处理方法交给多部服务器所组成的分布式系统,通过HTML parser对网页进行分析、文本分析、链接分析和网页质量控制、去重,得到相应的网页内容,将网页内容结果分成结构化信息(链接信息)和非结构化信息(文本信息),分别存储到结构化信息数据库和非结构化信息数据库中。通过分布式系统,可以处理非常高吞吐量的信息。
结构化和非结构化的分类可以通过判断该内容是否可以存储到结构化数据库中(如SQL)来判断。通常文本和图像是非结构化数据,无法把其中的内容进行切分和分类。如一段新闻,虽然知道里面有人名、地名、公司名、时间等信息,但是如果不进行处理,无法自动的把这些信息导入到SQL中,同时,结构化信息和非结构化信息也可以重复进行网页进行分析、文本分析、链接分析和网页质量控制、去重,得到精简的结构化信息和非结构化信息。
在将结构化与非结构化数据存入数据库之后,下一步就是知识抽取,采取的是基于实体的知识抽取技术(实体分析技术),通过实体分析技术提取结构化与非结构化信息之间的联系关系,并将所述联系关系存储至人力资源专有知识库中。对非结构化文本数据进行机器阅读,首先通过自然语言处理技术进行词性标注等;然后通过自增强(Bootstrapping)技术找到尽量多的关系,如<实体,关系,实体>三元组:通过实体得到更多实体之间的关系, 再通过关系找到更多的实体,从而实现自增强的信息抽取。通过信息抽取过程,就可以构建人力资源专有知识库。
人力资源专有知识库构建之后,还可以进一步构建其相关图谱并进行关联学习。具体而言,根据提取的知识词条以及词条与词条之间的不同种类的异构关系建立知识图谱。图谱上面的节点即知识词条,边即词条与词条之间的联系。这里需要量化词条与词条之间的关系做为图谱上边的权重,该权重一般为非负值。若词条间联系越紧,则权重越大;联系越松,则权重越小。对权重进行归一化后设计恰当的图上的随机游走的方式来学习词条与词条之间的本质联系。
人才信息爬取模块在相关网站上爬取人才简历,获取用户所参与的社交媒体以及用户行为,求职意向的相关信息。人才简历的爬取与人力资源专有知识库构建模块中结构化与非结构化数据的爬取相似。
信息抽取、融合、比较模块将人才信息爬取模块爬取到的个人信息(用户所参与的社交媒体以及用户行为,求职意向信息)进行整合分析,建立人才专有的个人档案;所述个人档案进一步解析成为若干关键词以及其中的内在联系,从而完成用户建模,同时,解析招聘方招聘职位信息,进行职位建模分析,将职位信息和用户需求建立映射对应,进行职位和用户需求映射建模。
用户建模包括包括以下步骤:
1-1)标签传播:通过用户档案中的关键词实体在构建的人力资源专有知识库中进行随机游走得到标签传播的概率,从而扩展用户的描述;
1-2)内容判别:对用户档案的内容进行分析,使用话题模型、实体抽取得到可能的标签;同时,通过训练机器学习分类器对已有标签的用户进行学习,从而对没有标签的用户进行标签判断;
1-3)用户其他信息判别:对于用户发表的内容进行理解以及对其朋友圈进行分析,进而预估用户的年龄、工作性质、工作地点、收入信息,从而理解用户的需求;对用户的年龄、工作性质、工作地点和收入信息进行预估时,对用户提取关键词和好友属性特征,使用机器学习方法,对已有标注信息进行学习得到分类器,对未知样本进行分类。
较优地,信息抽取、融合、比较模块的职位建模分析包括以下步骤:
2-1)职位信息增强,仅仅靠解析招聘方张贴的广告往往得到的信息不够完备,需要基于互联网搜索引擎进行搜索,从搜索到的网站上相关的摘要和广告内容中得到其他与该职位相关的描述与刻画,从而对职位的信息进行增强。
2-2)职位路径分类,在抓取职位增强信息的同时获取职位路径分类树的信息,另外对没有路径分类树信息的职位进行分类,并分类到职位路径树的某一个节点上;
2-3)职位其他信息采集,对职位相关的其他信息进行收集,并存储到数据库(存储信息的数据库)中,通过对人力资源类型网站的结构进行分析,得到相应的评论和打分(人力资源网站对特定的公司和职位有评论和打分,在网站上爬取相应的信息)。
职位和用户需求映射建模将职位和用户需求建立映射对应,对用户在网站上提到求职意向时发表的内容以及人力资源网站上的职位描述、用户对职位以及应聘单位的评论去噪,建立映射模型,映射模型是对数据的直接特征抽取或者是通过机器学习的手段得到的特征表达,得到了映射模型后,比较职位和用户的相关性。
职位推荐模块连接有用户端推荐模块和职位端推荐模块。
用户端推荐模块运行过程包括以下步骤:
3-1)通过用户和职位的相关性得到可能推荐的职位列表;
3-2)对用户的好友以及已有用户的评论进行用户和商品的相关性的分析;
3-3)通过分析用户刻画对职位推荐进行处理,细分推荐目标,所述用户刻画包括年龄,收入,兴趣,地域,学历以及用户已有的工作历史;
3-4)通过社交媒体的交互方式为该用户进行职位推荐,所述社交媒体的交互方式包括添加好友、引用好友、私信、评论。
职位端推荐模块运行过程包括以下步骤:
4-1)通过用户和职位的相关性得到可能对该职位感兴趣的用户;
4-2)对用户的好友进行职位和用户的相关性分析,并通过好友的职位选择对该用户进行投票;
4-3)通过分析用户刻画对商品推荐进行处理,细分推荐目标,所述用户刻画包括年龄,收入,兴趣,地域,学历以及用户已有的工作历史;
4-4)通过社交媒体的交互方式为该用户进行职位推荐,所述社交媒体的交互方式包括添加好友、引用好友、私信、评论。
本发明有益效果包括,本发明针对人力资源这一特定领域建立专有知识库,并有效的利用该知识库实现在线的对用户的精准职位推荐;
进一步地,本申请针对招聘方和人才用户爬取数据,对招聘方数据和人才用户数据同时进行需求和匹配挖掘,不仅仅针对人才用户的求职简历进行分析,同时分析社交媒体等人才用户数据,充分深度数据挖掘,职位推荐全面评估,推荐准确,能够满足当前职位以及用户需求多样化的需求;
进一步地,本发明是针对现代的人力资源与职位匹配设计的系统,通过人力资源专有知识库的构建,深度挖掘用户的求职意向,最大化完成求职者与应聘者意向的匹配;
进一步地,职位推荐模块连接有用户端推荐模块和职位端推荐模块,满足人才用户和招聘方双方的需求,职位推荐方便准确。
附图说明
图1为本发明基于知识库的职位推荐系统的结构示意图;
图2为人力资源专有知识库构建模及人才信息爬取模块块过程处理示意图;
图3为信息抽取、融合、比较模块处理过程示意图;
图4 为职位推荐模块结构示意图。
具体实施方式
下面结合附图和具体的实施例对本发明技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
如图1所示,一种基于知识库的职位推荐系统,包括人力资源专有知识库构建模块,人才信息爬取模块,信息抽取、融合、比较模块和职位推荐模块;
人力资源专有知识库构建模块通过对人力资源相关知识进行爬取和实体分析,构建与人力资源专有知识库;
人才信息爬取模块在人力资源相关网站(或者知识库网站)上爬取人才简历,所参与的社交媒体以及用户行为,求职意向的相关信息;
信息抽取、融合、比较模块用于对抓取得到的数据进行分析、处理,对用户进行建模分析,并将用户简历与知识库进行比对。
职位推荐模块,将应聘放所需职位描述与知识库进行比对,并计算用户与当前职位的相关性,完成职位推荐;
人力资源专有知识库构建模块,人才信息爬取模块,信息抽取、融合、比较模块,职位推荐模块相连接。
如图2所示,人才信息爬取取模块通过网络爬虫(包括N个爬虫,爬虫1、爬虫2、爬虫3……爬虫N)获取社交媒体上的数据,得到数据后,通过使用hadoop将多条URL抓取的任务分配调度处理给多台计算机,使得每台计算机的负载均衡的调度处理方法交给多部服务器所组成的分布式系统,通过HTML parser对网页进行分析、文本分析、链接分析和网页质量控制、去重,得到相应的网页内容,将所述网页内容结果分成结构化信息(朋友、群等链接信息)和非结构化信息(文本、图像等),分别存储到结构化信息数据库和非结构化信息数据库中。
结构化和非结构化的分类可以通过判断该内容是否可以存储到结构化数据库中(如SQL)来判断。通常文本和图像是非结构化数据,无法把其中的内容进行切分和分类。如一段新闻,虽然知道里面有人名、地名、公司名、时间等信息,但是如果不进行处理,无法自动的把这些信息导入到SQL中。同时,结构化信息和非结构化信息也可以重复进行网页进行分析、文本分析、链接分析和网页质量控制、去重,得到精简的结构化信息和非结构化信息。
在将结构化与非结构化数据存入数据库之后,下一步就是知识抽取。这里采取的是基于实体的只是抽取技术。例如,可以从“百度的本部在西二旗”抽取三元组<百度,本部是在,西二旗>,其中“百度”是公司名称,“西二旗”是地点或地址,“本部是在”是关系。更多的关系例如“CEO是”,“主演是”,“主打产品是”等等。得到这些关系后,需要对他们进行聚类处理。例如“CEO是”,“首席执行官是”以及“创建者是”等等关系会以一定概率聚在一起。得到这些三元组后,进一步将其组织成数据库,进而可使用例如RDF语言等进行处理和查询,重点将主要研究文本自动获取三元组关系的方法,尽可能的提高抽取精度并不损失抽取的覆盖率。对非结构化文本数据进行机器阅读,首先通过自然语言处理技术进行词性标注等;然后通过自增强(Bootstrapping)技术找到尽量多的关系,如<实体,关系,实体>三元组:通过实体得到更多他们之间的关系, 再通过关系找到更多的实体,从而实现自增强的信息抽取。通过这样的信息抽取过程,就可以构建与人力资源相关的专有知识库。
如图3所示,所述信息抽取、融合、比较模块将人才信息爬取模块爬取到的个人信息(用户所参与的社交媒体以及用户行为,求职意向信息)进行整合分析,建立人才专有的个人档案;个人档案进一步解析成为若干关键词以及其中的内在联系,从而完成用户建模,同时,解析招聘方招聘职位信息,进行职位建模分析,将职位信息和用户需求建立映射对应,进行职位和用户需求映射建模。
信息抽取、融合、比较模块包括用户建模模块、职位需求建模模块、职位和用户映射建模模块,用户建模模块、职位需求建模模块与职位和用户映射建模模块相连接。
用户建模模块工作过程包括:
1-1)标签传播:通过用户档案中的关键词实体在构建的人力资源专有知识库中进行随机游走得到标签传播的概率,从而扩展用户的描述;
1-2)内容判别:对用户档案的内容进行分析,使用话题模型、实体抽取得到可能的标签;同时,通过训练机器学习分类器对已有标签的用户进行学习,从而对没有标签的用户进行标签判断;
1-3)用户其他信息判别:对于用户发表的内容进行理解以及对其朋友圈进行分析,进而预估用户的年龄、工作性质、工作地点、收入信息,从而可以更好的理解用户的需求;对用户的年龄、工作性质、工作地点和收入信息进行预估时,对用户提取关键词和好友属性特征,使用机器学习方法,对已有标注信息进行学习得到分类器,对未知样本进行分类。
职位需求建模模块运行过程包括,
2-1)职位信息增强,仅仅靠解析招聘方张贴的广告往往得到的信息不够完备,需要基于互联网搜索引擎进行搜索,从相关的摘要和广告内容中得到其他与该职位相关的描述与刻画,从而对职位的信息进行增强。
2-2)职位路径分类,在抓取职位增强信息的同时得到职位路径分类树的信息。另外对没有路径分类树信息的职位进行分类,并分类到职位路径树的某一个节点上;
2-3)职位其他信息采集,对职位相关的其他信息进行收集,并存储到数据库(数据库存储信息,指存储信息的数据库)中,通过对人力资源类型网站的结构进行分析,得到相应的评论和打分。
用户建模模块获取得到用户刻画(用户刻画指用户描述分析包括年龄,收入,兴趣,地域,学历以及用户已有的工作历史;),职位需求建模模块获取到职位刻画(职位描述),职位和用户需求映射建模模块将职位和用户需求建立映射对应(将人才刻画与职位刻画建立映射对应),对用户在网站上提到求职意向时发表的内容以及人力资源网站上的职位描述、用户对职位以及应聘单位的评论去噪,建立映射模型,职位和用户需求映射模型是对数据的直接特征抽取或者是通过机器学习的手段得到的特征表达,得到了映射模型后,比较职位和用户的相关性。
如图4所示,职位推荐模块连接有用户端推荐模块和职位端推荐模块。
用户端推荐模块运行过程包括以下步骤:
3-1)通过用户和职位的相关性得到可能推荐的职位列表;
3-2)对用户的好友以及已有用户的评论进行用户和商品的相关性的分析;
3-3)通过分析用户刻画对职位推荐进行处理,细分推荐目标,所述用户刻画包括年龄,收入,兴趣,地域,学历以及用户已有的工作历史;
3-4)通过社交媒体的交互方式为该用户进行职位推荐,所述社交媒体的交互方式包括添加好友、引用好友、私信、评论等。
职位端推荐模块运行过程包括以下步骤:
4-1)通过用户和职位的相关性得到可能对该职位感兴趣的用户;
4-2)对用户的好友进行职位和用户的相关性分析,并通过好友的职位选择对该用户进行投票;
4-3)通过分析用户刻画对商品推荐进行进一步处理,细分推荐目标,所述用户刻画包括年龄,收入,兴趣,地域,学历以及用户已有的工作历史;
4-4)通过社交媒体的交互方式为该用户进行职位推荐,所述社交媒体的交互方式包括添加好友、引用好友、私信、评论。
以上仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.基于知识库的职位推荐系统,其特征在于,包括人力资源专有知识库构建模块,人才信息爬取模块,信息抽取、融合、比较模块和职位推荐模块;
人力资源专有知识库构建模块通过对人力资源相关知识进行爬取和实体分析,构建人力资源专有知识库;
人才信息爬取模块在人力资源网站上爬取人才简历,获取用户所参与的社交媒体以及用户行为,求职意向信息;
信息抽取、融合、比较模块对人才信息爬取模块抓取得到的人才信息数据进行分析、处理,对用户进行建模分析,并将用户简历与人力资源专有知识库进行比对;
职位推荐模块,将应聘方所需职位描述与人力资源专有知识库进行比对,并计算用户与当前职位的相关性,完成职位推荐;
所述职位推荐模块连接有用户端推荐模块和职位端推荐模块;
所述用户端推荐模块运行过程包括以下步骤:
3-1)通过用户和职位的相关性得到可能推荐的职位列表;
3-2)对用户的好友以及已有用户的评论进行用户和职位的相关性的分析;
3-3)通过分析用户刻画对职位推荐进行细分推荐目标,所述用户刻画包括年龄、收入、兴趣、地域、学历以及用户已有的工作历史;
3-4)通过社交媒体的交互方式为用户进行职位推荐,所述社交媒体的交互方式包括添加好友、引用好友、私信、评论;
所述职位端推荐模块运行过程包括以下步骤:
4-1)通过用户和职位的相关性得到可能对职位感兴趣的用户;
4-2)对用户的好友进行职位和用户的相关性分析,并通过好友的职位选择对用户进行投票;
4-3)通过分析用户刻画对商品推荐进行处理,细分推荐目标;
4-4)通过社交媒体的交互方式为用户进行职位推荐。
2.根据权利要求1所述的基于知识库的职位推荐系统,其特征在于,
所述人力资源专有知识库构建模块通过网络爬虫获取互联网上人力资源相关的数据,得到所述数据后,通过使用hadoop将URL抓取的任务分配给多台计算机,每台计算机基于负载均衡的调度处理方法交给多部服务器所组成的分布式系统,通过HTML parser进行网页分析、文本分析、链接分析和网页质量控制、去重,得到网页内容,将所述网页内容结果分成结构化信息和非结构化信息;通过实体分析技术提取结构化与非结构化信息之间的联系关系,并将所述联系关系存储至人力资源专有知识库中。
3.根据权利要求1所述的基于知识库的职位推荐系统,其特征在于,所述人才信息爬取模块通过分析结构化的个人简历,并通过交叉链接爬取用户所参与的社交媒体、用户日常行为、观点和求职意向信息。
4.根据权利要求1所述的基于知识库的职位推荐系统,其特征在于,所述信息抽取、融合、比较模块将人才信息爬取模块爬取到的个人信息进行整合分析,建立人才专有的个人档案;
所述个人档案解析为若干关键词以及关键词的内在联系,完成用户建模,同时,解析招聘方招聘职位信息,进行职位建模分析,将职位信息和用户需求建立映射对应,进行职位和用户需求映射建模。
5.根据权利要求4所述的基于知识库的职位推荐系统,其特征在于,所述用户建模包括以下步骤:
1-1)标签传播:通过用户档案中的关键词实体在构建的人力资源专有知识库中进行随机游走得到标签传播的概率,扩展用户的描述;
1-2)内容判别:对用户档案的内容进行分析,使用话题模型、实体抽取得到可能的标签;同时,通过训练机器学习分类器对已有标签的用户进行学习,从而对没有标签的用户进行标签判断;
1-3)用户其他信息判别:对于用户发表的内容进行理解以及对其朋友圈进行分析,进而预估用户的年龄、工作性质、工作地点、收入信息,从而理解用户的需求。
6.根据权利要求4所述的基于知识库的职位推荐系统,其特征在于,所述职位建模分析包括以下步骤,
2-1)职位信息增强:基于互联网搜索引擎进行搜索,从搜索到的网站上相关的摘要和广告内容中得到与职位相关的描述,从而对职位的信息进行增强;
2-2)职位路径分类:在抓取职位增强信息的同时获取职位路径分类树的信息,将没有路径分类树信息的职位分类到职位路径树的某一个节点上;
2-3)职位其他信息采集:对职位相关的其他信息进行收集,并存储到数据库中,通过对人力资源类型网站的结构进行分析,得到相应的评论和打分。
7.根据权利要求4所述的基于知识库的职位推荐系统,其特征在于,所述职位和用户需求映射建模将职位和用户需求建立映射对应,对用户在网站上提到求职意向时发表的内容、人力资源网站上的职位描述、用户对职位以及应聘单位的评论去噪,建立映射模型,所述映射模型是对数据的直接特征抽取或者是通过机器学习的手段得到的特征表达,得到了映射模型后,比较职位和用户的相关性。
CN201510109074.3A 2015-03-13 2015-03-13 基于知识库的职位推荐系统 Expired - Fee Related CN104834668B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510109074.3A CN104834668B (zh) 2015-03-13 2015-03-13 基于知识库的职位推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510109074.3A CN104834668B (zh) 2015-03-13 2015-03-13 基于知识库的职位推荐系统

Publications (2)

Publication Number Publication Date
CN104834668A CN104834668A (zh) 2015-08-12
CN104834668B true CN104834668B (zh) 2018-10-02

Family

ID=53812556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510109074.3A Expired - Fee Related CN104834668B (zh) 2015-03-13 2015-03-13 基于知识库的职位推荐系统

Country Status (1)

Country Link
CN (1) CN104834668B (zh)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787619A (zh) * 2014-12-25 2016-07-20 阿里巴巴集团控股有限公司 一种数据处理方法、装置及系统
CN105159962B (zh) * 2015-08-21 2018-08-17 北京全聘致远科技有限公司 职位推荐方法与装置、简历推荐方法与装置、招聘平台
CN106598994B (zh) * 2015-10-20 2020-09-04 苏州贝弗安信息科技有限公司 一种基于用户在线行为数据的高效招聘系统及方法
CN106651281A (zh) * 2015-11-04 2017-05-10 上海仓实网络科技有限公司 一种基于移动终端的求职者与兼职职位匹配方法及系统
CN105447678A (zh) * 2015-11-11 2016-03-30 上海斐讯数据通信技术有限公司 一种提供职业规划参考方案的方法、系统及一种电子设备
CN106933821A (zh) * 2015-12-29 2017-07-07 中国电信股份有限公司 一种基于相似度计算的个性化职位推荐方法和系统
CN105550855A (zh) * 2016-01-28 2016-05-04 华南理工大学 一种面向大学生的校园项目与应招者互匹的系统及方法
CN105677902A (zh) * 2016-02-05 2016-06-15 北京普猎创新网络科技有限公司 一种简历的展示方法
CN105608477B (zh) * 2016-03-01 2021-06-08 吕云 一种人物画像与职位匹配的方法及系统
CN105843918B (zh) * 2016-03-25 2020-04-07 前锦网络信息技术(上海)有限公司 一种从职位数据库中快速筛选职位的方法
CN107291715A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 简历评估方法和装置
CN105868968A (zh) * 2016-04-21 2016-08-17 广州爱拼信息科技有限公司 基于机器学习的招聘信息解析系统及其方法
CN106055618B (zh) * 2016-05-26 2020-02-07 优品财富管理有限公司 一种基于网络爬虫与结构化存储的数据处理方法
CN107784028A (zh) * 2016-08-31 2018-03-09 李宝玉 一种信息发布与管理的方法
CN106408249A (zh) * 2016-08-31 2017-02-15 五八同城信息技术有限公司 简历与职位匹配方法及装置
CN106408262A (zh) * 2016-09-27 2017-02-15 吉林码帝科技有限公司 一种招聘和应聘匹配方法
US10607273B2 (en) * 2016-12-28 2020-03-31 Google Llc System for determining and displaying relevant explanations for recommended content
CN108604247A (zh) * 2016-12-30 2018-09-28 微软技术许可有限责任公司 目标导航
CN106649885A (zh) * 2017-01-13 2017-05-10 深圳爱拼信息科技有限公司 一种专业类与标准专业名的匹配方法及系统
CN107066599B (zh) * 2017-04-20 2021-11-30 北京文因互联科技有限公司 一种基于知识库推理的相似上市公司企业检索分类方法及系统
CN107239892B (zh) * 2017-05-26 2021-06-15 山东省科学院情报研究所 基于大数据的区域人才供需平衡量化分析方法
CN107315807B (zh) * 2017-06-26 2020-08-04 三螺旋大数据科技(昆山)有限公司 人才推荐方法和装置
CN107562940A (zh) * 2017-09-22 2018-01-09 四川省艾普网络股份有限公司 大数据信息获取方法及系统
CN107609798A (zh) * 2017-10-17 2018-01-19 上海鸥未信息科技有限公司 岗位胜任模型体系应用方法
CN107943907A (zh) * 2017-11-17 2018-04-20 南京感度信息技术有限责任公司 一种基于内容标签的知识库推荐系统
CN107844595B (zh) * 2017-11-21 2021-06-25 安徽网才信息技术股份有限公司 一种求职网站职位智能推荐方法
CN107909351A (zh) * 2017-12-08 2018-04-13 成都帮你找信息技术有限公司 一种新型网络招聘管理系统
CN108304539A (zh) * 2018-01-30 2018-07-20 平安科技(深圳)有限公司 人才数据库建立方法、装置及存储介质
CN108171449A (zh) * 2018-03-03 2018-06-15 成都中空间科技有限公司 基于农民工施工水平的推荐就业系统
CN110309405B (zh) * 2018-03-08 2022-09-30 腾讯科技(深圳)有限公司 一种项目推荐方法、装置及存储介质
CN108628990A (zh) * 2018-04-28 2018-10-09 京东方科技集团股份有限公司 推荐方法、计算机装置及可读存储介质
CN108647294A (zh) * 2018-05-07 2018-10-12 韦玮 信息推荐系统
CN108319735A (zh) * 2018-05-11 2018-07-24 重庆工商职业学院 一种就业岗位信息推送查询系统及其方法
CN108764838A (zh) * 2018-05-24 2018-11-06 佛山市轻遣网络有限公司 用于招聘系统的推荐方法及系统
CN108876285A (zh) * 2018-05-24 2018-11-23 佛山市轻遣网络有限公司 向用户推荐职位信息的方法及系统
CN108764835A (zh) * 2018-05-24 2018-11-06 广州合摩计算机科技有限公司 逆向人才推送信息方法和装置
CN108920544A (zh) * 2018-06-13 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化职位推荐方法
CN110727852A (zh) * 2018-07-16 2020-01-24 Tcl集团股份有限公司 一种推送招聘推荐服务的方法、装置及终端
CN109299852A (zh) * 2018-08-22 2019-02-01 北京云智汇科技有限公司 企业社交图谱生成方法
CN111198943B (zh) * 2018-11-19 2024-06-18 Tcl科技集团股份有限公司 一种简历筛选方法、装置及终端设备
CN109492164A (zh) * 2018-11-26 2019-03-19 北京网聘咨询有限公司 一种简历的推荐方法、装置、电子设备及存储介质
CN109614587B (zh) * 2018-12-07 2023-04-07 厦门市美亚柏科信息股份有限公司 一种智能人脉关系分析建模方法、终端设备及存储介质
CN109710851B (zh) * 2018-12-27 2021-02-23 三盟科技股份有限公司 基于互联网模式下多源数据分析的就业推荐方法及系统
CN109829500B (zh) * 2019-01-31 2023-05-02 华南理工大学 一种职位构图和自动聚类方法
CN110020208B (zh) * 2019-04-17 2020-12-01 北京网聘咨询有限公司 职位推荐系统
CN112084320B (zh) * 2019-06-14 2023-09-15 百度在线网络技术(北京)有限公司 一种试题推荐方法、装置和智能设备
CN110443571A (zh) * 2019-07-16 2019-11-12 阿里巴巴集团控股有限公司 基于知识图谱进行简历评估的方法、装置及设备
CN110390514B (zh) * 2019-07-26 2023-03-14 北京博海迪信息科技有限公司 一种基于人才市场处理人才模型信息的方法及系统
CN110717051A (zh) * 2019-10-11 2020-01-21 集奥聚合(北京)人工智能科技有限公司 基于社交网络的知识图谱构建方法
CN111080241A (zh) * 2019-12-04 2020-04-28 贵州非你莫属人才大数据有限公司 一种基于互联网平台的数据化人才管理分析系统
CN111737495B (zh) * 2020-06-28 2022-12-06 福州数据技术研究院有限公司 基于领域自分类的中高端人才智能推荐系统及其方法
CN112686643A (zh) * 2021-01-08 2021-04-20 携程计算机技术(上海)有限公司 基于数据匹配的线上招聘方法、系统、设备及存储介质
CN113902400A (zh) * 2021-09-26 2022-01-07 上海嵘仕企业管理咨询有限公司 一种数据收集、传输以及存储系统
CN114691892A (zh) * 2022-04-21 2022-07-01 君之福(北京)科技有限公司 一种基于大数据的退役军人职业规划方法及系统
CN115775140B (zh) * 2023-02-10 2023-06-27 北京中科航天人才服务有限公司 一种城市人才规划与人力资源智能调配系统及方法
US11809508B1 (en) * 2023-06-15 2023-11-07 Geodex Inc. Artificial intelligence geospatial search
CN117171428B (zh) * 2023-08-04 2024-04-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN116737697B (zh) * 2023-08-10 2023-10-20 云筑信息科技(成都)有限公司 建筑行业物料主数据管理方法、装置及电子设备
CN117668236B (zh) * 2024-01-25 2024-04-16 山东省标准化研究院(Wto/Tbt山东咨询工作站) 一种专利标准融合系统的分析方法、系统及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1707506A (zh) * 2004-06-11 2005-12-14 株式会社培绎 利用网络提供招募/求职信息及其关联信息的匹配系统
CN103714413A (zh) * 2013-11-21 2014-04-09 清华大学 基于职位信息构建素质模型的系统与方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720791B2 (en) * 2005-05-23 2010-05-18 Yahoo! Inc. Intelligent job matching system and method including preference ranking

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1707506A (zh) * 2004-06-11 2005-12-14 株式会社培绎 利用网络提供招募/求职信息及其关联信息的匹配系统
CN103714413A (zh) * 2013-11-21 2014-04-09 清华大学 基于职位信息构建素质模型的系统与方法

Also Published As

Publication number Publication date
CN104834668A (zh) 2015-08-12

Similar Documents

Publication Publication Date Title
CN104834668B (zh) 基于知识库的职位推荐系统
US10817518B2 (en) Implicit profile for use with recommendation engine and/or question router
Mena‐Chalco et al. Brazilian bibliometric coauthorship networks
CN103823844B (zh) 社区问答服务中基于主客观上下文的问题转发系统和方法
Papoutsoglou et al. Mining people analytics from stackoverflow job advertisements
Burel et al. Automatic identification of best answers in online enquiry communities
CN101779180A (zh) 基于背景的内容推荐的方法和设备
Elgin Utilizing hyperlink network analysis to examine climate change supporters and opponents
Westerski et al. Exploiting structured linked data in enterprise knowledge management systems: An idea management case study
McQuillan et al. Models of internationalization: A business model approach to professional service firm internationalization
Goncalves et al. Gathering alumni information from a web social network
Lappas An overview of web mining in societal benefit areas
Moalla et al. Data warehouse design from social media for opinion analysis: the case of Facebook and Twitter
Contandriopoulos et al. Some insights related to social network analysis data collection challenges–a research note
Muruganandham et al. A hybrid web analytic approach through click enabled vision based page segmentation in quest software for school students
TWM625409U (zh) 自動蒐集目的地旅遊規劃及網路評量資訊提供平台
Shokeen On measuring the role of social networks in project recommendation
Hamdane et al. Big data based architecture to bringing together graduates and recruiters: case of Moroccan university
Furlan et al. A Survey and Evaluation of State‐of‐the‐Art Intelligent Question Routing Systems
Abdelhamid et al. Harvesting tweets for a better understanding of Engineering Students' First-Year Experiences
Khan An efficient human resource management system model using web-based hybrid technique
Sadikan et al. User behaviour pattern for online learning system: UiTM iLearn portal case
Marmo Competitive Analysis Based on Social Media Mining
Tedesco How and why to study collaboration at the level of economic ecosystems
André Digital Acceleration Index: Digital Maturity trends in Portugal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180810

Address after: 210039 No. 284-3 Banqiao street, Yuhuatai District, Nanjing, Jiangsu

Applicant after: Chen Wen

Address before: 315100 room 803, 1299, Yin County Road, Yinzhou District, Ningbo, Zhejiang.

Applicant before: Zhejiang Qi Dao network technology company limited

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191025

Address after: Room 201, South Second floor, management committee, Chaohu Economic Development Zone, Hefei City, Anhui Province 230000

Patentee after: Hefei Tuogu Information Technology Co., Ltd

Address before: 210039 No. 284-3 Banqiao street, Yuhuatai District, Nanjing, Jiangsu

Patentee before: Chen Wen

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181002

Termination date: 20210313