CN104731906A - 一种招聘网站个人简历自动推送方法 - Google Patents
一种招聘网站个人简历自动推送方法 Download PDFInfo
- Publication number
- CN104731906A CN104731906A CN201510129388.XA CN201510129388A CN104731906A CN 104731906 A CN104731906 A CN 104731906A CN 201510129388 A CN201510129388 A CN 201510129388A CN 104731906 A CN104731906 A CN 104731906A
- Authority
- CN
- China
- Prior art keywords
- recruitment
- information
- resume
- website
- recruiting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种招聘网站个人简历自动推送方法,该个人简历自动推送方法是利用网络爬虫抓取招聘网站中的招聘与应聘信息,基于数据挖掘技术提取关键应聘条件与招聘要求进行关联比对,计算得到二者间的紧密重合区域,并根据重合区域的密度进行简历推送或岗位推荐。本发明的一种招聘网站个人简历自动推送方法和现有技术相比,能够根据应聘与招聘双方发布的信息,分析得到二者间的紧密重合区域,实现简历的自动推送与岗位的自动推荐,很大程度上节约时间与降低成本消耗,提高了最终结果的精准度。
Description
技术领域
本发明涉及计算机数据挖掘技术领域,具体地说是一种招聘网站个人简历自动推送方法。
背景技术
随着互联网的普及与应用,信息载体逐渐由纸质报刊向互联网信息过渡,而招聘信息的载体也逐渐由纸质报刊转向互联网上的各类招聘网站。当今,招聘网站已成为企业与应聘者发布及获取招聘信息的主要途径,招聘前期的主要工作,包括简历的投递及岗位的筛选,都是通过互联网环节完成的。企业为了能够招聘到高精尖的人才,都会在不同的招聘网站上发布相应的招聘信息,应聘者为了能够找到满意的工作,也会去不同的网站去寻找相应的招聘信息。随着招聘网站的不断增多,招聘信息也呈现出不断增长的趋势,而且信息内容随着岗位与企业的不同也呈现出不同与多变。招聘方与应聘者通常无法24小时不间断的刷新招聘网站浏览信息,如何从海量简历与海量招聘信息中快速且准确的找到符合自身要求的人才与岗位,成为各大招聘网站面临的一个重大难题。若能够根据应聘与招聘双方发布的信息实现简历的自动推送与岗位的自动推荐,将在很大程度上节约时间与消耗成本,提高最终结果的精准度。
发明内容
本发明的技术任务是提供一种招聘网站个人简历自动推送方法。
本发明的技术任务是按以下方式实现的,该个人简历自动推送方法是利用网络爬虫抓取招聘网站中的招聘与应聘信息,基于数据挖掘技术提取关键应聘条件与招聘要求进行关联比对,计算得到二者间的紧密重合区域,并根据重合区域的密度进行简历推送或岗位推荐。
该个人简历自动推送方法的操作步骤如下:
步骤1:从互联网上找到要采集的主流招聘网站;
步骤2:针对招聘信息与应聘信息,分别进行数据采集;通过抓包工具获取相关url,配置采集规则,利用网络爬虫工具进行数据抓取;
步骤3:对抓取到的数据进行数据验证;
步骤4:将采集到的数据根据类别不同分类进行存储,筛选关键字段作为关联字段;
步骤5:根据关联字段对数据进行关联,根据二者的紧密程度计算关联度;
步骤6:根据关联度将招聘信息与应聘信息分类处理。
所述的步骤6中将招聘信息与应聘信息分为三类:不相关信息、相关信息和极为相关信息,将相关信息与极为相关信息简历推送给招聘方,并标明相关度。
本发明的一种招聘网站个人简历自动推送方法和现有技术相比,能够根据应聘与招聘双方发布的信息,分析得到二者间的紧密重合区域,实现简历的自动推送与岗位的自动推荐,很大程度上节约时间与降低成本消耗,提高了最终结果的精准度。
附图说明
附图1为一种招聘网站个人简历自动推送方法的流程框图。
具体实施方式
实施例1:
该个人简历自动推送方法是利用网络爬虫抓取招聘网站中的招聘与应聘信息,基于数据挖掘技术提取关键应聘条件与招聘要求进行关联比对,计算得到二者间的紧密重合区域,并根据重合区域的密度进行简历推送或岗位推荐。
该个人简历自动推送方法的操作步骤如下:
步骤1:从互联网上找到要采集的主流招聘网站;
步骤2:针对招聘信息与应聘信息,分别进行数据采集;通过抓包工具获取相关url,配置采集规则,利用网络爬虫工具进行数据抓取;
步骤3:对抓取到的数据进行数据验证;
步骤4:将采集到的数据根据类别不同分类进行存储,筛选关键字段作为关联字段;
步骤5:根据关联字段对数据进行关联,根据二者的紧密程度计算关联度;
步骤6:根据关联度将招聘信息与应聘信息分类处理,将招聘信息与应聘信息分为三类:不相关信息、相关信息和极为相关信息,将相关信息与极为相关信息简历推送给招聘方,并标明相关度。
实施例2:
该个人简历自动推送方法的操作步骤如下:
步骤1:从互联网上找到要采集的主流招聘网站;
步骤2:针对招聘信息与应聘信息,分别进行数据采集;通过抓包工具获取相关url,配置采集规则,利用网络爬虫工具进行数据抓取;
步骤3:对抓取到的数据进行数据验证,若采集的质量较差或准确性较低,则对步骤2的采集规则进行调整,再次进行采集;
步骤4:将采集到的数据根据类别不同分为两类分别进行存储,筛选关键字段作为关联字段;
步骤5:根据关联字段对数据进行关联,根据二者的紧密程度计算关联度;
步骤6:根据关联度将招聘信息与应聘信息分类处理,将招聘信息与应聘信息分为三类:不相关信息、相关信息和极为相关信息,将相关信息与极为相关信息简历推送给招聘方,并标明相关度。
步骤7:招聘企业与应聘人员对推送结果做出反馈。
名称解释:
url:统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。
Claims (3)
1.一种招聘网站个人简历自动推送方法,其特征在于,该个人简历自动推送方法是利用网络爬虫抓取招聘网站中的招聘与应聘信息,基于数据挖掘技术提取关键应聘条件与招聘要求进行关联比对,计算得到二者间的紧密重合区域,并根据重合区域的密度进行简历推送或岗位推荐。
2.根据权利要求1所述的一种招聘网站个人简历自动推送方法,其特征在于,该个人简历自动推送方法的操作步骤如下:
步骤1:从互联网上找到要采集的主流招聘网站;
步骤2:针对招聘信息与应聘信息,分别进行数据采集;通过抓包工具获取相关url,配置采集规则,利用网络爬虫工具进行数据抓取;
步骤3:对抓取到的数据进行数据验证;
步骤4:将采集到的数据根据类别不同分类进行存储,筛选关键字段作为关联字段;
步骤5:根据关联字段对数据进行关联,根据二者的紧密程度计算关联度;
步骤6:根据关联度将招聘信息与应聘信息分类处理。
3. 根据权利要求2所述的一种招聘网站个人简历自动推送方法,其特征在于,所述的步骤6中将招聘信息与应聘信息分为三类:不相关信息、相关信息和极为相关信息,将相关信息与极为相关信息简历推送给招聘方,并标明相关度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510129388.XA CN104731906A (zh) | 2015-03-24 | 2015-03-24 | 一种招聘网站个人简历自动推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510129388.XA CN104731906A (zh) | 2015-03-24 | 2015-03-24 | 一种招聘网站个人简历自动推送方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104731906A true CN104731906A (zh) | 2015-06-24 |
Family
ID=53455793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510129388.XA Pending CN104731906A (zh) | 2015-03-24 | 2015-03-24 | 一种招聘网站个人简历自动推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104731906A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN105205106A (zh) * | 2015-08-27 | 2015-12-30 | 河南中欧企业咨询有限公司 | 一种方便企业管理招聘网站的系统 |
CN106920070A (zh) * | 2017-02-13 | 2017-07-04 | 济南浪潮高新科技投资发展有限公司 | 一种简历收集方法、装置及系统 |
CN106919585A (zh) * | 2015-12-24 | 2017-07-04 | 中移(杭州)信息技术有限公司 | 根据终端的统一资源定位符确定商品信息的方法及装置 |
CN107133779A (zh) * | 2017-05-02 | 2017-09-05 | 山东浪潮通软信息科技有限公司 | 一种多域通信主动式收集简历的方法、系统及浏览器插件 |
CN108765219A (zh) * | 2018-05-11 | 2018-11-06 | 重庆工商职业学院 | 一种就业岗位调取系统及其控制方法 |
CN108959561A (zh) * | 2018-07-03 | 2018-12-07 | 龙马智芯(珠海横琴)科技有限公司 | 服务端及系统、信息推荐方法 |
CN109408763A (zh) * | 2018-11-06 | 2019-03-01 | 深圳市东宝信息技术有限公司 | 一种对不同模板的简历进行管理的方法及系统 |
CN109472553A (zh) * | 2018-11-12 | 2019-03-15 | 用友网络科技股份有限公司 | 一种基于浏览器插件的多域通信推拉式双向收集简历的方法和装置 |
CN109559093A (zh) * | 2018-11-16 | 2019-04-02 | 合肥风聘网络科技有限公司 | 一种便于猎头整合多平台招聘信息的一键发布系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090171744A1 (en) * | 2007-12-28 | 2009-07-02 | Hake Richard L | System and method for reducing employee training time and distributing corporate and job information to employees |
CN102117323A (zh) * | 2011-02-21 | 2011-07-06 | 深圳埃斯欧纳信息咨询有限公司 | 一种推荐求职简历的处理方法和系统 |
CN102236716A (zh) * | 2011-07-12 | 2011-11-09 | 上海简胜企业管理咨询有限公司 | 一种求职者与招聘职位匹配的系统及匹配方法 |
US20110276582A1 (en) * | 2010-05-04 | 2011-11-10 | Schmitt Steven J | Systems and methods for a job and referral recommendation engine |
CN103544312A (zh) * | 2013-11-04 | 2014-01-29 | 成都数之联科技有限公司 | 一种基于社交网络的招聘信息匹配方法 |
-
2015
- 2015-03-24 CN CN201510129388.XA patent/CN104731906A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090171744A1 (en) * | 2007-12-28 | 2009-07-02 | Hake Richard L | System and method for reducing employee training time and distributing corporate and job information to employees |
US20110276582A1 (en) * | 2010-05-04 | 2011-11-10 | Schmitt Steven J | Systems and methods for a job and referral recommendation engine |
CN102117323A (zh) * | 2011-02-21 | 2011-07-06 | 深圳埃斯欧纳信息咨询有限公司 | 一种推荐求职简历的处理方法和系统 |
CN102236716A (zh) * | 2011-07-12 | 2011-11-09 | 上海简胜企业管理咨询有限公司 | 一种求职者与招聘职位匹配的系统及匹配方法 |
CN103544312A (zh) * | 2013-11-04 | 2014-01-29 | 成都数之联科技有限公司 | 一种基于社交网络的招聘信息匹配方法 |
Non-Patent Citations (1)
Title |
---|
董亚则等: "基于Web的个性化就业信息服务系统设计", 《长春工业大学学报(自然科学版)》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN105159962B (zh) * | 2015-08-21 | 2018-08-17 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN105205106A (zh) * | 2015-08-27 | 2015-12-30 | 河南中欧企业咨询有限公司 | 一种方便企业管理招聘网站的系统 |
CN106919585A (zh) * | 2015-12-24 | 2017-07-04 | 中移(杭州)信息技术有限公司 | 根据终端的统一资源定位符确定商品信息的方法及装置 |
CN106920070A (zh) * | 2017-02-13 | 2017-07-04 | 济南浪潮高新科技投资发展有限公司 | 一种简历收集方法、装置及系统 |
CN107133779A (zh) * | 2017-05-02 | 2017-09-05 | 山东浪潮通软信息科技有限公司 | 一种多域通信主动式收集简历的方法、系统及浏览器插件 |
CN108765219A (zh) * | 2018-05-11 | 2018-11-06 | 重庆工商职业学院 | 一种就业岗位调取系统及其控制方法 |
CN108959561A (zh) * | 2018-07-03 | 2018-12-07 | 龙马智芯(珠海横琴)科技有限公司 | 服务端及系统、信息推荐方法 |
CN109408763A (zh) * | 2018-11-06 | 2019-03-01 | 深圳市东宝信息技术有限公司 | 一种对不同模板的简历进行管理的方法及系统 |
CN109472553A (zh) * | 2018-11-12 | 2019-03-15 | 用友网络科技股份有限公司 | 一种基于浏览器插件的多域通信推拉式双向收集简历的方法和装置 |
CN109559093A (zh) * | 2018-11-16 | 2019-04-02 | 合肥风聘网络科技有限公司 | 一种便于猎头整合多平台招聘信息的一键发布系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104731906A (zh) | 一种招聘网站个人简历自动推送方法 | |
CN108090223B (zh) | 一种基于互联网信息的开放学者画像方法 | |
CN102999420B (zh) | 基于dom的跨站脚本漏洞测试方法和系统 | |
CN104199874A (zh) | 一种基于用户浏览行为的网页推荐方法 | |
CN103077250B (zh) | 一种网页内容抓取方法及装置 | |
CN104156389A (zh) | 基于Hadoop平台的深度包检测系统及方法 | |
CN103823904A (zh) | 网页浏览路径优化方法及其系统 | |
CN103927400A (zh) | Web网站产品详细信息的分类抓取及产品信息库建立方法 | |
CN103838796A (zh) | 一种网页结构化信息抽取方法 | |
CN104899219A (zh) | 伪静态url的筛除方法、系统及网页爬取方法、系统 | |
CN105808722A (zh) | 一种信息判别方法和系统 | |
CN103744954A (zh) | 一种词关联网模型的构建方法及其构建器 | |
CN108694325B (zh) | 指定类型网站的辨别方法和指定类型网站的辨别装置 | |
CN104317845A (zh) | 一种深度网络数据自动抽取方法及系统 | |
CN104572874A (zh) | 一种网页信息的抽取方法及装置 | |
CN106168977B (zh) | 一种用于网站安全监测的栏目识别方法 | |
CN104123337A (zh) | 一种预测报考信息的方法和装置 | |
CN105763637A (zh) | 一种基于大数据的影评获取方法 | |
Tang et al. | A method of text dimension reduction based on CHI and TF-IDF | |
CN104978431A (zh) | 网页数据融合方法和装置 | |
Agheleh et al. | Identification and ranking of barriers and obstacles of SMEs green supply chain deployment (case study Qazvin State) | |
Asmandiyarov et al. | Complex Approach to Optimization of Brownfields Business Cases Based on the Pilot Project Renovation in PJSC Gazprom Neft | |
Sedkaoui | Data analytics process: there's great work behind the scenes | |
CN104866532A (zh) | 一种用于半封闭数据环境下的数据搜索的方法和装置 | |
Yue et al. | Improving navigation page detection by using DOM-based block text identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150624 |
|
WD01 | Invention patent application deemed withdrawn after publication |