CN108399525A - 一种基于数据挖掘和机器学习的人才评估方法 - Google Patents
一种基于数据挖掘和机器学习的人才评估方法 Download PDFInfo
- Publication number
- CN108399525A CN108399525A CN201710065033.8A CN201710065033A CN108399525A CN 108399525 A CN108399525 A CN 108399525A CN 201710065033 A CN201710065033 A CN 201710065033A CN 108399525 A CN108399525 A CN 108399525A
- Authority
- CN
- China
- Prior art keywords
- talent
- user
- information data
- appraisal procedure
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于数据挖掘和机器学习的人才评估方法,涉及数据挖掘领域,该方法步骤包括:从大量简历中提取人员信息数据;对人才的工作经验和项目经历进行评估打分;根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;将字段作为输入,通过机器学习模型给用户推荐合适职位;人工评估推荐是否合适,通过用户反馈自动调整模型参数;引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。本发明可以以计算机程序模拟人工评估简历和人才,从而大大降低HR的工作量。
Description
技术领域
本发明涉及数据挖掘领域,更具体地,涉及一种基于数据挖掘和机器学习的人才评估方法。
背景技术
人才评估一直是人力资源行业的一个重要领域,对于一个公司来说,对众多人选进行合适恰当的评判是一项重要任务,这关系到人才选拔。传统上这也是一项结合客观简历评估和主观面试考核评估的复杂工作,对于HR的职业要求并不简单。而且由于其涉及数据量大,HR常常会因为客观原因如疲劳,从而做出错误的人才评估。
大数据挖掘和机器学习技术的成熟,可以大大降低数据处理工作,将计算机程序应用于人才评估方面,可以模拟人类进行人才评估,不仅大大降低了数据处理压力,同时也带来了不断自动提高计算机程序取代人类进行人才评估综合可信度的可能性。
发明内容
有鉴于此,本发明的内容在于提供一种基于数据挖掘和机器学习的人才评估方法,可以减轻HR的工作量。
本发明提供了一种基于数据挖掘和机器学习的人才评估方法,该方法步骤包括:
从大量简历中提取人员信息数据;
对人才的工作经验和项目经历进行评估打分;
根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;
将字段作为输入,通过机器学习模型给用户推荐合适职位;
人工评估推荐是否合适,通过用户反馈自动调整模型参数;
引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。
其中,所述信息数据包括基础信息数据、教育信息数据和工作及项目信息数据。
进一步地,所述基础信息数据包括用户年龄、性别和地区;所述教育信息数据包括用户学历、学校和专业;所述工作及项目信息数据包括用户工作过的公司、所担任过的职位、工作内容及时长、业绩、所带项目、项目中担任的职责、项目内容及项目业绩。
本发明可以以计算机程序模拟人类进行简历筛选和人才评估,从而大大降低数据处理量,减轻了HR的工作量,同时还可以更客观地对人才做出评估。
附图说明
图1为本发明提供的一种基于数据挖掘和机器学习的人才评估方法流程图。
图2为本发明提供的一种基于贝叶斯模型的人才评估方法流程图。
具体实施方式
图1为本发明提供的一种基于数据挖掘和机器学习的人才评估方法流程图,该方法步骤包括:
步骤S101:从大量简历中提取人员信息数据;
步骤S102:对人才的工作经验和项目经历进行评估打分;
步骤S103:根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;
步骤S104:将字段作为输入,通过机器学习模型给用户推荐合适职位;
步骤S105:人工评估推荐是否合适,通过用户反馈自动调整模型参数;
步骤S106:引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。
其中,在步骤S101中,所述信息数据包括基础信息数据、教育信息数据和工作及项目信息数据。
进一步地,所述基础信息数据包括用户年龄、性别和地区;所述教育信息数据包括用户学历、学校和专业;所述工作及项目信息数据包括用户工作过的公司、所担任过的职位、工作内容及时长、业绩、所带项目、项目中担任的职责、项目内容及项目业绩。
图2为本发明提供的一种基于贝叶斯模型的人才评估方法流程图,该方法步骤包括:
步骤S201:使用自然语言处理的句法分析及命名实体识别方法提取用户工作内容及项目内容中的词关系,对内容提取词tf、idf及词性,通过pcfg进行句法分析并生成职位关键词及句式模板;
步骤S202:根据用户的简历内容,通过职位名及工作内容的词向量识别所在行业及职位信息,将同一类简历进行数据归类,将所有词tf、idf和词性及句法模板聚合,根据匹配度进行评估打分;
步骤S203:用户提交简历同时,自动根据简历内容匹配分数上下的简历返回给用户,让用户进行评判是否正确,并进行人工干预调整;
步骤S204:收集大量用户的输入,根据用户所标记的简历进行贝叶斯分析,提取用户标记上升排序及下降排序共有的词tf、idf和词性及句法模板,提取出简历中的句子,放入贝叶斯分类器进行机器学习训练,标记句子对当前职位的正负相关性;
步骤S205:对新输入的简历进行分句,放入分类器对句子进行判断,获取用户句子对职位的贡献比,然后整合分数对简历进行评估打分;
步骤S206:引入人才其他信息数据,通过多数据源比较筛选加强调整模型参数,进而经过机器学习后提高或降低针对该人才的评估打分,提高人才综合评估可信度。
其中,在步骤S206中,所述其他信息数据可以来自数字媒体、企业服务软件系统、流程管理软件系统、用户征信系统。进一步地,所述数字媒体包括微博、微信、知乎、在行、分答、果壳、领英,或其他个人APP、评论。
显然,本领域技术人员根据本实施例做出的非创造性的劳动,也属于本发明保护范围,本实施例并不限制本发明的保护范围。
Claims (9)
1.一种基于数据挖掘和机器学习的人才评估方法,其特征在于,该方法步骤包括:
从大量简历中提取人员信息数据;
对人才的工作经验和项目经历进行评估打分;
根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;
将字段作为输入,通过机器学习模型给用户推荐合适职位;
人工评估推荐是否合适,通过用户反馈自动调整模型参数;
引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。
2.根据权利要求1所述的人才评估方法,其特征在于:所述信息数据包括基础信息数据、教育信息数据和工作及项目信息数据。
3.根据权利要求2所述的人才评估方法,其特征在于:所述基础信息数据包括用户年龄、性别和地区。
4.根据权利要求2所述的人才评估方法,其特征在于:所述教育信息数据包括用户学历、学校和专业。
5.根据权利要求2所述的人才评估方法,其特征在于:所述工作及项目信息数据包括用户工作过的公司、所担任过的职位、工作内容及时长、业绩、所带项目、项目中担任的职责、项目内容及项目业绩。
6.根据权利要求1所述的人才评估方法,其特征在于:机器学习模型包括贝叶斯模型。
7.根据权利要求6所述的人才评估方法,其特征在于:基于所述贝叶斯模型进行人才评估的方法步骤包括:使用自然语言处理的句法分析及命名实体识别方法提取用户工作内容及项目内容中的词关系,对内容提取词tf、idf及词性,通过pcfg进行句法分析并生成职位关键词及句式模板;
根据用户的简历内容,通过职位名及工作内容的词向量识别所在行业及职位信息,将同一类简历进行数据归类,将所有词tf、idf和词性及句法模板聚合,根据匹配度进行评估打分;
用户提交简历同时,自动根据简历内容匹配分数上下的简历返回给用户,让用户进行评判是否正确,并进行人工干预调整;
收集大量用户的输入,根据用户所标记的简历进行贝叶斯分析,提取用户标记上升排序及下降排序共有的词tf、idf和词性及句法模板,提取出简历中的句子,放入贝叶斯分类器进行机器学习训练,标记句子对当前职位的正负相关性;
对新输入的简历进行分句,放入分类器对句子进行判断,获取用户句子对职位的贡献比,然后整合分数对简历进行评估打分;
引入人才其他信息数据,通过多数据源比较筛选加强调整模型参数,进而经过机器学习后提高或降低针对该人才的评估打分,提高人才综合评估可信度。
8.根据权利要求1所述的人才评估方法,其特征在于:所述其他信息数据可以来自数字媒体、企业服务软件系统、流程管理软件系统、用户征信系统。
9.根据权利要求8所述的人才评估方法,其特征在于:所述数字媒体包括微博、微信、知乎、在行、分答、果壳、领英,或其他个人APP、评论。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710065033.8A CN108399525A (zh) | 2017-02-04 | 2017-02-04 | 一种基于数据挖掘和机器学习的人才评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710065033.8A CN108399525A (zh) | 2017-02-04 | 2017-02-04 | 一种基于数据挖掘和机器学习的人才评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108399525A true CN108399525A (zh) | 2018-08-14 |
Family
ID=63093508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710065033.8A Withdrawn CN108399525A (zh) | 2017-02-04 | 2017-02-04 | 一种基于数据挖掘和机器学习的人才评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108399525A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636337A (zh) * | 2018-12-12 | 2019-04-16 | 北京唐冠天朗科技开发有限公司 | 一种基于大数据的人才库构建方法及电子设备 |
CN109934468A (zh) * | 2019-02-26 | 2019-06-25 | 北京多点在线科技有限公司 | 一种兼职工作匹配方法及系统、存储介质 |
CN109948131A (zh) * | 2019-03-15 | 2019-06-28 | 深圳八爪网络科技有限公司 | 同一人才不同简历的合并方法及装置 |
CN110069782A (zh) * | 2019-04-26 | 2019-07-30 | 西安募格网络科技有限公司 | 一种基于机器学习的简历质量判断方法 |
CN110866734A (zh) * | 2019-11-11 | 2020-03-06 | 北京网聘咨询有限公司 | 基于深度学习的智能招聘方法及系统 |
CN112883146A (zh) * | 2021-01-15 | 2021-06-01 | 上海柏观数据科技有限公司 | 一种基于社交信息的人才评价结果控制方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064971A (zh) * | 2013-01-05 | 2013-04-24 | 南京邮电大学 | 一种基于评分和中文情感分析的垃圾评论检测方法 |
US20150106378A1 (en) * | 2013-10-14 | 2015-04-16 | Barracuda Networks, Inc. | Document Categorization By Rules and Clause Group Scores Associated with Type Profiles Apparatus and Method |
CN105787639A (zh) * | 2016-02-03 | 2016-07-20 | 北京云太科技有限公司 | 基于人工智能的人才大数据量化精确匹配方法和装置 |
-
2017
- 2017-02-04 CN CN201710065033.8A patent/CN108399525A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064971A (zh) * | 2013-01-05 | 2013-04-24 | 南京邮电大学 | 一种基于评分和中文情感分析的垃圾评论检测方法 |
US20150106378A1 (en) * | 2013-10-14 | 2015-04-16 | Barracuda Networks, Inc. | Document Categorization By Rules and Clause Group Scores Associated with Type Profiles Apparatus and Method |
CN105787639A (zh) * | 2016-02-03 | 2016-07-20 | 北京云太科技有限公司 | 基于人工智能的人才大数据量化精确匹配方法和装置 |
Non-Patent Citations (2)
Title |
---|
贺媛: "基于神经网络的招聘系统改进", 《数字技术与应用》 * |
郭迎迎等: "基于优势关系的人才招聘研究", 《科技与管理》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636337A (zh) * | 2018-12-12 | 2019-04-16 | 北京唐冠天朗科技开发有限公司 | 一种基于大数据的人才库构建方法及电子设备 |
CN109934468A (zh) * | 2019-02-26 | 2019-06-25 | 北京多点在线科技有限公司 | 一种兼职工作匹配方法及系统、存储介质 |
CN109948131A (zh) * | 2019-03-15 | 2019-06-28 | 深圳八爪网络科技有限公司 | 同一人才不同简历的合并方法及装置 |
CN109948131B (zh) * | 2019-03-15 | 2023-05-12 | 长沙八爪网络科技有限公司 | 同一人才不同简历的合并方法及装置 |
CN110069782A (zh) * | 2019-04-26 | 2019-07-30 | 西安募格网络科技有限公司 | 一种基于机器学习的简历质量判断方法 |
CN110866734A (zh) * | 2019-11-11 | 2020-03-06 | 北京网聘咨询有限公司 | 基于深度学习的智能招聘方法及系统 |
CN112883146A (zh) * | 2021-01-15 | 2021-06-01 | 上海柏观数据科技有限公司 | 一种基于社交信息的人才评价结果控制方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399525A (zh) | 一种基于数据挖掘和机器学习的人才评估方法 | |
JP6306400B2 (ja) | クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 | |
CN109670727A (zh) | 一种基于众包的分词标注质量评估系统及评估方法 | |
CN105653590A (zh) | 一种中文文献作者重名消歧的方法 | |
US20200184144A1 (en) | Integrated admission data management system using big data analysis | |
CN111144079B (zh) | 一种智能获取学习资源的方法、装置、打印机和存储介质 | |
CN109241513A (zh) | 一种基于大数据众包模式数据标注的方法及装置 | |
Chen et al. | Hidden Markov model using Dirichlet process for de-identification | |
CN111242565A (zh) | 一种基于智能人事模型的简历优化方法及装置 | |
Abana | A decision tree approach for predicting student grades in Research Project using Weka | |
CN112347254A (zh) | 新闻文本的分类方法、装置、计算机设备和存储介质 | |
CN104598648A (zh) | 一种微博用户交互式性别识别方法及装置 | |
US9396255B2 (en) | Methods and systems for facilitating evaluation of documents | |
CN110532374A (zh) | 保险信息的处理方法及装置 | |
Arezina et al. | Content Analysis: Waste Management Strategy in the Republic of Serbia for the Period 2010-2019 | |
Thiele et al. | Terminology based visualization of interfaces in interdisciplinary research networks | |
US20210357634A1 (en) | Methods and systems for processing documents with task-specific highlighting | |
JP2012098921A (ja) | ユーザ区分けシステム | |
Hussain et al. | Lasr: A tool for large scale annotation of software requirements | |
CN115526589A (zh) | 一种用于待就业人群的就业信息处理方法及设备 | |
Prabakaran et al. | A Bidirectional LSTM approach for written script auto evaluation using keywords-based pattern matching | |
CN112528887A (zh) | 审核方法及装置 | |
Triantafyllou et al. | Group Affect Recognition: Completed Databases and Smart Uses | |
Ginting et al. | IMPLEMENTATION OF SIMPLE ADDITIVE WEIGHTING (SAW) ALGORITHM IN DECISION SUPPORT SYSTEM FOR DETERMINING WORKING AREA FOR COOPERATIVE | |
Bhattacharyya et al. | Hybrid computational intelligence: research and applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
DD01 | Delivery of document by public notice |
Addressee: Wang Xunyu Document name: Notification of Publication of the Application for Invention |
|
DD01 | Delivery of document by public notice | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200416 Address after: 200129 202, room 35, Lane 1728, Wulian Road, Pudong New Area, Shanghai. Applicant after: Fan Shaoxia Address before: 200129 202, room 35, Lane 1728, Wulian Road, Pudong New Area, Shanghai. Applicant before: Wang Xunyu |
|
TA01 | Transfer of patent application right | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180814 |
|
WW01 | Invention patent application withdrawn after publication |