CN108399525A - 一种基于数据挖掘和机器学习的人才评估方法 - Google Patents

一种基于数据挖掘和机器学习的人才评估方法 Download PDF

Info

Publication number
CN108399525A
CN108399525A CN201710065033.8A CN201710065033A CN108399525A CN 108399525 A CN108399525 A CN 108399525A CN 201710065033 A CN201710065033 A CN 201710065033A CN 108399525 A CN108399525 A CN 108399525A
Authority
CN
China
Prior art keywords
talent
user
information data
appraisal procedure
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201710065033.8A
Other languages
English (en)
Inventor
王珣昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fan Shaoxia
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710065033.8A priority Critical patent/CN108399525A/zh
Publication of CN108399525A publication Critical patent/CN108399525A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于数据挖掘和机器学习的人才评估方法,涉及数据挖掘领域,该方法步骤包括:从大量简历中提取人员信息数据;对人才的工作经验和项目经历进行评估打分;根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;将字段作为输入,通过机器学习模型给用户推荐合适职位;人工评估推荐是否合适,通过用户反馈自动调整模型参数;引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。本发明可以以计算机程序模拟人工评估简历和人才,从而大大降低HR的工作量。

Description

一种基于数据挖掘和机器学习的人才评估方法
技术领域
本发明涉及数据挖掘领域,更具体地,涉及一种基于数据挖掘和机器学习的人才评估方法。
背景技术
人才评估一直是人力资源行业的一个重要领域,对于一个公司来说,对众多人选进行合适恰当的评判是一项重要任务,这关系到人才选拔。传统上这也是一项结合客观简历评估和主观面试考核评估的复杂工作,对于HR的职业要求并不简单。而且由于其涉及数据量大,HR常常会因为客观原因如疲劳,从而做出错误的人才评估。
大数据挖掘和机器学习技术的成熟,可以大大降低数据处理工作,将计算机程序应用于人才评估方面,可以模拟人类进行人才评估,不仅大大降低了数据处理压力,同时也带来了不断自动提高计算机程序取代人类进行人才评估综合可信度的可能性。
发明内容
有鉴于此,本发明的内容在于提供一种基于数据挖掘和机器学习的人才评估方法,可以减轻HR的工作量。
本发明提供了一种基于数据挖掘和机器学习的人才评估方法,该方法步骤包括:
从大量简历中提取人员信息数据;
对人才的工作经验和项目经历进行评估打分;
根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;
将字段作为输入,通过机器学习模型给用户推荐合适职位;
人工评估推荐是否合适,通过用户反馈自动调整模型参数;
引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。
其中,所述信息数据包括基础信息数据、教育信息数据和工作及项目信息数据。
进一步地,所述基础信息数据包括用户年龄、性别和地区;所述教育信息数据包括用户学历、学校和专业;所述工作及项目信息数据包括用户工作过的公司、所担任过的职位、工作内容及时长、业绩、所带项目、项目中担任的职责、项目内容及项目业绩。
本发明可以以计算机程序模拟人类进行简历筛选和人才评估,从而大大降低数据处理量,减轻了HR的工作量,同时还可以更客观地对人才做出评估。
附图说明
图1为本发明提供的一种基于数据挖掘和机器学习的人才评估方法流程图。
图2为本发明提供的一种基于贝叶斯模型的人才评估方法流程图。
具体实施方式
图1为本发明提供的一种基于数据挖掘和机器学习的人才评估方法流程图,该方法步骤包括:
步骤S101:从大量简历中提取人员信息数据;
步骤S102:对人才的工作经验和项目经历进行评估打分;
步骤S103:根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;
步骤S104:将字段作为输入,通过机器学习模型给用户推荐合适职位;
步骤S105:人工评估推荐是否合适,通过用户反馈自动调整模型参数;
步骤S106:引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。
其中,在步骤S101中,所述信息数据包括基础信息数据、教育信息数据和工作及项目信息数据。
进一步地,所述基础信息数据包括用户年龄、性别和地区;所述教育信息数据包括用户学历、学校和专业;所述工作及项目信息数据包括用户工作过的公司、所担任过的职位、工作内容及时长、业绩、所带项目、项目中担任的职责、项目内容及项目业绩。
图2为本发明提供的一种基于贝叶斯模型的人才评估方法流程图,该方法步骤包括:
步骤S201:使用自然语言处理的句法分析及命名实体识别方法提取用户工作内容及项目内容中的词关系,对内容提取词tf、idf及词性,通过pcfg进行句法分析并生成职位关键词及句式模板;
步骤S202:根据用户的简历内容,通过职位名及工作内容的词向量识别所在行业及职位信息,将同一类简历进行数据归类,将所有词tf、idf和词性及句法模板聚合,根据匹配度进行评估打分;
步骤S203:用户提交简历同时,自动根据简历内容匹配分数上下的简历返回给用户,让用户进行评判是否正确,并进行人工干预调整;
步骤S204:收集大量用户的输入,根据用户所标记的简历进行贝叶斯分析,提取用户标记上升排序及下降排序共有的词tf、idf和词性及句法模板,提取出简历中的句子,放入贝叶斯分类器进行机器学习训练,标记句子对当前职位的正负相关性;
步骤S205:对新输入的简历进行分句,放入分类器对句子进行判断,获取用户句子对职位的贡献比,然后整合分数对简历进行评估打分;
步骤S206:引入人才其他信息数据,通过多数据源比较筛选加强调整模型参数,进而经过机器学习后提高或降低针对该人才的评估打分,提高人才综合评估可信度。
其中,在步骤S206中,所述其他信息数据可以来自数字媒体、企业服务软件系统、流程管理软件系统、用户征信系统。进一步地,所述数字媒体包括微博、微信、知乎、在行、分答、果壳、领英,或其他个人APP、评论。
显然,本领域技术人员根据本实施例做出的非创造性的劳动,也属于本发明保护范围,本实施例并不限制本发明的保护范围。

Claims (9)

1.一种基于数据挖掘和机器学习的人才评估方法,其特征在于,该方法步骤包括:
从大量简历中提取人员信息数据;
对人才的工作经验和项目经历进行评估打分;
根据大量简历构建按工作职位及公司为参照指标的知识库,建立机器学习模型;
将字段作为输入,通过机器学习模型给用户推荐合适职位;
人工评估推荐是否合适,通过用户反馈自动调整模型参数;
引入人才其他信息数据,通过多数据源比较筛选加强自动调整模型参数。
2.根据权利要求1所述的人才评估方法,其特征在于:所述信息数据包括基础信息数据、教育信息数据和工作及项目信息数据。
3.根据权利要求2所述的人才评估方法,其特征在于:所述基础信息数据包括用户年龄、性别和地区。
4.根据权利要求2所述的人才评估方法,其特征在于:所述教育信息数据包括用户学历、学校和专业。
5.根据权利要求2所述的人才评估方法,其特征在于:所述工作及项目信息数据包括用户工作过的公司、所担任过的职位、工作内容及时长、业绩、所带项目、项目中担任的职责、项目内容及项目业绩。
6.根据权利要求1所述的人才评估方法,其特征在于:机器学习模型包括贝叶斯模型。
7.根据权利要求6所述的人才评估方法,其特征在于:基于所述贝叶斯模型进行人才评估的方法步骤包括:使用自然语言处理的句法分析及命名实体识别方法提取用户工作内容及项目内容中的词关系,对内容提取词tf、idf及词性,通过pcfg进行句法分析并生成职位关键词及句式模板;
根据用户的简历内容,通过职位名及工作内容的词向量识别所在行业及职位信息,将同一类简历进行数据归类,将所有词tf、idf和词性及句法模板聚合,根据匹配度进行评估打分;
用户提交简历同时,自动根据简历内容匹配分数上下的简历返回给用户,让用户进行评判是否正确,并进行人工干预调整;
收集大量用户的输入,根据用户所标记的简历进行贝叶斯分析,提取用户标记上升排序及下降排序共有的词tf、idf和词性及句法模板,提取出简历中的句子,放入贝叶斯分类器进行机器学习训练,标记句子对当前职位的正负相关性;
对新输入的简历进行分句,放入分类器对句子进行判断,获取用户句子对职位的贡献比,然后整合分数对简历进行评估打分;
引入人才其他信息数据,通过多数据源比较筛选加强调整模型参数,进而经过机器学习后提高或降低针对该人才的评估打分,提高人才综合评估可信度。
8.根据权利要求1所述的人才评估方法,其特征在于:所述其他信息数据可以来自数字媒体、企业服务软件系统、流程管理软件系统、用户征信系统。
9.根据权利要求8所述的人才评估方法,其特征在于:所述数字媒体包括微博、微信、知乎、在行、分答、果壳、领英,或其他个人APP、评论。
CN201710065033.8A 2017-02-04 2017-02-04 一种基于数据挖掘和机器学习的人才评估方法 Withdrawn CN108399525A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710065033.8A CN108399525A (zh) 2017-02-04 2017-02-04 一种基于数据挖掘和机器学习的人才评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710065033.8A CN108399525A (zh) 2017-02-04 2017-02-04 一种基于数据挖掘和机器学习的人才评估方法

Publications (1)

Publication Number Publication Date
CN108399525A true CN108399525A (zh) 2018-08-14

Family

ID=63093508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710065033.8A Withdrawn CN108399525A (zh) 2017-02-04 2017-02-04 一种基于数据挖掘和机器学习的人才评估方法

Country Status (1)

Country Link
CN (1) CN108399525A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636337A (zh) * 2018-12-12 2019-04-16 北京唐冠天朗科技开发有限公司 一种基于大数据的人才库构建方法及电子设备
CN109934468A (zh) * 2019-02-26 2019-06-25 北京多点在线科技有限公司 一种兼职工作匹配方法及系统、存储介质
CN109948131A (zh) * 2019-03-15 2019-06-28 深圳八爪网络科技有限公司 同一人才不同简历的合并方法及装置
CN110069782A (zh) * 2019-04-26 2019-07-30 西安募格网络科技有限公司 一种基于机器学习的简历质量判断方法
CN110866734A (zh) * 2019-11-11 2020-03-06 北京网聘咨询有限公司 基于深度学习的智能招聘方法及系统
CN112883146A (zh) * 2021-01-15 2021-06-01 上海柏观数据科技有限公司 一种基于社交信息的人才评价结果控制方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064971A (zh) * 2013-01-05 2013-04-24 南京邮电大学 一种基于评分和中文情感分析的垃圾评论检测方法
US20150106378A1 (en) * 2013-10-14 2015-04-16 Barracuda Networks, Inc. Document Categorization By Rules and Clause Group Scores Associated with Type Profiles Apparatus and Method
CN105787639A (zh) * 2016-02-03 2016-07-20 北京云太科技有限公司 基于人工智能的人才大数据量化精确匹配方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064971A (zh) * 2013-01-05 2013-04-24 南京邮电大学 一种基于评分和中文情感分析的垃圾评论检测方法
US20150106378A1 (en) * 2013-10-14 2015-04-16 Barracuda Networks, Inc. Document Categorization By Rules and Clause Group Scores Associated with Type Profiles Apparatus and Method
CN105787639A (zh) * 2016-02-03 2016-07-20 北京云太科技有限公司 基于人工智能的人才大数据量化精确匹配方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
贺媛: "基于神经网络的招聘系统改进", 《数字技术与应用》 *
郭迎迎等: "基于优势关系的人才招聘研究", 《科技与管理》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636337A (zh) * 2018-12-12 2019-04-16 北京唐冠天朗科技开发有限公司 一种基于大数据的人才库构建方法及电子设备
CN109934468A (zh) * 2019-02-26 2019-06-25 北京多点在线科技有限公司 一种兼职工作匹配方法及系统、存储介质
CN109948131A (zh) * 2019-03-15 2019-06-28 深圳八爪网络科技有限公司 同一人才不同简历的合并方法及装置
CN109948131B (zh) * 2019-03-15 2023-05-12 长沙八爪网络科技有限公司 同一人才不同简历的合并方法及装置
CN110069782A (zh) * 2019-04-26 2019-07-30 西安募格网络科技有限公司 一种基于机器学习的简历质量判断方法
CN110866734A (zh) * 2019-11-11 2020-03-06 北京网聘咨询有限公司 基于深度学习的智能招聘方法及系统
CN112883146A (zh) * 2021-01-15 2021-06-01 上海柏观数据科技有限公司 一种基于社交信息的人才评价结果控制方法和装置

Similar Documents

Publication Publication Date Title
CN108399525A (zh) 一种基于数据挖掘和机器学习的人才评估方法
JP6306400B2 (ja) クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法
CN109670727A (zh) 一种基于众包的分词标注质量评估系统及评估方法
CN105653590A (zh) 一种中文文献作者重名消歧的方法
US20200184144A1 (en) Integrated admission data management system using big data analysis
CN111144079B (zh) 一种智能获取学习资源的方法、装置、打印机和存储介质
CN109241513A (zh) 一种基于大数据众包模式数据标注的方法及装置
Chen et al. Hidden Markov model using Dirichlet process for de-identification
CN111242565A (zh) 一种基于智能人事模型的简历优化方法及装置
Abana A decision tree approach for predicting student grades in Research Project using Weka
CN112347254A (zh) 新闻文本的分类方法、装置、计算机设备和存储介质
CN104598648A (zh) 一种微博用户交互式性别识别方法及装置
US9396255B2 (en) Methods and systems for facilitating evaluation of documents
CN110532374A (zh) 保险信息的处理方法及装置
Arezina et al. Content Analysis: Waste Management Strategy in the Republic of Serbia for the Period 2010-2019
Thiele et al. Terminology based visualization of interfaces in interdisciplinary research networks
US20210357634A1 (en) Methods and systems for processing documents with task-specific highlighting
JP2012098921A (ja) ユーザ区分けシステム
Hussain et al. Lasr: A tool for large scale annotation of software requirements
CN115526589A (zh) 一种用于待就业人群的就业信息处理方法及设备
Prabakaran et al. A Bidirectional LSTM approach for written script auto evaluation using keywords-based pattern matching
CN112528887A (zh) 审核方法及装置
Triantafyllou et al. Group Affect Recognition: Completed Databases and Smart Uses
Ginting et al. IMPLEMENTATION OF SIMPLE ADDITIVE WEIGHTING (SAW) ALGORITHM IN DECISION SUPPORT SYSTEM FOR DETERMINING WORKING AREA FOR COOPERATIVE
Bhattacharyya et al. Hybrid computational intelligence: research and applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Wang Xunyu

Document name: Notification of Publication of the Application for Invention

DD01 Delivery of document by public notice
TA01 Transfer of patent application right

Effective date of registration: 20200416

Address after: 200129 202, room 35, Lane 1728, Wulian Road, Pudong New Area, Shanghai.

Applicant after: Fan Shaoxia

Address before: 200129 202, room 35, Lane 1728, Wulian Road, Pudong New Area, Shanghai.

Applicant before: Wang Xunyu

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180814

WW01 Invention patent application withdrawn after publication