CN113435857A - 应聘者数据分析方法及装置 - Google Patents

应聘者数据分析方法及装置 Download PDF

Info

Publication number
CN113435857A
CN113435857A CN202110780584.9A CN202110780584A CN113435857A CN 113435857 A CN113435857 A CN 113435857A CN 202110780584 A CN202110780584 A CN 202110780584A CN 113435857 A CN113435857 A CN 113435857A
Authority
CN
China
Prior art keywords
applicant
data
hired
feature
data analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110780584.9A
Other languages
English (en)
Other versions
CN113435857B (zh
Inventor
党娜
刘洋
李�昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202110780584.9A priority Critical patent/CN113435857B/zh
Publication of CN113435857A publication Critical patent/CN113435857A/zh
Application granted granted Critical
Publication of CN113435857B publication Critical patent/CN113435857B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种应聘者数据分析方法及装置,其中该方法包括:获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征分别对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。本发明涉及大数据技术领域,提高了对应聘者数据分析的客观性和准确性,并且提高了应聘者数据分析的效率。

Description

应聘者数据分析方法及装置
技术领域
本发明涉及大数据技术领域,尤其涉及应聘者数据分析方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
企业招聘员工时,会对应聘者多个方面的信息进行数据分析,根据数据分析结果聘用合适的应聘者,并且根据数据分析结果为应聘者安排合适的工作岗位。当前主要由招聘人员主观的对应聘者的信息进行数据分析,招聘人员对应聘者的信息考量维度可能存在差异,数据分析结果较为主观,导致应聘者数据分析结果不够准确,且数据分析效率低。
发明内容
本发明实施例提供一种应聘者数据分析方法,用以提高应聘者数据分析效率,该方法包括:
获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征分别对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;
根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;
能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。
本发明实施例还提供一种应聘者数据分析装置,用以提高应聘者数据分析效率,该装置包括:
获取模块,用于获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;
第一处理模块,用于根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;
第二处理模块,用于能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述应聘者数据分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述应聘者数据分析方法的计算机程序。
本发明实施例中,获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。与现有技术中由招聘人员对应聘者的信息进行数据分析相比,预先训练的应聘者数据分析模型能根据最合理、统一的参考特征对应聘者进行数据分析,确定应聘者能否被聘用,提高了对应聘者数据分析的客观性和准确性,并且提高了应聘者数据分析的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种应聘者数据分析方法的流程图;
图2为本发明实施例中提供的一种获取应聘者的特征数据的方法流程图;
图3为本发明实施例中提供的一种训练应聘者数据分析模型的方法流程图;
图4为本发明实施例中提供的另一种训练应聘者数据分析模型的方法流程图;
图5为本发明实施例中提供的一种应聘者数据分析装置的示例图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
经研究发现,企业在招聘员工时,会对应聘者的信息(例如应聘者的笔试情况、面试情况、个人基本信息等)进行数据分析,根据数据分析结果,确定应聘者能否被聘用,以及聘用之后能够胜任什么样的工作岗位。对招聘人员的信息分析、信息归纳整理能力的要求较高,并且招聘人员在对应聘者进行数据分析时,招聘人员对应聘者的信息考量维度可能存在差异,数据分析结果较为主观,导致应聘者数据分析结果不够准确,且数据分析效率低。
针对上述研究,本发明实施例提供一种应聘者数据分析方法,如图1所示,包括:
S101:获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征分别对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;
S102:根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;
S103:能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。
本发明实施例通过获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。与现有技术中由招聘人员对应聘者的信息进行数据分析相比,预先训练的应聘者数据分析模型能根据最合理、统一的参考特征对应聘者进行数据分析,确定应聘者能否被聘用,提高了对应聘者数据分析的客观性和准确性,并且提高了应聘者数据分析的效率。
下面对上述S101~S103进行详细说明。
针对上述S101,特征数据为从应聘者信息中提取的各参考特征分别对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;第一特征数据例如包括下述至少一种:应聘者的工作年限数据、应聘者的历史职位数据、应聘者历史所属公司数据、应聘者的年龄数据、应聘者的性别数据、应聘者的婚姻情况数据、应聘者的家庭成员数据、应聘者的户籍数据、应聘者的家庭地址数据、应聘者的面试评分数据、应聘者的笔试评分数据、应聘者的历史离职原因数据。
其中,应聘者的历史职位数据例如包括职位类型、职位级别等至少一种;应聘者历史所属公司数据例如包括历史所属公司的规模、历史所属公司的行业等至少一种。
此外,应聘者信息例如包括:应聘者的简历、面试记录、笔试记录等至少一种;如图2所示为本发明实施例提供的一种获取应聘者的特征数据的方法流程图,包括:
S201:根据预先针对应聘者信息提取的各参考特征从应聘者的简历、面试记录、笔试记录中获取各参考特征对应的文本数据。
此处,应聘者的简历、面试记录、笔试记录中,对各参考特征对应的数据以文本形式记录,文本形式例如包括文字、数字、字符等,将各参考特征对应的文本数据提取出来,例如针对应聘者的工作年限数据,应聘者的简历或者面试记录中记录为“工作年限:2年”,因此提取的应聘者的工作年限数据对应的文本数据为“2年”。
S202:对文本数据进行预处理得到各参考特征对应的特征数据。
其中,预处理包括下述至少一种:缺失值处理、特征离散化处理、特征选择处理、特征交叉处理、特征归一化处理。
具体的,得到文本数据后,需要将文本数据转化为机器可以识别的数据,需要按照预设的规则统一文本数据的格式,因此需要对文本数据进行预处理;例如:
(1)对文本数据进行特征选择处理,例如对各参考特征进行相关性分析,并选择出代表参考特征,去除高相关的参考特征,以此去除高相关参考特征对应的文本数据,减少需要进行处理的文本数据的数据量。
(2)对文本数据进行特征离散化处理,将文本数据转化为机器可以识别的数据,例如按照约定的数据格式,将文本数据进行独热编码(one-hot)操作,将文本数据转化为可计算的特征向量。
(3)对文本数据进行特征归一化处理,例如将文本数据映射到预设区间上,预设区间例如为[0,1],以减少异常文本数据带来的影响。
(4)对文本数据进行缺失值处理。针对不同的应聘者,可能只能获取到部分参考特征对应的文本数据,因此需对缺失的参考特征对应的文本数据进行填充;例如将缺失的数据按照预设数据进行填充。
此处,机器例如包括:具有计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
针对上述S102,在获取到应聘者的特征数据后,将应聘者的特征数据输入预先训练的应聘者数据分析模型,利用应聘者数据分析模型对应聘者的特征数据进行数据分析,得到应聘者能被聘用、以及不能被聘用的投票结果比例。
其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;如图3所示,为本发明实施例提供的一种训练应聘者数据分析模型的方法流程图,包括:
S301:获取历史应聘者信息。
其中,历史应聘者例如包括历史应聘者中被聘用的应聘者、以及没被聘用的应聘者;历史应聘者信息例如包括历史应聘者的简历、笔试记录、面试记录、聘用结果信息。
S302:从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征。
其中,参考特征例如包括下述至少一种:应聘者的年龄、应聘者的性别、应聘者的工作年限、应聘者的历史职位、应聘者历史所属公司、应聘者的婚姻情况、应聘者的家庭成员、应聘者的户籍、应聘者的家庭地址、应聘者的面试评分、应聘者的笔试评分、应聘者的历史离职原因。
S303:根据参考特征、以及历史应聘者信息得到训练样本。
具体的,例如根据参考特征从历史应聘者信息中得到各参考特征对应的特征数据;根据各历史应聘者信息对应的聘用结果、以及各历史应聘者信息对应的特征数据得到训练样本;此处,从历史应聘者信息中得到各参考特征对应的特征数据的方法与上述获取应聘者的特征数据的方法类似,这里不再赘述。
其中,训练样本例如包括正样本、负样本;根据各历史应聘者信息对应的聘用结果、以及各历史应聘者信息对应的特征数据得到训练样本时,例如根据聘用结果为能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到正样本;根据聘用结果为不能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到负样本。
S304:根据参考特征构建多个决策树,利用训练样本训练多个决策树。
具体的,将每一参考特征作为决策树的一个节点,将各节点随机组合,构成不同的决策树;例如从历史招聘者信息中一共提取了N个参考特征,则每棵决策数据包含N个节点,一共可以构建N*(N-1)*(N-2)...*1棵决策树,其中,N为正整数。
S305:根据训练结果从多个决策树中确定出决策结果符合预期的决策树。
具体的,利用训练样本进行有监督训练,例如将正样本的特征数据输入决策树,决策树的输出结果为能被聘用,将负样本的特征数据输入决策树,决策树的输出结果为不能被聘用,则该决策树为决策结果符合预期的决策树;利用训练样本对每一棵决策树进行有监督训练,从所有决策树中选出决策结果符合预期的决策树。
S306:对决策结果符合预期的决策树进行剪枝操作,得到目标决策树。
具体的,将决策结果符合预期的决策树的某些节点进行合并,也即执行剪枝操作,得到目标决策树。
S307:根据目标决策树得到应聘者数据分析模型。
其中,应聘者数据分析模型包括多棵目标决策树。
此外,如图4所示,为本发明提供的另一种训练应聘者数据分析模型的方法流程图,包括:
S401:获取历史应聘者信息,从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征。
此处,历史应聘者信息、以及参考特征与上述历史应聘者信息、以及参考特征类似,这里不再赘述,
S402:根据参考特征、以及历史应聘者信息得到训练样本。
此处,根据参考特征、以及历史应聘者信息得到训练样本的方法与上述S303所述的方法类似,这里不再赘述。
S403:从参考特征中抽取多个特征样本集。
其中,特征样本集中包含预设数量的参考特征;例如一共有N个参考特征,从N个参考特征中有放回的抽取M个特征样本集,每个特征样本集中包含n个参考特征,n<N。
S404:根据训练样本,构建每个特征样本集对应的决策树。
具体的,例如针对每一特征样本集,根据训练样本计算该特征样本集中每一参考特征的增益比;根据每一参考特征的增益比构建该特征样本集对应的决策树。
S405:利用训练样本对每个决策树进行训练;根据训练结果,从每个特征样本集对应的决策树中确定出决策结果符合预期的决策树。
S406:根据决策结果符合预期的决策树得到应聘者数据分析模型。
承接上述S102,根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例时,例如:根据特征数据,利用应聘者数据分析模型中的每一决策树对应聘者能否被聘用进行决策,得到每一决策树的决策结果;根据决策结果为能被聘用的决策树的数量、以及决策结果为不能被聘用的决策树的数量,得到应聘者能被聘用、以及不能被聘用的投票结果比例。
针对上述S103,能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用、以及不能被聘用的投票结果比例确定应聘者的评价等级例如包括:决策结果为能被聘用的决策树的数量大于决策结果为不能被聘用的决策树的数量时,根据能被聘用的投票结果比例、以及预先设置的等级阈值作比较,根据比较结果确定应聘者的评价等级。
示例性的,根据企业的岗位需求、以及应聘者数据分析模型中包含的决策树的数量,设置不同的等级阈值,例如设置A、B、C三个评价等级,决策结果为能被聘用的决策树的数量占总决策树数量的比例大于或者等于四分之一时,则确定应聘者的评价等级为A级;决策结果为能被聘用的决策树的数量占总决策树数量的比例小于四分之一,并且大于或者等于三分之一时,则确定应聘者的评价等级为B级;决策结果为能被聘用的决策树的数量占总决策树数量的比例小于三分之一,并且大于二分之一时,则确定应聘者的评价等级为C级。
本发明实施例中还提供了一种应聘者数据分析装置,如下面的实施例所述。由于该装置解决问题的原理与应聘者数据分析方法相似,因此该装置的实施可以参见应聘者数据分析方法的实施,重复之处不再赘述。
如图5所示,为本发明实施例提供的一种应聘者数据分析装置的示例图,包括:获取模块501、第一处理模块502、以及第二处理模块503;其中,
获取模块501,用于获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;
第一处理模块502,用于根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;
第二处理模块503,用于能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。
在一种可能的实施方式中,特征数据包括下述至少一种:应聘者的工作年限数据、应聘者的历史职位数据、应聘者历史所属公司数据、应聘者的年龄数据、应聘者的性别数据、应聘者的婚姻情况数据、应聘者的家庭成员数据、应聘者的户籍数据、应聘者的家庭地址数据、应聘者的面试评分数据、应聘者的笔试评分数据、应聘者的历史离职原因数据。
在一种可能的实施方式中,应聘者信息包括:应聘者的简历、面试记录、笔试记录;获取模块,具体用于根据预先针对应聘者信息提取的各参考特征从应聘者的简历、面试记录、笔试记录中获取各参考特征对应的文本数据;对文本数据进行预处理得到各参考特征对应的特征数据;其中,预处理包括下述至少一种:缺失值处理、特征离散化处理、特征选择处理、特征交叉处理、特征归一化处理。
在一种可能的实施方式中,还包括:第三处理模块,用于获取历史应聘者信息;从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征;根据参考特征、以及历史应聘者信息得到训练样本;根据参考特征构建多个决策树,利用训练样本训练多个决策树;根据训练结果从多个决策树中确定出决策结果符合预期的决策树;对决策结果符合预期的决策树进行剪枝操作,得到目标决策树;根据目标决策树得到应聘者数据分析模型。
在一种可能的实施方式中,第三处理模块,具体用于根据参考特征从历史应聘者信息中得到各参考特征对应的特征数据;根据各历史应聘者信息对应的聘用结果、以及各历史应聘者信息对应的特征数据得到训练样本。
在一种可能的实施方式中,训练样本包括:正样本、负样本;第三处理模块,具体用于根据聘用结果为能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到正样本;根据聘用结果为不能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到负样本。
在一种可能的实施方式中,第三处理模块,还用于获取历史应聘者信息,从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征;根据参考特征、以及历史应聘者信息得到训练样本;从参考特征中抽取多个特征样本集;其中,特征样本集中包含预设数量的参考特征;根据训练样本,构建每个特征样本集对应的决策树;利用训练样本对每个决策树进行训练;根据训练结果,从每个特征样本集对应的决策树中确定出决策结果符合预期的决策树;根据决策结果符合预期的决策树得到应聘者数据分析模型。
在一种可能的实施方式中,第三处理模块,具体用于针对每一特征样本集,根据训练样本计算该特征样本集中每一参考特征的增益比;根据每一参考特征的增益比构建该特征样本集对应的决策树。
在一种可能的实施方式中,第一处理模块,具体用于根据特征数据,利用应聘者数据分析模型中的每一决策树对应聘者能否被聘用进行决策,得到每一决策树的决策结果;根据决策结果为能被聘用的决策树的数量、以及决策结果为不能被聘用的决策树的数量,得到应聘者能被聘用、以及不能被聘用的投票结果比例。
在一种可能的实施方式中,第二处理模块,具体用于决策结果为能被聘用的决策树的数量大于决策结果为不能被聘用的决策树的数量时,根据能被聘用的投票结果比例、以及预先设置的等级阈值作比较,根据比较结果确定应聘者的评价等级。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述应聘者数据分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述应聘者数据分析方法的计算机程序。
本发明实施例中,获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级,与现有技术中由招聘人员对应聘者的信息进行数据分析的技术方案相比,预先训练的应聘者数据分析模型能根据最合理、统一的参考特征对应聘者进行数据分析,确定应聘者能否被聘用,提高了对应聘者数据分析的客观性和准确性,并且提高了应聘者数据分析的效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种应聘者数据分析方法,其特征在于,包括:
获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征分别对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;
根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;
能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。
2.根据权利要求1所述的应聘者数据分析方法,其特征在于,特征数据包括下述至少一种:
应聘者的工作年限数据、应聘者的历史职位数据、应聘者历史所属公司数据、应聘者的年龄数据、应聘者的性别数据、应聘者的婚姻情况数据、应聘者的家庭成员数据、应聘者的户籍数据、应聘者的家庭地址数据、应聘者的面试评分数据、应聘者的笔试评分数据、应聘者的历史离职原因数据。
3.根据权利要求1所述的应聘者数据分析方法,其特征在于,应聘者信息包括:应聘者的简历、面试记录、笔试记录;
获取应聘者的特征数据,包括:
根据预先针对应聘者信息提取的各参考特征从应聘者的简历、面试记录、笔试记录中获取各参考特征对应的文本数据;
对文本数据进行预处理得到各参考特征对应的特征数据;
其中,预处理包括下述至少一种:缺失值处理、特征离散化处理、特征选择处理、特征交叉处理、特征归一化处理。
4.根据权利要求1所述的应聘者数据分析方法,其特征在于,还包括:
获取历史应聘者信息;
从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征;
根据参考特征、以及历史应聘者信息得到训练样本;
根据参考特征构建多个决策树,利用训练样本训练多个决策树;
根据训练结果从多个决策树中确定出决策结果符合预期的决策树;
对决策结果符合预期的决策树进行剪枝操作,得到目标决策树;
根据目标决策树得到应聘者数据分析模型。
5.根据权利要求4所述的应聘者数据分析方法,其特征在于,根据参考特征、以及历史应聘者信息得到训练样本,包括:
根据参考特征从历史应聘者信息中得到各参考特征对应的特征数据;
根据各历史应聘者信息对应的聘用结果、以及各历史应聘者信息对应的特征数据得到训练样本。
6.根据权利要求5所述的应聘者数据分析方法,其特征在于,训练样本包括:正样本、负样本;
根据各历史应聘者信息对应的聘用结果、以及各历史应聘者信息对应的特征数据得到训练样本,包括:
根据聘用结果为能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到正样本;
根据聘用结果为不能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到负样本。
7.根据权利要求1所述的应聘者数据分析方法,其特征在于,还包括:
获取历史应聘者信息,从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征;
根据参考特征、以及历史应聘者信息得到训练样本;
从参考特征中抽取多个特征样本集;其中,特征样本集中包含预设数量的参考特征;
根据训练样本,构建每个特征样本集对应的决策树;
利用训练样本对每个决策树进行训练;
根据训练结果,从每个特征样本集对应的决策树中确定出决策结果符合预期的决策树;
根据决策结果符合预期的决策树得到应聘者数据分析模型。
8.根据权利要求7所述的应聘者数据分析方法,其特征在于,根据训练样本,构建每个特征样本集对应的决策树,包括:
针对每一特征样本集,根据训练样本计算该特征样本集中每一参考特征的增益比;
根据每一参考特征的增益比构建该特征样本集对应的决策树。
9.根据权利要求4-8任一项所述的应聘者数据分析方法,其特征在于,根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例,包括:
根据特征数据,利用应聘者数据分析模型中的每一决策树对应聘者能否被聘用进行决策,得到每一决策树的决策结果;
根据决策结果为能被聘用的决策树的数量、以及决策结果为不能被聘用的决策树的数量,得到应聘者能被聘用、以及不能被聘用的投票结果比例。
10.根据权利要求9所述的应聘者数据分析方法,其特征在于,能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用、以及不能被聘用的投票结果比例确定应聘者的评价等级,包括:
决策结果为能被聘用的决策树的数量大于决策结果为不能被聘用的决策树的数量时,根据能被聘用的投票结果比例、以及预先设置的等级阈值作比较,根据比较结果确定应聘者的评价等级。
11.一种应聘者数据分析装置,其特征在于,包括:
获取模块,用于获取应聘者的特征数据;其中,特征数据为从应聘者信息中提取的各参考特征对应的数据;参考特征为确定应聘者能否被聘用时的衡量因素;
第一处理模块,用于根据特征数据、以及预先训练的应聘者数据分析模型得到应聘者能被聘用、以及不能被聘用的投票结果比例;其中,应聘者数据分析模型为根据各参考特征通过机器学习得到的评价应聘者能否被聘用的模型;
第二处理模块,用于能被聘用的投票结果比例大于不能被聘用的投票结果比例时,根据能被聘用的投票结果比例确定应聘者的评价等级。
12.根据权利要求11所述的应聘者数据分析装置,其特征在于,特征数据包括下述至少一种:
应聘者的工作年限数据、应聘者的历史职位数据、应聘者历史所属公司数据、应聘者的年龄数据、应聘者的性别数据、应聘者的婚姻情况数据、应聘者的家庭成员数据、应聘者的户籍数据、应聘者的家庭地址数据、应聘者的面试评分数据、应聘者的笔试评分数据、应聘者的历史离职原因数据。
13.根据权利要求11所述的应聘者数据分析装置,其特征在于,应聘者信息包括:应聘者的简历、面试记录、笔试记录;
获取模块,具体用于根据预先针对应聘者信息提取的各参考特征从应聘者的简历、面试记录、笔试记录中获取各参考特征对应的文本数据;
对文本数据进行预处理得到各参考特征对应的特征数据;
其中,预处理包括下述至少一种:缺失值处理、特征离散化处理、特征选择处理、特征交叉处理、特征归一化处理。
14.根据权利要求11所述的应聘者数据分析装置,其特征在于,还包括:
第三处理模块,用于获取历史应聘者信息;
从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征;
根据参考特征、以及历史应聘者信息得到训练样本;
根据参考特征构建多个决策树,利用训练样本训练多个决策树;
根据训练结果从多个决策树中确定出决策结果符合预期的决策树;
对决策结果符合预期的决策树进行剪枝操作,得到目标决策树;
根据目标决策树得到应聘者数据分析模型。
15.根据权利要求14所述的应聘者数据分析装置,其特征在于,第三处理模块,具体用于根据参考特征从历史应聘者信息中得到各参考特征对应的特征数据;
根据各历史应聘者信息对应的聘用结果、以及各历史应聘者信息对应的特征数据得到训练样本。
16.根据权利要求15所述的应聘者数据分析装置,其特征在于,训练样本包括:正样本、负样本;
第三处理模块,具体用于根据聘用结果为能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到正样本;
根据聘用结果为不能被聘用的历史应聘者信息对应的特征数据、以及聘用结果得到负样本。
17.根据权利要求11所述的应聘者数据分析装置,其特征在于,第三处理模块,还用于获取历史应聘者信息,从历史应聘者信息中提取出多个评价应聘者能否被聘用的参考特征;
根据参考特征、以及历史应聘者信息得到训练样本;
从参考特征中抽取多个特征样本集;其中,特征样本集中包含预设数量的参考特征;
根据训练样本,构建每个特征样本集对应的决策树;
利用训练样本对每个决策树进行训练;
根据训练结果,从每个特征样本集对应的决策树中确定出决策结果符合预期的决策树;
根据决策结果符合预期的决策树得到应聘者数据分析模型。
18.根据权利要求17所述的应聘者数据分析装置,其特征在于,第三处理模块,具体用于针对每一特征样本集,根据训练样本计算该特征样本集中每一参考特征的增益比;
根据每一参考特征的增益比构建该特征样本集对应的决策树。
19.根据权利要求14-18任一项所述的应聘者数据分析装置,其特征在于,第一处理模块,具体用于根据特征数据,利用应聘者数据分析模型中的每一决策树对应聘者能否被聘用进行决策,得到每一决策树的决策结果;
根据决策结果为能被聘用的决策树的数量、以及决策结果为不能被聘用的决策树的数量,得到应聘者能被聘用、以及不能被聘用的投票结果比例。
20.根据权利要求19所述的应聘者数据分析装置,其特征在于,第二处理模块,具体用于
决策结果为能被聘用的决策树的数量大于决策结果为不能被聘用的决策树的数量时,根据能被聘用的投票结果比例、以及预先设置的等级阈值作比较,根据比较结果确定应聘者的评价等级。
21.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10任一所述应聘者数据分析方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至10任一所述应聘者数据分析方法的计算机程序。
CN202110780584.9A 2021-07-09 2021-07-09 应聘者数据分析方法及装置 Active CN113435857B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110780584.9A CN113435857B (zh) 2021-07-09 2021-07-09 应聘者数据分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110780584.9A CN113435857B (zh) 2021-07-09 2021-07-09 应聘者数据分析方法及装置

Publications (2)

Publication Number Publication Date
CN113435857A true CN113435857A (zh) 2021-09-24
CN113435857B CN113435857B (zh) 2024-07-23

Family

ID=77759891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110780584.9A Active CN113435857B (zh) 2021-07-09 2021-07-09 应聘者数据分析方法及装置

Country Status (1)

Country Link
CN (1) CN113435857B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139065A (zh) * 2022-02-07 2022-03-04 北京融信数联科技有限公司 基于大数据的人才筛选推荐方法、系统及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291715A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 简历评估方法和装置
CN110472647A (zh) * 2018-05-10 2019-11-19 百度在线网络技术(北京)有限公司 基于人工智能的辅助面试方法、装置及存储介质
WO2020119563A1 (zh) * 2018-12-14 2020-06-18 深圳壹账通智能科技有限公司 一种基于神经网络模型的应聘者评估方法及装置
CN111832039A (zh) * 2020-05-27 2020-10-27 福建亿能达信息技术股份有限公司 一种基于机器学习的职能科室招聘系统、设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291715A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 简历评估方法和装置
CN110472647A (zh) * 2018-05-10 2019-11-19 百度在线网络技术(北京)有限公司 基于人工智能的辅助面试方法、装置及存储介质
WO2020119563A1 (zh) * 2018-12-14 2020-06-18 深圳壹账通智能科技有限公司 一种基于神经网络模型的应聘者评估方法及装置
CN111832039A (zh) * 2020-05-27 2020-10-27 福建亿能达信息技术股份有限公司 一种基于机器学习的职能科室招聘系统、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139065A (zh) * 2022-02-07 2022-03-04 北京融信数联科技有限公司 基于大数据的人才筛选推荐方法、系统及可读存储介质
CN114139065B (zh) * 2022-02-07 2022-05-24 北京融信数联科技有限公司 基于大数据的人才筛选推荐方法、系统及可读存储介质

Also Published As

Publication number Publication date
CN113435857B (zh) 2024-07-23

Similar Documents

Publication Publication Date Title
US20240185130A1 (en) Normalizing text attributes for machine learning models
CN111738589B (zh) 基于内容推荐的大数据项目工作量评估方法、装置及设备
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN112036476A (zh) 基于二分类业务的数据特征选择方法、装置及计算机设备
CN111652667A (zh) 一种企业主要相关自然人实体数据对齐方法
CN115641101A (zh) 一种智能化招聘的方法、装置及计算机可读介质
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN113435857B (zh) 应聘者数据分析方法及装置
CN111882113B (zh) 一种企业手机银行用户的预测方法和装置
CN113505117A (zh) 基于数据指标的数据质量评估方法、装置、设备及介质
CN116304033B (zh) 一种基于半监督、双层多分类的诉请识别方法
CN112560480A (zh) 任务社区发现方法、装置、设备和存储介质
CN111104422A (zh) 一种数据推荐模型的训练方法、装置、设备及存储介质
CN113742495B (zh) 基于预测模型的评级特征权重确定方法及装置、电子设备
CN115510847A (zh) 代码工作量的分析方法及装置
CN115204501A (zh) 企业评估方法、装置、计算机设备和存储介质
CN114610576A (zh) 一种日志生成监控方法和装置
CN1403984A (zh) 用于帮助赢利组织评估和改善来自客户的利润的方法和系统
CN114926012B (zh) 一种研发项目智慧验收评审方法、系统及可读存储介质
CN113627806A (zh) 应聘信息评估方法及装置
EP4109353A2 (en) Method and apparatus of generating pre-training model, electronic device, and storage medium
CN118071104A (zh) 基于智能ai实现企业协同办公的方法及系统
CN117078300A (zh) 客户分群方法、装置、设备及存储介质
Wibowo et al. Identifying Determinant Factors to Internet Access Using Decision Tree.
CN118037339A (zh) 目标区域产业发展趋势预测方法、系统、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant