CN113902009A - 一种简历分析方法、装置、电子设备、介质及产品 - Google Patents

一种简历分析方法、装置、电子设备、介质及产品 Download PDF

Info

Publication number
CN113902009A
CN113902009A CN202111166196.8A CN202111166196A CN113902009A CN 113902009 A CN113902009 A CN 113902009A CN 202111166196 A CN202111166196 A CN 202111166196A CN 113902009 A CN113902009 A CN 113902009A
Authority
CN
China
Prior art keywords
resume
information
evaluation
model
recruitment information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111166196.8A
Other languages
English (en)
Inventor
张玉芳
邵世臣
李永恒
徐飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111166196.8A priority Critical patent/CN113902009A/zh
Publication of CN113902009A publication Critical patent/CN113902009A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种简历分析方法、装置、电子设备、介质及产品,涉及数据处理技术领域,尤其涉及大数据分析技术领域。具体实现方案为:获取待评测简历,根据待评测简历中的职位信息和求职能力信息,确定待评测简历所属的目标评测分区。然后将待评测简历输入目标评测分区对应的目标评测模型,得到目标评测模型输出的评测结果。其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,第一简历样本集包括多个简历样本和每个简历样本的标注信息。由此可以对不同评测分区的简历提供差异化的评测结果。

Description

一种简历分析方法、装置、电子设备、介质及产品
技术领域
本公开涉及数据处理技术领域,尤其涉及大数据分析技术领域。
背景技术
简历是求职者向招聘单位发送的一份简要的个人介绍,例如简历中包括求职者的基本信息、学习经历、工作经历和期望薪资等。一份优秀的简历不但能让人快速了解求职者的能力和要求,还能够给面试官留下好的印象,对于获得面试机会至关重要。
不同的求职者对于简历的撰写水平不同,尤其对于缺乏简历撰写经验的求职者来说,撰写的简历更难以在简历筛选阶段脱颖而出。因此对于简历的自动分析有助于提高求职者的应聘成功率。
发明内容
本公开提供了一种简历分析方法、装置、电子设备、介质及产品。
根据本公开的第一方面,提供了一种简历分析方法,包括:
获取待评测简历;
根据所述待评测简历中的职位信息和求职能力信息,确定所述待评测简历所属的目标评测分区;
将所述待评测简历输入所述目标评测分区对应的目标评测模型,得到所述目标评测模型输出的评测结果;
其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,所述第一简历样本集包括多个简历样本和每个简历样本的标注信息。
根据本公开的第二方面,提供了一种简历分析装置,包括:
获取模块,用于获取待评测简历;
确定模块,用于根据所述获取模块获取的所述待评测简历中的职位信息和求职能力信息,确定所述待评测简历所属的目标评测分区;
评测模块,用于将所述待评测简历输入所述确定模块确定的所述目标评测分区对应的目标评测模型,得到所述目标评测模型输出的评测结果;
其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,所述第一简历样本集包括多个简历样本和每个简历样本的标注信息。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的方法。
根据本公开的第四方面,提供了存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面所述方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面所述的方法。
本公开实施例提供的简历分析方法、装置、电子设备、介质及产品,利用待评测简历所属的目标评测分区的目标分析模型,对待评测简历进行分析得到分析结果。由于本公开实施例利用求职领域、求职岗位、学历和工作经验对简历进行精细化分区,并利用每个评测分区的分析模型分析该评测分区的简历,使得对于简历的分析更具有针对性。而且由于本公开实施例划分了评测分区,因此可以对不同评测分区的简历提供差异化的评测结果。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种简历评测方法的流程图;
图2是根据本公开实施例提供的一种获得待评测简历的方法的流程图;
图3是根据本公开实施例提供的一种训练评测模型的方法流程图;
图4是根据本公开实施例提供的一种岗位匹配方法的流程图;
图5是根据本公开实施例提供的一种训练匹配模型的方法流程图;
图6是根据本公开实施例提供的一种训练关键词标注模型的方法流程图;
图7是根据本公开实施例提供的一种简历处理流程的示例性示意图;
图8是根据本公开实施例提供的一种简历内容评测过程的示例性示意图;
图9是根据本公开实施例提供的一种岗位匹配过程的示例性示意图;
图10a是根据本公开实施例提供的一种简历评测装置的结构示意图;
图10b是根据本公开实施例提供的另一种简历评测装置的结构示意图;
图11是用来实现本公开实施例的简历评测方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
面对企业繁多且精细的招聘需求,如何在简历筛选阶段即让简历脱颖而出,并提升应聘的成功率,是每位求职者的困扰。目前大多数智能简历系统都是面向企业招聘者,很少有面向求职者的智能简历系统。而且目前面向求职者的智能简历系统只能对简历进行简单的评测,而不能针对不同的简历提供差异化的评测结果。
本公开实施例面向求职者,提供了一种简历分析方法,该方法应用于电子设备,例如电子设备可以是终端或者服务器,终端可以是手机、计算机、平板电脑等具备数据处理能力的设备。如图1所示,该方法包括如下步骤:
S101、获取待评测简历。
S102、根据待评测简历中的职位信息和求职能力信息,确定待评测简历所属的目标评测分区。
其中,职位信息包括求职领域和/或求职岗位。例如,求职领域可以是:互联网、房地产、金融、教育培训、医疗、交通运输或者传媒等。求职岗位可以是:软件工程师、研发经理或者运维工程师等。
求职能力信息表示求职者在待评测简历中填写的自身的工作能力和/或学习能力等。求职能力信息包括学历和/或工作经验。例如,学历可以是:大专、本科、硕士或者博士等。工作经验可以是:一年、两年或者三年等。
本公开实施例根据求职领域、求职岗位、学历和/或工作经验,确定待评测简历的评测分区,可以看出本公开实施例对于评测分区的划分粒度细,使得对于待评测简历的分析结果更有针对性。
S103、将待评测简历输入目标评测分区对应的目标评测模型,得到目标评测模型输出的评测结果。
其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,第一简历样本集包括多个简历样本和每个简历样本的标注信息。
本公开实施例提供的简历分析方法,利用待评测简历所属的目标评测分区对应的目标评测模型,对待评测简历进行评测得到评测结果。由于本公开实施例利用职位信息和求职能力信息对简历进行精细化分区,并利用每个评测分区的评测模型分析该评测分区的简历,使得对于简历的分析更具有针对性。而且由于本公开实施例划分了评测分区,因此可以对不同评测分区的简历提供差异化的评测结果。
本公开实施例的技术方案包括四个部分,分别为:简历制作与解析、简历内容评测、简历内容优化、岗位匹配与投递,可以实现对简历从制作到投递的一站式服务。
以下对简历制作与解析部分进行具体说明:
本公开实施例可以提供针对各领域和各岗位的简历模板供求职者在线使用,求职者在简历模板中填写的简历可作为上述S101中的待评测简历。
另外,本公开实施例还可以支持求职者上传已制作完成的各类文档格式的简历。例如,简历的文档格式包括:文档(Document,DOC)、图片、演示文稿(PowerPoint,PPT)、便携式文档格式(Portable Document Format,PDF)、超文本标记语言(Hyper Text MarkupLanguage,HTML)、DOCX、富文本格式(Rich Text Format,RTF)和OpenOffice等。其中,DOCX为微软Word的一种文档格式。OpenOffice是一种跨平台的办公室软件套件的文档格式。电子设备获取到求职者上传的简历后,可以对该简历进行解析,并重组成简历模板的格式,然后将重组后的简历作为上述S101中的待评测简历。
其中,本公开实施例可以预先收集多种领域中多种岗位的优质简历,利用机器学习和/或人工筛选的方式,生成通用的预设简历模板,预设简历模板中包括多个必备的模块,每个模块的标题可以是基本信息、求职意向、教育背景、工作经历或项目经历等。每个模块存在对应的关键字,例如,求职意向模块对应的关键字包括意向岗位和薪资要求等。
参见图2,上述S101获取待评测简历的方式可以实现为以下步骤:
S201、获取用户上传的简历文档。
用户上传的简历文档包括多个内容模块,每个内容模块填写有不同维度的用户信息。例如,简历文档中的内容模块包括:个人照片、基础信息、教育背景、工作经历和求职意向等。
S202、确定简历文档的文档类型。
电子设备可以使用内容分析工具(Apache Tika)对文档依次进行容器格式检测、魔术字检测和文件后缀名检测,从而判断出文档类型,文档类型指的是文档格式。其中,魔术字检测指的是检测文档最开始的几个字节是不是魔术字。
S203、将简历文档输入文档类型对应的解析器,得到解析器输出的简历文档包括的各项内容数据和结构数据。
电子设备可以先对文档进行数据清理,去除文档中没有实际意义的常见词。例如,可以去除文档中的停止词、空格和特殊字符等。停止词包括:冠词、介词、副词和连词等。特殊字符包括:~、@、#、¥、%等。
示例性的,对于“在大学里我参加了很多的社团”去除停止词后,得到“大学我参加很多社团”。
在完成数据清理后,使用Apache Tika,调用该文档类型的解析器解析该简历文档。得到该简历文档的内容数据和结构数据。其中,内容数据包括文本内容和图片信息,结构数据用于表示各项内容数据分别所属的内容模。简历文档传入解析器时以字节流的形式传入,同时解析器的输出结果的格式为XHTML SAX event格式。其中,XHTML SAX event为可扩展超文本标记语言(eXtensible HyperText Markup Language,XHTML)的流机制解析器(Simple API for XML,SAX)解析的事件(event)格式。
S204、根据结构数据将各项内容数据分别填充在预设简历模板的相应内容模块,得到待评测简历。
先将各项内容数据与预设简历模板的每个模块的标题和关键字段进行泛化匹配。
其中,泛化匹配的方式可以是近义词匹配,指的是在匹配两个词语时,先分别确定这两个词语各自的近义词,将每个词语与其近义词组成一个匹配集合。在一个匹配集合中任一词与另一个匹配集合中的词匹配成功时,即可确定这两个词语匹配。
在泛化匹配后,可以得到每项内容数据在预设简历模板中匹配的模块。利用结构信息,将每项内容数据填充至与其匹配的内容模块。
本公开实施例不仅支持用户在线编辑简历,还可以对用户上传的简历文档进行解析并重组为可进行评测的简历,从而降低了对待评测简历的获取要求,方便用户使用简历的评测分析功能。而且,本公开实施例中支持解析多种格式的简历文档,降低了对简历文档格式的限制。
以下对简历内容评测部分进行具体说明:
简历内容评测部分所评测的简历,可以是通过上述简历制作与解析部分得到的简历。简历内容评测部分包括两个阶段,分别为模型训练阶段和对简历的评测阶段。
在模型训练阶段,首先收集多个简历样本,并对各简历样本按照领域、岗位、学历和工作经验四种交叉维度进行精细化分区,得到多个评测分区,每个评测分区的各简历样本组成一个第一简历样本集,以此建立简历文档库。
例如,各简历样本共涉及了8个领域,每个领域中共包含10个岗位,共有3种学历和4种工作经验,分区后可得到8×10×3×4=960个评测分区。其中,不同的领域包含的岗位不同。如教育领域包括教师和辅导员,医疗领域包括医生和护士。
然后针对每个评测分区,将该评测分区中的所有简历样本作为训练样本,或者为了提高训练速度,可以将该评测分区中的部分简历样本作为训练样本。例如从每个评测分区中随机选择1000篇简历作为训练样本。并对每个训练样本设置标注信息。每个训练样本对应的标注信息包括如下三个方面的数据:
1、整体评分。例如,整体评分的分数范围为1-10,分数越高简历越优质。
2、整体评价信息,包括每个预设维度的评分和优化建议。例如,预设维度包括内容完整度、内容表现力、技能情况、经验情况、教育背景和竞争力这6个维度。
示例性的,内容完整度的优化建议可以包括:简历包含的所有必要内容模块(例如,个人照片、基础信息、教育背景、工作经历和求职意向等)是否均填有信息、简历中必要但未填写的内容模块、简历中非必要的内容模块的占比情况和/或非必要的内容模块展示的必要性等。其中,内容模块指的是简历中包括的各板块。简历中非必要的内容模块的占比情况包括:非必要的内容模块数量占简历中总内容模块数量的比重,和/或非必要的内容模块中数据量占简历总数据量的比重等。
内容表现力的优化建议可以包括:简历中哪些内容模块包括的内容精炼度、感染力和/或专业度需要提高等。
技能情况的优化建议可以包括:简历中缺少所属评测分区所需要的哪些必备技能和/或还可以增加哪些额外技能等。其中额外技能可以有助于简历投递成功。
经验情况的优化建议可以包括:增加对工作经历的描述和/或减少工作经历的数量等。其中工作经历包括工作过的公司的公司规模(大型企业或者小型企业等)、公司性质和/或在该公司的工作年限等。
教育背景的优化建议可以包括:增加对毕业学校的介绍(例如学校的排名)、增加培训经历等。
竞争力的优化建议可以包括:结合简历的内容完整度、内容表现力、技能情况、经验情况和教育背景,以及简历所属评测分区的其他简历,所得出的该简历在所属评测分区中的竞争力情况。
3、各内容模块信息,包括:预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议。
例如,预设内容模块包括:基础信息、教育背景、工作经历、技能专长和意向岗位等。
预设内容模块中关键词为内容模块中影响简历优质情况的信息。每个关键词的特征类型可以是:必备、亮点、劣势或者无需。例如,求职意向内容模块中的期望薪资为关键词,期望薪资的标注为必备。技能专长内容模块中的英语六级为关键词,英语六级的标注为亮点。教育背景内容模块中的小学毕业学校为关键词,小学毕业学校的标注为无需。工作经历内容模块中工作数量为关键词,工作数量的标注为劣势(跳槽频率过高影响简历投递成功率)。
每个预设内容模块的优化建议可以包括:修改错别字、减少无需内容和/或删除劣势内容等。
其中,模块字段情况包括:是否缺少必备的内容信息。
模块内容情况包括:是否缺少必备的关键词、是否具有作为亮点的关键词、可新增的用于提升简历竞争力的亮点关键词、是否存在劣势的关键词和/或是否存在无需展示的关键词。
模型训练阶段用于训练得到评测阶段所涉及的每个评测分区对应的评测模型,本公开实施例可以预先训练得到各评测分区对应的评测模型,其中如图3所示,每个评测分区对应的评测模型通过以下步骤训练得到:
S301、获得该评测分区的多个简历样本。
其中,简历样本的标注信息包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议。
S302、分别将每个简历样本输入神经网络模型,得到神经网络模型的对每个简历样本的评测结果。
其中,评测结果包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议。
电子设备可以将该评测分区的第一简历样本集中各简历样本分别输入神经网络模型,得到神经网络模型的对每个简历样本的评测结果。
可选的,神经网络模型中可以包括基于上下文无关语法(Context-Free Grammer)构建的语法分析器,语法分析器可以对简历的内容进行语法识别。语法识别可包括:错别字识别、语法错误识别和上下文逻辑关系识别等。电子设备可以直接将语法识别结果标注在简历中。同时语法识别结果也可用于确定神经网络模型的输出结果。例如神经网络模型的输出结果中的整体评分可参考语法识别结果确定。
S303、根据输出结果和输入神经网络模型的简历样本的标注信息,确定神经网络模型是否收敛。若神经网络模型未收敛,则执行S304;若神经网络模型收敛,则执行S305。
电子设备可以可以基于输出结果和输入神经网络模型的简历样本的标注信息,计算损失函数(例如交叉熵损失函数),并基于损失函数确定神经网络模型是否收敛。
S304、调整神经网络模型的模型参数,并返回S302。
电子设备可以在当前的神经网络模型未收敛时,可以基于损失函数调整当前的神经网络模型的模型参数,并基于调整参数后的神经网络模型返回上述S302。
S305、将当前的神经网络模型作为该评测分区对应的评测模型。
电子设备可以在当前的神经网络模型收敛时,可以保留当前的模型参数,即将当前的神经网络模型作为该评测分区对应的评测模型。
可选的,获得该评测分区对应的评测模型之后,还可以获取已有投递结果的简历,基于该简历的投递结果对该简历进行二次标注,即更新该简历的标注信息,并基于更新后的简历和标注信息继续通过图3所示的方法训练该评测分区对应的评测模型。
本公开实施例在训练评测模型时,基于简历样本的整体评分、每个预设维度的评分和优化建议、预设内容模块中关键词和每个关键词的特征类型、以及每个预设内容模块的优化建议的精细化标注进行训练,使得评测模型对简历输出的优化建议更细致,且更有针对性,能够精细化至岗位必须的能力。
其中,对简历的评测阶段可通过上述S102和S103实现。
对于上述S102,确定待评测简历所属的目标评测分区的方式与上述S301中确定简历样本所属评测分区的方式相同,可参考上述描述,此处不再赘述。
对于上述S103,将待评测简历输入经过图3的方式训练后得到的目标评测模型。相应的,目标评测模型对于待评测简历的评测结果包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议。
此外,目标评测模型还可以对比待评测简历的整体评分以及目标评测分区中其他简历的整体评分,从而输出待评测简历在目标评测分区中的整体评分排名。例如,输出待评测简历在所属评测分区中打败了xx%的简历,其中,xx%表示目标评测分区中评分低于待评测简历的简历数量与目标评测分区中总简历数量的比值。
而且,目标评测模型中由于设置有语法分析器,因此目标评测模型还可以输出待评测简历的语法分析结果,包括错别字识别结果、语法错误识别结果和上下文逻辑关系识别结果等。电子设备可以基于语法分析结果,在待评测简历中对语法错误处进行标注。
本公开实施例能够在评测阶段对待评测简历进行有针对性的评测,并给出精细化的优化建议,方便用户基于此进行简历优化。
以下对简历内容优化部分进行具体说明:
在上述S103之后,求职者可以基于目标评测模型输出的评测结果,对待评测简历进行优化。例如,增加必备的内容信息、增加亮点的内容信息、减少无需的内容信息和/或删除劣势的内容信息。优化后可再次通过上述简历的评测阶段的评测方式进行再次评测,并基于评测结果进行进一步优化,直至获得评分较高的简历。
以下对于岗位匹配与投递部分进行具体说明:
岗位匹配与投递部分由岗位匹配部分和岗位投递部分组成,其中岗位匹配部分包括预训练阶段和匹配阶段。
以下对岗位匹配部分的匹配阶段进行具体说明:
如图4所示,电子设备对待评测简历进行岗位匹配的方式包括如下步骤:
S401、提取待投递简历对应基础信息的和企业信息。
待投递简历为上述简历内容优化部分中基于待评测简历的评测结果对待评测简历优化后的简历,或者待投递简历为用户输入的简历,基础信息包括职位信息、意向薪资和求职能力信息。职位信息包括:领域、工作地点、岗位和/或薪资范围等。求职能力信息包括学历和/或工作经验等。
企业信息可以是求职者选择和/或填写的针对求职企业的要求。例如,企业信息包括:公司性质、公司规模、融资阶段和/或公司名称等。
S402、基于待投递简历对应的基础信息和企业信息,确定待投递简历所匹配的目标岗位分区。其中每个岗位分区中包括多条招聘信息。
本公开实施例在预训练阶段预先收集了多条招聘信息,并获取每条招聘信息中的基础信息和企业信息,基础信息包括职位信息、意向薪资和求职能力信息。其中,招聘信息中的职位信息用于表示招聘的工作所属的领域情况,招聘信息中的意向薪资用于表示招聘单位计划给出的薪资情况。招聘信息中的求职能力信息用于表示对求职者的能力要求情况。并获取每个招聘信息对应的企业信息,企业信息表示发布招聘信息的企业情况。
例如,职位信息包括:领域、工作地点、岗位和/或薪资范围等。求职能力信息包括学历和/或工作经验等。企业信息包括:公司性质、公司规模、融资阶段和/或公司名称等。
然后基于基础信息和企业信息,对各招聘信息进行分区,得到多个岗位分区。
基于此,S402中可以对待投递简历的基础信息与岗位分区的基础信息进行泛化匹配,并将待投递简历的企业信息与岗位分区的企业信息进行泛化匹配,得到与待投递简历匹配的目标岗位分区,其中与待投递简历匹配的目标岗位分区的数量可以是一个也可以是多个。然后将目标岗位分区包括的各条招聘信息作为待投递简历的基础匹配岗位集合。一种实施方式中,可以将基础匹配岗位集合中的各条招聘信息推荐给求职者。或者通过S403和S404的方式,对基础匹配岗位集合中包括的各条招聘信息进行进一步筛选。
S403、通过训练完成的匹配模型,计算待投递简历包括的关键词与目标岗位分区内每条招聘信息包括的关键词之间的特征匹配分值。
待投递简历包括关键词和每个关键词对应的特征类型。例如,关键词的特征类型包括:必备、亮点和劣势。待投递简历包括的关键词和每个关键词对应的特征类型可以由评测阶段中目标评测模型的输出结果得到。
相应的,每条招聘信息包括关键词和每个关键词对应的特征类型。招聘信息的必备关键词表示招聘企业对于求职者的必要要求,例如招聘信息中的学历要求为本科,那么本科为必备关键词。招聘信息中的亮点关键词表示招聘企业优先考虑的条件,例如招聘信息中的有工作经验优先,那么工作经验为亮点关键词。招聘信息的劣势关键词表示被招聘企业淘汰的条件,例如招聘信息中的学历要求为本科,那么低于本科的大专为劣势关键词。
可选的,可通过以下公式(1)计算待评测简历与目标岗位分区内每条招聘信息的特征匹配分值:
θ=λ1x12x23x3 (1)
其中,θ表示待投递简历与招聘信息之间的特征匹配分值,λ1表示招聘信息中对于特征类型为必备的关键词的权重,λ2表示招聘信息中对于特征类型为亮点的关键词的权重,λ3表示招聘信息中对于特征类型为劣势的关键词的权重;
x1表示待投递简历的必备关键词与招聘信息包括的必备关键词中,相匹配的关键词数量/招聘信息包括的必备关键词总数量;x2表示待投递简历的亮点关键词与招聘信息包括的亮点关键词中,相匹配的关键词数量/招聘信息包括的亮点关键词总数量;x3表示待投递简历的劣势关键词与招聘信息包括的劣势关键词中,相匹配的关键词数量/招聘信息包括的劣势关键词总数量。
其中,进行关键词匹配时可采用泛化匹配的方式。
例如,待投递简历的关键词包括本科(必备)、教师资格证(亮点)和频繁跳槽(劣势)。招聘信息1的必备关键词包括本科和5年工作经验,且必备关键词的权重为1;招聘信息1的亮点关键词包括英语六级,且亮点关键词的权重为0.5;招聘信息1的劣势关键词包括无工作经验和每份工作的工作时间短,且劣势关键词的权重为-0.2。由于频繁跳槽能够与每份工作的工作时间短泛化匹配成功,因此计算的特征匹配分值为:1×1/2+0.5×0/2-0.2×1/2=0.4。
本公开实施例可以根据必备、亮点和劣势三个维度对待投递简历和招聘信息进行匹配,同时每个维度对特征匹配分值的重要性不同,因此本公开实施例为每个维度可设置不同的权重,从而使得确定的特征匹配分值更准确。
S404、根据待投递简历与目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与待投递简历匹配的招聘信息。
在上述S404中,可通过以下三种方式中的任意一种向求职者推送与待投递简历匹配的招聘信息:
方式一、将与待投递简历之间的特征匹配分值大于预设阈值的招聘信息按照特征匹配分值从高到低的顺序推送给求职者。
其中,预设阈值可以根据实际情况设置。例如,招聘信息与待投递简历之间的特征匹配分值的取值范围为0~1时,预设阈值可以为85%。
方式二、按照与待投递简历之间的特征匹配分值从高到低的顺序,选择预设数量的招聘信息推送给求职者。
其中,预设数量可根据实际情况设置,例如可以根据求职者使用的客户端可同时显示的招聘信息数量确定。方式二可将与待投递简历之间的特征匹配分值最高的前预设数量条招聘信息推送给求职者。
方式三、按照与待投递简历之间的特征匹配分值从高到低的顺序,向求职者推送目标岗位分区内每条招聘信息。
求职者所使用客户端在显示招聘信息时,可按照招聘信息的推送顺序,依次自上而下显示各条招聘信息,即,将与待投递简历之间的特征匹配分值高的招聘信息,显示在于待投递简历之间的特征匹配分值低的招聘信息上方,求职者可通过自上向下查阅可浏览到特征匹配分值越来越低的招聘信息,以将与待投递简历之间的特征匹配分值高的招聘信息优先显示,提高求职者的投递成功率。
上述三种向求职者推送招聘信息的方式中,在向求职者推送招聘信息时,如果执行上述方法的电子设备是服务器,那么可以由服务器向求职者所使用的客户端发送招聘信息。如果执行上述方法的电子设备是客户端,则由客户端在显示屏中显示各条招聘信息。
本公开实施例可以通过多种不同的方式向求职者推送招聘信息,从而提高了推送的灵活性和多样性。
本公开实施例可以基于待投递简历的基础信息和企业信息,筛选待投递简历匹配的目标岗位分区,并从目标岗位分区的招聘信息中,基于与待投递简历的特征匹配分值对招聘信息进行进一步筛选,从而得到与待投递简历更匹配的招聘信息,提高投递成功率。
在本公开的一个实施例中,在上述S404根据待投递简历与目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与待投递简历匹配的招聘信息之后,电子设备还可以接收求职者对待投递简历匹配的招聘信息的筛选操作,然后将待投递简历一键投递至求职者筛选出的与待投递简历匹配的招聘信息。
一种实现方式中,求职者可以对客户端中显示的各招聘信息进行勾选或删除,将用户勾选出的或者未删除的招聘信息作为用户筛选出的招聘信息。
可选的,用户对招聘信息进行删除时,可同时选择删除理由,该删除理可用于对S403中的匹配模型进行更新。另外,在简历投递完成后,电子设备可收集面试官对简历操作的投递结果。例如,投递结果包括:是否通过初筛、是否进入面试和/或未进入面试的原因等。并基于投递结果进一步动态调整匹配模型。
本公开实施例可以提供求职者对招聘信息进行二次筛选的功能,避免将简历投递至与求职者的简历匹配,但求职者不感兴趣的招聘信息。
以下对岗位匹配部分的预训练阶段进行具体说明:
参见图5,训练完成的匹配模型通过以下步骤得到:
S501、基于职位信息、薪资范围、求职能力信息和企业信息,对岗位数据库中包括的招聘信息进行分区,得到多个岗位分区。
本公开实施例预先收集多个招聘信息,并获取每个招聘信息中的职位信息和求职能力信息,其中,招聘信息中的职位信息用于表示招聘的工作所属的领域情况,招聘信息中的求职能力信息用于表示对求职者的能力要求情况。并获取每个招聘信息对应的企业信息,企业信息表示发布招聘信息的企业情况。
例如,职位信息包括:领域、工作地点、岗位和/或薪资范围等。求职能力信息包括学历和/或工作经验等。企业信息包括:公司性质、公司规模、融资阶段和/或公司名称等。
然后基于职位信息、求职能力信息和企业信息,对各招聘信息进行分区,得到多个岗位分区。
S502、通过关键词标注模型确定每个岗位分区内的每条招聘信息的关键词以及每个关键词对应的特征类型。
参见图6,上述S502中的关键词标注模型通过以下步骤训练得到:
S601、获取招聘信息样本集。其中,招聘信息样本集包括多个岗位分区的招聘信息样本以及每条招聘信息样本的标注信息,招聘信息样本的标注信息包括招聘信息样本指定内容模块中的关键词以及每个关键词对应的特征类型。例如,指定内容模块包括工作职责、职位描述和任职要求模块。
S602、分别将每个招聘信息样本输入深度学习网络,得到深度学习网络的输出结果。其中,输出结果包括关键词以及每个关键词对应的特征类型。
S603、根据输出结果和输入深度学习网络的招聘信息样本的标注信息,确定深度学习网络是否收敛。若深度学习网络未收敛,则执行S604;若深度学习网络收敛,则执行S605。
S604、调整深度学习网络的网络参数,并返回S602。
S605、将当前的深度学习网络作为关键词标注模型。
本公开实施例对关键词标注模型的训练方式与对评测模型的训练方式类似,可参考上述描述,此处不再赘述。
在S502中,可以针对每个岗位分区,从该岗位分区中选择部分招聘信息样本,并分别对选择的每条招聘信息样本的指定内容模块标注关键词以及每个关键词的类别。
然后,利用已标注的招聘信息样本训练深度学习模型,得到岗位数据关键词标注模型,利用岗位数据关键词标注模型对该分区的所有招聘信息样本标注关键词和关键词的类型。
本公开实施例利用带有标注信息的招聘信息样本训练深度学习网络,得到关键词标注模型,关键词标注模型可对招聘信息进行关键词标注,减少人工标注的招聘信息数量,即减少了岗位匹配过程的人工工作量。
S503、针对第二简历样本集中的每个简历样本,基于该简历样本的基础信息和企业信息,确定该简历样本所匹配的岗位分区,将该简历样本所匹配的岗位分区中包括的招聘信息作为该简历样本的基础匹配集合。
一种实现方式中,电子设备可以获取多个简历样本,利用特征提取算法提取简历样本的文本,并通过命名实体识别模型识别简历样本的文本中包括的具有特定意义的实体词,从而得到简历样本中的职位信息和求职能力信息。其中,命名实体识别模型的网络结构可以是迭代扩展卷积神经网络(Iterated Dilated CNN)结构,或者命名实体识别模型的网络结构也可以是其他结构,本公开实施例对此不作具体限定。
同时获取每个简历样本对应的企业信息。每个简历样本对应的企业信息可以是简历样本所属的用户填写和/或选择的企业数据。企业信息包括:公司性质、公司规模、融资阶段和/或公司名称等。
其中,岗位匹配部分的预训练阶段所利用的简历样本,可以是上述简历内容评测部分的模型训练阶段的简历样本,各简历样本的标注信息包括关键词和关键词的类别。
S504、通过匹配模型计算该简历样本包括的关键词与基础匹配集合中每条招聘信息包括的关键词之间的特征匹配分值。
对各简历样本的关键词和对应的基础匹配岗位集合包括的每个招聘信息的关键词进行泛化匹配,计算特征匹配分值。其中,特征匹配分值的计算方式可参考上述公式(1),此处不再赘述。
S505、确定特征匹配分值的误差。
S506、若误差大于等于预设误差阈值,则调整匹配模型的模型参数,返回S504。
S507、若误差小于预设误差阈值,则将当前的匹配模型作为训练完成的匹配模型。
结合S505-S507,一种实现方式中,可以对计算的特征匹配分值和预设的标准匹配分值进行对比,若计算的特征匹配分值和预设的标准匹配分值之间的误差大于误差阈值,则调整关键词类别的权重,并基于调整后的权重,返回上述S504。直到计算的特征匹配分值和预设的标准匹配分值之间的误差小于或等于误差阈值时,停止迭代,保留当前各关键词类别的权重,用于在岗位匹配的匹配阶段计算特征匹配分值。
其中,预设误差阈值可以根据实际情况设置,例如预设误差阈值为0.00005。
本公开实施例在进行岗位匹配时,不但考虑了简历和招聘信息的硬性条件(例如工作地点、期望薪资和求职岗位等),还结合了简历和招聘信息的软性条件(例如工作经验、项目经历等),所以本公开实施例的匹配结果更准确,可以针对求职者的简历匹配更加合适的岗位,进而提高简历的投递成功率。
参见图7,以下对本公开实施例中对简历处理的整体流程进行说明:
如图7所示,本公开实施例对简历从制作到投递的一站式服务包括5各部分,分别为:简历制作与解析、简历内容评测、简历内容优化、岗位匹配和岗位投递。
对于简历制作与解析部分,对于用户上传的简历文档,首先利用Apache Tika进行文档类型检测,确定简历文档的文档类型。然后对简历文件进行文档数据处理,即清除简历文档中的无效信息,再获取简历文档包括的各项内容数据和结构数据,之后基于结构数据对各项内容数据进行重组,并填充在预设简历模板相应内容模块中,得到待评测简历。
对于简历内容评测部分,对待评测简历提取领域、岗位、学历和工作经验,并以此确定待评测简历所属的目标评测分区。利用目标评测分区对应的目标评测模型确定待评测简历的评测结果。
对于简历内容优化部分,求职者可基于评测结果,在线对待评测简历进行优化,优化后得到待投递简历。
对于岗位匹配部分,获取求职者选择的企业信息,并结合待投递简历的基础信息,确定待投递简历所匹配的目标岗位分区。将目标岗位分区包括的各条招聘信息作为基础匹配岗位集合。利用匹配模型确定待投递简历的关键词与基础匹配岗位集合包括的每条招聘信息的关键词之间的特征匹配分值。按照特征匹配分值从高到低的顺序,向求职者推送预设数量的招聘信息。接收求职者对推送的招聘信息的二次筛选,将筛选出的招聘信息作为可投递岗位。同时根据求职者的筛选结果动态更新匹配模型。图7中的虚线线头表示反向传播,即动态更新计算待投递简历包括的关键词与基础匹配岗位集合中每条招聘信息包括的关键词之间的特征匹配分值所基于的匹配模型。
对于岗位投递部分,将待投递简历一键投递至求职者筛选出的可投递岗位。并收集简历的投递结果,以此动态更新匹配模型。
具体的,简历内容评测部分包括模型训练阶段和对简历的评测阶段。以下结合图8对简历内容评测部分进行具体说明:
在预先的模型训练阶段,首先收集多个简历样本,并进行精细化分区,得到划分的多个评测分区。对各评测分区的简历样本添加标注信息。
利用每个评测分区的简历样本训练得到一个评测模型。其中评测模型对于简历样本的识别包括特征特征提取和语法分析。
可通过反向传播的方式训练评测模型,例如,可通过评测模型对于简历样本的评测结果,以及简历样本的标注信息,训练评测模型。以及根据简历的投递结果训练评测模型。
在对简历的评测阶段,可确定待评测简历所属的评测分区,并将待评测简历输入该评测分区对应的训练后的评测模型中,得到评测结果。
具体的,岗位匹配部分包括预训练阶段和匹配阶段。以下结合图9对岗位匹配部分进行具体说明:
预训练阶段的流程如图9所示,收集招聘信息建立岗位数据库,并基于职位信息、薪资范围、求职能力信息和企业信息对岗位数据库中的招聘信息进行分区,得到多个岗位分区。
针对每个岗位分区,对部分招聘信息添加标注,该标注包括关键词和关键词对应的特征类型,并以此训练得到关键词标注模型。通过关键词标注模型对岗位数据库中的招聘信息标注关键词和关键词对应的特征类型。
同时收集简历样本,基于每个简历样本的基础信息和企业信息,确定每个简历样本匹配的岗位分区。将简历样本所匹配的岗位分区包括的招聘信息组成该简历样本的基础匹配岗位集合。
通过匹配模型计算该简历样本包括的关键词与基础匹配集合中每条招聘信息包括的关键词进行泛化匹配,并计算特征匹配分值。确定特征匹配分值的误差。若误差大于或等于预设误差阈值,则调整匹配模型,并返回计算特征匹配分值的步骤,直至误差小于预设误差阈值。
相应的,基于图9所示的流程,在匹配阶段,提取待投递简历对应基础信息的和企业信息,以此确定待投递简历所匹配的目标岗位分区。可以向求职者推荐目标岗位分区包括的各招聘信息。
或者,通过匹配模型计算待投递简历包括的关键词与目标岗位分区内每条招聘信息包括的关键词之间的特征匹配分值。然后根据待投递简历与目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与待投递简历匹配的招聘信息。
基于相同的发明构思,对应于上述方法实施例,本公开实施例还提供了一种简历分析装置,如图10a所示,包括:获取模块1001、确定模块1002和评测模块1003;
获取模块1001,用于获取待评测简历;
确定模块1002,用于根据获取模块1001获取的待评测简历中的职位信息和求职能力信息,确定待评测简历所属的目标评测分区;
评测模块1003,用于将待评测简历输入确定模块1002确定的目标评测分区对应的目标评测模型,得到目标评测模型输出的评测结果;
其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,第一简历样本集包括多个简历样本和每个简历样本的标注信息。
可选地,标注信息包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议;
可选地,如图10b所示,装置还包括训练模块1004,训练模块1004用于:
获得该评测分区的多个简历样本;
分别将每个简历样本输入神经网络模型,得到神经网络模型的对每个简历样本的评测结果,评测结果包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议;
根据输出结果和输入神经网络模型的简历样本的标注信息,确定神经网络模型是否收敛;
若神经网络模型未收敛,则调整神经网络模型的模型参数,并返回分别将每个简历样本输入神经网络模型的步骤;
若神经网络模型收敛,则将当前的神经网络模型作为该评测分区对应的评测模型。
可选地,如图10b所示,装置还包括匹配模块1005,匹配模块1005用于:
提取待投递简历对应的基础信息和企业信息,待投递简历为基于待评测简历的评测结果对待评测简历优化后的简历,或者待投递简历为用户输入的简历,基础信息包括职位信息、意向薪资和求职能力信息;
基于待投递简历对应的基础信息和企业信息,确定待投递简历所匹配的目标岗位分区,其中每个岗位分区中包括多条招聘信息;
通过训练完成的匹配模型计算待投递简历包括的关键词与目标岗位分区内每条招聘信息包括的关键词之间的特征匹配分值;
根据待投递简历与目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与待投递简历匹配的招聘信息。
可选地,如图10b所示,装置还包括训练模块1004,训练模块1004用于:
基于职位信息、薪资范围、求职能力信息和企业信息,对岗位数据库中包括的招聘信息进行分区,得到多个岗位分区;
通过关键词标注模型确定每个岗位分区内的每条招聘信息的关键词以及每个关键词对应的特征类型;
针对第二简历样本集中的每个简历样本,基于该简历样本的基础信息和企业信息,确定该简历样本所匹配的岗位分区,将该简历样本所匹配的岗位分区中包括的招聘信息作为该简历样本的基础匹配集合;
通过匹配模型计算该简历样本包括的关键词与基础匹配集合中每条招聘信息包括的关键词之间的特征匹配分值;
确定特征匹配分值的误差;
若误差大于等于预设误差阈值,则调整匹配模型的模型参数,返回通过匹配模型计算该简历样本包括的关键词与基础匹配集合中每条招聘信息包括的关键词之间的特征匹配分值的步骤;
若误差小于预设误差阈值,则将当前的匹配模型作为训练完成的匹配模型。
可选地,训练模块1004还用于:
获取招聘信息样本集,招聘信息样本集包括多个岗位分区的招聘信息样本以及每条招聘信息样本的标注信息,招聘信息样本的标注信息包括招聘信息样本指定内容模块中的关键词以及每个关键词对应的特征类型;
分别将每个招聘信息样本输入深度学习网络,得到深度学习网络的输出结果,输出结果包括关键词以及每个关键词对应的特征类型;
根据输出结果和输入深度学习网络的招聘信息样本的标注信息,确定深度学习网络是否收敛;
若深度学习网络未收敛,则调整深度学习网络的网络参数,并返回分别将每个简历样本输入深度学习网络的步骤;
若深度学习网络收敛,则将当前的深度学习网络作为关键词标注模型。
可选地,特征类型包括:必备、亮点和劣势;特征匹配分值为:θ=λ1x1+λ2x2+λ3x3;
其中,θ表示待投递简历与招聘信息之间的特征匹配分值,λ1表示招聘信息中对于特征类型为必备的关键词的权重,λ2表示招聘信息中对于特征类型为亮点的关键词的权重,λ3表示招聘信息中对于特征类型为劣势的关键词的权重;
x1表示待投递简历的必备关键词与招聘信息包括的必备关键词中,相匹配的关键词数量/招聘信息包括的必备关键词总数量;x2表示待投递简历的亮点关键词与招聘信息包括的亮点关键词中,相匹配的关键词数量/招聘信息包括的亮点关键词总数量;x3表示待投递简历的劣势关键词与招聘信息包括的劣势关键词中,相匹配的关键词数量/招聘信息包括的劣势关键词总数量。
可选地,匹配模块1005,具体用于:
将与待投递简历之间的特征匹配分值大于预设阈值的招聘信息按照特征匹配分值从高到低的顺序推送给求职者;或者,
按照与待投递简历之间的特征匹配分值从高到低的顺序,选择预设数量的招聘信息推送给求职者;或者,
按照与待投递简历之间的特征匹配分值从高到低的顺序,向求职者推送目标岗位分区内每条招聘信息。
可选地,如图10b所示,装置还包括:投递模块1006,投递模块1006用于:
在根据待投递简历与目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与待投递简历匹配的招聘信息之后,接收求职者对待投递简历匹配的招聘信息的筛选操作;
将待投递简历一键投递至求职者筛选出的与待投递简历匹配的招聘信息。
可选地,获取模块1001,具体用于:
获取用户上传的简历文档;
确定简历文档的文档类型;
将简历文档输入文档类型对应的解析器,得到解析器输出的简历文档包括的各项内容数据和结构数据;结构数据用于表示各项内容数据分别所属的内容模块;
根据结构数据将各项内容数据分别填充在预设简历模板的相应内容模块,得到待评测简历。
可选地,职位信息包括:求职领域和/或求职岗位;
求职能力信息包括:学历和/或工作经验;
企业信息包括:公司性质、公司规模、融资阶段和/或公司名称。
需要说明的是,本实施例中的简历样本来自于公开数据集。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,电子设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储电子设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
电子设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许电子设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如简历分析方法。例如,在一些实施例中,简历分析方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到电子设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的简历分析方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行简历分析方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (14)

1.一种简历分析方法,包括:
获取待评测简历;
根据所述待评测简历中的职位信息和求职能力信息,确定所述待评测简历所属的目标评测分区;
将所述待评测简历输入所述目标评测分区对应的目标评测模型,得到所述目标评测模型输出的评测结果;
其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,所述第一简历样本集包括多个简历样本和每个简历样本的标注信息。
2.根据权利要求1所述的方法,所述标注信息包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议;
每个评测分区对应的评测模型通过以下步骤训练获得:
获得该评测分区的多个简历样本;
分别将每个简历样本输入神经网络模型,得到神经网络模型的对每个简历样本的评测结果,所述评测结果包括:整体评分,每个预设维度的评分和优化建议,预设内容模块中关键词和每个关键词的特征类型,以及每个预设内容模块的优化建议;
根据所述输出结果和输入所述神经网络模型的简历样本的标注信息,确定所述神经网络模型是否收敛;
若所述神经网络模型未收敛,则调整所述神经网络模型的模型参数,并返回所述分别将每个简历样本输入神经网络模型的步骤;
若所述神经网络模型收敛,则将当前的神经网络模型作为该评测分区对应的评测模型。
3.根据权利要求1所述的方法,所述方法还包括:
提取待投递简历对应的基础信息和企业信息,所述待投递简历为基于所述待评测简历的评测结果对所述待评测简历优化后的简历,或者所述待投递简历为用户输入的简历,所述基础信息包括职位信息、意向薪资和求职能力信息;
基于所述待投递简历对应的基础信息和企业信息,确定所述待投递简历所匹配的目标岗位分区,其中每个岗位分区中包括多条招聘信息;
通过训练完成的匹配模型,计算所述待投递简历包括的关键词与所述目标岗位分区内每条招聘信息包括的关键词之间的特征匹配分值;
根据所述待投递简历与所述目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与所述待投递简历匹配的招聘信息。
4.根据权利要求3所述的方法,所述训练完成的匹配模型通过以下步骤得到:
基于职位信息、薪资范围、求职能力信息和企业信息,对岗位数据库中包括的招聘信息进行分区,得到多个岗位分区;
通过关键词标注模型确定每个岗位分区内的每条招聘信息的关键词以及每个关键词对应的特征类型;
针对第二简历样本集中的每个简历样本,基于该简历样本的基础信息和企业信息,确定该简历样本所匹配的岗位分区,将该简历样本所匹配的岗位分区中包括的招聘信息作为该简历样本的基础匹配集合;
通过匹配模型计算该简历样本包括的关键词与所述基础匹配集合中每条招聘信息包括的关键词之间的特征匹配分值;
确定所述特征匹配分值的误差;
若所述误差大于等于预设误差阈值,则调整匹配模型的模型参数,返回所述通过匹配模型计算该简历样本包括的关键词与所述基础匹配集合中每条招聘信息包括的关键词之间的特征匹配分值的步骤;
若所述误差小于所述预设误差阈值,则将当前的匹配模型作为训练完成的匹配模型。
5.根据权利要求4所述的方法,所述关键词标注模型通过以下步骤训练得到:
获取招聘信息样本集,所述招聘信息样本集包括多个岗位分区的招聘信息样本以及每条招聘信息样本的标注信息,招聘信息样本的标注信息包括招聘信息样本指定内容模块中的关键词以及每个关键词对应的特征类型;
分别将每个招聘信息样本输入深度学习网络,得到深度学习网络的输出结果,所述输出结果包括关键词以及每个关键词对应的特征类型;
根据所述输出结果和输入深度学习网络的招聘信息样本的标注信息,确定深度学习网络是否收敛;
若深度学习网络未收敛,则调整深度学习网络的网络参数,并返回所述分别将每个简历样本输入深度学习网络的步骤;
若深度学习网络收敛,则将当前的深度学习网络作为所述关键词标注模型。
6.根据权利要求3所述的方法,其中,所述特征类型包括:必备、亮点和劣势;所述特征匹配分值为:θ=λ1x12x23x3
其中,θ表示所述待投递简历与招聘信息之间的特征匹配分值,λ1表示招聘信息中对于特征类型为必备的关键词的权重,λ2表示招聘信息中对于特征类型为亮点的关键词的权重,λ3表示招聘信息中对于特征类型为劣势的关键词的权重;
x1表示所述待投递简历的必备关键词与招聘信息包括的必备关键词中,相匹配的关键词数量/招聘信息包括的必备关键词总数量;x2表示所述待投递简历的亮点关键词与招聘信息包括的亮点关键词中,相匹配的关键词数量/招聘信息包括的亮点关键词总数量;x3表示所述待投递简历的劣势关键词与招聘信息包括的劣势关键词中,相匹配的关键词数量/招聘信息包括的劣势关键词总数量。
7.根据权利要求3所述的方法,其中,根据所述待投递简历与所述目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与所述待投递简历匹配的招聘信息,包括:
将与所述待投递简历之间的特征匹配分值大于预设阈值的招聘信息按照特征匹配分值从高到低的顺序推送给求职者;或者,
按照与所述待投递简历之间的特征匹配分值从高到低的顺序,选择预设数量的招聘信息推送给求职者;或者,
按照与所述待投递简历之间的特征匹配分值从高到低的顺序,向求职者推送所述目标岗位分区内每条招聘信息。
8.根据权利要求3所述的方法,在所述根据所述待投递简历与所述目标岗位分区内每条招聘信息的特征匹配分值,向求职者推送与所述待投递简历匹配的招聘信息之后,所述方法还包括:
接收所述求职者对所述待投递简历匹配的招聘信息的筛选操作;
将所述待投递简历一键投递至所述求职者筛选出的与所述待投递简历匹配的招聘信息。
9.根据权利要求1所述的方法,其中,获取待评测简历,包括:
获取用户上传的简历文档;
确定所述简历文档的文档类型;
将所述简历文档输入所述文档类型对应的解析器,得到所述解析器输出的所述简历文档包括的各项内容数据和结构数据;所述结构数据用于表示各项内容数据分别所属的内容模块;
根据所述结构数据将所述各项内容数据分别填充在预设简历模板的相应内容模块,得到所述待评测简历。
10.根据权利要求3所述的方法,其中,所述职位信息包括:求职领域和/或求职岗位;
所述求职能力信息包括:学历和/或工作经验;
所述企业信息包括:公司性质、公司规模、融资阶段和/或公司名称。
11.一种简历分析装置,包括:
获取模块,用于获取待评测简历;
确定模块,用于根据所述获取模块获取的所述待评测简历中的职位信息和求职能力信息,确定所述待评测简历所属的目标评测分区;
评测模块,用于将所述待评测简历输入所述确定模块确定的所述目标评测分区对应的目标评测模型,得到所述目标评测模型输出的评测结果;
其中,每个评测分区对应一个评测模型,每个评测分区对应的评测模型为利用该评测分区的第一简历样本集对神经网络模型训练得到的模型,所述第一简历样本集包括多个简历样本和每个简历样本的标注信息。
12.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
13.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。
CN202111166196.8A 2021-09-30 2021-09-30 一种简历分析方法、装置、电子设备、介质及产品 Pending CN113902009A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111166196.8A CN113902009A (zh) 2021-09-30 2021-09-30 一种简历分析方法、装置、电子设备、介质及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111166196.8A CN113902009A (zh) 2021-09-30 2021-09-30 一种简历分析方法、装置、电子设备、介质及产品

Publications (1)

Publication Number Publication Date
CN113902009A true CN113902009A (zh) 2022-01-07

Family

ID=79190068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111166196.8A Pending CN113902009A (zh) 2021-09-30 2021-09-30 一种简历分析方法、装置、电子设备、介质及产品

Country Status (1)

Country Link
CN (1) CN113902009A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293131A (zh) * 2022-09-29 2022-11-04 广州万维视景科技有限公司 数据匹配方法、装置、设备及存储介质
CN116166717A (zh) * 2023-04-25 2023-05-26 贵州自由客网络技术有限公司 一种应用于简历的人工智能信息提取方法
CN117217719A (zh) * 2023-11-07 2023-12-12 湖南海润天恒科技集团有限公司 一种基于大数据的人才信息招聘数据智能管理方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293131A (zh) * 2022-09-29 2022-11-04 广州万维视景科技有限公司 数据匹配方法、装置、设备及存储介质
CN115293131B (zh) * 2022-09-29 2023-01-06 广州万维视景科技有限公司 数据匹配方法、装置、设备及存储介质
CN116166717A (zh) * 2023-04-25 2023-05-26 贵州自由客网络技术有限公司 一种应用于简历的人工智能信息提取方法
CN116166717B (zh) * 2023-04-25 2023-06-23 贵州自由客网络技术有限公司 一种应用于简历的人工智能信息提取方法
CN117217719A (zh) * 2023-11-07 2023-12-12 湖南海润天恒科技集团有限公司 一种基于大数据的人才信息招聘数据智能管理方法及系统
CN117217719B (zh) * 2023-11-07 2024-02-09 湖南海润天恒科技集团有限公司 一种基于大数据的人才信息招聘数据智能管理方法及系统

Similar Documents

Publication Publication Date Title
CN110825882B (zh) 一种基于知识图谱的信息系统管理方法
AU2020321751B2 (en) Neural network system for text classification
US10331764B2 (en) Methods and system for automatically obtaining information from a resume to update an online profile
Singh et al. PROSPECT: a system for screening candidates for recruitment
US8301640B2 (en) System and method for rating a written document
CN113902009A (zh) 一种简历分析方法、装置、电子设备、介质及产品
CN109299865B (zh) 基于语义分析的心理测评系统及方法、信息数据处理终端
US11586656B2 (en) Opportunity network system for providing career insights by determining potential next positions and a degree of match to a potential next position
US20230136368A1 (en) Text keyword extraction method, electronic device, and computer readable storage medium
US20220261766A1 (en) Creating and using triplet representations to assess similarity between job description documents
CN113495900A (zh) 基于自然语言的结构化查询语言语句获取方法及装置
US20240211692A1 (en) Method of training ranking model, and electronic device
TW201403354A (zh) 以資料降維法及非線性算則建構中文文本可讀性數學模型之系統及其方法
US10210251B2 (en) System and method for creating labels for clusters
CN111143556A (zh) 软件功能点自动计数方法、装置、介质及电子设备
CN112784591B (zh) 数据的处理方法、装置、电子设备和存储介质
Laukkanen Comparative causal mapping and CMAP3 software in qualitative studies
CN111767334A (zh) 信息抽取方法、装置、电子设备及存储介质
CN114218951B (zh) 实体识别模型的训练方法、实体识别方法及装置
CN111708870A (zh) 基于深度神经网络的问答方法、装置及存储介质
Kudi et al. Online Examination with short text matching
US11734517B1 (en) Systems and methods for measuring automatability of report generation using a natural language generation system
CN115292506A (zh) 应用于办公领域的知识图谱本体构建方法和装置
CN115017271A (zh) 用于智能生成rpa流程组件块的方法及系统
CN114741538A (zh) 简历筛选方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination