CN111241270A - 一种简历处理方法及装置 - Google Patents
一种简历处理方法及装置 Download PDFInfo
- Publication number
- CN111241270A CN111241270A CN201811340583.7A CN201811340583A CN111241270A CN 111241270 A CN111241270 A CN 111241270A CN 201811340583 A CN201811340583 A CN 201811340583A CN 111241270 A CN111241270 A CN 111241270A
- Authority
- CN
- China
- Prior art keywords
- resume
- content
- field
- analyzing
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000004590 computer program Methods 0.000 claims description 22
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 9
- 239000003607 modifier Substances 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 230000007115 recruitment Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种简历处理方法及装置,该方法包括:获取待处理的简历;确定所述简历的目标类型;采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;存储所述简历中各字段的内容。通过本发明提供的简历处理方法,可以提高简历解析的准确性,进而提高简历分类整理的准确性。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种简历处理方法及装置。
背景技术
随着互联网招聘平台的不断发展,目前有大量从事各种形态的招聘网站。实际应用中,许多公司的人力资源部门都会存储来自不同招聘网站的人才的简历,经整理收集成为简历库。然而,各个招聘网站提供的简历并不是一个结构化的内容,不同招聘网站提供的简历模板和格式多种多样,并且同一招聘网站在不同时间的简历模板和/或格式往往会产生变化,难于准确的对简历进行分类整理,例如,将简历按照标签整理为结构化的内容,例如,姓名,电话,邮箱,学历,教育背景,工作经历,职位意向,等等。
在现有技术中,针对因简历模板或格式多样,造成简历分类整理较为不准确的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种简历处理方法及装置,以解决因简历模板或格式多样,造成简历分类整理较为不准确的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种简历处理方法。该方法包括:
获取待处理的简历;
确定所述简历的目标类型;
采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;
存储所述简历中各字段的内容。
第二方面,本发明实施例还提供一种简历处理装置。该简历处理装置包括:
获取模块,用于获取待处理的简历;
确定模块,用于确定所述简历的目标类型;
解析模块,用于采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;
存储模块,用于存储所述简历中各字段的内容。
第三方面,本发明实施例还提供一种简历处理装置,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的简历处理方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的简历处理方法的步骤。
本发明实施例中,通过获取待处理的简历;确定所述简历的目标类型;采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;存储所述简历中各字段的内容。由于针对不同类型的简历采用其对应的解析方式进行解析,因而可以提高简历解析的准确性,进而提高简历分类整理的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的简历处理方法的流程图;
图2是本发明又一实施例提供的简历处理方法的流程图;
图3是本发明又一实施例提供的简历处理装置的结构图;
图4是本发明实施例提供的简历处理装置的结构图;
图5是本发明又一实施例提供的简历处理装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种简历处理方法。参见图1,图1是本发明实施例提供的简历处理方法的流程图,如图1所示,包括以下步骤:
步骤101、获取待处理的简历。
本发明实施例中,上述待处理的简历可以包括从预设邮箱中获取的简历,也可以包括接收用户上传的简历,其中,上述预设邮箱可以根据实际需求进行设置,其数量也可以根据实际需求进行设置。实际应用中,可以预先设置将来自不同招聘网站的简历均投递至预设邮箱中,从而从该预设邮箱中可以较为便捷的获取来自不同招聘网站的简历。
可选的,为了减少垃圾邮件对简历解析的影响,可以对预设邮箱中的一些垃圾邮件进行过滤,例如,可以设置邮件来源的白名单,仅获取邮件来源属于上述白名单的邮件的正文及附件等内容。需要说明的是,本发明实施例中也可以预先将邮件来源属于上述白名单的邮件存储于预设邮箱的预设区域,例如,用于存储简历邮件的文件夹,或是转存至其他邮箱中,从而可以直接从上述文件夹或是邮箱中读取邮件。
实际应用中,可以每隔预设时间(例如,5分钟、10分钟等)从预设邮箱中读取邮件,在邮件数量较多的情况下,可以每次读取预设数量(例如,50、100等)的邮件进行处理,便于及时的、稳定的对接收到的简历进行分类整理。
步骤102、确定所述简历的目标类型。
本发明实施例中,目标类型也即上述待处理的简历的类型。需要说明的是,简历类型划分的维度可以根据实际需求进行确定。例如,可以根据简历的来源划分简历类型,例如,来源于不同招聘网站的简历划分为不同的类型;也可以根据简历的格式划分简历类型,例如,将格式为HTML(HyperText Markup Language,超文本标记语言)的简历划分为一类,将图片格式和PDF格式的简历划分为一类,将DOC或DOCX格式的简历划分为一类,等等。
步骤103、采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容。
本发明实施例中,可以先建立简历的类型和解析方式之间的对应关系,从而基于简历的类型可以快速查找到对应的解析方式,以对该简历进行解析,得到简历中各个字段的内容。
例如,对于HTML格式的简历,可以基于该简历对应的HTML代码的标签进行解析;对于PDF格式的简历,可以将PDF格式的简历转换为可编辑的简历文本,在基于可编辑的简历文本进行解析;或者对于来源于第一招聘网站的简历,可以基于第一招聘网站对应的简历模板对该简历进行解析;对于来源于第二招聘网站的简历,可以基于第二招聘网站对应的简历模板对该简历进行解析;或者对于存在对应简历模板的简历,基于其对应的简历模板进行解析,对于不存在简历模板的简历,采用预先训练的简历解析模型对该简历进行解析,等等。
实际应用中,可以预先设置需要解析的字段,例如,姓名,电话,邮箱,学历,专业,职位意向,教育背景,工作经历,技能特长,荣誉奖项等。可选的,上述字段可以根据检索需求进行设置。
步骤104、存储所述简历中各字段的内容。
该步骤中,可以将解析得到的各个字段的内容进行存储,例如,存储于数据库中,便于用户检索。
本发明实施例的简历处理方法,获取待处理的简历;确定所述简历的目标类型;采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;存储所述简历中各字段的内容。由于针对不同类型的简历采用其对应的解析方式进行解析,因而可以提高简历解析的准确性,进而提高简历分类整理的准确性。
参见图2,图2是本发明又一实施例提供的简历处理方法的流程图。本发明实施例与上一实施例的区别主要在于对上述步骤103进行进一步限定。本发明实施例中,所述采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容,包括:在所述目标类型存在对应的简历模板的情况下,根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容;在所述目标类型不存在对应的简历模板的情况下,利用预先训练的简历解析模型对所述简历进行解析,得到所述简历中各个字段的内容。
如图2所示,本发明实施例提供的简历处理方法包括以下步骤:
步骤201、获取待处理的简历。
该步骤同上述步骤101,为避免重复,在此不做赘述。
步骤202、确定所述简历的目标类型。
本发明实施例中,目标类型也即上述待处理的简历的类型。具体的,可以根据简历的来源划分简历类型,例如,来源于不同招聘网站的简历划分为不同的类型。需要说明的是,可以将无法识别来源的简历可以划分为一类。
实际应用中,可以在获取到简历后,检测简历的来源,例如,可以根据携带该简历的邮件的地址、简历的徽标、简历中的特定词等信息确定简历的来源。
步骤203、在所述目标类型存在对应的简历模板的情况下,根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容。
实际情况中,许多招聘网站都提供简历模板,求职者往往需要按照其提供的简历模板填写简历,才可以基于其提供的简历投递接口投递简历。
因此,本发明实施例可以预先存储不同招聘网站的简历模板,从而在检测到某一简历来源于某一招聘网站的情况下,可以基于该招聘网站的简历模板对该简历进行解析,例如,可以基于该招聘网站的简历模板中各个字段的布局,分别从该简历中提取各个字段的内容。
步骤204、在所述目标类型不存在对应的简历模板的情况下,利用预先训练的简历解析模型对所述简历进行解析,得到所述简历中各个字段的内容。
实际情况中,存在一些简历不存在对应的简历模板,例如,一些用户上传的简历,此时,可以利用预先训练的简历解析模型对所述简历进行解析,以提高简历解析的兼容性。
本发明实施例中,上述简历解析模型可以是利用大量已标注各个字段的简历样本,对构建的机器学习模型进行训练得到的。其中,上述机器学习模型可以根据实际情况进行合理设置,例如,神经网络模型、支持向量机等。
该步骤中,可以将不存在对应的简历模板的简历输入上述简历解析模型,上述简历解析模型可以对该简历进行解析,输出该简历中各个字段的内容。
步骤205、存储所述简历中各字段的内容。
该步骤同上述步骤104,为避免重复,在此不做赘述。
本发明实施例提供的简历处理方法,在目标类型存在对应的简历模板的情况下,根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容,可以较为精准的提取到简历中各个字段的内容。此外,在目标类型不存在对应的简历模板的情况下,利用预先训练的简历解析模型对所述简历进行解析,得到所述简历中各个字段的内容,可以提高简历解析的兼容性和通用性。
可选的,上述步骤203,也即所述根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容,可以包括:
根据所述简历模板对应的正则表达式,对所述简历进行解析,得到所述简历中各个字段的内容。
实际应用中,可以预先设置各个简历模板对应的正则表达式。例如,可以分别依据各个简历模板中各个字段或是标签的布局,建立各个简历模板对应的正则表达式。例如,在某一HTML格式的简历模板中,第一个标签为姓名、第二个标签为联系方式、第三个标签为学历、第四个标签为求职意向、第五个标签为教育背景、第六个标签为工作经历等,则可以依据该简历模板中各个标签的内容以及各个标签的位置确定正则表达式。
本发明实施例基于各个简历模板对应的正则表达式,进行简历解析,可以提高简历解析的准确性和效率。
可选的,上述步骤204之前,也即所述根据预先训练的简历解析模型,对所述简历进行解析,得到所述简历中各个字段的内容之前,所述方法还可以包括:
对所述简历进行预处理;其中,所述预处理包括格式转换处理和/或修饰符过滤处理;
上述步骤204,也即所述根据预先训练的简历解析模型,对所述简历进行解析,得到所述简历中各个字段的内容,可以包括:
根据预先训练的简历解析模型,对预处理后的简历进行解析,得到所述简历中各个字段的内容。
本发明实施例中,上述格式转换处理可以是将简历转换为可编辑的格式,例如,文本格式。上述修饰符可以是指用于修饰简历中的内容的信息,例如,简历中字符颜色、字符大小、字符字体等。例如,对于HTML格式的简历,可以过滤脚本(即SCRIPT)标签、样式(即STYLE)标签、HTML标签等修饰符。
本发明实施例通过对上述待处理的简历进行格式转换处理,从而可以适配不同格式的简历。此外,通过过滤上述待处理的简历中的修饰符,可以减少修饰符对简历内容解析的干扰。
可选的,所述方法还可以包括:
根据目标内容,对所述简历解析模型进行优化训练;
其中,所述目标内容包括根据简历模板对所述简历进行解析得到的所述简历中的各个字段的内容,和/或根据用户输入的修正操作修正后的所述简历中的各个字段的内容。
在一实施方式中,由于基于简历模板解析得到简历中各个字段的内容的准确性较高,此时,可以基于解析得到的所述简历中各个字段的内容,对所述简历解析模型进行优先训练,以提高简历解析模型进行简历解析的准确性。
具体的,可以将上述简历输入上述简历解析模型,并将基于简历解析模型解析得到的简历中各个字段的内容,与基于简历模板解析得到简历中各个字段的内容进行比较,简历解析模型可以基于比较结果进行调整,以实现简历解析模型的自我学习,进而可以提高简历解析模型简历解析的准确性。
在另一实施方式中,用户也可以对解析得到简历中各个字段的内容中的错误信息进行修正。例如,可以在输出简历信息供用户查看的过程中,若接收到用户输入的针对简历某个字段的内容的修正操作,则可以修正该字段的内容,并可以基于修正后该简历各个字段的内容,对所述简历解析模型进行优先训练,以提高简历解析模型进行简历解析的准确性。
可选的,上述步骤101或是步骤201,也即所述确定所述简历的目标类型,可以包括:
识别所述简历的特征词;
将所述简历的特征词与预设特征词库中的特征词进行匹配;
根据匹配结果确定所述简历的目标类型。
本发明实施例中,上述预设特征词库中的特征词可以根据实际情况进行合理设置,例如,可以基于各个招聘网站的域名、徽标(即Logo)、名称等设置预设特征词库。
具体的,在获取到待处理的简历后,可以从发送该简历的招聘网站的域名、简历中的徽标、简历名称、简历页眉、简历页脚等中提取特征词,并可以将该简历中提取的各个特征词分别与预设特征词库中的特征词进行匹配,以根据匹配结果确定该简历的类型。例如,若简历中提取的特征词A与预设特征词库中的特征词B匹配,则将特征词B对应的招聘网站确定为该简历的来源。
本发明实施例通过将所述简历的特征词与预设特征词库中的特征词进行匹配,并根据匹配结果确定简历的类型,可以提高简历类型匹配的准确性和效率。
可选的,所述简历中各字段的内容存储于简历数据库中;所述方法还包括:
接收目标检索词;
从所述简历数据库中检索与所述目标检索词匹配的简历;
输出与所述目标检索词匹配的简历。
本发明实施例中,可以按照简历的字段,将所解析的所有简历的内容存储至简历数据库中,其中,上述简历数据库可以是关系型数据库。在用户需要检索满足特定条件(例如,学历为硕士的简历)的简历的情况下,可以输入检索词,例如,“硕士”,则可以从简历数据库中检索学历为硕士的简历,并输出检索结果。
需要说明的是,与所述目标检索词匹配的简历,可以是包含目标检索词的简历,也可以是包含于目标检索词相关的词语的简历。例如,检索词为“重点大学”,则可以遍历简历数据库中所有简历中“教育背景”字段中包括的学校,并与预设的重点大学词典进行比较,以获取与“重点大学”匹配的简历。
本发明实施例中,用户可以根据需求从所述简历数据库中检索简历,便于用户快速、准确的筛选符合要求的简历。
以下结合图3对本发明实施例进行说明:
参见图3,本发明实施例提供的简历处理方法包括如下步骤:
步骤301、简历邮箱接收携带简历的邮件。
本发明实施例中,简历邮箱是所有简历的主要入口,其中,邮件的正文及附件都可能包括简历。具体的,简历邮箱可以接收各个招聘网站的简历以及外部投递的简历,例如,招聘者可以通过邮件将需要解析的简历发送至上述简历邮箱。
步骤302、定时读取简历邮箱中的邮件。
本发明实施例中,为了整体系统的稳定、简装,可以定时(例如,每隔10分钟)从简历邮箱中读取邮件,每次可以仅处理特定数量的简历邮件,例如,50封。为了对简历邮箱中的垃圾邮件进行过滤,可以采用邮件规则将固定来源的邮件转存到白名单邮箱中。
需要说明的是,本发明实施例也可以接收用户上传的简历,如果上传的简历为压缩包,则可以支持对压缩包进行自动解压。上传的简历可以与邮件简历一起进入步骤303中进行处理。
步骤303、根据特征词判断简历类型。
该步骤中,获得简历正文后,可以先检测简历来源。实际应用中,对于一些招聘网站,例如,51job、智联、猎聘、拉勾、中华英才等招聘网站,通常很容易通过域名、Logo、特殊的词句等找出其简历的特征词(也可以称为特征码)。判断出简历来源之后,如果存在对应的简历模板,则执行步骤304,否则执行步骤305。
需要说明的是,由于招聘网站可能不定期的修改简历展示方式,为了适应变化,可以提供Web界面维护特征词。
步骤304、简历模板解析引擎对简历进行解析。
本发明实施例中,简历模板解析引擎用于基于简历模板进行简历解析。例如,简历模板解析引擎可以基于简历模板设置的正则表达式解析简历。具体的,可以预先基于各个简历模板构建对应的正则表达式,在确定某个简历存在对应的简历模板的情况下,可以基于其对应的简历模板对应的正则表达式解析该简历。
需要说明的是,在基于简历模板解析引擎对简历进行解析之后,还可以将该简历输入AI识别引擎进行处理,AI识别引擎可以对比其解析结果和简历模板解析引擎的解析结果,以实现自我学习。其中,上述AI识别引擎用于基于预先训练的简历解析模型进行简历解析。
步骤305、预处理引擎对简历进行预处理。
该步骤中,预处理引擎用于对简历进行预处理。具体的,预处理引擎可以对简历进行格式转换处理,以适配各类文件格式,并可以过滤简历中肉眼不可见的修饰符,转换成可阅读的内容。
步骤306、AI识别引擎对预处理后的简历进行解析。
本发明实施例中,可以通过搜集大量的简历样本,例如,大于5万份的简历样本,人工对简历中各个字段进行标注,并将标志各个字段后的简历样本输入至构建的机器学习模型(例如,深度算法模型)进行训练、学习,得到上述简历解析模型。
步骤307、将解析后的简历存储至数据库。
该步骤中,可以将简历模板解析引擎和AI识别引擎的解析结果均存储至数据库中其中,该数据库可以为关系型数据库,便于检索。
步骤308、基于检索引擎进行检索。
本发明实施例中,由于简历里有大量的项目经历、工作经历等,因此,全文检索引擎必不可少,此外,还可以包括弹性检索(即Elastic Search)引擎。
实际应用中,用户通过Web系统登录系统之后搜索、检索、筛选简历,以及查看简历的详细信息,如果发现简历有错误,则可以进行纠错。同样的,纠错信息可以用于训练上述简历解析模型。
本发明实施例提供的简历处理方法,首先,可以通过求职者的自助投递、在第三方网站的检索发送、手工上传等方法,将所有的简历均汇总到一个渠道中进行处理,简化了简历的采集工作。其次,对于特定来源的简历,基于简历模板进行解析,只要在各简历网站改版时做少量的适配即可,可以提高简历解析的准确性。再次,对于个人自行编写或者改编的简历,可以采用AI识别引擎进行泛解析,使得系统更加具备弹性。最后,基于简历模板解析出来的简历可以训练AI识别引擎,以加强AI识别引擎的精确度。人工纠错、标记也可以帮助再训练AI识别引擎,从而提高AI识别引擎的精确度。
参见图4,图4是本发明实施例提供的简历处理装置的结构图。如图4所示,简历处理装置400包括:获取模块401、确定模块402、解析模块403和存储模块404,其中:
获取模块401,用于获取待处理的简历;
确定模块402,用于确定所述简历的目标类型;
解析模块403,用于采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;
存储模块404,用于存储所述简历中各字段的内容。
可选的,所述解析模块,包括:
第一解析单元,用于在所述目标类型存在对应的简历模板的情况下,根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容;
第二解析单元,用于在所述目标类型不存在对应的简历模板的情况下,利用预先训练的简历解析模型对所述简历进行解析,得到所述简历中各个字段的内容。
可选的,所述第一解析单元具体用于:
根据所述简历模板对应的正则表达式,对所述简历进行解析,得到所述简历中各个字段的内容。
可选的,所述装置还包括:
预处理模块,用于所述根据预先训练的简历解析模型,对所述简历进行解析,得到所述简历中各个字段的内容之前,对所述简历进行预处理;其中,所述预处理包括格式转换处理和/或修饰符过滤处理;
所述第二解析单元具体用于:
根据预先训练的简历解析模型,对预处理后的简历进行解析,得到所述简历中各个字段的内容。
可选的,所述装置还包括:
训练模块,用于根据目标内容,对所述简历解析模型进行优化训练;
其中,所述目标内容包括根据简历模板对所述简历进行解析得到的所述简历中的各个字段的内容,和/或根据用户输入的修正操作修正后的所述简历中的各个字段的内容。
可选的,所述确定模块具体用于:
识别所述简历的特征词;
将所述简历的特征词与预设特征词库中的特征词进行匹配;
根据匹配结果确定所述简历的目标类型。
可选的,所述简历中各字段的内容存储于简历数据库中;所述装置还包括:
接收模块,用于接收目标检索词;
检索模块,用于从所述简历数据库中检索与所述目标检索词匹配的简历;
输出模块,用于输出与所述目标检索词匹配的简历。
本发明实施例提供的简历处理装置400能够实现上述方法实施例中的各个过程,为避免重复,这里不再赘述。
本发明实施例的简历处理装置400,获取模块401,用于获取待处理的简历;确定模块402,用于确定所述简历的目标类型;解析模块403,用于采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;存储模块404,用于存储所述简历中各字段的内容。由于针对不同类型的简历采用其对应的解析方式进行解析,因而可以提高简历解析的准确性,进而提高简历分类整理的准确性。
参见图5,图5是本发明又一实施提供的简历处理装置的结构图,如图5所示,简历处理装置500包括:处理器501、存储器502及存储在所述存储器502上并可在所述处理器上运行的计算机程序,数据发送装置500中的各个组件通过总线接口503耦合在一起,所述计算机程序被所述处理器501执行时实现如下步骤:
获取待处理的简历;
确定所述简历的目标类型;
采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;
存储所述简历中各字段的内容。
可选的,所述计算机程序被所述处理器501执行时还用于:
在所述目标类型存在对应的简历模板的情况下,根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容;
在所述目标类型不存在对应的简历模板的情况下,利用预先训练的简历解析模型对所述简历进行解析,得到所述简历中各个字段的内容。
可选的,所述计算机程序被所述处理器501执行时还用于:
根据所述简历模板对应的正则表达式,对所述简历进行解析,得到所述简历中各个字段的内容。
可选的,所述计算机程序被所述处理器501执行时还用于:
所述根据预先训练的简历解析模型,对所述简历进行解析,得到所述简历中各个字段的内容之前,对所述简历进行预处理;其中,所述预处理包括格式转换处理和/或修饰符过滤处理;
根据预先训练的简历解析模型,对预处理后的简历进行解析,得到所述简历中各个字段的内容。
可选的,所述计算机程序被所述处理器501执行时还用于:
根据目标内容,对所述简历解析模型进行优化训练;
其中,所述目标内容包括根据简历模板对所述简历进行解析得到的所述简历中的各个字段的内容,和/或根据用户输入的修正操作修正后的所述简历中的各个字段的内容。
可选的,所述计算机程序被所述处理器501执行时还用于:
识别所述简历的特征词;
将所述简历的特征词与预设特征词库中的特征词进行匹配;
根据匹配结果确定所述简历的目标类型。
可选的,所述简历中各字段的内容存储于简历数据库中;
所述计算机程序被所述处理器501执行时还用于:
接收目标检索词;
从所述简历数据库中检索与所述目标检索词匹配的简历;
输出与所述目标检索词匹配的简历。
本发明实施例还提供一种简历处理装置,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述简历处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述简历处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (10)
1.一种简历处理方法,其特征在于,包括:
获取待处理的简历;
确定所述简历的目标类型;
采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;
存储所述简历中各字段的内容。
2.根据权利要求1所述的方法,其特征在于,所述采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容,包括:
在所述目标类型存在对应的简历模板的情况下,根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容;
在所述目标类型不存在对应的简历模板的情况下,利用预先训练的简历解析模型对所述简历进行解析,得到所述简历中各个字段的内容。
3.根据权利要求2所述的方法,其特征在于,所述根据所述简历模板对所述简历进行解析,得到所述简历中各个字段的内容,包括:
根据所述简历模板对应的正则表达式,对所述简历进行解析,得到所述简历中各个字段的内容。
4.根据权利要求2所述的方法,其特征在于,所述根据预先训练的简历解析模型,对所述简历进行解析,得到所述简历中各个字段的内容之前,所述方法还包括:
对所述简历进行预处理;其中,所述预处理包括格式转换处理和/或修饰符过滤处理;
所述根据预先训练的简历解析模型,对所述简历进行解析,得到所述简历中各个字段的内容,包括:
根据预先训练的简历解析模型,对预处理后的简历进行解析,得到所述简历中各个字段的内容。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据目标内容,对所述简历解析模型进行优化训练;
其中,所述目标内容包括根据简历模板对所述简历进行解析得到的所述简历中的各个字段的内容,和/或根据用户输入的修正操作修正后的所述简历中的各个字段的内容。
6.根据权利要求1所述的方法,其特征在于,所述确定所述简历的目标类型,包括:
识别所述简历的特征词;
将所述简历的特征词与预设特征词库中的特征词进行匹配;
根据匹配结果确定所述简历的目标类型。
7.根据权利要求1所述的方法,其特征在于,所述简历中各字段的内容存储于简历数据库中;所述方法还包括:
接收目标检索词;
从所述简历数据库中检索与所述目标检索词匹配的简历;
输出与所述目标检索词匹配的简历。
8.一种简历处理装置,其特征在于,包括:
获取模块,用于获取待处理的简历;
确定模块,用于确定所述简历的目标类型;
解析模块,用于采用与所述目标类型对应的解析方式,对所述简历进行解析,得到所述简历中各个字段的内容;
存储模块,用于存储所述简历中各字段的内容。
9.一种简历处理装置,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的简历处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的简历处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340583.7A CN111241270A (zh) | 2018-11-12 | 2018-11-12 | 一种简历处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340583.7A CN111241270A (zh) | 2018-11-12 | 2018-11-12 | 一种简历处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111241270A true CN111241270A (zh) | 2020-06-05 |
Family
ID=70877380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811340583.7A Pending CN111241270A (zh) | 2018-11-12 | 2018-11-12 | 一种简历处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111241270A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737969A (zh) * | 2020-07-27 | 2020-10-02 | 北森云计算有限公司 | 一种基于深度学习的简历解析方法和系统 |
CN111967848A (zh) * | 2020-08-19 | 2020-11-20 | 工银科技有限公司 | 获取简历的方法、装置、系统及介质 |
CN113268306A (zh) * | 2021-06-08 | 2021-08-17 | 金蝶软件(中国)有限公司 | 简历解析接口调用方法、装置及计算机存储介质 |
CN118093520A (zh) * | 2024-03-13 | 2024-05-28 | 北京才多对信息技术有限公司 | 数据存储方法、数据存储装置和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6874002B1 (en) * | 2000-07-03 | 2005-03-29 | Magnaware, Inc. | System and method for normalizing a resume |
CN106096913A (zh) * | 2016-06-14 | 2016-11-09 | 嘉兴飞刀软件科技有限公司 | 一种基于云服务的简历邮件解析系统及方法 |
CN107392143A (zh) * | 2017-07-20 | 2017-11-24 | 中国科学院软件研究所 | 一种基于svm文本分类的简历精确解析方法 |
CN108664474A (zh) * | 2018-05-21 | 2018-10-16 | 众安信息技术服务有限公司 | 一种基于深度学习的简历解析方法 |
-
2018
- 2018-11-12 CN CN201811340583.7A patent/CN111241270A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6874002B1 (en) * | 2000-07-03 | 2005-03-29 | Magnaware, Inc. | System and method for normalizing a resume |
CN106096913A (zh) * | 2016-06-14 | 2016-11-09 | 嘉兴飞刀软件科技有限公司 | 一种基于云服务的简历邮件解析系统及方法 |
CN107392143A (zh) * | 2017-07-20 | 2017-11-24 | 中国科学院软件研究所 | 一种基于svm文本分类的简历精确解析方法 |
CN108664474A (zh) * | 2018-05-21 | 2018-10-16 | 众安信息技术服务有限公司 | 一种基于深度学习的简历解析方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737969A (zh) * | 2020-07-27 | 2020-10-02 | 北森云计算有限公司 | 一种基于深度学习的简历解析方法和系统 |
CN111737969B (zh) * | 2020-07-27 | 2020-12-08 | 北森云计算有限公司 | 一种基于深度学习的简历解析方法和系统 |
CN111967848A (zh) * | 2020-08-19 | 2020-11-20 | 工银科技有限公司 | 获取简历的方法、装置、系统及介质 |
CN113268306A (zh) * | 2021-06-08 | 2021-08-17 | 金蝶软件(中国)有限公司 | 简历解析接口调用方法、装置及计算机存储介质 |
CN113268306B (zh) * | 2021-06-08 | 2024-03-19 | 金蝶软件(中国)有限公司 | 简历解析接口调用方法、装置及计算机存储介质 |
CN118093520A (zh) * | 2024-03-13 | 2024-05-28 | 北京才多对信息技术有限公司 | 数据存储方法、数据存储装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685056B (zh) | 获取文档信息的方法及装置 | |
CN111241270A (zh) | 一种简历处理方法及装置 | |
US20200234183A1 (en) | Data transformations for robotic process automation | |
CN107392143B (zh) | 一种基于svm文本分类的简历精确解析方法 | |
US10223616B1 (en) | System and method identification and classification of internet advertising | |
CN107145584B (zh) | 一种基于n-gram模型的简历解析方法 | |
CN109948120B (zh) | 一种基于二元化的简历解析方法 | |
CN109165295B (zh) | 一种智能简历评估方法 | |
US9710769B2 (en) | Methods and systems for crowdsourcing a task | |
CN112632989A (zh) | 一种合同文本中风险信息的提示方法、装置及设备 | |
EP3196811A1 (en) | Cognitive document reader | |
CN107153716B (zh) | 网页内容提取方法和装置 | |
EP2671190A1 (en) | System for data extraction and processing | |
CN115293131A (zh) | 数据匹配方法、装置、设备及存储介质 | |
CN114003692A (zh) | 合同文本信息的处理方法、装置、计算机设备及存储介质 | |
CN111428480A (zh) | 简历识别方法、装置、设备及存储介质 | |
CN112418813A (zh) | 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质 | |
CN113326413A (zh) | 一种网页信息提取方法、系统、服务器及存储介质 | |
CN114743012A (zh) | 一种文本识别方法及装置 | |
WO2020111074A1 (ja) | メール分類装置、メール分類方法、およびコンピュータプログラム | |
US12033413B2 (en) | Method and apparatus for data structuring of text | |
CN111798217B (zh) | 数据分析系统及方法 | |
CN116306506A (zh) | 一种基于内容识别的智能邮件模板方法 | |
CN114549177A (zh) | 保函审查方法、装置、系统与计算机可读存储介质 | |
CN113947510A (zh) | 一种基于文件格式自适应的不动产电子证照管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |