CN103634420B - 简历邮件筛选系统及方法 - Google Patents

简历邮件筛选系统及方法 Download PDF

Info

Publication number
CN103634420B
CN103634420B CN201310598050.XA CN201310598050A CN103634420B CN 103634420 B CN103634420 B CN 103634420B CN 201310598050 A CN201310598050 A CN 201310598050A CN 103634420 B CN103634420 B CN 103634420B
Authority
CN
China
Prior art keywords
resume
mail
current
keyword
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310598050.XA
Other languages
English (en)
Other versions
CN103634420A (zh
Inventor
谢小雪
孙洁
赵勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tanjiawan Heritage Park Operation Management Wuzhen Tongxiang Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310598050.XA priority Critical patent/CN103634420B/zh
Publication of CN103634420A publication Critical patent/CN103634420A/zh
Application granted granted Critical
Publication of CN103634420B publication Critical patent/CN103634420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种简历邮件筛选系统及方法,包括:对于获取的当前简历邮件,从中解析出简历邮件信息,包括:简历邮件内容、收件地址和发件地址;获取与所述当前简历邮件的招聘职位相对应的关键词权重列表;将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选。应用本发明,可以降低简历邮件筛选的人力成本,并提高筛选效率及筛选质量。

Description

简历邮件筛选系统及方法
技术领域
本发明涉及互联网领域,尤其涉及一种简历邮件筛选系统及方法。
背景技术
随着互联网技术的不断发展,通过电子邮件接收应聘简历的人才招聘方式不断得到各招聘者的青睐。
目前,招聘者一般会在发布的招聘启事中公布用于接收应聘简历的招聘邮箱。这样,应聘者可以根据招聘单位公布的招聘邮箱,将简历邮件直接发送至招聘邮箱中。同时,招聘者对招聘邮箱中接收的简历邮件进行人工筛选,从中筛选出的优秀的应聘简历转发给实际用人招聘部门。
现有技术中,招聘者需要查看招聘邮箱中接收的简历邮件的内容,然后,通过人工筛选的方式排除不符合招聘职位的以及质量不好的简历邮件,以此,来获得优秀的应聘简历。事实上,招聘邮箱每天接收的简历邮件的数量可能会非常大,采用现有的这种人工筛选的方式存在所需投入的人力成本高,筛选效率低等不足;而且,筛选出的简历邮件的质量受限于招聘者本身具有的关于招聘职位的专业知识。
综上所述,现有技术的人工筛选简历邮件的方法,存在筛选效率低、筛选质量差及人力成本高的不足。
发明内容
针对上述现有技术存在的缺陷,本发明提供了一种简历邮件处理方法及系统,可以降低人力成本,并提高筛选效率及筛选质量。
根据本发明的一个方面,提供了一种简历邮件筛选方法,包括:
对于获取的当前简历邮件,从中解析出简历邮件信息,包括:简历邮件内容、收件地址和发件地址;
获取与所述当前简历邮件的招聘职位相对应的关键词权重列表;
将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值;
根据获取的权重值确定出所述当前简历邮件的权重评分;
根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选。
进一步,所述当前简历邮件的招聘职位根据如下方法确定:
分析所述当前简历邮件的简历邮件内容,包括:邮件标题、邮件正文、附件,从所述简历邮件内容中提取招聘职位的信息;或者,
对于每个招聘职位,将所述简历邮件内容与该招聘职位对应的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;确定对应当前简历邮件的权重评分最大的招聘职位为当前简历邮件的招聘职位。
进一步,所述招聘职位相对应的关键词权重列表中的内容是由招聘者预先录入的,包括针对所述招聘职位设置的关键词以及该关键词的权重值;或者,
所述招聘职位的关键词权重列表是根据如下方法预先确定出的:
获取预先经招聘者评分,且评分高于设定的评分阈值的、至少设定数量的所述招聘职位的简历邮件作为训练语料;统计所述训练语料中所包含的词语,以及每个词语的词频;
从统计出的词语中剔除副词,以及所述招聘职位所属行业的行业通用关键词后,选取词频超过设定阈值的词语作为针对所述招聘职位设置的关键词;并
根据每个选取的关键词的词频为该关键词设置权重值。
进一步,所述关键词权重列表中还包括:行业通用关键词及其权重值。
进一步,所述根据获取的权重值确定出所述当前简历邮件的权重评分,具体包括:
将获取的权重值累加得到所述当前简历邮件的权重评分。
进一步,在所述解析出简历邮件信息后,还包括:根据所述收件地址在数据库中查找到对应的用户标识UID;以及
所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选,具体包括:
若根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件,则将所述当前简历邮件向对应所述UID登记的简历接收邮箱进行转发。
进一步,所述当前简历邮件是在所述当前简历邮件到达所述收件地址所指示的简历接收邮箱之前获取的;以及
所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选,具体包括:
若根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件,则将所述当前简历邮件发送到所述收件地址所指示的简历接收邮箱中。
进一步,所述收件地址中包括前/后缀信息和对应所述UID登记的简历接收邮箱地址;以及
所述根据所述收件地址在数据库中查找到对应的UID,具体包括:
在数据库中查找到与所述收件地址中剔除前/后缀信息后得到的邮箱地址对应记录的UID。
进一步,所述前/后缀信息具体为渠道标识符;以及
在所述解析出简历邮件信息后,还包括:
从所述收件地址中提取出渠道标识符;并根据提取出的渠道标识符确定出所述当前简历邮件的来源渠道权重评分;以及
所述根据获取的权重值确定出所述当前简历邮件的权重评分,具体包括:
将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
进一步,在所述解析出简历邮件信息后,还包括:
从数据库中查找出对应于所述简历接收邮箱地址的至少一级好友关系的好友邮箱的地址;在确定出其中一个好友邮箱的地址与所述发件地址相同后,根据该好友邮箱与所述简历接收邮箱地址的好友关系的级数确定所述当前简历邮件的来源渠道权重评分;以及
所述根据获取的权重值确定出所述当前简历邮件的权重评分,具体包括:
将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
进一步,所述对应所述UID登记的简历接收邮箱为多个,分别与所述UID登记的各招聘职位相对应;以及
将所述当前简历邮件向对应所述UID登记的简历接收邮箱进行转发,具体包括:
将所述当前简历邮件向与所述招聘职位对应的简历接收邮箱进行转发;以及
所述当前简历邮件的招聘职位根据如下方法确定:
根据当前简历邮件的收件地址,在数据库中查找到对应的UID,以及对应的简历接收邮箱;确定与查找到的简历接收邮箱相对应的招聘职位为当前简历邮件的招聘职位。
进一步,在所述解析出简历邮件信息后,还包括:
从所述简历邮件内容中提取出简历文件后,将提取出的简历文件转换为结构化文本,并将转换的结构化文本进行类别分段;对于每个类别分段,将该类别分段的结构化文本与该类别分段所属类别所对应的关键信息库进行匹配,提取与所述关键信息库中的信息相匹配的字段作为该类别分段的关键字段;将提取的各个类别分段的关键字段以设定的格式组成所述当前简历邮件的简要信息;以及
所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选,具体包括:
若根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件,则将所述当前简历邮件及其简要信息发送至所述收件地址对应的简历接收邮箱中。
进一步,所述关键词权重列表中针对每个关键词还记录有该关键词所属类别;以及
所述将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配,具体包括:
对于每个类别分段,将该类别分段与所述关键词权重列表中类别与该类别分段所属类别相同的关键词进行匹配。
进一步,在所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选之后,还包括:
每隔设定时间段,将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到所述收件地址对应的简历接收邮箱。
根据本发明的另一个方面,还提供了一种简历邮件筛选系统,包括:
简历邮件接收模块,用于在获取到当前简历邮件后,从中解析出简历邮件信息,包括:简历邮件内容、收件地址和发件地址;
简历邮件分析模块,用于从所述简历邮件接收模块接收当前简历邮件的简历邮件内容,并获取所述当前简历邮件的招聘职位相对应的关键词权重列表;将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;
简历邮件推送模块,用于从所述简历邮件分析模块接收当前简历邮件的权重评分,并根据接收的当前简历邮件的权重评分对所述当前简历邮件进行筛选。
较佳地,所述简历邮件分析模块还用于分析所述当前简历邮件的简历邮件内容,包括:邮件标题、邮件正文、附件,从所述简历邮件内容中提取招聘职位的信息;或者,
所述简历邮件分析模块还用于对于每个招聘职位,将所述简历邮件内容与该招聘职位对应的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;确定对应当前简历邮件的权重评分最大的招聘职位为当前简历邮件的招聘职位。
较佳地,所述系统还包括:权重列表生成模块;
所述权重列表生成模块用于对于每个招聘职位,接收招聘者录入的针对该招聘职位设置的关键词以及该关键词的权重值,并根据接收的内容生成所述招聘职位的关键词权重列表;或者,
所述权重列表生成模块用于对于每个招聘职位,获取预先经招聘者评分,且评分高于设定的评分阈值的、至少设定数量的该招聘职位的简历邮件作为训练语料;统计所述训练语料中所包含的词语,以及每个词语的词频;从统计出的词语中剔除副词,以及该招聘职位所属行业的行业通用关键词后,选取词频超过设定阈值的词语作为针对该招聘职位设置的关键词;并根据每个选取的关键词的词频为该关键词设置权重值。
较佳地,所述关键词权重列表中还包括:行业通用关键词及其权重值。
较佳地,所述简历邮件接收模块还用于根据所述收件地址在数据库中查找到对应的UID;以及
所述简历邮件推送模块具体用于在根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件时,将所述当前简历邮件向对应所述UID登记的简历接收邮箱进行转发。
较佳地,所述当前简历邮件是由所述简历邮件接收模块在到达所述收件地址所指示的简历接收邮箱之前获取的;以及
所述简历邮件推送模块具体用于在根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件时,将所述当前简历邮件发送到所述收件地址所指示的简历接收邮箱中。
较佳地,所述收件地址中包括前/后缀信息和对应所述UID登记的简历接收邮箱地址;以及
所述简历邮件接收模块具体用于在数据库中查找到与所述收件地址中剔除前后/缀信息后得到的邮箱地址对应记录的UID。
较佳地,所述前/后缀信息具体为渠道标识符;以及
所述简历邮件接收模块还用于在所述解析出简历邮件信息后,从所述收件地址中提取出渠道标识符;以及
所述简历邮件分析模块还用于根据提取出的渠道标识符确定出所述当前简历邮件的来源渠道权重评分;并将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
较佳地,所述简历邮件接收模块还用于在所述解析出简历邮件信息后,从数据库中查找出对应于所述简历接收邮箱地址的至少一级好友关系的好友邮箱的地址;以及
所述简历邮件分析模块还用于在确定出其中一个好友邮箱的地址与所述发件地址相同后,根据该好友邮箱与所述简历接收邮箱地址的好友关系的级数确定所述当前简历邮件的来源渠道权重评分;并将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
较佳地,所述对应所述UID登记的简历接收邮箱为多个,分别与所述UID登记的各招聘职位相对应;以及
所述简历邮件推送模块具体用于将所述当前简历邮件向与所述招聘职位对应的简历接收邮箱进行转发;以及
所述简历邮件分析模块还用于根据当前简历邮件的收件地址,在数据库中查找到对应的UID,以及对应的简历接收邮箱;确定与查找到的简历接收邮箱相对应的招聘职位为当前简历邮件的招聘职位。
较佳地,所述简历邮件分析模块还用于从所述简历邮件内容中提取出简历文件后,将提取出的简历文件转换为结构化文本,并将转换的结构化文本进行类别分段;对于每个类别分段,将该类别分段的结构化文本与该类别分段所属类别所对应的关键信息库进行匹配,提取与所述关键信息库中的信息相匹配的字段作为该类别分段的关键字段;将提取的各类别分段的关键字段以设定的格式组成所述当前简历邮件的简要信息;以及
所述简历邮件推送模块还用于在根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件时,将所述当前简历邮件及其简要信息发送至所述收件地址对应的简历接收邮箱中。
较佳地,所述关键词权重列表中针对每个关键词还记录有该关键词所属类别;以及
所述简历邮件分析模块具体用于对于每个类别分段,将该类别分段与所述关键词权重列表中类别与该类别分段所属类别相同的关键词进行匹配。
较佳地,所述简历邮件推送模块还用于在所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选之后,每隔设定时间段,将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到所述收件地址对应的简历接收邮箱。
本发明技术方案中,简历邮件筛选系统从获取的简历邮件中解析出简历邮件内容、收件地址和发件地址;获取与简历邮件的招聘职位相对应的关键词权重列表后,将简历邮件内容与获取的关键词权重列表中的关键词进行匹配并获取匹配的关键词的权重值;并根据获取的权重值确定出简历邮件的权重评分。招聘者无需再人工查看简历接收邮箱中接收的每一封简历邮件的内容,大大减小人力成本;而且,利用对应招聘职位的关键词权重列表而得到简历邮件的权重评分,并根据得到的简历邮件的权重评分来进行简历邮件的筛选,提高了筛选质量及筛选效率。
进一步地,简历邮件筛选系统还可以按照简历邮件的权重评分的高低顺序,定时将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到招聘者的简历接收邮箱,节省了招聘者阅读简历的时间,进一步提高了筛选效率。
附图说明
图1为本发明实施例的简历邮件筛选系统的内部结构示意图;
图2为本发明实施例的简历邮件筛选方法的流程图;
图3为本发明实施例的根据来源渠道得到简历邮件的权重评分的方法的流程图;
图4为本发明实施例的根据好友关系得到简历邮件的权重评分的方法的流程图。
具体实施方式
以下将结合附图对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内,一个模块也可以位于一台计算机上和/或分布于两台或更多台计算机之间。
本发明的发明人考虑到,可以预先根据招聘者的行业及招聘职位设置对应该招聘职位的关键词权重列表。从获取的简历邮件中解析出简历邮件内容、收件地址和发件地址;获取与简历邮件的招聘职位相对应的关键词权重列表后,将简历邮件内容与获取的关键词权重列表中的关键词进行匹配并获取匹配的关键词的权重值;并根据获取的权重值确定出简历邮件的权重评分。这样,就可以根据应聘者的简历邮件的权重评分来进行简历邮件的筛选,将符合筛选条件的简历邮件发送至招聘者指定的简历接收邮箱。通过上述筛选方法,招聘者无需再人工查看招聘邮箱中接收的每一封简历邮件的内容,大大减小人力成本;而且,利用对应招聘职位的关键词权重列表而得到简历邮件的权重评分,并根据得到的简历邮件的权重评分来进行筛选,可以提高筛选质量。
本发明的发明人还考虑到,可以根据各简历邮件的权重评分的高低顺序,定时将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到招聘者的简历接收邮箱。这样,招聘者根据权重评分的高低顺序进行筛选,可以提高筛选效率。进一步地,还可以从简历邮件内容中提取简历邮件的关键字段,并将提取的关键字段以统一的格式组成简历邮件的简要信息,并将符合筛选条件的简历邮件及该简历邮件的简要信息发送至招聘者的收件邮箱,或者,在合并处理过程中,将各简历邮件的简要信息以邮件正文的形式添加到合并的邮件中。这样,可以节省招聘者阅读简历的时间,进一步提高筛选效率。
下面结合附图详细说明本发明的技术方案。
本发明实施例中,在进行简历邮件筛选之前,每个招聘者可以在本发明实施例所提供的简历邮件筛选系统中预先登记用于接收经筛选处理的简历邮件的简历接收邮箱,比如example@mycompany.com。其中,每个招聘者将对应一个唯一的UID(UserIdentification,用户标识),且简历接收邮箱地址与UID之间的对应关系将被存储为数据库中的一条记录。
在应聘者发送简历邮件时,本发明实施例所提供的简历邮件筛选系统可以在简历邮件到达简历接收邮箱之前获取到简历邮件并对其进行筛选,比如可以采用如下两种方式在简历接收邮箱之前获取到简历邮件:
方式一中简历邮件筛选系统可以通过一个中间邮箱地址先接收未经筛选处理的简历邮件,比如“user@kuaijianli.com”,而该中间邮箱地址也可预先由招聘者对应该招聘者的UID、简历接收邮箱地址进行登记;在招聘者针对各个招聘职位而发布的招聘启事中,预先将中间邮箱作为简历邮件的收件地址进行公布。
方式二中招聘者在针对各个招聘职位而发布的招聘启事中,将预先登记的简历接收邮箱作为应聘者发送的简历邮件的收件地址进行公布。而招聘者可以预先将自己的域名的MX(mail exchanger,邮件交换器)记录的DNS(Domain Name Server,域名服务器)解析到简历邮件筛选系统所在服务器,这样,简历邮件筛选系统可以在简历邮件到达简历接收邮箱之前截获该简历邮件并对之进行筛选。
从而,在以上述两种方式进行简历筛选之后,可以将符合筛选条件的当前简历邮件发送到招聘者所登记的简历接收邮箱中,避免了大量的人工筛选工作,而提高了简历筛选效率。
实际应用中,一个招聘者同时招聘的招聘职位可能不止一个,所以,为了提高筛选质量,对应招聘者唯一的UID登记的简历接收邮箱可以为多个,且分别与该招聘者的UID登记的各招聘职位相对应。这样,在实际应用中,可以使得招聘者在简历接收邮箱中只收到与该简历接收邮箱对应的招聘职位的简历邮件,有利于减少招聘者的阅读量。
本发明实施例的简历邮件筛选系统,如图1所示,包括:简历邮件接收模块101、简历邮件分析模块102、简历邮件推送模块103。
其中,简历邮件筛选系统进行简历邮件筛选方法的流程,如图2所示,具体包括如下步骤:
S201:简历邮件筛选系统对于获取的当前简历邮件,从中解析出简历邮件信息,包括:简历邮件内容、收件地址和发件地址。
本步骤中,简历邮件筛选系统中的简历邮件接收模块101在获取到当前简历邮件后,从中解析出简历邮件信息。其中,解析出的简历邮件信息包括简历邮件内容、简历邮件的收件地址及简历邮件的发件地址。其中,从当前简历邮件中解析出的简历邮件的发件地址具体是指当前简历邮件的原始发件地址,即应聘者的发件地址;简历邮件的收件地址可以是简历邮件的收件人的收件地址,或者简历邮件的抄送人的收件地址,或者简历邮件的密送人的收件地址。
具体地,一种简历邮件的获取方式中,在应聘者发送的简历邮件到达公布的用于接收未经筛选处理的简历邮件的中间邮箱之后,简历邮件接收模块101可以POP3/SMTP/IMAP等邮件传输协议从中间邮箱中获取当前简历邮件,并通过RFC协议从获取的简历邮件中解析出简历邮件信息,其中,简历邮件信息包括简历邮件内容、简历邮件的收件地址及发件地址。而简历邮件内容具体包括邮件标题、邮件正文及附件。
或者,对于没有公布中间邮箱的另一种简历邮件的获取方式中,在应聘者发送的简历邮件到达公布的用于接收经筛选处理后的简历邮件的简历接收邮箱之前,简历邮件接收模块101可以先通过POP3/SMTP/IMAP等邮件传输协议截获简历邮件,并通过RFC协议从截获的简历邮件中解析出简历邮件信息。
S202:简历邮件筛选系统获取与当前简历邮件的招聘职位相对应的关键词权重列表。
本步骤中,简历邮件筛选系统中的简历邮件分析模块102从简历邮件接收模块101接收的简历邮件信息,根据简历邮件信息确定出当前简历邮件的招聘职位后,获取与当前简历邮件的招聘职位相对应的关键词权重列表。其中,确定当前简历邮件的招聘职位的具体方法将在后续详细介绍。
S203:简历邮件筛选系统将简历邮件内容与获取的关键词权重列表中的关键词进行匹配后,从关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出当前简历邮件的权重评分。
本步骤中,简历邮件筛选系统中的简历邮件分析模块102将当前简历邮件的简历邮件内容与获取的关键词权重列表中的每个关键词进行匹配,若关键词权重列表中的关键词出现在简历邮件内容中,则获取该关键词的权重值。在将关键词权重列表中的每个关键词匹配结束后,根据获取的权重值确定出当前简历邮件的权重评分。关于本步骤中的确定出当前简历邮件的权重评分的详细方法将在后续详细介绍。
更优地,由步骤S202获取的关键词权重列表中针对每个关键词还记录有该关键词所属类别。例如,关键词权重列表可以采用如下格式:
其中,将有多个同义词的关键词用分隔符“|”进行分隔,并作为一个关键词设定在关键词权重列表中。
这样,简历邮件分析模块102可以从当前简历邮件的简历邮件内容中提取简历文件后,将提取的简历文件转换为结构化文本,并将转换的结构化文本按照设定的类别进行类别分段;对于每个类别分段,将该类别分段与获取的关键词权重列表中类别与该类别分段所属类别相同的关键词进行匹配,并从关键词权重列表中获取匹配的关键词的权重值。例如,对于当前简历邮件的“教育经历”类别分段,可以将该类别分段的结构化文本与关键词权重列表中属于“教育经历”类别的关键词进行匹配,这样,可以提高匹配精度,使得筛选效率更高。
S204:简历邮件筛选系统根据当前简历邮件的权重评分对当前简历邮件进行筛选。
本步骤中,简历邮件筛选系统中的简历邮件推送模块103从简历邮件分析模块102接收当前简历邮件的权重评分后,根据接收的当前简历邮件的权重评分,判断当前简历邮件是否符合筛选条件;若判定当前简历邮件的权重评分高于设定的第一权重评分阈值(比如80分)则符合筛选条件,简历邮件推送模块103将当前简历邮件向当前简历邮件的收件地址所指示的简历接收邮箱进行转发。
具体地,对应于上述简历邮件接收模块101从中间邮箱获取当前接收的简历邮件的简历邮件获取方式,简历邮件推送模块103在从中间邮箱获得简历邮件后,根据当前简历邮件的收件地址可以在数据库中查找到与收件地址对应的UID;在进行简历邮件筛选之后,简历邮件推送模块103可以将符合筛选条件的当前简历邮件向查找到的UID登记的简历接收邮箱进行转发。
或者,对应于上述简历邮件接收模块101在简历邮件到达简历接收邮箱之前截获简历邮件的方式,简历邮件推送模块103在进行简历邮件筛选之后,可以将符合筛选条件的当前简历邮件发送到当前简历邮件的收件地址所指示的简历接收邮箱中。
本发明实施例中,筛选条件具体可以由本领域技术人员预先设定,例如,可以将筛选条件设定为权重评分高于80分,只有当简历邮件的权重评分高于80分时,才能被判定为符合筛选条件,即可以将简历邮件立即发送至与简历接收邮箱。通过设定的筛选条件,可以将权重评分较高的简历邮件筛选出来,而权重评分较高的简历邮件,对应的是更符合招聘职位及招聘者行业的,所以筛选出来的简历邮件的质量高。
作为一种更优地实施方式,每隔设定时间段,简历邮件推送模块103可以将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到当前简历邮件的收件地址对应的简历接收邮箱。具体地,在判定当前简历邮件不符合筛选条件后,简历邮件推送模块103根据接收的当前简历邮件的权重评分,判断当前简历邮件是否符合合并条件;若判定当前简历邮件的权重评分高于设定的第二权重评分阈值(比如60分)则符合合并条件,简历邮件推送模块103将当前简历邮件与设定时间段内其他符合合并条件的简历邮件进行合并。在进行合并处理时,简历邮件推送模块103可以按照各简历邮件的权重评分的高低顺序进行合并,这样,有利于节省招聘者对简历邮件的筛选时间。而且,还可以在合成的邮件中,为各简历邮件设置简历邮件的链接地址,这样,如果招聘者想查看完整简历,可以通过简历邮件的链接地址,在网站上直接查看简历邮件中的简历文件,或是将简历邮件中的简历文件下载之后再查看。
作为一种更优的实施方式,本发明实施例提供的简历邮件筛选装置中,简历邮件分析模块102还用于从当前简历邮件的简历邮件内容中提取出简历文件后,从简历文件中提取出与关键信息库中的信息相匹配的字段作为关键字段,并将提取的关键字段以设定的格式组成当前简历邮件的简要信息。
具体地,简历邮件分析模块102从简历邮件接收模块101接收当前简历邮件的简历邮件信息后,判断接收的简历邮件内容中是否存在附件;若存在附件,则进一步判断附件的格式是否为压缩包,若是压缩包,则解压附件,并从解压的附件中提取符合简历文件特征的简历文件;若不是压缩包,则从附件中提取符合简历文件特征的简历文件。若简历邮件内容中没有附件,则将从简历邮件文件中提取的邮件正文作为简历文件。其中,简历文件特征是由本领域技术人人员预先设定的,例如,简历文件的名称包含“简历”、简历文件的后缀为doc/docx/pdf等。
实际应用中,由于应聘者的简历的格式是各种各样的,这增加了阅读简历的招聘者查找关键字段的时间,所以,本发明实施例中,简历邮件分析模块102可以在从简历邮件内容中提取出简历文件后,将提取出的简历文件转换为结构化文本,并将转换的结构化文本进行类别分段;对于每个类别分段,将该类别分段的结构化文本与该类别分段所属类别所对应的关键信息库进行匹配,提取与关键信息库中的信息相匹配的字段作为该类别分段的关键字段;这样,在后续操作中,可以将提取的各个类别分段的关键字段以设定的格式组成当前简历邮件的简要信息,并显示在发送给招聘者的邮件中,从而减少阅读简历的时间。
具体地,将提取的简历文件转换为结构化文本之后,根据结构化文本的结构和文本语义,将转换的结构化文本划分为可识别结构化文本和不可识别结构化文本。其中,可识别结构化文本具体是指可以按照设定的类别进行类别分段的结构化文本,而设定的类别可以为“基本信息”、“教育经历”、“工作经历”、“项目经历”等,也可以将类别设定为多层,例如,可以在设定的“基本信息”类别下继续设定子类别“姓名”和子类别“年龄”等,在设定的“教育经历”类别下继续设定子类别“学校”和子类别“学位”等。
对于可分段识别结构化文本,按照设定的类别进行类别分段划分;并针对每个划分出的类别分段,将该类别分段的结构化文本转换为纯文本内容,并将转换的纯文本内容与对应该类别的关键信息词库进行匹配,从中提取出与关键信息词库中的信息相匹配的字段作为该类别分段的关键字段,例如,对于基本信息类别,将与对应基本信息类别的关键信息库中的信息匹配的“姓名”、“性别”、“年龄”等字段作为基本信息类别分段的关键字段。其中,每个类别对应的关键信息词库是预先设定的。
对于不可识别分段结构化文本,可作为一个新的类别分段全部转换纯文本内容,然后,将纯文本内容与所有类别的关键词信息库进行匹配,从中提取出与关键信息词库中的信息相匹配的字段得到作为该类别分段的关键词字段。
这样,在简历邮件分析模块102提取出当前简历邮件的简要信息,以及确定出当前简历邮件的权重评分之后,简历邮件推送模块103可以在根据当前简历邮件的权重评分判定当前简历邮件符合筛选条件时,将当前简历邮件及其简要信息发送至收件地址对应的简历接收邮箱中。而且,简历邮件推送模块103还可以将不符合筛选条件但符合合并条件的简历邮件及其简要信息合并成一份邮件发送到所述收件地址对应的简历接收邮箱。这样,通过将各简历邮件的简要信息发送至招聘者的简历接收邮箱,可以使得招聘者从接收的简历邮件或是合并的邮件中,直接看到各简历邮件的简要信息,大大节省了招聘者阅读简历的时间。
对于上述步骤S202中提到的确定出当前简历邮件的招聘职位,本发明技术方案中提供了如下三种确定出当前简历邮件的招聘职位的具体方法:
方法一,简历邮件分析模块102根据当前简历邮件的收件地址,在数据库中查找到与收件地址对应的UID,以及对应的简历接收邮箱;确定与查找到的简历接收邮箱相对应的招聘职位为当前简历邮件的招聘职位。
方法二,简历邮件分析模块102分析当前简历邮件的简历邮件内容,包括:邮件标题、邮件正文、附件,从所述简历邮件内容中提取招聘职位的信息。
方法三,对于每个招聘职位,简历邮件分析模块102将当前简历邮件的简历邮件内容与该招聘职位对应的关键词权重列表中的关键词进行匹配后,从关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出当前简历邮件的权重评分;确定对应当前简历邮件的权重评分最大的招聘职位为当前简历邮件的招聘职位。
进一步,本发明实施例的简历邮件筛选系统还包括:权重列表生成模块104。
权重列表生成模块104用于预先确定出各招聘职位对应的关键词权重列表。
具体地,步骤S202中,招聘职位相对应的关键词权重列表是由简历邮件筛选系统中的权重列表生成模块104预先确定出的,比如可以采用如下两种方案确定出关键词权重列表:
方案一中权重列表生成模块104对于每个招聘职位,接收招聘者录入的针对该招聘职位设置的关键词以及该关键词的权重值;并根据接收的内容生成所述招聘职位的关键词权重列表。具体地,在方案一中,对于不同类别的关键词,其对招聘职位的影响也是不尽相同的。所以在为关键词设置权重值之前,可以预先对关键词进行分类,比如“学校”、“学位”、“技能”、“公司”、“证书”等。实际应用中,还可以将多个相关的类别分别作为一个大的类别的子类别,例如,将“学校”和“学位”作为大的类别“教育经历”的子类别,这样,在关键词权重列表中设置关键词时,可以将该关键词所属的子类别以及该子类别所属的类别作为一个整体设置为该关键词的类别,例如,“教育经历|学校”设置为关键词“北京大学”的类别。在对关键词进行分类后,则可以根据关键词的类别及本领域技术人员的经验,对每个关键词设置相应的权重值。例如,相比学校类别的关键词,技能类别的关键词对于招聘职位更为重要,所以,在设置权重值时,可以将技能类别的关键词的权重值设置的比学校类别的关键词的权重值高。
方案二中权重列表生成模块104可以对于每个招聘职位,获取预先经招聘者评分,且评分高于设定的评分阈值的、至少设定数量的该招聘职位的简历邮件作为训练语料;统计训练语料中所包含的词语,以及每个词语的词频;从统计出的词语中剔除副词,以及该招聘职位所属行业的行业通用关键词后,选取词频超过设定阈值的词语作为针对该招聘职位设置的关键词;并根据每个选取的关键词的词频为该关键词设置权重值。其中,对于预先经招聘者评分的简历邮件,具体可以由招聘者可以进行人工评分,也可以由本发明提供的简历邮件筛选系统得到该简历邮件的权重评分。
在方案二中,可以按照本领域技术人员所公知的IF-IDF算法,将获取的预先经招聘者评分,且评分高于设定的评分阈值的、至少设定数量的对应该招聘职位的简历作为训练语料,并统计训练语料中所包含的词语,以及每个词语的词频;从统计出的词语中剔除副词,如“的”、“是”、“这”等,以及将该招聘职位所属行业的行业通用关键词;将剩下的词语的词频与设定阈值进行比较,并选取词频超过该设定阈值的词语作为针对该招聘职位的关键词;并根据本领域技术人员的实际经验及每个选取的关键词的词频,为选取的关键词设置权重值。其中,行业通用关键词具体可以为招聘者所在行业中通用的词语。
实际应用中,应聘者除了要满足招聘职位的要求,还要掌握关于招聘者所在行业的基本技能或知识等。所以,为了增加各简历邮件之间的区分度,更优地,关键词权重列表中还包括招聘职位所属行业的行业通用关键词及其权重值。关于关键词权重列表中的行业通用关键词及其权重值的确定,可以由招聘者预先录入,也可以将之前获取的针对行业的简历邮件作为训练语料,采用与确定针对招聘者职位的关键词的相同的方法,从中提取出行业通用关键词,具体提取方法在此不再赘述。
一般说来,针对招聘职位的关键词的重要性要比行业通用关键词的重要性要高,所以,在设置关键词权重值时,除了考虑关键词的类别,还可以考虑关键词是属于针对招聘职位的关键词,还是行业通用关键词。例如,可以将关键词权重列表中的对应针对招聘职位的关键词的权重值设置的比对应行业通用关键词的权重值高。这样,有利于将符合招聘职位的简历邮件的权重评分与不符合招聘职位的简历邮件的权重评分区分开来,提高筛选质量。
对于上述步骤S203中提到的简历邮件的权重评分,本发明技术方案中提供了如下几种具体的确定方法:
方法一中,简历邮件分析模块102获取关键词权重列表中与当前简历邮件的简历邮件内容相匹配的关键词的权重值后,可直接将获取的权重值累加得到当前简历邮件的权重评分。
方法二中,还可根据修饰词得到简历邮件的权重评分;具体地,简历邮件分析模块102在将当前简历邮件的简历邮件内容与获取的关键词权重列表中的关键词进行匹配,并从关键词权重列表中获取匹配的关键词的权重值后,还从简历邮件内容中提取各匹配的关键词的修饰词。这样,简历邮件分析模块102还可以进一步判断提取的匹配的关键词是否有修饰词,若有,则可以根据设定的修饰词比重,将该关键词对应的权重值与该修饰词对应的比重的乘积累加到当前简历邮件的权重评分上;否则,仅将该关键词对应的权重值累加到当前简历邮件的权重评分上。其中,设定的修饰词比重具体可以由本领域技术人员预先设定。
对于关键词权重列表中各个类别的关键词,可以对该类别的关键词的常用修饰词进行相应的比重设置。例如,对于技能类别的关键词,将常用的修饰词“了解”的比重设置为40%,修饰词“熟悉”的比重设置为80%,修饰词“精通”的比重设置为100%。
例如,在当前简历邮件的简历邮件内容中找到技能类别的关键词“java编程”之后,从简历邮件内容中提取的关键词“java编程”的修饰词为“熟悉”,则根据预先设定的修饰词比重,得知技能类别的修饰词“熟悉”的比重为80%,则可以将关键词“java编程”对应的权重的80%累加到当前简历邮件的权重评分上。
方法三中,还可根据来源渠道得到简历邮件的权重评分,如图3所示,具体包括如下步骤:
S301:简历邮件接收模块101在解析出简历邮件信息后,从收件地址中提取出渠道标识符,并发送至简历邮件分析模块102。
实际应用中,针对各个招聘职位,招聘者可能将招聘启事发布在不同的平台,如微博、论坛等。所以,为了区分应聘者发送的简历邮件的来源渠道,招聘者还可以根据发布平台,自定义渠道标识符,比如,将微博对应的渠道标识符定义为“weibo”,将论坛对应的渠道标识符定义为“bbs”。
同时,在不同的平台发布的招聘启事中,可以在公布的用于接收简历邮件的简历接收邮箱地址的之前、或之后加上渠道标识符,作为对应该简历接收邮箱的收件地址的前缀信息、或后缀信息,例如,发布在微博的招聘启事中简历邮件的收件地址可以公布为“user.weibo@kuaijianli.com”或“weibo.user@kuaijianli.com”,而发布在论坛的招聘启事中的简历邮件的收件地址可以公布为“user.bbs@kuaijianli.com”或“bbs.user@kuaijianli.com”。
本步骤中,简历邮件接收模块101解析出的简历邮件的收件地址中包括前缀信息和对应UID登记的简历接收邮箱地址;或者,解析出的简历邮件的收件地址中包括后缀信息和对应UID登记的简历接收邮箱地址。
简历邮件接收模块101根据从该收件地址中剔除前缀信息或后缀信息得到的邮箱地址,在数据库中查找到与该邮箱地址对应记录的UID;并将当前简历邮件的收件地址中的前缀信息、或后缀信息作为当前简历邮件的渠道标识符。
S302:简历邮件分析模块102根据接收的渠道标识符确定出当前简历邮件的来源渠道权重评分。
实际应用中,不同来源渠道的简历邮件的质量也会存在差异,所以,可以根据各渠道对应的渠道标识符,预先设置渠道标识符与来源渠道权重评分的对应关系表。
例如,招聘者认为来源于行业论坛的简历比来源于微博的会更专业一点,质量会更好,那么他可以将渠道标识符“bbs”的权重值对应设置为5,而将渠道标识符“weibo”的权重值对应设置为3。
本步骤中,简历邮件分析模块102从简历邮件接收模块101接收当前简历邮件的渠道标识符,并根据接收的渠道标识符及预先设置渠道标识符与来源渠道权重评分的对应关系表,确定出当前简历邮件的来源渠道权重评分。
S303:简历邮件分析模块102根据上述步骤S203中获取的权重值,以及步骤S302中确定出的来源渠道权重评分,得到当前简历邮件的权重评分。
具体地,简历邮件分析模块102可以将获取的匹配的关键词的权重值累加后,与当前简历邮件的来源渠道权重按照设定的计算方案得到当前简历邮件的权重评分。例如,可以将获取的匹配的关键词的权重值累加后,与当前简历邮件的来源渠道权重相加得到当前简历邮件的权重评分。
方法四中,还可根据好友关系得到简历邮件的权重评分,如图4所示,具体包括如下步骤:
S401:简历邮件接收模块101在解析出简历邮件信息后,从数据库中查找出对应于当前简历邮件的简历接收邮箱的至少一级好友关系的好友邮箱,并发送至简历邮件分析模块102。
本步骤中,简历邮件接收模块101可以预先根据招聘者登记的简历接收邮箱的好友邮箱,迭代得到对应该简历接收邮箱的一定级数的好友关系的好友邮箱。例如,简历接收邮箱的好友邮箱与简历接收邮箱之间为一级好友关系,且该好友邮箱可称为一级好友邮箱;而该一级好友邮箱的好友邮箱与简历接收邮箱之间为二级好友关系。
S402:简历邮件分析模块102在确定出其中一个好友邮箱的地址与当前简历邮件的发件地址相同后,根据该好友邮箱与简历接收邮箱地址的好友关系的级数确定当前简历邮件的来源渠道权重评分。
本发明实施例中,简历邮件分析模块102在确定出其中一个好友邮箱的地址与当前简历邮件的发件地址相同后,还可以将好友邮箱与简历接收邮箱的好友关系的级数确定为当前简历邮件与简历接收邮箱的好友度。
S403:简历邮件分析模块102根据上述步骤S203中获取的权重值,以及步骤S402中确定出的来源渠道权重评分,得到当前简历邮件的权重评分。
具体地,简历邮件分析模块102可以将获取的匹配的关键词的权重值累加后,与当前简历邮件的来源渠道权重评分按照设定的计算方案得到当前简历邮件的权重评分。例如,可以将获取的匹配的关键词的权重值累加后,与当前简历邮件的来源渠道权重评分相加得到当前简历邮件的权重评分。
更优地,在确定出当前简历邮件与简历接收邮箱的好友度后,可以将筛选条件进行扩展,例如,将权重评分高于80分,且与简历接收邮箱的好友度高于3作为筛选条件,这样,经筛选出的简历邮件既能保证质量,也与招聘者存在较为亲近的好友关系,有利于提高简历邮件的筛选质量,并减少招聘者的筛选时间。
实际应用中,在确定出当前简历邮件的权重评分后,简历邮件分析模块102还可以进一步根据确定出的当前简历邮件的权重评分及参与权重评分的各权重值的总和,将简历邮件的权重评分转换成百分制。
本发明技术方案中,简历邮件筛选系统从获取的简历邮件中解析出简历邮件内容、收件地址和发件地址;获取与简历邮件的招聘职位相对应的关键词权重列表后,将简历邮件内容与获取的关键词权重列表中的关键词进行匹配并获取匹配的关键词的权重值;并根据获取的权重值确定出简历邮件的权重评分。招聘者无需再人工查看简历接收邮箱中接收的每一封简历邮件的内容,大大减小人力成本;而且,利用对应招聘职位的关键词权重列表而得到简历邮件的权重评分,并根据得到的简历邮件的权重评分来进行筛选,可以提高筛选质量及筛选效率。进一步地,按照简历邮件的权重评分的高低顺序,定时将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到招聘者的简历接收邮箱,可进一步提高筛选效率,减少招聘者阅读简历的时间。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (25)

1.一种简历邮件筛选方法,其特征在于,包括:
对于获取的当前简历邮件,从中解析出简历邮件信息,包括:简历邮件内容、收件地址和发件地址;
获取与所述当前简历邮件的招聘职位相对应的关键词权重列表;
将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值;
根据获取的权重值确定出所述当前简历邮件的权重评分;
根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选;
在所述解析出简历邮件信息后,还包括:
从所述简历邮件内容中提取出简历文件后,将提取出的简历文件转换为结构化文本,并将转换的结构化文本进行类别分段;对于每个类别分段,将该类别分段的结构化文本与该类别分段所属类别所对应的关键信息库进行匹配,提取与所述关键信息库中的信息相匹配的字段作为该类别分段的关键字段;将提取的各个类别分段的关键字段以设定的格式组成所述当前简历邮件的简要信息;以及
所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选,具体包括:
若根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件,则将所述当前简历邮件及其简要信息发送至所述收件地址对应的简历接收邮箱中。
2.如权利要求1所述的方法,其特征在于,所述当前简历邮件的招聘职位根据如下方法确定:
分析所述当前简历邮件的简历邮件内容,包括:邮件标题、邮件正文、附件,从所述简历邮件内容中提取招聘职位的信息;或者,
对于每个招聘职位,将所述简历邮件内容与该招聘职位对应的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;确定对应当前简历邮件的权重评分最大的招聘职位为当前简历邮件的招聘职位。
3.如权利要求1所述的方法,其特征在于,所述招聘职位相对应的关键词权重列表中的内容是由招聘者预先录入的,包括针对所述招聘职位设置的关键词以及该关键词的权重值;或者,
所述招聘职位的关键词权重列表是根据如下方法预先确定出的:
获取预先经招聘者评分,且评分高于设定的评分阈值的、至少设定数量的所述招聘职位的简历邮件作为训练语料;统计所述训练语料中所包含的词语,以及每个词语的词频;
从统计出的词语中剔除副词,以及所述招聘职位所属行业的行业通用关键词后,选取词频超过设定阈值的词语作为针对所述招聘职位设置的关键词;并
根据每个选取的关键词的词频为该关键词设置权重值。
4.如权利要求3所述的方法,其特征在于,所述关键词权重列表中还包括:行业通用关键词及其权重值。
5.如权利要求4所述的方法,其特征在于,所述根据获取的权重值确定出所述当前简历邮件的权重评分,具体包括:
将获取的权重值累加得到所述当前简历邮件的权重评分。
6.如权利要求1-5任一所述的方法,其特征在于,在所述解析出简历邮件信息后,还包括:根据所述收件地址在数据库中查找到对应的用户标识UID;以及
所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选,具体包括:
若根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件,则将所述当前简历邮件向对应所述UID登记的简历接收邮箱进行转发。
7.如权利要求1-5任一所述的方法,其特征在于,所述当前简历邮件是在所述当前简历邮件到达所述收件地址所指示的简历接收邮箱之前获取的;以及
所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选,具体包括:
若根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件,则将所述当前简历邮件发送到所述收件地址所指示的简历接收邮箱中。
8.如权利要求6所述的方法,其特征在于,所述收件地址中包括前/后缀信息和对应所述UID登记的简历接收邮箱地址;以及
所述根据所述收件地址在数据库中查找到对应的UID,具体包括:
在数据库中查找到与所述收件地址中剔除前/后缀信息后得到的邮箱地址对应记录的UID。
9.如权利要求8所述的方法,其特征在于,所述前/后缀信息具体为渠道标识符;以及
在所述解析出简历邮件信息后,还包括:
从所述收件地址中提取出渠道标识符;并根据提取出的渠道标识符确定出所述当前简历邮件的来源渠道权重评分;以及
所述根据获取的权重值确定出所述当前简历邮件的权重评分,具体包括:
将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
10.如权利要求6所述的方法,其特征在于,在所述解析出简历邮件信息后,还包括:
从数据库中查找出对应于所述简历接收邮箱地址的至少一级好友关系的好友邮箱的地址;在确定出其中一个好友邮箱的地址与所述发件地址相同后,根据该好友邮箱与所述简历接收邮箱地址的好友关系的级数确定所述当前简历邮件的来源渠道权重评分;以及
所述根据获取的权重值确定出所述当前简历邮件的权重评分,具体包括:
将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
11.如权利要求6所述的方法,其特征在于,所述对应所述UID登记的简历接收邮箱为多个,分别与所述UID登记的各招聘职位相对应;以及
将所述当前简历邮件向对应所述UID登记的简历接收邮箱进行转发,具体包括:
将所述当前简历邮件向与所述招聘职位对应的简历接收邮箱进行转发;以及
所述当前简历邮件的招聘职位根据如下方法确定:
根据当前简历邮件的收件地址,在数据库中查找到对应的UID,以及对应的简历接收邮箱;确定与查找到的简历接收邮箱相对应的招聘职位为当前简历邮件的招聘职位。
12.如权利要求1-5任一所述的方法,其特征在于,所述关键词权重列表中针对每个关键词还记录有该关键词所属类别;以及
所述将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配,具体包括:
对于每个类别分段,将该类别分段与所述关键词权重列表中类别与该类别分段所属类别相同的关键词进行匹配。
13.如权利要求12所述的方法,其特征在于,在所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选之后,还包括:
每隔设定时间段,将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到所述收件地址对应的简历接收邮箱;
其中,若判定当前简历邮件的权重评分高于设定的第二权重评分阈值,则符合合并条件。
14.一种简历邮件筛选系统,其特征在于,包括:
简历邮件接收模块,用于在获取到当前简历邮件后,从中解析出简历邮件信息,包括:简历邮件内容、收件地址和发件地址;
简历邮件分析模块,用于从所述简历邮件接收模块接收当前简历邮件的简历邮件内容,并获取所述当前简历邮件的招聘职位相对应的关键词权重列表;将所述简历邮件内容与获取的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;
简历邮件推送模块,用于从所述简历邮件分析模块接收当前简历邮件的权重评分,并根据接收的当前简历邮件的权重评分对所述当前简历邮件进行筛选;
所述简历邮件分析模块还用于从所述简历邮件内容中提取出简历文件后,将提取出的简历文件转换为结构化文本,并将转换的结构化文本进行类别分段;对于每个类别分段,将该类别分段的结构化文本与该类别分段所属类别所对应的关键信息库进行匹配,提取与所述关键信息库中的信息相匹配的字段作为该类别分段的关键字段;将提取的各类别分段的关键字段以设定的格式组成所述当前简历邮件的简要信息;以及
所述简历邮件推送模块还用于在根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件时,将所述当前简历邮件及其简要信息发送至所述收件地址对应的简历接收邮箱中。
15.如权利要求14所述的系统,其特征在于,
所述简历邮件分析模块还用于分析所述当前简历邮件的简历邮件内容,包括:邮件标题、邮件正文、附件,从所述简历邮件内容中提取招聘职位的信息;或者,
所述简历邮件分析模块还用于对于每个招聘职位,将所述简历邮件内容与该招聘职位对应的关键词权重列表中的关键词进行匹配后,从所述关键词权重列表中获取匹配的关键词的权重值,并根据获取的权重值确定出所述当前简历邮件的权重评分;确定对应当前简历邮件的权重评分最大的招聘职位为当前简历邮件的招聘职位。
16.如权利要求14所述的系统,其特征在于,还包括:权重列表生成模块;
所述权重列表生成模块用于对于每个招聘职位,接收招聘者录入的针对该招聘职位设置的关键词以及该关键词的权重值,并根据接收的内容生成所述招聘职位的关键词权重列表;或者,
所述权重列表生成模块用于对于每个招聘职位,获取预先经招聘者评分,且评分高于设定的评分阈值的、至少设定数量的该招聘职位的简历邮件作为训练语料;统计所述训练语料中所包含的词语,以及每个词语的词频;从统计出的词语中剔除副词,以及该招聘职位所属行业的行业通用关键词后,选取词频超过设定阈值的词语作为针对该招聘职位设置的关键词;并根据每个选取的关键词的词频为该关键词设置权重值。
17.如权利要求16所述的系统,其特征在于,所述关键词权重列表中还包括:行业通用关键词及其权重值。
18.如权利要求14-17任一所述的系统,其特征在于,
所述简历邮件接收模块还用于根据所述收件地址在数据库中查找到对应的UID;以及
所述简历邮件推送模块具体用于在根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件时,将所述当前简历邮件向对应所述UID登记的简历接收邮箱进行转发。
19.如权利要求14-17任一所述的系统,其特征在于,所述当前简历邮件是由所述简历邮件接收模块在到达所述收件地址所指示的简历接收邮箱之前获取的;以及
所述简历邮件推送模块具体用于在根据所述当前简历邮件的权重评分判定所述当前简历邮件符合筛选条件时,将所述当前简历邮件发送到所述收件地址所指示的简历接收邮箱中。
20.如权利要求18所述的系统,其特征在于,所述收件地址中包括前/后缀信息和对应所述UID登记的简历接收邮箱地址;以及
所述简历邮件接收模块具体用于在数据库中查找到与所述收件地址中剔除前后/缀信息后得到的邮箱地址对应记录的UID。
21.如权利要求20所述的系统,其特征在于,所述前/后缀信息具体为渠道标识符;以及
所述简历邮件接收模块还用于在所述解析出简历邮件信息后,从所述收件地址中提取出渠道标识符;以及
所述简历邮件分析模块还用于根据提取出的渠道标识符确定出所述当前简历邮件的来源渠道权重评分;并将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
22.如权利要求18所述的系统,其特征在于,
所述简历邮件接收模块还用于在所述解析出简历邮件信息后,从数据库中查找出对应于所述简历接收邮箱地址的至少一级好友关系的好友邮箱的地址;以及
所述简历邮件分析模块还用于在确定出其中一个好友邮箱的地址与所述发件地址相同后,根据该好友邮箱与所述简历接收邮箱地址的好友关系的级数确定所述当前简历邮件的来源渠道权重评分;并将获取的权重值累加后,与所述来源渠道权重评分相加得到所述当前简历邮件的权重评分。
23.如权利要求18所述的系统,其特征在于,所述对应所述UID登记的简历接收邮箱为多个,分别与所述UID登记的各招聘职位相对应;以及
所述简历邮件推送模块具体用于将所述当前简历邮件向与所述招聘职位对应的简历接收邮箱进行转发;以及
所述简历邮件分析模块还用于根据当前简历邮件的收件地址,在数据库中查找到对应的UID,以及对应的简历接收邮箱;确定与查找到的简历接收邮箱相对应的招聘职位为当前简历邮件的招聘职位。
24.如权利要求14-17任一所述的系统,其特征在于,所述关键词权重列表中针对每个关键词还记录有该关键词所属类别;以及
所述简历邮件分析模块具体用于对于每个类别分段,将该类别分段与所述关键词权重列表中类别与该类别分段所属类别相同的关键词进行匹配。
25.如权利要求24所述的系统,其特征在于,
所述简历邮件推送模块还用于在所述根据所述当前简历邮件的权重评分对所述当前简历邮件进行筛选之后,每隔设定时间段,将不符合筛选条件但符合合并条件的简历邮件合并成一份邮件发送到所述收件地址对应的简历接收邮箱;
其中,若判定当前简历邮件的权重评分高于设定的第二权重评分阈值,则符合合并条件。
CN201310598050.XA 2013-11-22 2013-11-22 简历邮件筛选系统及方法 Active CN103634420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310598050.XA CN103634420B (zh) 2013-11-22 2013-11-22 简历邮件筛选系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310598050.XA CN103634420B (zh) 2013-11-22 2013-11-22 简历邮件筛选系统及方法

Publications (2)

Publication Number Publication Date
CN103634420A CN103634420A (zh) 2014-03-12
CN103634420B true CN103634420B (zh) 2017-07-28

Family

ID=50215035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310598050.XA Active CN103634420B (zh) 2013-11-22 2013-11-22 简历邮件筛选系统及方法

Country Status (1)

Country Link
CN (1) CN103634420B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104980469A (zh) * 2014-04-10 2015-10-14 阿里巴巴集团控股有限公司 一种提取邮件的方法及系统
CN105183742A (zh) * 2015-06-12 2015-12-23 南京富士通南大软件技术有限公司 一种简历识别方法
CN106713114B (zh) * 2015-11-17 2020-12-11 阿里巴巴集团控股有限公司 一种核验信息处理方法及设备
CN107291715A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 简历评估方法和装置
CN107392668A (zh) * 2017-07-26 2017-11-24 爱爱网(深圳)电子商务有限公司 资讯显示封面女郎图片和信息的方法
CN107391748A (zh) * 2017-08-14 2017-11-24 深圳新闻网传媒股份有限公司 问答政管理方法、装置、系统及计算机可读存储介质
CN107665383A (zh) * 2017-10-26 2018-02-06 北京拉勾科技有限公司 一种简历处理延时模型的构建方法和计算设备
CN108897726B (zh) * 2018-05-03 2021-11-16 平安科技(深圳)有限公司 一种电子简历的创建方法、存储介质和服务器
CN108710657A (zh) * 2018-05-11 2018-10-26 广州松榛企业管理有限公司 一种企业员工招聘用简历自动管理系统
CN108984507A (zh) * 2018-08-03 2018-12-11 四川民工加网络科技有限公司 流动性工人的简历生成方法及装置
CN109740147B (zh) * 2018-12-14 2023-08-04 国云科技股份有限公司 一种大数量人才简历去重匹配分析方法
CN109684441A (zh) * 2018-12-21 2019-04-26 义橙网络科技(上海)有限公司 对职位和简历进行匹配的方法、系统、设备和介质
CN110020327A (zh) * 2019-04-16 2019-07-16 上海大易云计算股份有限公司 一种基于垂直搜索引擎的简历解析系统
CN110069603A (zh) * 2019-04-17 2019-07-30 北京军融英杰信息技术服务有限公司 简历快速处理方法、装置及电子设备
CN110084571A (zh) * 2019-05-08 2019-08-02 软通智慧科技有限公司 一种简历筛选方法、装置、服务器和介质
CN110417855A (zh) * 2019-06-18 2019-11-05 衢州学院 一种基于物联网应用的高档社区用智慧管理公告屏
CN112256877A (zh) * 2019-12-30 2021-01-22 北京来也网络科技有限公司 结合rpa和ai的简历筛选方法、装置、设备及存储介质
CN111339285B (zh) * 2020-02-18 2023-05-26 北京网聘咨询有限公司 基于bp神经网络的企业简历筛选方法和系统
CN111597441B (zh) * 2020-05-06 2023-04-18 北京字节跳动网络技术有限公司 信息处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546331A (zh) * 2009-05-07 2009-09-30 刘健 获取有助检索的特征、评价相关事物的价值的系统及方法
CN101937432A (zh) * 2009-06-29 2011-01-05 刘健 一种按照供需信息进行两方撮合的系统与方法
CN102117323A (zh) * 2011-02-21 2011-07-06 深圳埃斯欧纳信息咨询有限公司 一种推荐求职简历的处理方法和系统
CN102243631A (zh) * 2010-05-13 2011-11-16 吴春尧 超关键字分布式搜索方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4923604B2 (ja) * 2006-02-13 2012-04-25 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7814112B2 (en) * 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546331A (zh) * 2009-05-07 2009-09-30 刘健 获取有助检索的特征、评价相关事物的价值的系统及方法
CN101937432A (zh) * 2009-06-29 2011-01-05 刘健 一种按照供需信息进行两方撮合的系统与方法
CN102243631A (zh) * 2010-05-13 2011-11-16 吴春尧 超关键字分布式搜索方法
CN102117323A (zh) * 2011-02-21 2011-07-06 深圳埃斯欧纳信息咨询有限公司 一种推荐求职简历的处理方法和系统

Also Published As

Publication number Publication date
CN103634420A (zh) 2014-03-12

Similar Documents

Publication Publication Date Title
CN103634420B (zh) 简历邮件筛选系统及方法
CN104463552B (zh) 日历提醒生成方法和装置
CN101251837B (zh) 电子文件列表的显示处理方法和系统
US9171070B2 (en) Method for classifying unknown electronic documents based upon at least one classificaton
Cormack et al. Feature engineering for mobile (SMS) spam filtering
CN103514174B (zh) 一种文本分类方法和装置
JP5775348B2 (ja) エンティティ類似度の算出方法
JP2011227889A (ja) 拡張されたエンティティ抽出を基礎とするメッセージ及び会話間の意味的類似性の計算方法
JP2007149094A (ja) 電子メールオーガナイザー
CA2682585A1 (en) Open profile content identification
EP1736901A3 (en) Method for classifying sub-trees in semi-structured documents
EP2605154A1 (en) Method and system for providing information
US7788576B1 (en) Grouping of documents that contain markup language code
US20090276411A1 (en) Issue trend analysis system
CN108009297A (zh) 基于自然语言处理的文本情感分析方法与系统
CN106156105A (zh) 电子邮件聚合分类方法和装置
Woitaszek et al. Identifying junk electronic mail in Microsoft outlook with a support vector machine
Bhat et al. Classification of email using BeaKS: Behavior and keyword stemming
CN105955990A (zh) 一种兼顾多样性和有效性的评论排序和筛选方法
CN105243095A (zh) 一种基于微博文本的情绪分类方法及系统
CN110048936A (zh) 一种语义关联词判断垃圾邮件的方法
Cukier et al. Genres of spam: Expectations and deceptions
CN103365898B (zh) 一种好友信息分享的处理方法和系统
CN1987909B (zh) 一种提纯贝叶斯垃圾邮件的方法、系统及装置
O’Brien et al. Comparing SpamAssassin with CBDF email filtering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Xie Xiaoxue

Inventor after: Sun Jie

Inventor after: Zhao Yong

Inventor before: Chen Lijie

Inventor before: Luo Fei

TA01 Transfer of patent application right

Effective date of registration: 20170704

Address after: Blue city in Guangdong province Jieyang 515527 Long Wei Zhen Jiedong Cun Xia Cun Gao Tian San Xiang No. eleven step

Applicant after: Xie Xiaoxue

Applicant after: Sun Jie

Applicant after: Zhao Yong

Address before: 100080, room 1, building 3, Haidian Avenue, Haidian District, Beijing,

Applicant before: BEIJING JIKE YOUCAI TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20181227

Address after: 277100 Zhongxing Lake City 2 building, Qi Cun town, Shizhong District, Zaozhuang, Shandong

Patentee after: ZAOZHUANG JIUYI ELECTRONIC TECHNOLOGY CO.,LTD.

Address before: 515527 No. 11, No. 3 Lane, Butian, Xia Village, Gaoming Village, Longwei Town, Lancheng District, Jieyang City, Guangdong Province

Co-patentee before: Sun Jie

Patentee before: Xie Xiaoxue

Co-patentee before: Zhao Yong

TR01 Transfer of patent right
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190301

Address after: 230000 B-1512, west of Ganquan Road, Shushan District, Hefei, Anhui.

Patentee after: ANHUI YINGLONG INDUSTRIAL DESIGN Co.,Ltd.

Address before: 277100 Zhongxing Lake City 2 building, Qi Cun town, Shizhong District, Zaozhuang, Shandong

Patentee before: ZAOZHUANG JIUYI ELECTRONIC TECHNOLOGY CO.,LTD.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191015

Address after: 314000 NO.3-4, yuejingzhuang erjiefang, no.1508, ziye East Road, Wuzhen Town, Tongxiang City, Jiaxing City, Zhejiang Province

Patentee after: Tanjiawan Heritage Park Operation Management (Wuzhen, Tongxiang) Co.,Ltd.

Address before: Ganquan road Shushan District of Hefei City, Anhui Province, 230000 West hillock road to the South Wild Garden commercial office building room B-1512

Patentee before: ANHUI YINGLONG INDUSTRIAL DESIGN Co.,Ltd.

PP01 Preservation of patent right

Effective date of registration: 20230609

Granted publication date: 20170728

PP01 Preservation of patent right