CN111460174A - 基于实体知识推理的简历异常检测方法及系统 - Google Patents
基于实体知识推理的简历异常检测方法及系统 Download PDFInfo
- Publication number
- CN111460174A CN111460174A CN202010260582.2A CN202010260582A CN111460174A CN 111460174 A CN111460174 A CN 111460174A CN 202010260582 A CN202010260582 A CN 202010260582A CN 111460174 A CN111460174 A CN 111460174A
- Authority
- CN
- China
- Prior art keywords
- resume
- structured
- entities
- knowledge
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于实体知识推理的简历异常检测方法及系统,所述方法包括:对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈,本发明可通过形成知识图谱并基于知识图谱进行简历实体知识推理确定简历信息的内容是否存在异常,提高简历信息中异常检测的准确度和效率,节省人力成本。
Description
技术领域
本发明涉及简历信息处理技术领域,尤其涉及一种基于实体知识推理的简历异常检测方法及系统。
背景技术
在简历招聘领域,确定应聘者提供的简历信息上描述的经历是否属实是一个比较耗时耗力的工作,现在的简历招聘对此的解决方式通常是采用背景调查,但是背景调查过程强烈依赖于工作人员的专业和尽职程度。同时,工作人员在针对简历进行调查时,也没有办法针对细节的内容,特别是专业领域的内容进行详细调查,因为工作人员往往不是这个该专业领域的专业人士。因此,现有的招聘过程中,背景调查的效果往往不能尽如人意,甚至完全不起作用,仍然无法有效确定应聘者的简历信息中描述的经历是否属实。
发明内容
本发明的一个目的在于提供一种基于实体知识推理的简历异常检测方法,通过形成知识图谱并基于知识图谱进行简历实体知识推理确定简历信息的内容是否存在异常,提高简历信息中异常检测的准确度和效率,节省人力成本。本发明的另一个目的在于提供一种基于实体知识推理的简历异常检测系统。本发明的再一个目的在于提供一种计算机设备。本发明的还一个目的在于提供一种可读介质。
为了达到以上目的,本发明一方面公开了一种基于实体知识推理的简历异常检测方法,包括:
对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;
基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;
基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。
优选的,所述对多个简历信息分别进行结构化信息提取得到多个结构化简历具体包括:
通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体;
根据所述结构化字段和对应的简历实体形成结构化简历。
优选的,所述基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱具体包括:
根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱;
根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。
优选的,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱具体包括:
确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
优选的,所述检测规则包括以下规则的至少之一:
个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。
本发明还公开了一种基于实体知识推理的简历异常检测系统,包括:
结构化提取单元,用于对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;
知识图谱关联单元,用于基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;
异常检测单元,用于基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。
优选的,所述结构化提取单元具体用于通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体,根据所述结构化字段和对应的简历实体形成结构化简历。
优选的,所述知识图谱关联单元具体用于根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱,根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。
优选的,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述知识图谱关联单元具体用于确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
优选的,所述检测规则包括以下规则的至少之一:
个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。
本发明还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,
所述处理器执行所述程序时实现如上所述方法。
本发明还公开了一种计算机可读介质,其上存储有计算机程序,
该程序被处理器执行时实现如上所述方法。
本发明通过对简历信息进行结构化信息抽取得到结构化简历。将结构化简历根据预设的特征类别提取相应的结构化字段和简历实体形成不同特征类别的知识图谱,并进一步将形成的多个知识图谱相关联,从而对不同特征类别中关联的知识图谱进行知识推理,实现对于不同特征类别有针对性的异常检测。进一步基于预设检测规则对关联知识图谱进行异常检测可得到异常检测结果,即本发明可根据工作人员自定义的检测规则进行异常检测,实现检测规则的可配置。对于专业领域性强的简历信息,可设置符合专利特性的检测规则,进行有针对性的异常分析检测,有助于提高简历异常及虚假信息检测的准确度和效率。本发明可对简历信息进行自动异常检测及预警,无需人为判断,节省人力成本,为工作人员的招聘工作提供便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明基于实体知识推理的简历异常检测方法一个具体实施例的流程图;
图2示出本发明基于实体知识推理的简历异常检测方法一个具体实施例中S100的流程图;
图3示出本发明基于实体知识推理的简历异常检测方法一个具体实施例中非结构化简历的示意图;
图4示出本发明基于实体知识推理的简历异常检测方法一个具体实施例中结构化简历的示意图;
图5示出本发明基于实体知识推理的简历异常检测方法一个具体实施例中S200的流程图;
图6示出本发明基于实体知识推理的简历异常检测系统一个具体实施例的结构图;
图7示出适于用来实现本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的一个方面,本实施例公开了一种基于实体知识推理的简历异常检测方法。如图1所示,本实施例中,所述方法包括:
S100:对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体。
S200:基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中关联知识图谱。
S300:基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。
本发明通过对简历信息进行结构化信息抽取得到结构化简历。将结构化简历根据预设的特征类别提取相应的结构化字段和简历实体形成不同特征类别的知识图谱,并进一步将形成的多个知识图谱相关联,从而对不同特征类别中关联的知识图谱进行知识推理,实现对于不同特征类别有针对性的异常检测。进一步基于预设检测规则对关联知识图谱进行异常检测可得到异常检测结果,即本发明可根据工作人员自定义的检测规则进行异常检测,实现检测规则的可配置。对于专业领域性强的简历信息,可设置符合专利特性的检测规则,进行有针对性的异常分析检测,有助于提高简历异常及虚假信息检测的准确度和效率。本发明可对简历信息进行自动异常检测及预警,无需人为判断,节省人力成本,为工作人员的招聘工作提供便利。
在优选的实施方式中,如图2所示,所述S100具体可包括:
S110:通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体。其中,实体是指自然语言处理中的命名实体,指的是具备特定意义的可在现实世界中对应的事实的名称,则简历实体即为简历信息中与现实世界中对应的事实的名称。
S120:根据所述结构化字段和对应的简历实体形成结构化简历。
在一个具体例子中,对于如图3所示的简历,可以通过结构化提取模型提取得到简历实体,形成结构化简历。在一些实施例中,简历信息可以是WORD或PDF等形式的文档,对于WORD形式的文档,可以直接识别得到简历实体,对于PDF形式的文档,可以通过OCR或机器学习模型等技术进行文字识别得到文本信息,然后通过结构化提取模型,对简历实体进行特征分析,与结构化简历中预设结构化字段进行匹配,根据结构化字段与匹配的简历实体形成结构化简历。例如,从简历信息中提取得到“女”这个简历实体,通过结构化提取模型可确定与“女”对应的结构化字段为“性别”。根据识别得到的所有简历实体与对应的结构化字段形成结构化简历,如图4所示。
可以理解的是,在该优选的实施方式中,为了实现简历实体的识别和提高识别准确度,通过预设的结构化提取模型进行简历实体的提取。优选的,可以通过机器学习原理形成结构化提取模型,对简历信息进行自动的结构化信息提取,可提高识别的简历实体与预设结构化字段匹配的准确度。
在优选的实施方式中,如图5所示,所述S200具体可包括:
S210:根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱。
S220:根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。
可以理解的是,在该优选的实施方式中,特征类别可以理解为是与一系列结构化字段对应的预先分类,通过设置特征类别可以对结构化简历中的一系列结构化字段和对应的简历实体进行抽取得到不同特征类别的知识图谱。进一步根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱,形成不同数据维度的关联知识图谱,通过对不同数据维度的关联知识图谱进行异常检测分析可以实现多维度数据的数据分析,可通过多种分析方式进行异常检测,可提高异常检测的准确率。
在本发明的一个或多个实施例中,特征类别可以包括职业发展和技能等多种类别中的至少一种。其中,对于职业发展的特征类别,可预先确定与职业发展的特征类别对应的公司、职位和薪资等结构化字段,则可从结构化简历中提取公司、职位和薪资等结构化字段和对应的简历实体形成职业发展的知识图谱。
可根据不同人员的简历信息以及不同来源得到的不同版本简历信息得到多个知识图谱形成知识图谱集,确定多个知识图谱中异常检测字段对应的简历实体相同的知识图谱为关联知识图谱。例如,对于职业发展的知识图谱,检测现有的知识图谱集中预设异常检测字段对应的简历实体,若多个职业发展的知识图谱中公司的结构化字段对应的公司名字的简历实体相同,则将该多个职业发展的知识图谱设为关联知识图谱。
在优选的实施方式中,所述结S220具体可包括:
S221:确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
本发明通过特征类别提取结构化简历中的结构化字段和简历实体形成不同特征类别的知识图谱,在提取得到的一个或多个特征类别的知识图谱中,通过设定异常检测的选定简历实体将具有相同简历实体的知识图谱确定为关联知识图谱,实现简历信息的横向关联和分析。
在该优选的实施方式中,所述结构化字段的类型包括简历版本、人员身份和职业发展。根据简历版本、人员身份和职业发展中的至少一种结构化字段可以得到不同的关联知识图谱。其中,根据人员身份和简历版本可以确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,可对应聘者提供的一个版本的简历信息进行异常检测。再例如,职业发展类型的结构化字段包括公司和职位等,对于大量不同个人的职业发展分析类别的知识图谱,当设定的选定简历实体为公司和职位对应的简历实体时,可得到任职于同一个公司、同一个职位的不同个人关联知识图谱,则分析关联知识图谱中其他结构化字段对应的简历实体,可确定应聘者简历信息中职业发展的简历内容是否存在异常。例如,通过对比分析任职于同一个公司、同一个职位的不同个人关联知识图谱中的薪资结构化字段对应的简历实体可确定应聘者简历中填写的薪资水平是否异常,其中,可以设定不同薪资的正常波动范围以确定薪资水平是否异常。
此外,应聘者在不同时间、不同网络或不同平台可能均会提供一份简历信息,则形成不同来源的多个版本的简历信息。在分析时,可根据人员身份和简历版本等结构化字段关联不同来源的不同版本简历信息得到个人不同版本关联知识图谱,从而可对不同版本的简历信息进行异常检测,确定应聘者在不同平台上提供的简历信息是否一致。由此,对于应聘者简历的分析不同局限于对于每个人简历的单独分析,而是综合所有相关的不同分析类别、不同版本或不同个人的知识图谱进行分析,提高异常分析的准确度。
在优选的实施方式中,所述检测规则包括以下规则的至少之一:个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。
关联知识图谱可包括通过以下三个方式得到的三个类型的关联知识图谱:确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
可以理解的是,检测规则可以包括采用通过数据逻辑性分析的数据驱动的检测规则,也可以包括工作人员人为制定的专业检测规则,本发明融合不同的检测规则可以实现对于关联知识图谱的灵活检测。
具体的,对于一个应聘者个人同版本关联知识图谱的分析可以通过根据结构化字段的属性特征设定预设合理范围,当简历实体在预设合理范围内,则认为是正常的,否则认为是异常的,以确定应聘者一个版本的简历信息中是否存在异常,可通过数据驱动的检测规则,也可以通过设置专业检测规则进行检测。例如,对于职业发展特征类别的知识图谱,可以通过检测预设时间范围内的各职业发展的简历实体是否在正常范围内的专业检测规则进行分析,即可设置检测规则为在一年时间内掌握的职业技能小于10个为正常为,超过10个则被认定可能存在虚报等异常情况。在其他例子中,也可以为简历实体设置合理数值范围进行基于数据驱动检测规则的异常检测。
对于个人不同版本关联知识图谱的分析可以通过确定不同简历版本间相同结构化字段的简历实体是否保持一致以分析应聘者在不同时间、不同平台或不同网站提供的简历信息是否一致,若不一致,可能存在虚拟等异常情况。在此过程中,对于个人不同版本关联知识图谱的分析可以通过比对简历实体的数值是否一致的数据驱动检测规则实现。在其他实施方式中,也可以通过工作人员人为制定并输入的专业检测规则确定应聘者在不同时间、不同平台或不同网站提供的简历信息是否一致。其中,一致是指相比较的两个对象在差值在预设范围内,而并非仅仅表示完全一致的情形,当两个简历实体的数据差值在预设范围内,即认为两个简历实体一致,该预设范围可根据需要灵活设置,在此不做限定。
对于不同应聘者的不同简历信息形成的不同个人关联知识图谱的分析可以通过分析关联知识图谱相对应的简历实体是否符合聚类特性,即通过数据驱动的检测规则确定关联知识图谱是否存在异常。关联知识图谱的某些简历实体由于具有类似的发展进程而呈现出类似的特征,因此,可以通过聚类特性分析的方式确定关联知识图谱中是否存在特征与其他知识图谱不同的简历实体,若是,则认为其表现出的特征不符合相同条件下的正常水平,则确定该简历实体异常。
需要说明的是,在实际应用中,本领域技术人员可根据实际情况灵活配置检测规则,检测规则并不仅限于以上列举的几种情况,采用其他预设检测规则的基本相同发明构思的技术方案也理应在本发明的保护范围内。
本发明通过根据特征类别对结构化简历进行精细化分类,提高分析效率。并且根据预设的结构化字段形成不同特征类别的关联知识图谱,对知识图谱进行聚类,形成可供分析的群体简历图谱,引入了不同版本、不同应聘者的数据进行横向及纵向的综合分析,对简历信息进行全面的异常检测,异常检测的结果准确,效率高。本发明综合了数据驱动自动检测的准确性和人为设定检测规则的科学性的优点,对简历信息的异常检测的规则灵活、准确度高。
基于相同原理,本实施例还公开了一种基于实体知识推理的简历异常检测系统。如图6所示,本实施例中,所述系统包括结构化提取单元11、知识图谱关联单元12和异常检测单元13。
其中,所述结构化提取单元用于对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体。
所述知识图谱关联单元用于基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱。
异常检测单元,用于基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。
在优选的实施方式中,所述结构化提取单元11具体用于通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体,根据所述结构化字段和对应的简历实体形成结构化简历。
在优选的实施方式中,所述知识图谱关联单元12具体用于根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱,根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。
在优选的实施方式中,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述知识图谱关联单元12具体用于确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
在优选的实施方式中,所述检测规则包括以下规则的至少之一:
个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。
由于该系统解决问题的原理与以上方法类似,因此本系统的实施可以参见方法的实施,在此不再赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备,具体的,计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中计算机设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法。
下面参考图7,其示出了适于用来实现本申请实施例的计算机设备600的结构示意图。
如图7所示,计算机设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶反馈器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (12)
1.一种基于实体知识推理的简历异常检测方法,其特征在于,包括:
对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;
基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;
基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。
2.根据权利要求1所述的简历异常检测方法,其特征在于,所述对多个简历信息分别进行结构化信息提取得到多个结构化简历具体包括:
通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体;
根据所述结构化字段和对应的简历实体形成结构化简历。
3.根据权利要求1所述的简历异常检测方法,其特征在于,所述基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱具体包括:
根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱;
根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。
4.根据权利要求1所述的简历异常检测方法,其特征在于,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱具体包括:
确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
5.根据权利要求1所述的简历异常检测方法,其特征在于,所述检测规则包括以下规则的至少之一:
个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。
6.一种基于实体知识推理的简历异常检测系统,其特征在于,包括:
结构化提取单元,用于对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;
知识图谱关联单元,用于基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;
异常检测单元,用于基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。
7.根据权利要求6所述的简历异常检测系统,其特征在于,所述结构化提取单元具体用于通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体,根据所述结构化字段和对应的简历实体形成结构化简历。
8.根据权利要求6所述的简历异常检测系统,其特征在于,所述知识图谱关联单元具体用于根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱,根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。
9.根据权利要求8所述的简历异常检测系统,其特征在于,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述知识图谱关联单元具体用于确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。
10.根据权利要求9所述的简历异常检测系统,其特征在于,所述检测规则包括以下规则的至少之一:
个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。
11.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述程序时实现如权利要求1-5任一项所述方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,
该程序被处理器执行时实现如权利要求1-5任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010260582.2A CN111460174A (zh) | 2020-04-03 | 2020-04-03 | 基于实体知识推理的简历异常检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010260582.2A CN111460174A (zh) | 2020-04-03 | 2020-04-03 | 基于实体知识推理的简历异常检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111460174A true CN111460174A (zh) | 2020-07-28 |
Family
ID=71683574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010260582.2A Pending CN111460174A (zh) | 2020-04-03 | 2020-04-03 | 基于实体知识推理的简历异常检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111460174A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914101A (zh) * | 2020-08-17 | 2020-11-10 | 南方电网数字电网研究院有限公司 | 档案关联关系的异常识别方法、装置和计算机设备 |
CN113434687A (zh) * | 2021-07-22 | 2021-09-24 | 高向咨询(深圳)有限公司 | 自动简历查找方法、自动招聘系统、计算机存储介质 |
CN114117079A (zh) * | 2021-12-07 | 2022-03-01 | 宁安市伟恒互联网信息服务有限公司 | 基于大数据分析拦截的拦截反馈处理方法及信息拦截系统 |
CN114841247A (zh) * | 2022-03-31 | 2022-08-02 | 前锦网络信息技术(上海)有限公司 | 一种恶意用户识别方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140207712A1 (en) * | 2013-01-22 | 2014-07-24 | Hewlett-Packard Development Company, L.P. | Classifying Based on Extracted Information |
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
CN108985707A (zh) * | 2018-06-11 | 2018-12-11 | 安徽引航科技有限公司 | 一种快速判断简历内容真实性的方法 |
CN109816397A (zh) * | 2018-12-03 | 2019-05-28 | 北京奇艺世纪科技有限公司 | 一种欺诈判别方法、装置及存储介质 |
CN110348719A (zh) * | 2019-06-29 | 2019-10-18 | 上海淇毓信息科技有限公司 | 一种基于用户信息知识图谱的风险控制方法、装置和电子设备 |
CN110489513A (zh) * | 2019-06-24 | 2019-11-22 | 覃立万 | 一种智能机器人社交信息处理方法及与人的社交系统 |
CN110516120A (zh) * | 2019-08-27 | 2019-11-29 | 北京明略软件系统有限公司 | 信息处理方法及装置、存储介质、电子装置 |
CN110795574A (zh) * | 2019-11-07 | 2020-02-14 | 北京集奥聚合科技有限公司 | 一种基于金融反欺诈的知识图谱构建方法 |
-
2020
- 2020-04-03 CN CN202010260582.2A patent/CN111460174A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140207712A1 (en) * | 2013-01-22 | 2014-07-24 | Hewlett-Packard Development Company, L.P. | Classifying Based on Extracted Information |
CN108985707A (zh) * | 2018-06-11 | 2018-12-11 | 安徽引航科技有限公司 | 一种快速判断简历内容真实性的方法 |
CN108920544A (zh) * | 2018-06-13 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化职位推荐方法 |
CN109816397A (zh) * | 2018-12-03 | 2019-05-28 | 北京奇艺世纪科技有限公司 | 一种欺诈判别方法、装置及存储介质 |
CN110489513A (zh) * | 2019-06-24 | 2019-11-22 | 覃立万 | 一种智能机器人社交信息处理方法及与人的社交系统 |
CN110348719A (zh) * | 2019-06-29 | 2019-10-18 | 上海淇毓信息科技有限公司 | 一种基于用户信息知识图谱的风险控制方法、装置和电子设备 |
CN110516120A (zh) * | 2019-08-27 | 2019-11-29 | 北京明略软件系统有限公司 | 信息处理方法及装置、存储介质、电子装置 |
CN110795574A (zh) * | 2019-11-07 | 2020-02-14 | 北京集奥聚合科技有限公司 | 一种基于金融反欺诈的知识图谱构建方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914101A (zh) * | 2020-08-17 | 2020-11-10 | 南方电网数字电网研究院有限公司 | 档案关联关系的异常识别方法、装置和计算机设备 |
CN111914101B (zh) * | 2020-08-17 | 2023-10-20 | 南方电网数字电网研究院有限公司 | 档案关联关系的异常识别方法、装置和计算机设备 |
CN113434687A (zh) * | 2021-07-22 | 2021-09-24 | 高向咨询(深圳)有限公司 | 自动简历查找方法、自动招聘系统、计算机存储介质 |
CN114117079A (zh) * | 2021-12-07 | 2022-03-01 | 宁安市伟恒互联网信息服务有限公司 | 基于大数据分析拦截的拦截反馈处理方法及信息拦截系统 |
CN114117079B (zh) * | 2021-12-07 | 2022-10-11 | 中软数智信息技术(武汉)有限公司 | 基于大数据分析拦截的拦截反馈处理方法及信息拦截系统 |
CN114841247A (zh) * | 2022-03-31 | 2022-08-02 | 前锦网络信息技术(上海)有限公司 | 一种恶意用户识别方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111460174A (zh) | 基于实体知识推理的简历异常检测方法及系统 | |
KR102026304B1 (ko) | Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 | |
CN110443657B (zh) | 客户流量数据处理方法、装置、电子设备及可读介质 | |
US8996524B2 (en) | Automatically mining patterns for rule based data standardization systems | |
US20120101870A1 (en) | Estimating the Sensitivity of Enterprise Data | |
CN109472310B (zh) | 确定两份简历为相同人才的识别方法及装置 | |
CN110310012B (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
US10346294B2 (en) | Comparing software projects having been analyzed using different criteria | |
CN110782349A (zh) | 一种模型训练方法和系统 | |
US20170154294A1 (en) | Performance evaluation device, control method for performance evaluation device, and control program for performance evaluation device | |
CN112907358A (zh) | 贷款用户信用评分方法、装置、计算机设备和存储介质 | |
CN110851611A (zh) | 一种隐患数据知识图谱的构建方法及装置、设备、介质 | |
CN113535813A (zh) | 一种数据挖掘方法、装置、电子设备以及存储介质 | |
CN115239214A (zh) | 企业的评估处理方法、装置及电子设备 | |
CN116881395A (zh) | 一种舆情信息检测方法和装置 | |
CN113869789A (zh) | 一种风险监控的方法、装置、计算机设备及存储介质 | |
CN112434071B (zh) | 一种基于数据图谱的元数据血缘关系与影响分析平台 | |
CN111198934A (zh) | 一种信息处理方法及相关设备 | |
CN117668628A (zh) | 对象分类方法和装置、电子设备及存储介质 | |
CN116521871A (zh) | 文件的检测方法、装置、处理器以及电子设备 | |
CN113742450B (zh) | 用户数据等级落标的方法、装置、电子设备和存储介质 | |
CN110727767B (zh) | 一种扩展文本样本的方法及系统 | |
CN111460272A (zh) | 一种文本页面的排序方法及相关设备 | |
CN115689740A (zh) | 基于深度学习的交易异常检测方法及装置 | |
CN109885647B (zh) | 用户履历验证方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220923 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |