CN116596069A - 目标对象图谱构建方法、装置、电子设备及存储介质 - Google Patents

目标对象图谱构建方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116596069A
CN116596069A CN202310611187.8A CN202310611187A CN116596069A CN 116596069 A CN116596069 A CN 116596069A CN 202310611187 A CN202310611187 A CN 202310611187A CN 116596069 A CN116596069 A CN 116596069A
Authority
CN
China
Prior art keywords
target object
information
database
target
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310611187.8A
Other languages
English (en)
Inventor
胡泽婷
路兴
史琬滢
杜强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing E Hualu Information Technology Co Ltd
Original Assignee
Beijing E Hualu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing E Hualu Information Technology Co Ltd filed Critical Beijing E Hualu Information Technology Co Ltd
Priority to CN202310611187.8A priority Critical patent/CN116596069A/zh
Publication of CN116596069A publication Critical patent/CN116596069A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种目标对象图谱构建方法、装置、电子设备及存储介质,其中,该方法包括:根据获取到的目标对象信息,构建初始数据库;根据预设知识融合方法对初始数据库进行处理,得到目标数据库;根据目标数据库,构建目标对象图谱;获取目标对象信息对应的规则变更数据和新增数据;分别根据规则变更数据和新增数据,更新目标对象图谱。通过本申请,解决了相关技术中存在无法实现人才信息的有效整合与关联分析以及没有对知识图谱实时更新,不能满足人才业务最新需求的问题。

Description

目标对象图谱构建方法、装置、电子设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种目标对象图谱构建方法、装置、电子设备及存储介质。
背景技术
现有的人才信息系统中的数据分散在不同的子系统中,数据格式和描述方式各异,无法实现人才信息的有效整合与关联分析。如何突破数据孤岛,实现人才信息资源的全面集成与深度挖掘,是当前人才管理领域亟待解决的问题。另外,现有技术在构建知识图谱后,没有对知识图谱实时更新,无法使知识图谱不断丰富和优化,不能满足当前人才业务的最新需求。
因此,现有技术中存在无法实现人才信息的有效整合与关联分析以及没有对知识图谱实时更新,不能满足人才业务最新需求的问题。
发明内容
本申请提供了一种目标对象图谱构建方法、装置、电子设备及存储介质,以至少解决相关技术中存在无法实现人才信息的有效整合与关联分析以及没有对知识图谱实时更新,不能满足人才业务最新需求的问题。
根据本申请实施例的一个方面,提供了一种目标对象图谱构建方法,该方法包括:
根据获取到的目标对象信息,构建初始数据库;
根据预设知识融合方法对所述初始数据库进行处理,得到目标数据库;
根据所述目标数据库,构建目标对象图谱;
获取所述目标对象信息对应的规则变更数据和新增数据;
分别根据所述规则变更数据和所述新增数据,更新所述目标对象图谱。
根据本申请实施例的另一个方面,还提供了一种目标对象图谱构建装置,该装置包括:
第一构建模块,用于根据获取到的目标对象信息,构建初始数据库;
第一得到模块,用于根据预设知识融合方法对所述初始数据库进行处理,得到目标数据库;
第二构建模块,用于根据所述目标数据库,构建目标对象图谱;
获取模块,用于获取所述目标对象信息对应的规则变更数据和新增数据;
更新模块,用于分别根据所述规则变更数据和所述新增数据,更新所述目标对象图谱。
可选地,更新模块包括:
第一得到单元,用于根据所述规则变更数据调整所述目标对象图谱的结构,得到调整后的目标对象图谱;
第一删减单元,用于删去所述调整后的目标对象图谱中与所述规则变更数据不相关的知识,完成对所述目标对象图谱更新。
可选地,更新模块还包括:
第二得到单元,用于根据所述新增数据,得到新增的目标对象概念信息、所述目标对象概念信息对应的实例以及目标对象之间新增的新关系信息;
映射单元,用于将所述目标对象概念信息、所述实例以及所述新关系信息,映射到所述目标对象图谱中,得到中间目标对象图谱;
处理单元,用于合并所述中间目标对象图谱中的重复实例,并删去所述中间目标对象图谱中的错误实例,完成对所述目标对象图谱更新。
可选地,第二构建模块包括:
生成单元,用于根据所述目标数据库,生成知识图谱本体;
第三得到单元,用于根据所述目标数据库和所述知识图谱本体,得到当前实体关系信息;
第四得到单元,用于根据所述当前实体关系信息,得到新的实体关系信息;
计算单元,用于计算所述目标数据库、所述知识图谱本体以及所述新的实体关系信息中所有知识的置信度;
第二删减单元,用于从所述目标数据库、所述知识图谱本体以及所述新的实体关系中删去置信度小于预设阈值的所述知识,得到删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息;
第五得到单元,用于根据所述删减后的目标数据库、所述删减后的知识图谱本体以及所述删减后的实体关系信息,得到所述目标对象图谱。
可选地,第一得到模块包括:
实体链接单元,用于对所述初始数据库中的实体信息进行实体链接,得到中间数据库;
获取单元,用于获取外部知识库和关系数据库;
合并单元,用于将所述外部知识库、所述关系数据库以及所述中间数据库进行合并,得到所述目标数据库。
可选地,第一构建模块包括:
第六得到单元,用于根据所述目标对象信息,得到目标对象档案信息、档案业务信息以及业务外部信息;
第七得到单元,用于根据所述目标对象档案信息、所述档案业务信息以及所述业务外部信息,得到非结构化资源、结构化资源以及半结构化资源;
第八得到单元,用于根据所述非结构化资源、结构化资源以及半结构化资源,得到实体信息、关系信息以及属性信息;
第九得到单元,用于根据所述实体信息、所述关系信息以及所述属性信息,得到所述初始数据库。
可选地,该装置还包括:
第二得到模块,用于根据所述目标对象图谱,得到待匹配对象图谱和需求对象图谱;
第三得到模块,用于根据所述待匹配对象图谱,得到待匹配对象的特征信息;
第四得到模块,用于根据所述需求对象图谱,得到需求对象的需求信息;
匹配模块,用于根据所述特征信息、所述需求信息以及预设匹配模型,对所述待匹配对象和所述需求对象进行匹配,得到匹配结果。
根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
在本申请实施例中,通过根据获取到的目标对象信息,构建初始数据库;根据预设知识融合方法对初始数据库进行处理,得到目标数据库;根据目标数据库,构建目标对象图谱;获取目标对象信息对应的规则变更数据和新增数据;分别根据规则变更数据和新增数据,更新目标对象图谱。通过上述方法,对目标对象信息进行自动解析、关联和聚合,构建初始数据库。建立知识融合机制,实现初始数据库与其他数据源的结合。利用目标数据库构建目标对象图谱,实现目标对象信息的结构化表达。并设计增量更新机制,利用目标对象信息对应的规则变更数据和新增数据,对目标对象图谱持续更新和优化,实现目标对象图谱与新增业务数据和新增数据的快速融合。通过构建目标对象图谱,实现信息的标准化集成、智能关联与深度理解,释放数据资源的潜在价值,提高了信息管理工作效率。解决了相关技术中存在无法实现人才信息的有效整合与关联分析以及没有对知识图谱实时更新,不能满足人才业务最新需求的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种可选的目标对象图谱构建方法的流程示意图;
图2是根据本申请实施例的一种可选的目标对象图谱构建和更新的流程示意图;
图3是根据本申请实施例的一种可选的基于人才数据的知识图谱示意图;
图4是根据本申请实施例的一种可选的基于岗位数据的知识图谱示意图;
图5是根据本申请实施例的一种可选的目标对象图谱构建装置的结构框图;
图6是根据本申请实施例的一种可选的电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种目标对象图谱构建方法,如图1所示,该方法的流程可以包括以下步骤:
步骤S101,根据获取到的目标对象信息,构建初始数据库。
可选地,目标对象可以为人才、企业等用人单位、岗位等,本实施例以人才为目标对象为例进行说明。获取目标对象信息即获取人才信息,包括:从人事档案系统中定期抽取人才信息,例如:人才的基本信息、工作经历、教育背景、技能特长、培训记录等数据,主要包含五大类信息:基本信息、教育经历、工作经历、专业技术获得情况以及奖惩情况,具体如表1所示。
表1人事档案相关指标
步骤S102,根据预设知识融合方法对初始数据库进行处理,得到目标数据库。
可选地,预设知识融合方法包括实体链接和知识合并两个部分。其中,实体链接是指将初始数据库中抽取到的实体与初始数据库中对应的正确实体对象相联结的操作,主要包括实体消歧和共指消解两个步骤,实体消歧主要是解决同名实体出现歧义的问题,使用较多的方法为聚类法。共指消解则是用于解决多个指向对应一个实体对象的问题,可以采用现有的实体相似性模型、上下文相似性模型解决这一问题。知识合并包括合并外部知识库和关系数据库两个方面,根据上述预设知识融合方法对初始数据库进行处理,得到目标数据库。
步骤S103,根据目标数据库,构建目标对象图谱。
可选地,构建目标对象图谱的过程,主要包括本体构建、知识推理和质量评估三个步骤。根据目标数据库建立知识图谱本体,根据目标数据库和知识图谱本体可以确定已有实体关系,根据已有实体关系发现新的实体关系,受现有技术限制,目标数据库、知识图谱本体以及新的实体关系中的知识元素仍可能存在错误,因此在构建完整的目标对象图谱之前,需要对其进行质量评估,并且通过对其包含知识的可信度进行量化,通过舍弃置信度低的知识来确保目标对象图谱内数据的质量。根据目标数据库和以上三个步骤,可以构建出目标对象图谱。
步骤S104,获取目标对象信息对应的规则变更数据和新增数据。
可选地,以人才为目标对象为例,则目标对象信息及人才信息,则获取目标对象信息对应的规则变更数据,包括:监测人才业务规则的变更,如人才分类标准、技能要求的调整等。这需要关注人才相关规则的更新。获取目标对象信息对应的新增数据,包括:持续收集新的人才业务数据,如新增的人才档案、人才调查问卷等。这需要关注人才业务系统中产生的新数据。
步骤S105,分别根据规则变更数据和新增数据,更新目标对象图谱。
可选地,对目标对象图谱进行更新包括用户需求更新和档案资源更新两个方面,利用规则变更数据进行用户需求更新,利用新增数据进行档案资源更新。通过收集归纳新进档案和用户网页浏览查询痕迹等数据,保持图谱的实时性,同时提高服务精准度,增强图谱适配性。
在本申请实施例中,通过根据获取到的目标对象信息,构建初始数据库;根据预设知识融合方法对初始数据库进行处理,得到目标数据库;根据目标数据库,构建目标对象图谱;获取目标对象信息对应的规则变更数据和新增数据;分别根据规则变更数据和新增数据,更新目标对象图谱。通过上述方法,对目标对象信息进行自动解析、关联和聚合,构建初始数据库。建立知识融合机制,实现初始数据库与其他数据源的结合。利用目标数据库构建目标对象图谱,实现目标对象信息的结构化表达。并设计增量更新机制,利用目标对象信息对应的规则变更数据和新增数据,对目标对象图谱持续更新和优化,实现目标对象图谱与新增业务数据和新增数据的快速融合。通过构建目标对象图谱,实现信息的标准化集成、智能关联与深度理解,释放数据资源的潜在价值,提高了信息管理工作效率。解决了相关技术中存在无法实现人才信息的有效整合与关联分析以及没有对知识图谱实时更新,不能满足人才业务最新需求的问题。
作为一种可选实施例,根据规则变更数据更新目标对象图谱,包括:
根据规则变更数据调整目标对象图谱的结构,得到调整后的目标对象图谱;
删去调整后的目标对象图谱中与规则变更数据不相关的知识,完成对目标对象图谱更新。
可选地,本实施例以人才为目标对象为例进行说明,则目标对象图谱为人才图谱。
根据规则变更数据,可以了解人才业务规则的变更,例如人才分类标准、技能要求的调整等。根据人才业务规则的变更,调整人才图谱的结构,例如修改人才图谱中人才类型、技能或工作经验的概念,增加或删除概念关系等,得到调整后的人才图谱。删除调整后的人才图谱中与根据规则变更数据确定的当前业务不相符的知识,保证人才图谱中知识的准确性,完成对人才图谱即目标对象图谱更新。
另外,对人才图谱进行用户需求更新是一个涉及多方面的系统过程,需要业务监测、数据标注、知识抽取以及调整结构重新进行本体构建等一系列步骤。
上述内容如图2所示,更新层用于对目标对象图谱进行更新,更新层包括:利用上述规则变更数据更新业务需求,利用业务需求反馈修复目标对象图谱,目标对象图谱为业务需求提供服务。
在本申请实施例中,对目标对象图谱进行持续更新,可以使目标对象图谱不断丰富和优化,切合当前业务的最新需求,并且具有更高的实用价值。这是实施以目标对象图谱为基础的智能应用的基础。
作为一种可选实施例,根据新增数据更新目标对象图谱,包括:
根据新增数据,得到新增的目标对象概念信息、目标对象概念信息对应的实例以及目标对象之间新增的新关系信息;
将目标对象概念信息、实例以及新关系信息,映射到目标对象图谱中,得到中间目标对象图谱;
合并中间目标对象图谱中的重复实例,并删去中间目标对象图谱中的错误实例,完成对目标对象图谱更新。
可选地,本实施例以人才为目标对象为例进行说明,则目标对象图谱为人才图谱。
根据新增数据,可以确定新的人才业务数据,例如新增的人才档案、人才调查问卷等。
对新增数据进行标注和抽取,识别新增数据中的人才概念信息、人才概念信息对应的实例,并提取人才之间的新增的新关系信息。将标注结果(包括:人才概念信息、实例以及新关系信息)映射到人才图谱,创建新的人才实例,增加实例之间的新关系,丰富人才图谱的内容,得到中间人才图谱即中间目标对象图谱。合并中间人才图谱中的重复实例,删除中间人才图谱中错误或失效的实例,不断优化知识的质量,完成对人才图谱即目标对象图谱更新。
另外,对人才图谱进行更新会形成人才图谱的新版本,新增的知识会基于原有图谱进行增量更新。并评估新版本的人才图谱的效果,检查新增知识的正确性,为后续进一步完善知识提供依据。因此,对人才图谱的增量更新也是一个涉及多方面的系统工程。它需要业务监测、数据标注、知识抽取以及本体构建等一系列步骤。
上述内容如图2所示,更新层还包括:利用新增数据更新目标对象图谱。
在本申请实施例中,对目标对象图谱进行持续更新,可以使目标对象图谱不断丰富和优化,切合当前业务的最新需求,并且具有更高的实用价值。这是实施以目标对象图谱为基础的智能应用的基础。
作为一种可选实施例,根据目标数据库,构建目标对象图谱,包括:
根据目标数据库,生成知识图谱本体;
根据目标数据库和知识图谱本体,得到当前实体关系信息;
根据当前实体关系信息,得到新的实体关系信息;
计算目标数据库、知识图谱本体以及新的实体关系信息中所有知识的置信度;
从目标数据库、知识图谱本体以及新的实体关系中删去置信度小于预设阈值的知识,得到删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息;
根据删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息,得到目标对象图谱。
可选地,本实施例以人才为目标对象为例进行说明,则目标对象图谱为人才图谱。通过目标数据库可以得到关于人才和岗位一系列基本的事实表达,但事实并不等于知识,因此还需要知识加工,构建人才图谱即目标对象图谱,构建目标对象图谱的过程,主要包括本体构建、知识推理和质量评估三个步骤。
如图2所示,本体构建层分为知识融合和知识加工两大部分,本体构建层是为了根据目标数据库生成知识图谱本体进而生成目标对象图谱。结合图2中本体构建层的知识加工部分,对本实施例进行说明:根据目标数据库生成知识图谱本体。根据目标数据库和知识图谱本体,得到当前实体关系信息。之后根据当前已有实体关系,进行指示推理,包括:从已有的实体关系出发,经过计算机推理,发现新的实体关系,人才图谱网络得到进一步完善和更新。受现有技术限制,目标数据库、知识图谱本体以及新的实体关系中的知识元素仍可能存在错误,因此在构建完整的目标对象图谱之前,需要对其进行质量评估,并且通过对其包含知识的可信度进行量化,通过删去置信度小于预设阈值的知识来确保目标对象图谱内数据的质量,预设阈值根据需求设定,得到删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息,进而生成人才图谱即目标对象图谱。
需要说明的是,目标对象图谱是将数字档案馆中不同的档案资源进行集成和整理后形成的,是智能应用的基础,以人才图谱为例,在构建出人才图谱后,利用人才图谱能够搭建人才库、进行人才盘点、辅助进行人才培养等等。从人才图谱中可以清楚的了解到人才关于教育经历、工作经历、专业技能等具体情况,进而根据岗位需求,可以将适合的人才特性以画像的形式描绘出来得到人才画像,让用人单位了解地储备人才的相关特征,从而有的放矢,帮助企业更有针对性地开展招聘、培训、发展等工作。
通过目标对象图谱对数字档案信息源的数据进行处理,将产出的结构化关联数据用于深度学习算法训练,得到能解决具体场景问题的研判模型,从而形成解决办法产生价值的服务形式,最终构建的人才图谱能够为档案服务带来不同的应用效果,包括档案内容自动审核、人才一键背调、关键人才综合盘点、人才精准高效招引和人才个性化培养等。
在本申请实施例中,通过本体构建、知识融合与更新、质量评估等步骤,构建目标对象图谱。构建统一的知识图谱本体,实现知识的标准化和结构化。采用人工智能技术实现目标对象信息的自动解析和实例的关联识别。设计知识图谱本体与信息映射机制,实现知识的结构化表达,并设计知识质量评估体系,指导知识的完善与修正。
作为一种可选实施例,根据预设知识融合方法对初始数据库进行处理,得到目标数据库,包括:
对初始数据库中的实体信息进行实体链接,得到中间数据库;
获取外部知识库和关系数据库;
将外部知识库、关系数据库以及中间数据库进行合并,得到目标数据库。
可选地,本实施例以人才为目标对象为例进行说明,则目标对象图谱为人才图谱。根据人才管理需求和人才学理论,设计人才类型体系、技能和能力分类体系、工作经历及教育背景的标准等知识结构,是后续知识整合的基础。本体构建层分为知识融合和知识加工两大部分。在经过信息收集层后,能够获得实体、关系以及属性的相关信息,但这些相关信息可能存在大量信息错误以及信息冗余,数据之间的关系也不清晰,缺乏层次性以及逻辑性,因此需要通过知识融合进行清洗和整合。
结合图2中本体构建层的知识融合部分,对本实施例进行说明:知识融合包括实体链接和知识合并两个方面。对初始数据库中的实体信息进行实体链接,得到中间数据库,其中,实体链接是指将抽取到的实体与知识库相联结的程序,主要包括实体消歧和共指消解方法。实体消歧主要是解决同名实体出现歧义的问题,使用较多的方法为聚类法。共指消解则是用于解决多个指向对应一个实体对象的问题,现有技术相对来说已经比较成熟,同时出现的实体相似性模型、上下文相似性模型能够很好地解决这一问题。
而知识合并是指将第三方的数据如岗位相关信息、企业相关信息所示合并进数据库,包括合并外部知识库和关系数据库两个方面。获取外部知识库和关系数据库,将外部知识库、关系数据库以及中间数据库进行合并,得到目标数据库。
需要说明的是,人事档案数据在经过知识融合之后,识别实体已经变成标准化知识并且同时附有相关属性关系,被归入人才库、职位库和企业库中。
在本申请实施例中,通过对初始数据库中的实体信息进行实体链接,并将其与外部知识库、关系数据库进行合并,得到目标数据库。建立多源数据融合机制,实现知识的全面丰富与优化,实现与其他数据源的结合,解决了当前人事档案服务比较单一,内容不够深度挖掘的问题。
作为一种可选实施例,根据获取到的目标对象信息,构建初始数据库,包括:
根据目标对象信息,得到目标对象档案信息、档案业务信息以及业务外部信息;
根据目标对象档案信息、档案业务信息以及业务外部信息,得到非结构化资源、结构化资源以及半结构化资源;
根据非结构化资源、结构化资源以及半结构化资源,得到实体信息、关系信息以及属性信息;
根据实体信息、关系信息以及属性信息,得到初始数据库。
可选地,如图2所示,信息收集层分为数据融合和信息抽取两大部分,信息收集层是为了抽取实体、关系以及属性,进而得到初始数据库。
结合图2中信息收集层,对本实施例进行说明:根据目标对象信息,得到目标对象的档案信息、档案业务信息以及业务外部信息。将目标对象档案信息、档案业务信息以及业务外部信息进行结构化分类和分层,得到非结构化资源、结构化资源以及半结构化资源。在非结构化资源、结构化资源以及半结构化资源中进行实体抽取、关系抽取以及属性抽取,得到实体信息、关系信息以及属性信息,整合实体信息、关系信息以及属性信息,得到初始数据库。
在本申请实施例中,通过信息收集层的结构化分类和分层,将目标对象信息转化成计算机可识别和理解的数据,构建初始数据库,规整数据使其达到标准化格式从而进入本体构建层,在数字档案服务方面,实现了各个档案文件信息之间的关联与聚合,从被动的服务方式转变成主动的服务模式。
作为一种可选实施例,在构建目标对象图谱之后,方法还包括:
根据目标对象图谱,得到待匹配对象图谱和需求对象图谱;
根据待匹配对象图谱,得到待匹配对象的特征信息;
根据需求对象图谱,得到需求对象的需求信息;
根据特征信息、需求信息以及预设匹配模型,对待匹配对象和需求对象进行匹配,得到匹配结果。
可选地,从建立的目标对象图谱中获取待匹配对象图谱和需求对象图谱,或者利用步骤S101-步骤S103建立待匹配对象图谱和需求对象图谱,再通过neo4j进行获取。待匹配对象例如人才、需求对象例如企业,因此,待匹配对象图谱为人才图谱,需求对象图谱为企业图谱。
人才图谱是将数字档案馆中不同的人才档案资源进行集成和整理后形成的。人才图谱如图3所示,从图3中可以清楚的了解到人才属性,人才的奖惩情况、基本信息、教育背景、专业技术获得情况、工作经历,奖惩情况包括:类别、名称、批准时间、批准单位名称,基本信息包括:毕业院校、出生日期、参加机构时间、性别、姓名、毕业时间、所学专业,教育背景包括:学历、学历1,其中,学历包括:所学专业、学校名称、教育类别、学位、学业结束类型、结束日期、开始日期,学历1包括:学校名称、教育类别1、学位1、所学专业1、学业结束类型1、结束日期1、开始日期1,专业技术获得情况包括:职称名称、职称级别、获得日期,工作经历包括:工作单位全称、工作单位全称1,其中,工作单位全称包括:合同其实日期、合同结束日期、接触劳动关系日期、流动方式,工作单位全称1包括:合同其实日期1、合同结束日期1、接触劳动关系日期1、流动方式。整合上述教育经历、工作经历、专业技能等具体信息,可以得到人才即待匹配对象的特征信息。
企业图谱如图4所示,从图4中可以清楚的了解到企业属性,基本信息、招聘岗位、岗位要求、其他信息,基本信息包括:成立时间、企业规模、是否上市、所在地区、企业名称、所属行业,招聘岗位包括:岗位职责、岗位薪资、岗位地点,岗位要求包括:专业、学历、性别、技能要求、年龄、工作经验,其他信息包括:福利,其他补助、生育津贴、节日福利、五险一金。整合上述信息可以清楚地了解到企业即需求对象的需求信息,如经历要求、教育背景、岗位职责等,另外,结合人才图谱进行知识推理,可以判断哪些是基本属性要求(如地点、学历、工作经验等),哪些是硬技能,哪些是行业或项目要求,哪些是对曾任企业的要求等进而根据岗位需求,可以将适合的人才特性以画像的形式描绘出来得到人才画像。
然后,通过人岗匹配模型(即预设匹配模型)、特征信息、需求信息,进行人才与企业之间的匹配和适配度评价,得到匹配结果,为企业内部调整人才梯队和外部招聘人才提供决策建议。
另外,通过目标对象图谱可以提高档案管理工作效率,利用其中的人才图谱进行背景调查对候选人能力模型进行综合评估,后续录用也可针对性地进行管理、培训、提升,保障团队健康稳定。人才图谱的建立可以辅助人才管理单位实施人才管理、人才盘点、人才分类认定申请、个性化培养、人才引进等工作。
在本申请实施例中,根据待匹配对象图谱和需求对象图谱,分别得到待匹配对象的特征信息、需求对象的需求信息。根据特征信息和需求信息、对待匹配对象和需求对象进行匹配,为目标对象图谱带来不同的应用效果,包括档案内容自动审核、人才一键背调、关键人才综合盘点、人才精准高效招引和人才个性化培养等。
根据本申请实施例的另一个方面,还提供了一种用于实施上述目标对象图谱构建方法的目标对象图谱构建装置。图5是据本申请实施例的一种可选的目标对象图谱构建装置的结构框图,如图5所示,该装置可以包括:
第一构建模块501,用于根据获取到的目标对象信息,构建初始数据库;
第一得到模块502,用于根据预设知识融合方法对初始数据库进行处理,得到目标数据库;
第二构建模块503,用于根据目标数据库,构建目标对象图谱;
获取模块504,用于获取目标对象信息对应的规则变更数据和新增数据;
更新模块505,用于分别根据规则变更数据和新增数据,更新目标对象图谱。
需要说明的是,该实施例中的第一构建模块501可以用于执行上述步骤S101,该实施例中的第一得到模块502可以用于执行上述步骤S102,该实施例中的第二构建模块503可以用于执行上述步骤S103,该实施例中的获取模块504可以用于执行上述步骤S104,该实施例中的更新模块505可以用于执行上述步骤S105。
通过上述模块,对目标对象信息进行自动解析、关联和聚合,构建初始数据库。建立知识融合机制,实现初始数据库与其他数据源的结合。利用目标数据库构建目标对象图谱,实现目标对象信息的结构化表达。并设计增量更新机制,利用目标对象信息对应的规则变更数据和新增数据,对目标对象图谱持续更新和优化,实现目标对象图谱与新增业务数据和新增数据的快速融合。通过构建目标对象图谱,实现信息的标准化集成、智能关联与深度理解,释放数据资源的潜在价值,提高了信息管理工作效率。解决了相关技术中存在无法实现人才信息的有效整合与关联分析以及没有对知识图谱实时更新,不能满足人才业务最新需求的问题。
作为一种可选实施例,更新模块包括:
第一得到单元,用于根据规则变更数据调整目标对象图谱的结构,得到调整后的目标对象图谱;
第一删减单元,用于删去调整后的目标对象图谱中与规则变更数据不相关的知识,完成对目标对象图谱更新。
作为一种可选实施例,更新模块还包括:
第二得到单元,用于根据新增数据,得到新增的目标对象概念信息、目标对象概念信息对应的实例以及目标对象之间新增的新关系信息;
映射单元,用于将目标对象概念信息、实例以及新关系信息,映射到目标对象图谱中,得到中间目标对象图谱;
处理单元,用于合并中间目标对象图谱中的重复实例,并删去中间目标对象图谱中的错误实例,完成对目标对象图谱更新。
作为一种可选实施例,第二构建模块包括:
生成单元,用于根据目标数据库,生成知识图谱本体;
第三得到单元,用于根据目标数据库和知识图谱本体,得到当前实体关系信息;
第四得到单元,用于根据当前实体关系信息,得到新的实体关系信息;
计算单元,用于计算目标数据库、知识图谱本体以及新的实体关系信息中所有知识的置信度;
第二删减单元,用于从目标数据库、知识图谱本体以及新的实体关系中删去置信度小于预设阈值的知识,得到删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息;
第五得到单元,用于根据删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息,得到目标对象图谱。
作为一种可选实施例,第一得到模块包括:
实体链接单元,用于对初始数据库中的实体信息进行实体链接,得到中间数据库;
获取单元,用于获取外部知识库和关系数据库;
合并单元,用于将外部知识库、关系数据库以及中间数据库进行合并,得到目标数据库。
作为一种可选实施例,第一构建模块包括:
第六得到单元,用于根据目标对象信息,得到目标对象档案信息、档案业务信息以及业务外部信息;
第七得到单元,用于根据目标对象档案信息、档案业务信息以及业务外部信息,得到非结构化资源、结构化资源以及半结构化资源;
第八得到单元,用于根据非结构化资源、结构化资源以及半结构化资源,得到实体信息、关系信息以及属性信息;
第九得到单元,用于根据实体信息、关系信息以及属性信息,得到初始数据库。
作为一种可选实施例,该装置还包括:
第二得到模块,用于根据目标对象图谱,得到待匹配对象图谱和需求对象图谱;
第三得到模块,用于根据待匹配对象图谱,得到待匹配对象的特征信息;
第四得到模块,用于根据需求对象图谱,得到需求对象的需求信息;
匹配模块,用于根据特征信息、需求信息以及预设匹配模型,对待匹配对象和需求对象进行匹配,得到匹配结果。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
根据本申请实施例的又一个方面,还提供了一种用于实施上述目标对象图谱构建方法的电子设备,该电子设备可以是服务器、终端、或者其组合。
图6是根据本申请实施例的一种可选的电子设备的结构框图,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601、通信接口602和存储器603通过通信总线604完成相互间的通信,其中,
存储器603,用于存储计算机程序;
处理器601,用于执行存储器603上所存放的计算机程序时,实现如下步骤:
根据获取到的目标对象信息,构建初始数据库;
根据预设知识融合方法对初始数据库进行处理,得到目标数据库;
根据目标数据库,构建目标对象图谱;
获取目标对象信息对应的规则变更数据和新增数据;
分别根据规则变更数据和新增数据,更新目标对象图谱。
可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,如图6所示,上述存储器603中可以但不限于包括上述目标对象图谱构建装置中的第一构建模块501、第一得到模块502、第二构建模块503、获取模块504、更新模块505。此外,还可以包括但不限于上述目标对象图谱构建装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,实施上述目标对象图谱构建方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子设备的结构造成限定。例如,终端设备还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于存储执行目标对象图谱构建方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
根据获取到的目标对象信息,构建初始数据库;
根据预设知识融合方法对初始数据库进行处理,得到目标数据库;
根据目标数据库,构建目标对象图谱;
获取目标对象信息对应的规则变更数据和新增数据;
分别根据规则变更数据和新增数据,更新目标对象图谱。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种目标对象图谱构建方法,其特征在于,所述方法包括:
根据获取到的目标对象信息,构建初始数据库;
根据预设知识融合方法对所述初始数据库进行处理,得到目标数据库;
根据所述目标数据库,构建目标对象图谱;
获取所述目标对象信息对应的规则变更数据和新增数据;
分别根据所述规则变更数据和所述新增数据,更新所述目标对象图谱。
2.根据权利要求1所述的方法,其特征在于,根据所述规则变更数据更新所述目标对象图谱,包括:
根据所述规则变更数据调整所述目标对象图谱的结构,得到调整后的目标对象图谱;
删去所述调整后的目标对象图谱中与所述规则变更数据不相关的知识,完成对所述目标对象图谱更新。
3.根据权利要求1所述的方法,其特征在于,根据所述新增数据更新所述目标对象图谱,包括:
根据所述新增数据,得到新增的目标对象概念信息、所述目标对象概念信息对应的实例以及目标对象之间新增的新关系信息;
将所述目标对象概念信息、所述实例以及所述新关系信息,映射到所述目标对象图谱中,得到中间目标对象图谱;
合并所述中间目标对象图谱中的重复实例,并删去所述中间目标对象图谱中的错误实例,完成对所述目标对象图谱更新。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标数据库,构建目标对象图谱,包括:
根据所述目标数据库,生成知识图谱本体;
根据所述目标数据库和所述知识图谱本体,得到当前实体关系信息;
根据所述当前实体关系信息,得到新的实体关系信息;
计算所述目标数据库、所述知识图谱本体以及所述新的实体关系信息中所有知识的置信度;
从所述目标数据库、所述知识图谱本体以及所述新的实体关系中删去置信度小于预设阈值的所述知识,得到删减后的目标数据库、删减后的知识图谱本体以及删减后的实体关系信息;
根据所述删减后的目标数据库、所述删减后的知识图谱本体以及所述删减后的实体关系信息,得到所述目标对象图谱。
5.根据权利要求1所述的方法,其特征在于,所述根据预设知识融合方法对所述初始数据库进行处理,得到目标数据库,包括:
对所述初始数据库中的实体信息进行实体链接,得到中间数据库;
获取外部知识库和关系数据库;
将所述外部知识库、所述关系数据库以及所述中间数据库进行合并,得到所述目标数据库。
6.根据权利要求1所述的方法,其特征在于,所述根据获取到的目标对象信息,构建初始数据库,包括:
根据所述目标对象信息,得到目标对象档案信息、档案业务信息以及业务外部信息;
根据所述目标对象档案信息、所述档案业务信息以及所述业务外部信息,得到非结构化资源、结构化资源以及半结构化资源;
根据所述非结构化资源、结构化资源以及半结构化资源,得到实体信息、关系信息以及属性信息;
根据所述实体信息、所述关系信息以及所述属性信息,得到所述初始数据库。
7.根据权利要求1所述的方法,其特征在于,在所述构建目标对象图谱之后,所述方法还包括:
根据所述目标对象图谱,得到待匹配对象图谱和需求对象图谱;
根据所述待匹配对象图谱,得到待匹配对象的特征信息;
根据所述需求对象图谱,得到需求对象的需求信息;
根据所述特征信息、所述需求信息以及预设匹配模型,对所述待匹配对象和所述需求对象进行匹配,得到匹配结果。
8.一种目标对象图谱构建装置,其特征在于,所述装置包括:
第一构建模块,用于根据获取到的目标对象信息,构建初始数据库;
第一得到模块,用于根据预设知识融合方法对所述初始数据库进行处理,得到目标数据库;
第二构建模块,用于根据所述目标数据库,构建目标对象图谱;
获取模块,用于获取所述目标对象信息对应的规则变更数据和新增数据;
更新模块,用于分别根据所述规则变更数据和所述新增数据,更新所述目标对象图谱。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,其特征在于,
所述存储器,用于存储计算机程序;
所述处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求1至7中任一项中所述的方法步骤。
10.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现权利要求1至7中任一项中所述的方法步骤。
CN202310611187.8A 2023-05-26 2023-05-26 目标对象图谱构建方法、装置、电子设备及存储介质 Pending CN116596069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310611187.8A CN116596069A (zh) 2023-05-26 2023-05-26 目标对象图谱构建方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310611187.8A CN116596069A (zh) 2023-05-26 2023-05-26 目标对象图谱构建方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116596069A true CN116596069A (zh) 2023-08-15

Family

ID=87611434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310611187.8A Pending CN116596069A (zh) 2023-05-26 2023-05-26 目标对象图谱构建方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116596069A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117787392A (zh) * 2024-02-23 2024-03-29 支付宝(杭州)信息技术有限公司 一种知识图谱的融合方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117787392A (zh) * 2024-02-23 2024-03-29 支付宝(杭州)信息技术有限公司 一种知识图谱的融合方法和装置

Similar Documents

Publication Publication Date Title
Singh et al. PROSPECT: a system for screening candidates for recruitment
CN109493265A (zh) 一种基于深度学习的政策解读方法及政策解读系统
CN110377814A (zh) 题目推荐方法、装置及介质
CN103207855A (zh) 针对产品评论信息的细粒度情感分析系统及方法
CN111984784B (zh) 人岗匹配方法、装置、电子设备和存储介质
Marsal-Llacuna et al. Smart urban planning: designing urban land use from urban time use
CN107368521B (zh) 一种基于大数据和深度学习的知识推介方法及系统
CN115619383B (zh) 一种基于知识图谱的故障诊断方法、装置及计算设备
WO2020010834A1 (zh) 一种faq问答库泛化方法、装置及设备
Li et al. Knowledge transfer and adaptation for land-use simulation with a logistic cellular automaton
CN112069329B (zh) 文本语料的处理方法、装置、设备及存储介质
CN111242565A (zh) 一种基于智能人事模型的简历优化方法及装置
CN116596069A (zh) 目标对象图谱构建方法、装置、电子设备及存储介质
CN114328980A (zh) 结合rpa及ai的知识图谱构建方法、装置、终端及存储介质
CN113326376A (zh) 一种基于机器学习的代码评审意见质量评估系统及方法
Maté et al. Tracing conceptual models' evolution in data warehouses by using the model driven architecture
CN112463986A (zh) 信息存储的方法及装置
CN115618006A (zh) 一种知识图谱的自动构建系统及其工作方法
CN114417012A (zh) 一种生成知识图谱的方法和电子设备
CN113220951A (zh) 一种基于智能内容的医学临床支持方法和系统
US20200160359A1 (en) User-experience development system
CN117236624A (zh) 一种基于动态图的Issue修复者推荐方法与装置
Shen Data sustainability and reuse pathways of natural resources and environmental scientists
Hunter Moving open access to open source: transitioning an open-access journal into the open journal systems journal management system
CN116595191A (zh) 一种交互式低代码知识图谱的构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Hu Zeting

Inventor after: Liu Jing

Inventor after: Hu Jin

Inventor after: Lu Xing

Inventor after: Shi Wanying

Inventor after: Du Qiang

Inventor before: Hu Zeting

Inventor before: Lu Xing

Inventor before: Shi Wanying

Inventor before: Du Qiang

CB03 Change of inventor or designer information