CN117314476B - 一种证书数据的整合方法及装置 - Google Patents

一种证书数据的整合方法及装置 Download PDF

Info

Publication number
CN117314476B
CN117314476B CN202311596746.9A CN202311596746A CN117314476B CN 117314476 B CN117314476 B CN 117314476B CN 202311596746 A CN202311596746 A CN 202311596746A CN 117314476 B CN117314476 B CN 117314476B
Authority
CN
China
Prior art keywords
information
personnel
target
certificate
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311596746.9A
Other languages
English (en)
Other versions
CN117314476A (zh
Inventor
张森
张晗
谭卓
葛丁铭
黄学涛
张润南
张大丽
闫智杰
张纯豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tunnel Tang Technology Co ltd
Original Assignee
Tunnel Tang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tunnel Tang Technology Co ltd filed Critical Tunnel Tang Technology Co ltd
Priority to CN202311596746.9A priority Critical patent/CN117314476B/zh
Publication of CN117314476A publication Critical patent/CN117314476A/zh
Application granted granted Critical
Publication of CN117314476B publication Critical patent/CN117314476B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Finance (AREA)

Abstract

本发明涉及数据处理技术领域,尤其涉及一种证书数据的整合方法及装置,该方法包括:获取目标领域的证书信息;获取目标企业的人员信息,目标企业属于目标领域;基于人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,第一类人员信息公开身份证信息,第二类人员信息未公开身份证信息且公开出生出身日期和所属公司信息,第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所属公司均属于目标企业;基于证书信息,分别与第一类人员信息、第二类人员信息以及第三类人员信息中任意一种相结合,将人员信息与证书信息进行整合,将证书通过各类人员信息进行关联,以避免同名不同人的情况,将证书与人员信息进行有效整合。

Description

一种证书数据的整合方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种证书数据的整合方法及装置。
背景技术
在工程领域中,人员证书数据会零散的分布在各个官方网站上公开,比如,住建部门公布人员的建造类证书,交安网站公布安全类证书,以及数量众多的其他官方网站,有些官方网站并不会公开人员的身份证信息,因此,各类证书是分开使用的,无法有效整合。
因此,如何将零散分布的证书进行有效整合是目前亟待解决的技术问题。
发明内容
鉴于上述问题,本发明提供了一种克服上述问题或者至少部分地解决上述问题的证书数据的整合方法及装置。
第一方面,本发明提供了一种证书数据的整合方法,包括:
获取目标领域内的证书信息;
获取目标企业内的人员信息,所述目标企业属于所述目标领域;
基于所述人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,所述第一类人员信息公开身份证信息,所述第二类人员信息未公开身份证信息且公开出身日期和所属公司信息,所述第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所述所属公司均属于所述目标企业;
基于所述证书信息,分别与所述第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合。
优选地,所述证书信息包括证书ID和姓名,所述证书ID基于证书的类型以及难易程度来确定,所述所属公司信息具体为所属公司ID,所属公司ID基于公司的信用代码确定。
优选地,所述基于所述证书信息,分别与所述第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合,包括:
基于所述证书信息与所述第一类人员信息,将人员信息与证书信息进行整合;或者
基于所述证书信息与所述第二类人员信息,将人员信息与证书信息进行整合;或者
基于所述证书信息与所述第三类人员信息,将人员信息与证书信息进行整合。
优选地,所述基于所述证书信息与所述第一类人员信息,将人员信息与证书信息进行整合,包括:
基于所述证书信息和所述第一类人员信息的身份证信息前两位和最后四位,确定与第一类目标人员信息相对应的第一目标证书信息,并将所述第一目标证书信息与所述第一类目标人员信息进行整合。
优选地,在第一类目标人员信息中存在相同姓名的人员时,所述基于所述证书信息和所述第一类人员信息的身份证信息前两位和最后四位,确定与第一类目标人员信息相对应的第一目标证书信息,并将所述第一目标证书信息与所述第一类目标人员信息进行整合,包括:
基于所述相同姓名的人员的身份证信息前两位和最后四位,判断第一类目标人员信息中相同姓名的人员是否为同一人员;
若是,将所述同一人员的多个第一目标证书信息整合在一起;
若否,将不同人员对应的第一目标证书信息分别进行整合。
优选地,所述基于所述证书信息与所述第二类人员信息,将人员信息与证书信息进行整合,包括:
基于所述证书信息和所述第二类人员信息中的出生日期和所属公司信息,确定与所述第二类目标人员信息相对应的第二目标证书信息,并将所述第二目标证书信息与所述第二类目标人员信息进行整合。
优选地,在第二类目标人员信息中存在相同姓名的人员时,所述基于所述证书信息和所述第二类人员信息中的出生日期和所属公司信息,确定与所述第二类目标人员信息相对应的第二目标证书信息,并将所述第二目标证书信息与所述第二类目标人员信息进行整合,包括:
基于所述相同姓名的人员的出生日期和所属公司信息,判断所述第二类目标人员信息中相同姓名的人员是否为同一人员;
若是,将所述同一人员的多个第二目标证书信息整合在一起;
若否,将不同人员对应的第二目标证书信息分别进行整合。
优选地,所述基于所述证书信息与所述第三类人员信息,将人员信息与证书信息进行整合,包括:
基于所述证书信息和所述第三类人员信息中的所属公司信息,确定与所述第三类人员信息相对应的第三目标证书信息,并将第三目标证书信息与第三类目标人员信息进行整合。
优选地,在第三类目标人员信息中存在相同姓名的人员时,所述基于所述证书信息和所述第三类人员信息中的所属公司信息,确定与所述第三类人员信息相对应的第三目标证书信息,并将第三目标证书信息与第三类目标人员信息进行整合,包括:
基于相同姓名的人员的所属公司信息和证书信息,判断第二类目标人员信息中相同姓名的人员是否为同一人员;
若是,将同一人员的多个第三目标证书信息整合在一起;
若否,将不同人员对应的第三目标证书信息分别进行整合。
第二方面,本发明还提供了一种证书数据的整合装置,包括:
第一获取模块,用于获取目标领域内的证书信息;
第二获取模块,用于获取目标企业内的人员信息,所述目标企业属于所述目标领域;
确定模块,用于基于所述人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,所述第一类人员信息为公开身份证信息,所述第二类人员信息未公开身份证信息且公开出身日期和所属公司信息,所述第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所述所属公司均属于所述目标企业;
整合模块,用于基于所述证书信息,分别与所述第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合。
第三方面,本发明还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中所述的方法步骤。
第四方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中所述的方法步骤。
本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提供了一种证书数据的整合方法,包括:获取目标领域的证书信息;获取目标企业的人员信息,目标企业属于目标领域;基于人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,第一类人员信息公开身份证信息,第二类人员信息未公开身份证信息且公开出生出身日期和所属公司信息,第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所属公司均属于目标企业;基于证书信息,分别与第一类人员信息、第二类人员信息以及第三类人员信息中任意一种相结合,将人员信息与证书信息进行整合,将证书通过各类人员信息进行关联,以避免同名不同人的情况,将证书与人员信息进行有效整合。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考图形表示相同的部件。在附图中:
图1示出了本发明实施例中证书数据的整合方法的步骤流程示意图;
图2示出了本发明实施例中证书数据的整合装置的结构示意图;
图3示出了本发明实施例中实现证书数据的整合方法的计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整传达给本领域的技术人员。
实施例1
本发明的实施例提供了一种证书数据的整合方法,如图1所示,包括:
S101,获取目标领域内的证书信息;
S102,获取目标企业的人员信息,目标企业属于目标领域;
S103,基于人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,第一类人员信息公开身份证信息和姓名,第二类人员信息未公开身份证信息且公开出身日期和所属公司信息,第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,该所属公司均属于目标企业;
S104,基于证书信息,分别于第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息于证书信息进行整合。
由于各个网站的证书信息是散落在各个官方网站的,比如,住建部官网公布人员的建造类证书,交安网站公布安全类证书,无法将同一人的多个证书进行有效整合,因此,为了将同一人的多个证书有效进行整合,首先,执行S101,获取目标领域内的证书信息。这里的证书信息包括:证书ID和姓名,其中,该证书ID是基于证书的类型以及难易程度来确定的。
下面以工程领域为例,罗列如下表内属于工程领域的证书:
同时,S102,获取目标企业内的人员信息,该目标企业属于目标领域。
以上述的工程领域为例,目标企业为一基建企业。
通过获取该目标企业的人员信息,以用于提供关联的依据。该人员信息,较杂乱,有些人员信息中公开了身份证信息,有些则没有,有些公开了出生日期,有些则没有,还有些仅公开了所属公司信息等等。
接下来,执行S103,基于该人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息。第一类人员信息为公开身份证信息,第二类人员信息为未公开身份证信息且公开出身日期和所属公司信息,第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所属公司均属于目标企业。
一个目标企业可能包含多个下属的子公司,整个企业内的人员信息,包括各个子公司内的人员信息。这些人员信息也都是杂乱无章的,有些是公开了人员的身份证信息,有些则未公开人员的身份证信息。可以先将人员信息进行分类,得到第一类人员信息、第二类人员信息以及第三类人员信息。其中,第一类人员信息公开身份证信息;第二类人员信息未公开身份证信息且公开出身日期和所属公司信息;第三类人员信息未公开身份证信息和出身日期且公开所属公司信息。
由于身份证信息是唯一能标识人员的信息,因此,可以根据身份证信息准确找到对应于该人员的证书信息。当然,对于未公开人员的身份证信息的人员来说,可以通过其他关联方式来唯一标识人员,以此来找到对应于该人员的证书信息,下面就如何根据身份证信息或者关联信息来找到该人员的证书信息进行详细描述。
因此,S104中,基于证书信息,分别与第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合。
具体地,基于证书信息与第一类人员信息,将人员信息与证书信息进行整合;或者
基于证书信息与第二类人员信息,将人员信息与证书信息进行整合;或者
基于证书信息与第三类人员信息,将人员信息与证书信息进行整合。
更具体地,基于证书信息和第一类人员信息的身份证信息前两位和最后四位,确定与第一类目标人员信息相对应的第一目标证书信息,并将第一目标证书信息与第一类目标人员信息进行整合。
或者,基于证书信息和第二类人员信息中的出生日期和所属公司信息,确定与第二类目标人员信息相对应的第二目标证书信息,并将第二目标证书信息与第二类目标人员信息进行整合。
或者,基于证书信息和第三类人员信息中的所属公司信息,确定与第三类目标人员信息相对应的第三目标证书信息,并将第三目标证书信息与第三类目标人员信息进行整合。
上述的方案是按照优先级排序的。
首先,选用第一类人员信息,该第一类人员信息公开有身份证信息。每个人的身份证号码中包含了一些特殊的含义,比如,身份证号码的前两位代表了这个人出身的省份,最后四位是一个顺序码,即对于同一地址区域内,同一年、月日出身的人的编码顺序号,在同一企业内,对于同一省份的同一地区来说,出身顺序码一样的概率很低。
在具体的实施方式中,第一类目标人员信息中存在相同姓名的人员,因此,整合过程如下:
基于相同姓名的人员的身份证信息前两位和最后四位,判断第一类目标人员信息中相同姓名的人员是否为同一人员;若是,将同一人员的多个第一目标证书信息整合在一起;若否,将不同人员对应的第一目标证书信息分别进行整合。
其中,在判断相同姓名的人员是否为同一人员时,具体是比较相同姓名的人员的身份证信息前两位和最后四位是否一致,若是,则确定为同一人员,若否,则确定为不同人员。
对于两个证书ID来说,比如,以一级注册建筑师和二级注册建筑师来说,检索之后发现有5个一级注册建筑师的证书以及4个二级注册建筑师的证书,其中,两个重名的信息,都叫:张三,分别对应一级注册建筑师和二级注册建筑师,如何确定这两个重名的人员是两个人员还是同一个人员呢?根据该这两个人的身份证信息前两位和最后四位来判断,具体地,在这两个人的身份证信息前两位和最后两位均相同时,确定这两个人为同一人。由此,将该张三所对应的一级注册建筑师和二级注册建筑师进行整合,都整合为张三这个人所对应的证书信息。
当然,若这两个人的身份证信息前两位和最后四位不同时,确定这两个人为不同的人。由此,1号张三对应的一级注册建筑师,2号张三对应额日记注册建筑师,分别进行整合。
在企业内部,并不是所有的人员都公开身份证信息,因此,对于没有身份证信息的人员来说,即未公开身份证信息且公开出身日期、所属公司信息的人员,即第二类人员信息,也可以通过关联信息唯一确定人员。
具体地,第二类目标人员信息中存在相同姓名的人员,因此,整合过程如下:
基于相同姓名的人员的出生日期和所属公司信息,判断第二类目标人员信息中相同姓名的人员是否为同一人员;若是,将同一人员的多个第二目标证书信息整合在一起;若否,将不同人员对应的第二目标证书信息分别进行整合。
其中,在判断相同姓名的人员是否为同一人员时,具体是比较相同姓名的人员的出生日期和所属公司信息是否一致,若是,则确定为同一人员,若否,则确定为不同人员。
还是以上述有5个一级注册建筑师的证书以及4个二级注册建筑师的证书,其中,有两个重名,叫张三,分别对应一级注册建筑师和二级注册建筑师。此时张山并没有公开身份证信息,仅有出生日期以及所属公司信息,若张三的这两个信息均相同,则确定为同一人员,则将张三的一级注册建筑师的证书和二级注册建筑师的证书整合在一个人员名下;若张三的任意一个信息不同,则确定为不同人员,则将两个张三分别进行整合,即1号张三名下整合一级注册建筑师的证书,2号张三名下整合二级注册建筑师的证书。其中所属公司信息具体是公司ID,该公司ID是基于公司的信用代码确定,同一企业下的多个公司的公司ID各不相同。
当然,企业内的所有人员信息中,也并非都有出身日期,那么,将未公开身份证信息和出生日期且仅公开所属公司信息的人员确定为第三类人员。
具体地,第三类目标人员信息中存在相同姓名的人员,因此,整合过程如下:
基于相同姓名的人员的所属公司信息和证书信息,判断第三类目标人员信息中相同姓名的人员是否为同一人员;若是,将同一人员的多个第三目标证书信息整合在一起;若否,将不同人员对应的第三目标证书信息分别进行整合。
其中,在判断相同姓名的人员是否为同一人员时,具体是比较相同姓名的人员的所属公司和证书信息是否一致,若是,则确定为同一人员,若否,则确定为不同人员。
还是以上述有5个一级注册建筑师的证书以及4个二级注册建筑师的证书,其中,有两个重名,叫张三,此时张三并没有公开身份证信息以及出生日期,仅有所属公司信息和证书信息,若两个张三的所属公司信息相同,证书信也相同,及证书ID相同,则确定为同一人员,则将证书信息整合在一个人员名下;若两个张三的所属公司相同,而证书信息不同,则确定为不同人员,则将两个张三的证书信息分别进行整合,比如1号张三名下整合一级注册建筑师的证书,2号张三名下整合二级注册建筑师的证书;若两个张三的所属公司不同,而证书信息相同,则确定为不同人员,则将两个张三的证书信息分别进行整合。
通过上述的整合方式,避免同名不同人的情况,以将证书与人员信息进行有效整合。
在具体技术实施过程中,数据库采用MySql(迈克尔数据库)+Clickhouse(是一个用于联机分析的列式数据库管理系统)。数据的清洗同步主要采用了Flink(一个框架和分布式处理引擎)+Yarn(一个资源调度平台,负责为运算冲程序提供服务器运算资源)+HDFS(分布式文件系统)。
将MySql的数据作为数据源使用FlinkCDC进行监听,产生数据流;将采集的数据存放在MySql中,此时的数据是未经过清洗的,且各个网站来源的数据都是毫无关联的。
接下来,对这些数据进行数据清洗。在Flink中,使用了四组MapState。作用具体如下:
第一组MapState,用于聚合依据与人员ID(身份证信息)的关联。
第二组MapState,用于人员ID与聚合依据的关联,以方便第一组MapState进行逆向查找与删除。
第三组MapState,用于将人员ID与多证书关联。
第四组MapState,用于将人员ID与人员身份、出生日期、所属公司信息的关联。
最后再使用一个ValueState记录时间戳状态,便于Flink数据流检查点的恢复。
以上所有的State都会定时五分钟一次持久化到HDFS中,即每五分钟进行一次检查点。
将清洗处理后的数据存储在Clickhouse,将整合后的数据存储到Clickhouse中,建表时采用ReplacintMergeeTree引擎,实现了人员证书的整合,同时,Clickhouse本身的特性也便于人员进行各种维度的统计。
将整合后的数据便于后期定位项目经理和项目总工,以便于后期投标使用等。
本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提供了一种证书数据的整合方法,包括:获取目标领域的证书信息;获取目标企业的人员信息,目标企业属于目标领域;基于人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,第一类人员信息为公开身份证信息,第二类人员信息未公开身份证信息且公开出生出身日期和所属公司信息,第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所属公司均属于目标企业;基于证书信息,分布于第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合,将证书通过各类人员信息进行关联,以避免同名不同人的情况,将证书与人员信息进行有效整合。
实施例2
基于相同的发明构思,本发明实施例还提供了一种证书数据的整合装置,如图2所示,包括:
第一获取模块201,用于获取目标领域内的证书信息;
第二获取模块202,用于获取目标企业内的人员信息,所述目标企业属于所述目标领域;
确定模块203,用于基于所述人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,所述第一类人员信息为公开身份证信息,所述第二类人员信息未公开身份证信息且公开出身日期和所属公司信息,所述第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所述所属公司均属于所述目标企业;
整合模块204,用于基于所述证书信息,分别与所述第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合。
在一种可选的实施方式中,所述证书信息包括证书ID和姓名,所述证书ID基于证书的类型以及难易程度来确定,所述所属公司信息具体为所属公司ID,所属公司ID基于公司的信用代码确定。
在一种可选的实施方式中,整合模块204用于:
基于所述证书信息与所述第一类人员信息,将人员信息与证书信息进行整合;或者
基于所述证书信息与所述第二类人员信息,将人员信息与证书信息进行整合;或者
基于所述证书信息与所述第三类人员信息,将人员信息与证书信息进行整合。
在一种可选的实施方式中,整合模块204用于:
基于所述证书信息和所述第一类人员信息的身份证信息前两位和最后四位,确定与第一类目标人员信息相对应的第一目标证书信息,并将所述第一目标证书信息与所述第一类目标人员信息进行整合。
在一种可选的实施方式中,整合模块204具体用于:
在第一类目标人员信息中存在相同姓名的人员时,基于所述相同姓名的人员的身份证信息前两位和最后四位,判断第一类目标人员信息中相同姓名的人员是否为同一人员;若是,将所述同一人员的多个第一目标证书信息整合在一起;若否,将不同人员对应的第一目标证书信息分别进行整合。
在一种可选的实施方式中,整合模块204用于:
基于所述证书信息和所述第二类人员信息中的出生日期和所属公司信息,确定与所述第二类目标人员信息相对应的第二目标证书信息,并将所述第二目标证书信息与所述第二类目标人员信息进行整合。
在一种可选的实施方式中,整合模块204具体用于:
第二类目标人员信息中存在相同姓名的人员时,基于所述相同姓名的人员的出生日期和所属公司信息,判断所述第二类目标人员信息中相同姓名的人员是否为同一人员;若是,将所述同一人员的多个第二目标证书信息整合在一起;若否,将不同人员对应的第二目标证书信息分别进行整合。
在一种可选的实施方式中,整合模块204用于:
基于所述证书信息和所述第三类人员信息中的所属公司信息,确定与所述第三类人员信息相对应的第三目标证书信息,并将第三目标证书信息与第三类目标人员信息进行整合。
在一种可选的实施方式中,整合模块204具体用于:
在第三类目标人员信息中存在相同姓名的人员时,基于相同姓名的人员的所属公司信息和证书信息,判断第二类目标人员信息中相同姓名的人员是否为同一人员;若是,将同一人员的多个第三目标证书信息整合在一起;若否,将不同人员对应的第三目标证书信息分别进行整合。
实施例3
基于相同的发明构思,本发明实施例提供了一种计算机设备,如图3所示,包括存储器304、处理器302及存储在存储器304上并可在处理器302上运行的计算机程序,所述处理器302执行所述程序时实现上述证书数据的整合方法的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
实施例4
基于相同的发明构思,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述证书数据的整合方法的步骤。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个实施例中所明确记载的特征更多的特征。更确切地说,如每个实施例所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在具体实施方式中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的证书数据的整合装置、计算机设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (3)

1.一种证书数据的整合方法,其特征在于,包括:
获取目标领域内的证书信息;
获取目标企业内的人员信息,所述目标企业属于所述目标领域;
基于所述人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,所述第一类人员信息公开身份证信息,所述第二类人员信息未公开身份证信息且公开出身日期和所属公司信息,所述第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所述所属公司均属于所述目标企业;
基于所述证书信息,分别与所述第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合,包括:
基于所述证书信息与所述第一类人员信息,将人员信息与证书信息进行整合,包括:
基于所述证书信息和所述第一类人员信息的身份证信息前两位和最后四位,确定与第一类目标人员信息相对应的第一目标证书信息,并将所述第一目标证书信息与所述第一类目标人员信息进行整合,包括:
在第一类目标人员信息中存在相同姓名的人员时,基于所述相同姓名的人员的身份证信息前两位和最后四位,判断第一类目标人员信息中相同姓名的人员是否为同一人员;
若是,将所述同一人员的多个第一目标证书信息整合在一起;
若否,将不同人员对应的第一目标证书信息分别进行整合;
或者
基于所述证书信息与所述第二类人员信息,将人员信息与证书信息进行整合,包括:
基于所述证书信息和所述第二类人员信息中的出生日期和所属公司信息,确定与第二类目标人员信息相对应的第二目标证书信息,并将所述第二目标证书信息与所述第二类目标人员信息进行整合,包括:
在第二类目标人员信息中存在相同姓名的人员时,基于所述相同姓名的人员的出生日期和所属公司信息,判断所述第二类目标人员信息中相同姓名的人员是否为同一人员;
若是,将所述同一人员的多个第二目标证书信息整合在一起;
若否,将不同人员对应的第二目标证书信息分别进行整合;
或者
基于所述证书信息与所述第三类人员信息,将人员信息与证书信息进行整合,包括:
基于所述证书信息和所述第三类人员信息中的所属公司信息,确定与第三类目标人员信息相对应的第三目标证书信息,并将第三目标证书信息与第三类目标人员信息进行整合,包括:
在第三类目标人员信息中存在相同姓名的人员时,基于相同姓名的人员的所属公司信息和证书信息,判断第三类目标人员信息中相同姓名的人员是否为同一人员;
若是,将同一人员的多个第三目标证书信息整合在一起;
若否,将不同人员对应的第三目标证书信息分别进行整合。
2.如权利要求1所述的方法,其特征在于,所述证书信息包括证书ID和姓名,所述证书ID基于证书的类型以及难易程度来确定,所述所属公司信息具体为所属公司ID,所属公司ID基于公司的信用代码确定。
3.一种证书数据的整合装置,其特征在于,包括:
第一获取模块,用于获取目标领域内的证书信息;
第二获取模块,用于获取目标企业内的人员信息,所述目标企业属于所述目标领域;
确定模块,用于基于所述人员信息,确定第一类人员信息、第二类人员信息以及第三类人员信息,所述第一类人员信息为公开身份证信息,所述第二类人员信息未公开身份证信息且公开出身日期和所属公司信息,所述第三类人员信息未公开身份证信息和出身日期且公开所属公司信息,所述所属公司均属于所述目标企业;
整合模块,用于基于所述证书信息,分别与所述第一类人员信息、第二类人员信息以及第三类人员信息中的任意一种相结合,将人员信息与证书信息进行整合,整合模块用于:
基于所述证书信息与所述第一类人员信息,将人员信息与证书信息进行整合,具体地,用于:
基于所述证书信息和所述第一类人员信息的身份证信息前两位和最后四位,确定与第一类目标人员信息相对应的第一目标证书信息,并将所述第一目标证书信息与所述第一类目标人员信息进行整合,具体用于:
在第一类目标人员信息中存在相同姓名的人员时,基于所述相同姓名的人员的身份证信息前两位和最后四位,判断第一类目标人员信息中相同姓名的人员是否为同一人员;若是,将所述同一人员的多个第一目标证书信息整合在一起;若否,将不同人员对应的第一目标证书信息分别进行整合;
或者
基于所述证书信息与所述第二类人员信息,将人员信息与证书信息进行整合,具体地:
基于所述证书信息和所述第二类人员信息中的出生日期和所属公司信息,确定与第二类目标人员信息相对应的第二目标证书信息,并将所述第二目标证书信息与所述第二类目标人员信息进行整合,具体用于:
第二类目标人员信息中存在相同姓名的人员时,基于所述相同姓名的人员的出生日期和所属公司信息,判断所述第二类目标人员信息中相同姓名的人员是否为同一人员;若是,将所述同一人员的多个第二目标证书信息整合在一起;若否,将不同人员对应的第二目标证书信息分别进行整合;
或者
基于所述证书信息与所述第三类人员信息,将人员信息与证书信息进行整合,具体地:
基于所述证书信息和所述第三类人员信息中的所属公司信息,确定与第三类目标人员信息相对应的第三目标证书信息,并将第三目标证书信息与第三类目标人员信息进行整合,具体用于:
在第三类目标人员信息中存在相同姓名的人员时,基于相同姓名的人员的所属公司信息和证书信息,判断第三类目标人员信息中相同姓名的人员是否为同一人员;若是,将同一人员的多个第三目标证书信息整合在一起;若否,将不同人员对应的第三目标证书信息分别进行整合。
CN202311596746.9A 2023-11-28 2023-11-28 一种证书数据的整合方法及装置 Active CN117314476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311596746.9A CN117314476B (zh) 2023-11-28 2023-11-28 一种证书数据的整合方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311596746.9A CN117314476B (zh) 2023-11-28 2023-11-28 一种证书数据的整合方法及装置

Publications (2)

Publication Number Publication Date
CN117314476A CN117314476A (zh) 2023-12-29
CN117314476B true CN117314476B (zh) 2024-02-27

Family

ID=89297619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311596746.9A Active CN117314476B (zh) 2023-11-28 2023-11-28 一种证书数据的整合方法及装置

Country Status (1)

Country Link
CN (1) CN117314476B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1304109A (zh) * 2000-01-07 2001-07-18 国际商业机器公司 有效地收集、整理和访问证书吊销表的系统和方法
CN101471780A (zh) * 2007-12-25 2009-07-01 株式会社理光 信息处理装置、证书管理方法、证书管理程序
CN101674301A (zh) * 2009-05-31 2010-03-17 北京飞天诚信科技有限公司 一种存储证书的方法
CN101808092A (zh) * 2010-03-12 2010-08-18 中国电信股份有限公司 多证书共享方法、系统和智能卡
CN101923665A (zh) * 2009-06-16 2010-12-22 赵频 一种管理系统和方法
CN101951319A (zh) * 2010-09-29 2011-01-19 中国航天科工集团第四研究院第四总体设计部 一种支持异构应用模块数据整合的统一身份认证方法
CN102394869A (zh) * 2011-10-21 2012-03-28 河南科技大学 一种用于数字网络的数字内容共享方法及系统
CN102946398A (zh) * 2012-11-26 2013-02-27 国网信息通信有限公司 一种双网隔离环境下的数字证书系统
CN105260856A (zh) * 2015-11-12 2016-01-20 青岛中加科技投资控股有限公司 一种组合一体式企业信息管理装置
CN107358561A (zh) * 2017-07-17 2017-11-17 长威信息科技发展股份有限公司 一种基于个人信用评分的证书自助办理方法及装置
CN108183804A (zh) * 2018-03-28 2018-06-19 湖南东方华龙信息科技有限公司 证书共享方法
CN108471419A (zh) * 2018-03-28 2018-08-31 湖南东方华龙信息科技有限公司 基于可信身份的证书共享方法
EP3386165A1 (en) * 2017-04-06 2018-10-10 Apeiron S.R.L. Method and device for implementing and managing secure communications, provisioning systems, authentication and signing systems
CN108764706A (zh) * 2018-05-25 2018-11-06 安徽理工大学 一种基于大数据的人才信息管理系统和方法
CN114240344A (zh) * 2021-12-06 2022-03-25 企查查科技有限公司 企业人员数据处理方法、装置、计算机设备和存储介质
CN116205593A (zh) * 2023-01-13 2023-06-02 上海梦创双杨数据科技股份有限公司 培训证书生成方法、装置、设备及计算机可读存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1304109A (zh) * 2000-01-07 2001-07-18 国际商业机器公司 有效地收集、整理和访问证书吊销表的系统和方法
CN101471780A (zh) * 2007-12-25 2009-07-01 株式会社理光 信息处理装置、证书管理方法、证书管理程序
CN101674301A (zh) * 2009-05-31 2010-03-17 北京飞天诚信科技有限公司 一种存储证书的方法
CN101923665A (zh) * 2009-06-16 2010-12-22 赵频 一种管理系统和方法
CN101808092A (zh) * 2010-03-12 2010-08-18 中国电信股份有限公司 多证书共享方法、系统和智能卡
CN101951319A (zh) * 2010-09-29 2011-01-19 中国航天科工集团第四研究院第四总体设计部 一种支持异构应用模块数据整合的统一身份认证方法
CN102394869A (zh) * 2011-10-21 2012-03-28 河南科技大学 一种用于数字网络的数字内容共享方法及系统
CN102946398A (zh) * 2012-11-26 2013-02-27 国网信息通信有限公司 一种双网隔离环境下的数字证书系统
CN105260856A (zh) * 2015-11-12 2016-01-20 青岛中加科技投资控股有限公司 一种组合一体式企业信息管理装置
EP3386165A1 (en) * 2017-04-06 2018-10-10 Apeiron S.R.L. Method and device for implementing and managing secure communications, provisioning systems, authentication and signing systems
CN107358561A (zh) * 2017-07-17 2017-11-17 长威信息科技发展股份有限公司 一种基于个人信用评分的证书自助办理方法及装置
CN108183804A (zh) * 2018-03-28 2018-06-19 湖南东方华龙信息科技有限公司 证书共享方法
CN108471419A (zh) * 2018-03-28 2018-08-31 湖南东方华龙信息科技有限公司 基于可信身份的证书共享方法
CN108764706A (zh) * 2018-05-25 2018-11-06 安徽理工大学 一种基于大数据的人才信息管理系统和方法
CN114240344A (zh) * 2021-12-06 2022-03-25 企查查科技有限公司 企业人员数据处理方法、装置、计算机设备和存储介质
CN116205593A (zh) * 2023-01-13 2023-06-02 上海梦创双杨数据科技股份有限公司 培训证书生成方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN117314476A (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
US7783658B1 (en) Multi-entity ontology weighting systems and methods
Cormack et al. Overview of the TREC 2010 legal track.
Carvalho et al. Probabilistic ontology and knowledge fusion for procurement fraud detection in Brazil
WO2022134466A1 (zh) 数据处理方法及相关设备
CN111709714B (zh) 基于人工智能的流失人员预测方法和装置
CN113032403B (zh) 数据洞察方法、装置、电子设备及存储介质
Harper et al. Using administrative data to count local populations
Davis et al. Use of multiple data sources for surveillance of work‐related amputations in Massachusetts, comparison with official estimates and implications for national surveillance
Bieh et al. Guidance for health risk assessment at recurrent mass gatherings: The Jeddah tool framework
CN117314476B (zh) 一种证书数据的整合方法及装置
CN111325255B (zh) 特定人群圈定方法、装置、电子设备及存储介质
Amies et al. Success factors for dam engineering industry: systematic literature review and conceptual classification
Shati et al. Social network size estimation and determinants in tehran province residents
Ozili Sustainable Development Goals and bank profitability: International evidence
CN115952216A (zh) 一种养老保险数据挖掘方法、装置、存储介质及电子设备
Martin Understanding the social geography of census undercount
CN113989005A (zh) 一种税务风险企业挖掘方法及装置
Fox Quantifying religion and state: round two of the religion and state project
CN112416922A (zh) 一种团伙关联数据挖掘方法、装置、设备及存储介质
CN108629555B (zh) 一种履历交叉验证的背调方法、装置、系统及其存储介质
Yampolskaya Research at work: Administrative data and behavioral sciences research
CN111460052A (zh) 一种基于监察数据关联分析的低保资金监督方法与系统
Anderson et al. Estimating the prevalence of human trafficking in Ohio
Hamilton et al. Legal status and health disparities
CN109598485A (zh) 一种突发事件报事方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant