CN110019542A - 企业图谱中企业关系的生成方法、生成组织成员数据库及识别同名成员的方法、装置 - Google Patents

企业图谱中企业关系的生成方法、生成组织成员数据库及识别同名成员的方法、装置 Download PDF

Info

Publication number
CN110019542A
CN110019542A CN201710695366.9A CN201710695366A CN110019542A CN 110019542 A CN110019542 A CN 110019542A CN 201710695366 A CN201710695366 A CN 201710695366A CN 110019542 A CN110019542 A CN 110019542A
Authority
CN
China
Prior art keywords
information
attribute
organizational
database
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710695366.9A
Other languages
English (en)
Other versions
CN110019542B (zh
Inventor
李小健
赵丹
黄晓婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710695366.9A priority Critical patent/CN110019542B/zh
Publication of CN110019542A publication Critical patent/CN110019542A/zh
Application granted granted Critical
Publication of CN110019542B publication Critical patent/CN110019542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种企业图谱中企业关系的生成方法,包括:获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;获取该第二组成成员的关系属性信息;基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。本申请同时涉及一种用于查询组织成员数据的方法、识别同名成员是否相同的方法、装置及电子设备。

Description

企业图谱中企业关系的生成方法、生成组织成员数据库及识 别同名成员的方法、装置
技术领域
本申请涉及同名识别和组织成员信息获取技术,具体涉及一种企业图谱中企业关系的生成方法及装置、一种机构间关系的生成方法、一种生成组织成员数据库的方法及装置;本申请同时涉及一种用于查询组织成员数据的方法、识别同名成员是否相同的方法以及装置;本申请同时提供一种识别同名成员是否相同的电子设备;本申请同时提供一种生成组织成员数据库的电子设备。
背景技术
现代社会,无论是在实体领域还是虚拟领域,对于组织成员信息的标注都非常重要,且应用非常普遍。然而,大多数情况下,对于个体信息都是通过名称进行标注的。名称标注的问题在于同名成员所对应的真实个体很难进行分辨,尤其在信息查询领域,常有的情况是,在各种信息平台进行信息查询时,会出现具有相同名称的个体出现多次、或者同一名称多次出现在不同名称的组织中的情况,而我们无法对多次出现的名称信息确定其对应的真实个体,无法确定多次出现在不同名称的组织的同名成员是否是相同个体,也无法确定所述不同名称的组织之间是否有一定的关联关系。
上述问题造成了成员名称和成员实体之间逻辑关系的混乱,并且无法对所述多次出现的名称信息所对应的真实个体进行分辨。
随着大数据时代的到来,各领域对信息的摄取和应用都达到了新的高度,尤其是对于准确信息的需求变得越来越广泛,例如企事业单位信息、民间团体机构信息、商品信息等都可以进行批量录入,将个体识别信息和其对应的特征属性信息进行标准化匹配,从而形成统一的信息匹配搜索平台,大大提高了各领域的信息匹配的准确性、高效性、相关性和完整性。
然而,在对实体信息进行查询时,大多数时候获得的实体信息都是没有经过整合的零碎信息,获取比较全面的实体信息还比较困难,无法将个体的实体信息进行更深层次的发掘和拓展,造成了进一步获取实体信息的障碍。
发明内容
本申请提供一种企业图谱中企业关系的生成方法,以解决现有的组织成员信息获取的上述的问题;本申请另外提供一种机构间关系的生成方法、生成组织成员数据库的方法、一种用于查询组织成员数据的方法、识别同名成员是否相同的方法、装置及电子设备;
本申请提供的一种企业图谱中企业关系的生成方法,包括:
获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。
可选的,所述关系属性信息,包括:成员名称和所述成员所属企业的名称;和/或
所述成员所属企业的设定组成成员。
可选的,所述关系属性信息为所述成员所属企业的设定组成成员;所述基于关系属性信息判断第一组织成员与第二组织成员是否为同一人包括:
对第一组织成员与第二组织成员各自所属企业的设定组成成员名称进行标准化处理;
比对第一组织成员与第二组织成员所属企业的设定组成成员中的相同成员数量是否满足设定的阈值,若满足,则视第一组织成员与第二组织成员为同一人;若不满足,则视第一组织成员与第二组织成员为不同人。
本申请还提供一种生成组织成员数据库的方法,其包括:
接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;
根据判断结果更新所述组织成员数据库。
可选的,所述辨识信息为成员的关系属性信息,包括:
成员名称和所述成员所属组织的名称;和/或
所述成员所属组织的设定组成成员。
可选的,所述根据所述辨识信息判断数据库中是否存在该成员的数据记录包括:
接收所述成员名称和所述成员所属组织的名称,判断所述数据库中是否存在所述成员名称和所述成员所属组织的名称对应的标识识别码;
若不存在,接收所述成员所属组织的设定组成成员,判断所述数据库中是否存在与所述成员所属组织的设定组成成员相同的成员,且相同成员数量是否满足设定阈值的数据记录。
可选的,若相同成员数量不满足设定阈值的数据记录,则视为所述组织成员数据库中不存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
将该组织成员的辨识信息作为新成员数据输入到所述组织成员数据库中。
可选的,所述作为新成员数据输入所述组织成员数据库包括:
将成员名称和其所属的组织名称生成标识识别码;
将所述成员信息进行标准化处理;
将标准化处理之后的成员信息绑定到所述标识识别码下。
将所述标识识别码和标准化处理之后的成员信息存储到所述组织成员数据库中。
可选的,所述将成员名称和其所属的组织名称生成标识识别码包括:
在所述成员名称及其属组织名称中加入密码盐,生成待编码对象,对所述待编码对象进行MD5计算,生成标识识别码。
可选的,所述进行标准化处理的成员信息,包括:
成员名称;
成员所属的组织名称;
成员所属组织的设定组成成员;
成员的个体属性信息。
可选的,若相同成员数量满足设定阈值的数据记录,则所述根据判断结果更新所述组织成员数据库包括:
将所述辨识信息标准化处理后作为增量信息添加至满足匹配的所述成员的数据记录中。
可选的,所述辨识信息为成员的个体属性信息;
所述根据所述辨识信息判断所述组织成员数据库中是否存在该成员的数据记录包括:
判断所述组织成员数据库中是否存在设定数量相同的属性类型和相同的对应属性值的个体属性信息的数据记录;若不存在,则视为所述组织成员数据库中不存在该成员的数据记录。
可选的,若不存在,则视为所述组织成员数据库中不存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
则将该组织成员的辨识信息作为新成员数据输入所述组织成员数据库。
可选的,若存在,则视为所述组织成员数据库中存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
将所述辨识信息标准化处理后作为增量信息添加至满足匹配的所述成员的数据记录中。
此外,本申请还提供一种生成组织成员数据库的装置,其包括:
辨识信息接收单元:用于接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
数据记录判断单元:用于根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;
组织成员数据库更新单元:用于根据判断结果更新所述组织成员数据库。
此外,本申请还提供一种用于查询组织成员数据的方法,其包括
接收对组织成员数据的查询请求;
根据所述查询请求,在组织成员数据库中查询该成员的数据记录;
若存在同名组织成员的不同数据记录,则根据所述数据记录获取各自的辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
将所述同名成员的辨识信息进行比对,根据比对结果给出所述同名成员是否同一成员的识别结果。
此外,本申请还提供一种识别同名成员是否相同的方法,其包括:
接收识别同名成员对应实体是否相同的请求信息;
根据所述请求信息,获取所述同名成员的辨识信息;
将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;
其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
可选的,所述同名成员的辨识信息为关系属性信息;所述关系属性信息为同名成员所属组织的设定组成成员名称。
可选的,所述将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果包括:
对同名成员各自所属组织的设定组成成员名称进行标准化处理;
比对同名成员所属组织的设定组成成员中的相同成员是否满足设定的阈值,若满足,则视所述同名成员为同一实体;若不满足,则视所述同名成员为不同实体。
可选的,所述同名成员的辨识信息为成员个体属性信息;所述将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果包括:
分别对同名成员各自的个体属性信息进行标准化处理;
判断所述标准化处理后相应的个体属性信息的相同属性类型所对应的属性值相同的数量是否满足设定值,若满足,则视所述同名成员为同一实体;若不满足,则视所述同名成员为不同实体。
可选的,所述同名成员为同名企业管理人员或股东,所述同名成员所属组织为其所属企业;所述辨识信息包括:
所述成员关系属性信息包括所述同名企业管理人员或股东所属企业的设定企业管理人员或股东名单;
所述成员个体属性信息包括所述企业管理人员或股东的身份信息、教育信息及经历信息。
此外,本申请还提供一种识别同名成员是否相同的装置,其包括:
信息接收单元:用于接收识别同名成员对应实体是否相同的请求信息;
辨识信息获取单元:用于根据所述请求信息,获取所述同名成员的辨识信息;
识别结果获得单元:用于将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;
其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
此外,本申请还提供一种电子设备,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:
获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。
此外,本申请还提供一种识别同名成员是否相同的电子设备,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:接收识别同名成员对应实体是否相同的请求信息;根据所述请求信息,获取所述同名成员的辨识信息;将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
此外,本申请还提供一种生成组织成员数据库的电子设备,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;根据判断结果更新所述组织成员数据库。
此外,本申请还提供一种机构间关系的生成方法,其包括:
获取第一机构的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二机构,该第二机构的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一机构与第二机构的关系。
此外,本申请还提供一种电子设备,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:获取第一机构的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二机构,该第二机构的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一机构与第二机构的关系。
与现有技术相比,本申请具有以下优点:本申请的一种企业图谱中企业关系的生成方法包括获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;获取该第二组成成员的关系属性信息;基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。本申请的方法通过对不同企业成员是否相同来建立企业之间的关系,有利于组织及成员关系网建立,并基于该关系网可构建完整、准确的组织关系图谱。
附图说明
图1为第一实施例的识别同名成员是否相同的方法流程图;
图2为第一实施例中的经过标准化处理后所生成的企业设定组成人员表格;
图3为第一实施例中的经过标准化处理后所生成的企业成员属性信息表格;
图4为第二实施例的生成组织成员数据库的方法流程图;
图5为第二实施例中所生成的数据记录表格;
图6为第三实施例的识别同名成员是否相同的装置单元框图;
图7为第四实施例的生成组织成员数据库的装置单元框图;
图8为第五实施例的识别同名成员是否相同的电子设备的示意图;
图9为第六实施例的生成组织成员数据库的电子设备的示意图。
图10为本申请的一种企业图谱中企业关系的生成方法的实施例的流程图
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
在本申请中,提供了一种企业图谱中企业关系的生成方法、一种机构间关系的生成方法、一种识别同名成员是否相同的方法以及装置;一种生成组织成员数据库的方法以及装置;本申请同时提供一种电子设备。以下结合各部分的实施例进行详细说明。
本申请第一实施例提供一种识别同名成员是否相同的方法,其在于识别同名成员是否相同时,利用对所述同名成员的辨识信息进行比对,根据比对结果确定识别结果,即确定识别的同名成员是否是同一成员。请参考图1,其为本申请第一实施例的识别同名成员是否相同的方法流程图。以下结合图1介绍该实施例。所述识别同名成员是否相同的方法,包括如下步骤:
步骤S101:接收识别同名成员对应实体是否相同的请求信息。
本申请针对相同名称对应实体的识别问题提供解决办法,在进行同名识别之前,需要接收到识别同名成员是否相同的请求信息,本步骤将对所述获取请求信息的背景和方式展开说明。
本申请提供的识别方法通过对同名成员所对应的辨识信息进行信息匹配,以匹配结果确定所述同名成员所对应的实体是否相同,从而完成对所述同名成员的识别。
在本实施例中,以待识别同名成员为企业的特定管理人员或股东为例来进行说明,例如,当同一高管姓名出现在不同企业中或者出现在不同的商业背景中时,要经过同名识别的方式以确定其是否是同一高管。需要说明的是,本申请所要保护的技术方案并不局限于此,其可应用于任何具有相同名称或姓名却隶属于不同组织的个体的识别。
所述请求信息携带待识别成员名称,或其他用于指代该成员的且与该成员实体具有强联系的代号;同时,所述请求信息还携带有该成员所属或所在组织的名称。本申请中,所述“组织”为与前述成员同类的个体集合,所述成员可以归属于该集合,也可以与该集合具备特定的联系。在本实施例中,该集合为企业,成员为股东和特定管理人员,二者为投资关系或隶属关系。例如,已知的,高管A是企业B的高管成员,与高管A同名的高管A1为企业C的高管成员,为了识别所述A和A1是否为同一个人,则需要分别提供高管A的姓名和企业B的名称以及高管A1的姓名和企业C的名称作为可进行区分查询的主体信息。
步骤S102:根据所述请求信息,获取所述同名成员的辨识信息;所述辨识信息包括成员个体属性信息和/或关系属性信息。
接收前述识别请求后,需要获取待识别成员的辨识信息,通过辨识信息确定待识别成员是否为同一主体。其中,所述辨识信息可以为前述成员的个体属性信息,即历史形成的与该成员的身份密切相关的信息;也可以为该成员的关系属性信息,也即该成员参与的或归属的特定组织的组织属性信息,如该组织的组成人员信息、该组织的活动信息、以及该组织的作用的对象等。例如,在本实施例中,以所述企业高管作为同名成员,其个体属性信息为该高管的身份信息、教育信息以及经历信息等,如所述高管的出生年月、籍贯、毕业院校等固定信息,每个个体属性信息由对应的属性种类和属性值组成;所述关系属性信息为该高管所属企业的设定组成人员,如所属企业的特定管理人员和股东。
所述辨识信息可从多种渠道获得,例如企业高管数据库、工商和税务网站、以及所述企业高管所属的企业网站等,其中,所述企业高管数据库为优先选择的信息来源地址。当从所述优选的信息来源地址中无法获取所述辨识信息时,可转换成其它信息来源地址进行获取。例如,本实施例中,当所述企业高管数据库中缺少A的辨识信息时,将从A所属企业的企业网站或者工商和税务网站中获取A的辨识信息,并且将所述获取的辨识信息提供给所述企业高管数据库进行存储,作为该数据库进行数据更新的一种方式。
所述辨识信息中的关系属性信息无法获取的情况为所述企业高管数据库中没有所述同名成员所属企业的设定组成人员姓名,或者缺少比对双方的其中任意一方的企业设定组成人员姓名;所述辨识信息中的个体属性信息无法获得的情况为所述企业高管数据库中没有所述同名成员的个体属性信息,或者缺少比对双方中的其中一方的个体属性信息,或者一方的个体属性信息与另一方的个体属性信息的属性种类不匹配。
在所述企业高管数据库中,每个高管对应如下信息:姓名、所属企业名称、所属企业的设定组成人员以及个体属性信息。所述姓名包括高管的曾用名(如有的话);其所属的企业名称包括目前就职的企业和曾经有就职经历的企业的名称;高管所属企业的设定组成人员包括所述高管目前就职的企业和曾经有就职经历的企业的特定管理人员和股东,所以,在所述数据库中,一个企业高管可对应多个所属企业,并且可对应多个所属企业的设定组成人员;高管的个体属性信息包括所述高管的身份信息、教育信息以及经历信息,例如所述高管出生年月、籍贯、毕业院校等固定信息,每个固定的个体属性信息由对应的属性种类和属性值组成,例如,高管A的属性种类为身高,其对应的属性值为175CM。
在本实施例中,所述根据请求信息获得辨识信息的过程为:
首先,当所述企业高管数据库接收到的主体信息为高管A和企业B时,可根据该主体信息快速匹配到A的企业高管信息,所述A的企业高管信息为该数据库中关于高管A的全部数据记录,即:A的姓名、A所属企业名称、A所属企业的设定组成人员名称、A的属性信息等四个部分内容,。
其次,按照预定的抽取程序,对所述A所属企业的设定组成人员名称进行抽取,或者对所述A的个体属性信息按照同样的抽取方法进行抽取。
步骤S103:将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果。
所述分别获得来自所述辨识信息来源地址的同名成员的辨识信息之后,将按照预定程序对所述辨识信息进行比对,并且根据比对结果确定所述同名成员是否为相同实体的识别结果。
本实施例中,按照预定程序分别获得所述同名企业高管的辨识信息之后,需对所述获得的辨识信息进行标准化处理,所述标准化处理指的是对所述辨识信息进行数据清洗和格式化,使之以预定的标准形式进行匹配。例如,由于同一个企业会变更名称,且简称也有多个,标准化的过程主要是将简称、历史名称等对应到同一个名称下面,并且根据预定的清洗规则进行数据清洗,如将中文括号清洗为英文括号、将乱码过滤掉、将含标点符号的公司过滤掉。同理,对高管姓名做标准化处理的方法与上述对企业名称的标准化处理方法形同。请参考图2,图2为本实施例中的高管A所属企业的设定组成人员经过标准化处理后所生成的企业设定组成人员表格。再例如,图3为本实施例中的高管A的个人属性信息经过标准化处理之后所生成的企业成员属性信息表格,其中包含有高管姓名和属性信息,属性信息包含属性种类和属性值,它们以json串的方式进行连接。
如果所述辨识信息来自所述企业高管数据库,所述获得的辨识信息则无需进行标准化处理,因为所述企业高管数据库中的信息是预先经过标准化处理之后存储的。
在辨识信息比对环节,当所述辨识信息为关系属性时,比对的过程为判断同名成员所属组织的设定组成成员中的相同成员的个数是否满足设定的阈值,例如,在本实施例中,比对的过程是对A所属企业的设定组成人员姓名和A1所属企业的设定组成人员姓名进行匹配,如果所述两组组成人员名称有两个或两个以上的姓名一致,则视为所述匹配结果相符,由此确定所述A和A1为同一高管,否则,则视为所述匹配结果不相符,即所述A和A1为不同高管。
当所述辨识信息为个体属性时,上述比对的过程为判断同名成员的个体属性信息的相同属性类型所对应的属性值相同的数量是否满足设定值,例如,本实施例中对A和A1的个体属性信息中的相同属性种类的属性值进行匹配,如果有两种或两种以上属性种类所对应的属性值一致,则认为匹配结果相符,由此确定所述同名企业高管为同一高管,否则,则认为匹配结果不相符,所述同名企业高管为不同高管。
此外,本申请另一实施例提供一种企业图谱中企业关系的生成方法,图10为本申请的一种企业图谱中企业关系的生成方法的实施例的流程图,请参考图10:
步骤S1001,获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;其中,所述个人属性信息与所述关系属性信息可以前述实施例相同,这里不再赘述。
步骤S1002,通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;可以通过税务、工商等官方部门网站或其他渠道公布的企业信息查询第二企业及第二组织成员的个人属性信息,当然,也可以通过其他商用数据库进行查询,这里对此不作限定。
步骤S1003,获取该第二组成成员的关系属性信息;根据第二组织成员所属第二企业获取该第二组织成员的关系属性信息。例如,第二企业的股东、高级管理人员等构成该第二企业的关系属性信息。
步骤S1004,基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。
所述关系属性信息为所述成员所属企业的设定组成成员;所述基于关系属性信息判断第一组织成员与第二组织成员是否为同一人包括:对第一组织成员与第二组织成员各自所属企业的设定组成成员名称进行标准化处理;比对第一组织成员与第二组织成员所属企业的设定组成成员中的相同成员数量是否满足设定的阈值,若满足,则视第一组织成员与第二组织成员为同一人;若不满足,则视第一组织成员与第二组织成员为不同人。具体的描述可参看前述实施例对不同组织的个体是否为同一人的判定方法,在此不再赘述。
在判定第一组织成员和第二组织成员为同一人后,建立以该第一组织成员为关系的第一企业和第二企业的关系。依次类推,可建立第一企业、第二企业与第三企业的关系。依据企业的组成人员建立企业之间的关系图谱。
本申请第二实施例提供一种生成组织成员数据库的方法,其核心思想在于,将待获取的组织成员信息中的部分已知信息在对应的数据库中进行匹配,根据匹配结果确定所述数据库中是否可提供所述待获取的组织成员信息,并且将所述部分已知信息更新到所述数据库中,以完善所述数据库。请参考图4,其为本申请第二实施例的生成组织成员数据库的方法流程图。以下结合图4介绍该实施例。所述生成组织成员数据库的方法,包括如下步骤:
步骤S201:接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
本实施例的框架构造为:在组织成员对应领域的数据库中,利用所述成员的部分信息获取尽可能多的完整信息的过程,本步骤所说明的内容为所述成员的部分信息的接收背景和方法。
所述组织成员辨识信息的接收主体为所述组织成员所对应的数据库。例如,本实施例中,以所述第一实施例中的企业高管A为例进行说明,所述组织成员所对应的数据库为上述第一实施例中的企业高管数据库,在本实施例中,对所述数据库的引用完全按照本申请第一实施例中的对所述企业高管数据库的说明。不同的是,本实施例要实现的是将所述企业高管A的辨识信息在所述企业高管数据库中进行匹配,从而获得A的相对完整信息、并且将A的辨识信息在所述数据库中进行更新的过程。
所述辨识信息指的是为了对某一成员的完整信息进行挖掘而提供的匹配信息,是预先通过其他途径获得的。所述辨识信息分为个体属性信息和关系属性信息,所述关系属性信息包括成员的名称与所述成员所属组织的名称的组合以及成员名称与所述成员所属组织的设定组成成员名称的组合;所述个体属性信息为成员的名称与所述成员的个体属性信息的组合。本实施例中,按照其内容的复杂程度和获取途径的难易程度将所述辨识信息分为三种等级,分别为:第一辨识信息:A的姓名和A所属企业的名称的组合;第二辨识信息:A的姓名和A所属企业的设定组成成员姓名的组合;第三辨识信息:A的姓名和A的个体属性信息的组合,所述高管A的属性信息包括高管A的属性种类,即出生年月、身高、性别、籍贯、毕业院校等固定信息,以及所述属性种类对应的属性值。
步骤S202:根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录。
当所述组织成员数据库接收到所述辨识信息之后,需要对所述辨识信息进行匹配,并根据匹配结果判断所述数据库中是否存在该成员的数据记录,本步骤主要是对所述辨识信息在该数据库中进行匹配的方法进行说明。
本实施例中,所述第一、第二和第三辨识信息仅仅是根据其信息内容的复杂程度和获取途径的难易程度而进行划分的,并不作为所述企业高管数据库接收所述辨识信息的次序和形式的限定,即原则上,该数据库只进行匹配,而不对所述辨识信息的内容和匹配次序进行选择和限定。然而,基于对匹配过程科学性和高效性的考虑,本申请优选的匹配方法为递进式匹配,即,全部接收所述辨识信息,将所述辨识信息进行标准化处理后按预定分类规则进行分类,划分出第一、第二和第三辨识信息,在匹配时,有选择性地先抽取第一辨识信息进行匹配,在根据第一辨识信息无法获取匹配结果时,再依次对第二、甚至第三辨识信息进行匹配,当所获取的辨识信息只有第二或者第三辨识信息时,则无选择性地根据所获取的辨识信息进行匹配。
本实施例中,该数据库预先对包含的成员信息中的高管和其所属企业的名称进行了数据编码,且生成了A的特定标识识别码,所述数据库中的A的标示识别码下对应的数据记录信息包括:A的姓名、A所属企业名称、A所属企业的设定组成人员名称以及A的个体属性信息等四个部分。所述对所述辨识信息的匹配过程为:将所述辨识信息与上述内容进行比对,如果所述辨识信息包含在上述信息中,或者与上述信息具有较高的重合度,则视为匹配结果相符;反之,则视为匹配结果不符。例如,当接收所述A的姓名和A所属企业的名称的组合在所述数据库中进行匹配时,匹配成功的条件为:根据A的姓名和A所属企业的名称的组合可获得其对应的标示识别码;当A的姓名和A所属企业的设定组成人员的名单的组合在所述企业高管数据库中进行匹配时,匹配成功的条件为:所述辨识信息与所述数据库中的A所属企业的设定组成人员中有两个或两个以上的姓名重合;当A的姓名和A的个体属性信息的组合在所述企业高管数据库中进行匹配时,匹配成功的条件为:所述辨识信息与所述数据库中的A的个体属性信息中至少有两种属性种类的属性值相符。
步骤S203:根据判断结果更新所述组织成员数据库。
在上述步骤完成辨识信息的匹配之后,本步骤将根据所述信息匹配结果确定是否可获取所述组织成员的数据记录,并同步将所接收的辨识信息的内容进行标准化处理后存储在所述组织成员数据库中,此方法为所述组织成员数据库进行数据更新的重要方法,所述辨识信息为所述组织成员数据库的重要信息来源。并且,如果所述匹配结果相符,则将所述可获取的成员数据记录进行展示。
上述匹配结果相符时,更新所述组织成员数据库的过程为:将所述辨识信息标准化处理后作为增量信息添加至所述满足匹配的成员数据记录中的对应信息项下。本实施例中,所述将辨识信息进行标准化处理,指的是将所述辨识信息进行归类、数据计算、数据清洗等一系列处理后使之与企业高管数据库所要求的内容格式相一致,并将处理后的信息内容更新到所述企业高管数据库中。
例如,上述匹配过程中所接收的辨识信息为A的姓名,A所属的企业E和F,A所属企业的3个设定组成人员,A的身高、毕业院校。如果该辨识信息与企业高管数据库的匹配结果相符,且相符的条件为:在进行第二辨识信息匹配时,A所属企业的3个设定组成成员中有两个人员姓名与所述企业高管数据库中的高管A的数据记录信息中的A所属企业的设定组成人员的姓名相符,以上相符的条件说明所述A所属的企业E和F均不存在于所述数据库中,高管A所属企业的3个设定组成人员中有其中一个不存在于所述数据库中,并且,所接收的高管A的身高和毕业院校也可能不存在于所述数据库中,需要将所述不存在的辨识信息的内容按预定方法标准化处理并更新到所述企业高管数据库中的高管A的成员数据记录中的对应信息项下。
上述匹配结果不相符时,更新所述组数据库的过程为:将该组织成员的辨识信息进行标准化处理后,作为新成员数据输入到所述组织成员数据库中。例如,本实施例中,如果上述匹配结果不相符,则说明具有上述辨识信息的高管A不存在于所述企业高管数据库中,需要作为新的成员数据记录输入到所述企业高管数据库中,其过程为:将成员名称和其所属的组织名称进行编码后生成标识识别码,本实施例中,所述生成标示识别码的方法为在所述高管A及其所属企业名称中加入密码盐,生成待编码对象,对所述待编码对象进行MD5计算后生成标识识别码;将所述成员信息进行标准化处理,本实施例中,所述标准化处理的方法与第一实施例中的步骤S103中的标准化方法相同,在此不加赘述;将标准化处理之后的成员信息绑定到所述标识识别码下,本步骤请参考图5,图5为所述企业高管信息进行标准化处理并绑定之后所生成的A的企业高管数据记录表格;将所述标识识别码和标准化处理之后的成员信息存储到所述组织成员数据库中,以后续接收的辨识信息作为增量信息而进行数据完善。
上述实施例的成组织成员的方法,在生成或更新时,对不同组织同名成员进行识别,并根据识别结果增加新的数据记录或更新已有的成员信息,不但可避免同一实体成员数据记录的重复存储,还可以在识别同名成员的基础上丰富成员的属性信息,有利于组织及成员关系网建立,并基于该关系网可构建完整、准确的组织关系图谱。
本申请还提供一种识别同名成员是否相同的装置。请参看图6,其为本方案第三实施例提供的一种识别同名成员是否相同的装置实施例单元框图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下面描述的装置实施例仅是示意性的。
所述识别同名成员是否相同的装置,包括:
信息接收单元301:用于接收识别同名成员对应实体是否相同的请求信息;
辨识信息获取单元302:用于根据所述请求信息,获取所述同名成员的辨识信息;所述辨识信息包括成员个体属性信息和/或关系属性信息。
识别结果获得单元303:用于将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果。
优选的,所述同名成员的辨识信息为关系属性信息;所述关系属性信息为同名成员所属组织的设定组成成员名称。
优选的,所述将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果包括:
对同名成员各自的关系属性进行标准化处理;
比对同名成员所属组织的设定组成人员中的相同成员是否满足设定的阈值,若满足,则视所述同名成员为同一实体;若不满足,则视所述同名成员为不同实体。
优选的,所述同名成员的辨识信息为成员个体属性信息;所述将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果包括:
分别对同名成员的个体属性信息进行标准化处理;
判断所述标准化处理后相应的个体属性信息的相同属性类型所对应的属性值相同的数量是否满足设定值,若满足,则视所述同名成员为同一实体;若不满足,则视所述同名成员为不同实体。
优选的,所述同名成员为同名企业管理人员或股东,所述同名成员所属组织为其所属企业;所述辨识信息包括:
所述成员关系属性信息包括所述同名企业管理人员或股东所属企业的设定企业管理人员或股东名单;
所述成员个体属性信息包括所述企业管理人员或股东的身份信息、教育信息及经历信息。
本申请还提供一种获取实体信息的装置。请参看图7,其为本方案第四实施例提供的一种获取实体信息的装置实施例单元框图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下面描述的装置实施例仅是示意性的。
所述生成组织成员数据库的装置包括:
辨识信息接收单元401:用于接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
数据记录判断单元402:用于根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;
组织成员数据库更新单元403:用于根据判断结果更新所述组织成员数据库。
优选的,所述辨识信息为成员的关系属性信息,包括:
成员名称和所述成员所属组织的名称;和/或
所述成员所属组织的设定组成成员。
优选的,所述根据所述辨识信息判断数据库中是否存在该成员的数据记录包括:
接收所述成员名称和所述成员所属组织的名称,判断所述数据库中是否存在所述成员名称和所述成员所属组织的名称对应的标识识别码;
若不存在,接收所述成员所属组织的设定组成成员,判断所述数据库中是否存在与所述成员所属组织的设定组成成员相同的成员,且相同成员数量是否满足设定阈值的数据记录。
优选的,若相同成员数量不满足设定阈值的数据记录,则视为所述组织成员数据库中不存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
将该组织成员的辨识信息作为新成员数据输入所述组织成员数据库。
优选的,所述作为新成员数据输入所述组织成员数据库包括:
将成员名称和其所属的组织名称生成标识识别码;
将所述成员信息进行标准化处理;
将标准化处理之后的成员信息绑定到所述标识识别码下。
将所述标识识别码和标准化处理之后的成员信息存储到所述组织成员数据库中。
优选的,所述将成员名称和其所属的组织名称生成标识识别码包括:
在所述成员名称及其属组织名称中加入密码盐,生成待编码对象,对所述待编码对象进行MD5计算,生成标识识别码。
优选的,所述进行标准化处理的成员信息,包括:
成员名称;
成员所属的组织名称;
成员所属组织的设定组成成员;
成员的个体属性信息。
优选的,若相同成员数量满足设定阈值的数据记录,则所述根据判断结果更新所述组织成员数据库包括:
将所述辨识信息标准化处理后作为增量信息添加至满足匹配的所述成员的数据记录中。
优选的,所述辨识信息为成员的个体属性信息;
所述根据所述辨识信息判断所述组织成员数据库中是否存在该成员的数据记录包括:
判断所述组织成员数据库中是否存在设定数量相同的属性类型和相同的对应属性值的个体属性信息的数据记录;若不存在,则视为所述组织成员数据库中不存在该成员的数据记录。
优选的,若不存在,则视为所述组织成员数据库中不存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
则将该组织成员的辨识信息作为新成员数据输入所述组织成员数据库。
优选的,若存在,则视为所述组织成员数据库中存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
将所述辨识信息标准化处理后作为增量信息添加至满足匹配的所述成员的数据记录中。
本申请第五实施例提供一种识别同名成员是否相同的电子设备,请参看图8,该图为该设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
所述识别同名成员是否相同的电子设备,包括:处理器501;存储器502。所述存储器502用以存储实现识别同名成员是否相同的程序,所述程序在被所述处理器读取运行后,执行如下操作:
接收识别同名成员对应实体是否相同的请求信息;
根据所述请求信息,获取所述同名成员的辨识信息;
将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;
其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
本申请第六实施例提供一种生成组织成员数据库的电子设备,请参看图9,该图为该设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
所述生成组织成员数据库的电子设备,包括:处理器601;存储器602。所述存储器602用以存储实现生成组织成员数据库的程序,所述程序在被所述处理器读取运行后,执行如下操作:接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;根据判断结果更新所述组织成员数据库。
此外,本申请还提供一种电子设备,所述电子设备包括:处理器;存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:
获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。
此外,本申请还提供一种机构间关系的生成方法,其包括:
获取第一机构的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二机构,该第二机构的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一机构与第二机构的关系。
此外,本申请还提供一种电子设备,所述电子设备包括:处理器;存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:获取第一机构的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二机构,该第二机构的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一机构与第二机构的关系。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。
此外,本申请还提供用于查询组织成员数据的方法,该方法包括,接收对组织成员数据的查询请求;根据所述查询请求,在组织成员数据库中查询该成员的数据记录;若存在同名组织成员的不同数据记录,则根据所述数据记录获取各自的辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;将所述同名成员的辨识信息进行比对,根据比对结果给出所述同名成员是否同一成员的识别结果。其中,查询数据记录的方法及比对同名成员是否为同一成员的方法可以采用上述实施例所描述的方法,在次不在赘述。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (27)

1.一种企业图谱中企业关系的生成方法,其特征在于,包括:
获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。
2.根据权利要求1所述的企业图谱中企业关系的生成方法,其特征在于,
所述关系属性信息,包括:成员名称和所述成员所属企业的名称;和/或
所述成员所属企业的设定组成成员。
3.根据权利要求1所述的企业图谱中企业关系的生成方法,其特征在于,所述关系属性信息为所述成员所属企业的设定组成成员;所述基于关系属性信息判断第一组织成员与第二组织成员是否为同一人包括:
对第一组织成员与第二组织成员各自所属企业的设定组成成员名称进行标准化处理;
比对第一组织成员与第二组织成员所属企业的设定组成成员中的相同成员数量是否满足设定的阈值,若满足,则视第一组织成员与第二组织成员为同一人;若不满足,则视第一组织成员与第二组织成员为不同人。
4.一种生成组织成员数据库的方法,其特征在于,包括:
接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;
根据判断结果更新所述组织成员数据库。
5.根据权利要求4所述的生成组织成员数据库的方法,其特征在于,所述辨识信息为成员的关系属性信息,包括:
成员名称和所述成员所属组织的名称;和/或
所述成员所属组织的设定组成成员。
6.根据权利要求5所述的生成组织成员数据库的方法,其特征在于,所述根据所述辨识信息判断数据库中是否存在该成员的数据记录包括:
接收所述成员名称和所述成员所属组织的名称,判断所述数据库中是否存在所述成员名称和所述成员所属组织的名称对应的标识识别码;
若不存在,接收所述成员所属组织的设定组成成员,判断所述数据库中是否存在与所述成员所属组织的设定组成成员相同的成员,且相同成员数量是否满足设定阈值的数据记录。
7.根据权利要求6所述的生成组织成员数据库的方法,其特征在于,若相同成员数量不满足设定阈值的数据记录,则视为所述组织成员数据库中不存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
将该组织成员的辨识信息作为新成员数据输入到所述组织成员数据库中。
8.根据权利要求7所述的生成组织成员数据库的方法,其特征在于,所述作为新成员数据输入所述组织成员数据库包括:
将成员名称和其所属的组织名称生成标识识别码;
将所述成员信息进行标准化处理;
将标准化处理之后的成员信息绑定到所述标识识别码下。
将所述标识识别码和标准化处理之后的成员信息存储到所述组织成员数据库中。
9.根据权利要求8所述的生成组织成员数据库的方法,其特征在于,所述将成员名称和其所属的组织名称生成标识识别码包括:
在所述成员名称及其属组织名称中加入密码盐,生成待编码对象,对所述待编码对象进行MD5计算,生成标识识别码。
10.根据权利要求9所述的生成组织成员数据库的方法,其特征在于,所述进行标准化处理的成员信息,包括:
成员名称;
成员所属的组织名称;
成员所属组织的设定组成成员;
成员的个体属性信息。
11.根据权利要求6所述的生成组织成员数据库的方法,其特征在于,若相同成员数量满足设定阈值的数据记录,则所述根据判断结果更新所述组织成员数据库包括:
将所述辨识信息标准化处理后作为增量信息添加至满足匹配的所述成员的数据记录中。
12.根据权利要求4所述的生成组织成员数据库的方法,其特征在于,所述辨识信息为成员的个体属性信息;
所述根据所述辨识信息判断所述组织成员数据库中是否存在该成员的数据记录包括:
判断所述组织成员数据库中是否存在设定数量相同的属性类型和相同的对应属性值的个体属性信息的数据记录;若不存在,则视为所述组织成员数据库中不存在该成员的数据记录。
13.根据权利要求12所述的生成组织成员数据库的方法,其特征在于,若不存在,则视为所述组织成员数据库中不存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
则将该组织成员的辨识信息作为新成员数据输入所述组织成员数据库。
14.根据权利要求12所述的生成组织成员数据库的方法,其特征在于,若存在,则视为所述组织成员数据库中存在该成员的数据记录,所述根据判断结果更新所述组织成员数据库包括:
将所述辨识信息标准化处理后作为增量信息添加至满足匹配的所述成员的数据记录中。
15.一种生成组织成员数据库的装置,其特征在于,包括:
辨识信息接收单元:用于接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
数据记录判断单元:用于根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;
组织成员数据库更新单元:用于根据判断结果更新所述组织成员数据库。
16.一种用于查询组织成员数据的方法,其特征在于,包括
接收对组织成员数据的查询请求;
根据所述查询请求,在组织成员数据库中查询该成员的数据记录;
若存在同名组织成员的不同数据记录,则根据所述数据记录获取各自的辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;
将所述同名成员的辨识信息进行比对,根据比对结果给出所述同名成员是否同一成员的识别结果。
17.一种识别同名成员是否相同的方法,其特征在于,包括:
接收识别同名成员对应实体是否相同的请求信息;
根据所述请求信息,获取所述同名成员的辨识信息;
将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;
其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
18.根据权利要求17所述的识别同名成员是否相同的方法,其特征在于,所述同名成员的辨识信息为关系属性信息;所述关系属性信息为同名成员所属组织的设定组成成员名称。
19.根据权利要求18所述的识别同名成员是否相同的方法,其特征在于,所述将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果包括:
对同名成员各自所属组织的设定组成成员名称进行标准化处理;
比对同名成员所属组织的设定组成成员中的相同成员是否满足设定的阈值,若满足,则视所述同名成员为同一实体;若不满足,则视所述同名成员为不同实体。
20.根据权利要求17所述的识别同名成员是否相同的方法,其特征在于,所述同名成员的辨识信息为成员个体属性信息;所述将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果包括:
分别对同名成员各自的个体属性信息进行标准化处理;
判断所述标准化处理后相应的个体属性信息的相同属性类型所对应的属性值相同的数量是否满足设定值,若满足,则视所述同名成员为同一实体;若不满足,则视所述同名成员为不同实体。
21.根据权利要求17至20任一所述的识别同名成员是否相同的方法,其特征在于:所述同名成员为同名企业管理人员或股东,所述同名成员所属组织为其所属企业;所述辨识信息包括:
所述成员关系属性信息包括所述同名企业管理人员或股东所属企业的设定企业管理人员或股东名单;
所述成员个体属性信息包括所述企业管理人员或股东的身份信息、教育信息及经历信息。
22.一种识别同名成员是否相同的装置,其特征在于,包括:
信息接收单元:用于接收识别同名成员对应实体是否相同的请求信息;
辨识信息获取单元:用于根据所述请求信息,获取所述同名成员的辨识信息;
识别结果获得单元:用于将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;
其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
23.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:
获取第一企业的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二企业,该第二企业的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一企业与第二企业的关系。
24.一种识别同名成员是否相同的电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:接收识别同名成员对应实体是否相同的请求信息;根据所述请求信息,获取所述同名成员的辨识信息;将所述同名成员的辨识信息进行比对,根据比对结果获得识别结果;其中,所述辨识信息包括成员个体属性信息和/或关系属性信息。
25.一种生成组织成员数据库的电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:接收组织成员辨识信息,其中,所述辨识信息包括成员个体属性信息和/或关系属性信息;根据所述辨识信息判断组织成员数据库中是否存在该成员的数据记录;根据判断结果更新所述组织成员数据库。
26.一种机构间关系的生成方法,其特征在于,包括:
获取第一机构的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二机构,该第二机构的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一机构与第二机构的关系。
27.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,用于存储计算机可执行指令,所述计算机可执行指令在被所述处理器读取执行时,执行如下操作:获取第一机构的第一组织成员的成员信息,所述成员信息包括个人属性信息以及关系属性信息;
通过所述第一组织成员的个人属性信息,查询得到第二机构,该第二机构的第二组织成员与第一组织成员的个人属性信息匹配;
获取该第二组成成员的关系属性信息;
基于关系属性信息判断第一组织成员与第二组织成员是否为同一人,若是,则建立以该第一组织成员为关系链的第一机构与第二机构的关系。
CN201710695366.9A 2017-08-15 2017-08-15 企业关系的生成、生成组织成员数据库及识别同名成员 Active CN110019542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710695366.9A CN110019542B (zh) 2017-08-15 2017-08-15 企业关系的生成、生成组织成员数据库及识别同名成员

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710695366.9A CN110019542B (zh) 2017-08-15 2017-08-15 企业关系的生成、生成组织成员数据库及识别同名成员

Publications (2)

Publication Number Publication Date
CN110019542A true CN110019542A (zh) 2019-07-16
CN110019542B CN110019542B (zh) 2023-08-29

Family

ID=67186075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710695366.9A Active CN110019542B (zh) 2017-08-15 2017-08-15 企业关系的生成、生成组织成员数据库及识别同名成员

Country Status (1)

Country Link
CN (1) CN110019542B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427406A (zh) * 2019-08-10 2019-11-08 吴诚诚 组织机构相关人员关系的挖掘方法及装置
CN112214477A (zh) * 2020-09-25 2021-01-12 王存超 一种个人信息库的数据核查和更新方法
CN112966099A (zh) * 2021-02-26 2021-06-15 北京金堤征信服务有限公司 关系图谱展示方法、装置及计算机可读存储介质
CN114240344A (zh) * 2021-12-06 2022-03-25 企查查科技有限公司 企业人员数据处理方法、装置、计算机设备和存储介质
CN114611516A (zh) * 2022-02-28 2022-06-10 北京金堤科技有限公司 人名消歧方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090024428A1 (en) * 2007-07-19 2009-01-22 Hudock Jr Robert System for and method of processing business personnel information
WO2012061162A1 (en) * 2010-10-25 2012-05-10 Intelius Inc. Cost-sensitive alternating decision trees for record linkage
US20140379741A1 (en) * 2013-06-20 2014-12-25 Linkedln Corporation Identifying entities based on free text in member records
CN105138652A (zh) * 2015-08-28 2015-12-09 山东合天智汇信息技术有限公司 一种企业关联关系识别方法及系统
CN106156082A (zh) * 2015-03-31 2016-11-23 华为技术有限公司 一种本体对齐方法及装置
CN106407461A (zh) * 2016-10-10 2017-02-15 山东合天智汇信息技术有限公司 一种企业圈的生成方法及系统
CN106528822A (zh) * 2016-11-17 2017-03-22 山东合天智汇信息技术有限公司 一种企业关系圈构建方法、查询方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090024428A1 (en) * 2007-07-19 2009-01-22 Hudock Jr Robert System for and method of processing business personnel information
WO2012061162A1 (en) * 2010-10-25 2012-05-10 Intelius Inc. Cost-sensitive alternating decision trees for record linkage
US20140379741A1 (en) * 2013-06-20 2014-12-25 Linkedln Corporation Identifying entities based on free text in member records
CN106156082A (zh) * 2015-03-31 2016-11-23 华为技术有限公司 一种本体对齐方法及装置
CN105138652A (zh) * 2015-08-28 2015-12-09 山东合天智汇信息技术有限公司 一种企业关联关系识别方法及系统
CN106407461A (zh) * 2016-10-10 2017-02-15 山东合天智汇信息技术有限公司 一种企业圈的生成方法及系统
CN106528822A (zh) * 2016-11-17 2017-03-22 山东合天智汇信息技术有限公司 一种企业关系圈构建方法、查询方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
郝丹丹等: "基于属性关系图的同名实体区分算法", 《计算机工程与科学》 *
郝丹丹等: "基于属性关系图的同名实体区分算法", 《计算机工程与科学》, vol. 32, no. 9, 31 December 2010 (2010-12-31), pages 1 - 2 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427406A (zh) * 2019-08-10 2019-11-08 吴诚诚 组织机构相关人员关系的挖掘方法及装置
CN112214477A (zh) * 2020-09-25 2021-01-12 王存超 一种个人信息库的数据核查和更新方法
CN112214477B (zh) * 2020-09-25 2024-04-19 国网江苏省电力有限公司 一种个人信息库的数据核查和更新方法
CN112966099A (zh) * 2021-02-26 2021-06-15 北京金堤征信服务有限公司 关系图谱展示方法、装置及计算机可读存储介质
CN114240344A (zh) * 2021-12-06 2022-03-25 企查查科技有限公司 企业人员数据处理方法、装置、计算机设备和存储介质
CN114611516A (zh) * 2022-02-28 2022-06-10 北京金堤科技有限公司 人名消歧方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN110019542B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN110019542A (zh) 企业图谱中企业关系的生成方法、生成组织成员数据库及识别同名成员的方法、装置
CN106815530B (zh) 数据存证方法、数据校验方法及装置
CN103164416B (zh) 一种用户关系的识别方法及设备
Krätke ‘Creative cities’ and the rise of the dealer class: a critique of Richard Florida's approach to urban theory
CN110569369A (zh) 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN108268581A (zh) 知识图谱的构建方法及装置
CN104361119B (zh) 一种数据清理的方法及系统
CN106326438B (zh) 一种人员信息的关联方法
CN110109908B (zh) 基于社会基础信息挖掘人物潜在关系的分析系统及方法
CN106844372A (zh) 一种物流信息查询方法和装置
CN110796269B (zh) 一种生成模型的方法、装置、信息处理的方法及装置
CN107766470B (zh) 一种数据分享的智能统计方法、智能统计显示方法及装置
CN110263022A (zh) 酒店数据匹配方法及装置
CN110019754A (zh) 一种知识库的建立方法、装置及设备
Gadar et al. A multilayer and spatial description of the Erasmus mobility network
Rossi et al. Where do firms relocate? Location optimisation within and between Polish metropolitan areas
TW201539214A (zh) 用以找出複雜二元或多重交易方關係之多維遞迴學習方法和系統
CN107944866B (zh) 交易记录排重方法及计算机可读存储介质
Zhang et al. Scientific collaboration network analysis for computing education conferences
CN109344173A (zh) 数据管理方法和装置、数据结构
CN112527924A (zh) 动态更新的知识图谱扩展方法及装置
Al-Busaidi The impact of supporting organizational knowledge management through a corporate portal on employees and business processes
CN114969528A (zh) 基于能力评测的用户画像和学习路径推荐方法、装置及设备
JP2019086940A (ja) 関連スコア算出システム、方法およびプログラム
Zhang et al. Data survey: developing the statistical longitudinal census dataset and identifying its potential uses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40010811

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant