CN105550307B - 一种网民身份关系网络图的生成方法 - Google Patents

一种网民身份关系网络图的生成方法 Download PDF

Info

Publication number
CN105550307B
CN105550307B CN201510924776.7A CN201510924776A CN105550307B CN 105550307 B CN105550307 B CN 105550307B CN 201510924776 A CN201510924776 A CN 201510924776A CN 105550307 B CN105550307 B CN 105550307B
Authority
CN
China
Prior art keywords
personal status
value
identity
status relationship
identity value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510924776.7A
Other languages
English (en)
Other versions
CN105550307A (zh
Inventor
陶小龙
刘中淼
王宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201510924776.7A priority Critical patent/CN105550307B/zh
Publication of CN105550307A publication Critical patent/CN105550307A/zh
Application granted granted Critical
Publication of CN105550307B publication Critical patent/CN105550307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种网民身份关系网络图的生成方法,该方法包括:获取网民的第一身份值,在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值;基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图。利用该生成方法,仅需对给定第一身份值的网民生成与之相对应的网民身份关系图,无需考虑其他网民的身份关系图,与现有的生成网民身份关系图的方法相比,既节省了生成时间,又很大程度的减少了生成过程的计算量以及网民身份关系图的规模;该生成方法在降低计算资源利用率的同时还提高了网民身份关系图的可靠性,并具有了实时性和便捷性的特点。

Description

一种网民身份关系网络图的生成方法
技术领域
本发明涉及计算机应用技术领域,具体涉及一种网民身份关系网络图的生成方法。
背景技术
随着计算机和通信技术的发展,网络应用迅速普及,已成为人们生活中不可或缺的部分。与此同时,网络的安全防护也越来越得到人们的重视,由此出现了针对网络安全的网络数据分析,特别是对网民在不同网络应用的行为分析,从而基于分析结果实现网民的网络身份和现实身份一一对应的关系。
在实现网民网络身份与现实身份的对应关系中,最终的结果形成一张网民身份关系网络图,基于该网民身份关系网络图就能确定网民的现实身份及其所有的网络身份。传统的建立网民身份关系网络图的方法是直接在可靠的网络数据中提取身份关系对,将组成身份关系对的各身份值作为节点,将身份关系作为边,形成一个网络关系图。上述现有的构建网络图的方法,存在以下不足:一方面,基于上述方法形成的是所有网民的身份关系网络图,而现实中绝大多数网民的关系网络图都没有机会使用,造成计算资源的浪费;另一方面,由于网络数据是固定不变的,生成的关系网也是固定不变的,由于数据信息不能及时更新,导致所生成关系网的可靠度降低;此外,现有网络图生成方法的计算量大,存储大,特别是在分布系统下完成计算时,其算法和存储会更加复杂。综上所述,现有的网民身份关系网络图生成方法不仅需要较高的资源占用率,而且在可靠性、实时性以及便捷性等方面也都存在局限。
发明内容
本发明实施例提出一种网民身份关系网络图的生成方法,以简单快速的方法生成具有高可靠性且可实时更新的网络身份关系网。
本发明实施例提供了一种网民身份关系网络图的生成方法,包括:
获取网民的第一身份值,在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值;
基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图。
本发明实施例中提供的一种网民身份关系网络图的生成方法,首先基于给定的网民第一身份值,在已生成的身份关系数据库中查找与该第一身份值相关的所有第二身份值;基于第二身份值及身份值之间所形成的身份关系对,生成网民身份关系图。利用该生成方法,仅需对给定第一身份值的网民生成与之相对应的网民身份关系图,无需考虑其他网民的身份关系图,与现有的生成网民身份关系图的方法相比,既节省了生成时间,又很大程度的减少了生成过程的计算量以及网民身份关系图的规模;该生成方法在降低计算资源利用率的同时还提高了网民身份关系图的可靠性,并具有了实时性和便捷性的特点。
附图说明
图1为本发明实施例一提供的一种网民身份关系网络图的生成方法的流程示意图;
图2为本发明实施例二提供的一种网民身份关系网络图的生成方法的流程示意图;
图3为本发明实施例三提供的一种网民身份关系网络图的生成方法的流程示意图;
图4为本发明实施例三中构建星型加权图的具体操作流程图;
图5a~图5f为本发明实施例三中生成网民身份关系网络图时所需的网络图示例图;
图6为本发明实施例三中简化原始身份关系图形成网民身份关系网络图的具体操作流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种网民身份关系网络图的生成方法的流程示意图,本发明实施例适用于基于给出的身份值以及已有的网民身份关系数据库生成网民身份关系网络图的情况。
如图1所示,本发明实施例一提供的一种网民身份关系网络图的生成方法,具体包括:
步骤S101、获取网民的第一身份值,在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值。
在本实施例中,所述网民的第一身份值具体可指:给定的网民的一个身份值。所述身份值具体可为:网民上网时从其上网数据中提取出的身份属性值;同理,所述第二身份值也可具体为从网民上网数据提取出的身份属性值,一般地,所述第一身份值与第二身份值可以基于某种特定关系进行关联,这种特定关系主要在已生成的身份关系数据库中体现。此外,所述身份属性值(身份值)主要包括:网民在各种应用程序上的注册账号、网民注册帐号时相关的邮箱、手机号、身份证以及网民上网所使用的不同上网工具的物理信息等,所述物理信息可以为国际移动用户识别码IMSI、移动设备国际身份码IMEI以及介质访问控制子层协议MAC值等。
进一步的,所述已生成的身份关系数据库包括若干个数据场景表,每个数据场景表中至少包含一个身份关系信息;其中,所述身份关系信息包括身份关系对和所述身份关系对的权重值。
在本实施例中,所述网民身份关系网络图主要基于网民上网时的各身份值以及身份值之间存在的特定关系不断迭代连接扩展而成。因此,在根据身份值之间的特定关系生成网民身份关系网络图之前,需要找到各身份值以及身份值之间的特定关系,所以出现了用于存储和检索各身份值之间所存在的特定关系的身份关系数据库。所述身份关系数据库的生成主要基于身份关系数据库的生成方法。利用上述身份关系数据库的生成方法,可以将所获取的网民上网的网络数据按照数据的获取来源不同,划分为多个数据场景,并可以在各数据场景中获取相应网络数据的身份值,以及身份值之间存在的身份关系对,同时还能计算获得各身份关系对的权重值。
具体的,在所述已生成的身份关系数据库中,具体包含有若干个数据场景表,在每个数据场景表中,包含有该数据场景下的身份值所构成的身份关系对以及相应身份关系对的权重值。一般地,可以将数据场景表中的身份关系对及身份关系对的权重值合称为身份关系信息,其中,数据场景表中的每个身份关系信息可具体表示成:{[身份值1,身份值2],权重值Wt}的形式。需要说明的是,不同数据场景表中有可能存在相同的身份关系对,但在不同数据场景表中同一个身份关系对的权重值有可能不同。
因此,在给定了网民的第一身份值后,基于已生成的身份关系数据库,就能确定出该第一身份值的若干个相关联的第二身份值。
步骤S102、基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图。
在本实施例中,所述第二身份值具体为与网民的第一身份值相关联的身份值。基于所获取的第二身份值和相应的身份关系信息就可以生成该网民的网民身份关系网络图。
具体的,网民身份关系网络图的生成过程可描述为:将第二身份值基于核心身份值的定义进行核心身份值提取,并将提取后的核心身份值看作一个核心节点,然后根据身份关系数据库中所存储的相应身份关系信息,以核心身份值为核心节点,以与核心身份值相关联的其他身份值为扩展节点,以包含核心身份值或相关联的其他身份值的身份关系对为边,在没有达到终止条件的情况下不断迭代扩展形成核心身份值的星型加权图,其中,所述边的加权值为所述身份关系对在不同数据场景表中的权重值;之后通过核心身份值之间存在的关系,对核心身份值进行连接,从而使相应的星型加权图实现了合并,由此形成原始身份关系加权图。
需要说明的是,由于同一身份关系对可以存在于多个数据场景中,所以在原始身份关系加权图中,对于两节点的连接,存在多边并行连接的情况,此时需要简化原始身份关系加权图,最终使得两节点间仅有一条边连接,从而生成所需要的网民身份关系网络图。
本实施例一提供的一种网民身份关系网络图的生成方法,首先基于给定的网民第一身份值,在已生成的身份关系数据库中查找与该第一身份值相关的所有第二身份值;基于第二身份值及身份值之间所形成的身份关系对,生成网民身份关系图。利用该生成方法,仅需对给定第一身份值的网民生成与之相对应的网民身份关系图,无需考虑其他网民的身份关系图,与现有的生成网民身份关系图的方法相比,既节省了生成时间,又很大程度的减少了生成过程的计算量以及网民身份关系图的规模;该生成方法在降低计算资源利用率的同时还提高了网民身份关系图的可靠性,并具有了实时性和便捷性的特点。
实施例二
图2为本发明实施例二提供的一种网民身份关系网络图的生成方法的流程示意图,本发明实施例二以上述实施例为基础,进一步的,将步骤“在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值”具体优化为:a)构建一第二身份值集合,初始为空集;b)检索所述身份关系数据库,获取与所述第一身份值直接构成身份关系对的关联身份值;c)去除所述关联身份值中的终止身份值,将所述关联身份值并入所述第二身份值集合;d)重新检索所述身份关系数据库,获取与所述关联身份值直接构成身份关系对的新的关联身份值;e)如果没有达到终止条件,则返回步骤c)继续执行;否则,提取结束,得到包含若干个第二身份值的第二身份值集合。
如图2所示,本发明实施例二提供的一种网民身份关系网络图的生成方法,具体包括如下操作:
步骤S201、获取网民的第一身份值,并构建一第二身份值集合,同时初始所述第二身份值集合为空集。
在本实施例中,网民的第一身份值为预先给定的网民的一个身份值,基于该身份值,可以找出与该网民相关联的第二身份值,且最终能为该网民生成相应的网民身份关系网络图,基于选定的网民第一身份值来构造相应的网民身份关系网络图,与已有的构建网民身份关系网络图的方法相比,不需花费很大的成本构建所有网民的网民身份关系网络图,仅需基于给定的条件构建对应网民的网民身份关系图,大大降低了身份关系网络图的生成规模,节省了计算资源。
在本实施例中,所构建的第二身份值集合,主要用于获取所有的与网民第一身份值相关联的第二身份值,该集合最初为空集。
步骤S202、检索所述身份关系数据库,获取与所述第一身份值直接构成身份关系对的关联身份值。
在本实施例中,所述身份关系数据库为基于身份关系数据库的生成方法生成的身份关系数据库,包含若干个数据场景表,每个数据场景表具有至少一个身份关系信息,所述身份关系信息又可具体为:身份关系对及其身份关系对的权重值。
在本实施例中,基于给定的第一身份值以及身份关系数据库,就能首先确定与所述第一身份值直接构成身份关系对的关联身份值。具体的,在身份关系数据库的各个数据场景表中,查找与所述第一身份值直接构成身份关系对的关联身份值。
示例性的,假如给定的第一身份值为“手机号码”,而在身份关系数据库的不同数据场景表里可以检索出,[手机号码,网易邮箱],[手机号码,微信帐号],[手机号码,搜狐邮箱],[手机号码,QQ账号],[手机号码,姓名],[手机号码,固定电话号码]等身份关系对,则与该第一身份值“手机号码”直接构成身份关系对的关联身份值可能包括,网易邮箱、微信帐号、搜狐邮箱、QQ账号、姓名、固定电话号码等。需要注意的是,身份关系数据库中构成身份关系对的身份值为具体值,如手机号码以“手机号1234567890”的具体形式表述,账号以“QQ号465789337”的形式表述,本实施例为了便于表述,所举的示例中直接以文字形式表述身份关系对中的身份值。
步骤S203、去除所述关联身份值中的终止身份值,将所述关联身份值并入所述第二身份值集合。
在本实施例中,对于基于步骤S202获取的关联身份值,还要进一步的处理,需要去除关联身份值中的终止身份值,以避免相关联身份值查询操作的无限循环。然后将去除终止身份值后的关联身份值并入第二身份值集合。
进一步的,所述核心身份值具体包括:身份证、手机号、国际移动用户识别码(International Mobile Subscriber Identification Number,IMSI)、移动设备国际身份码(International Mobile Equipment Identity,IMEI)、介质访问控制(Media AccessControl,MAC)值、腾讯QQ账号;所述终止身份具体包括:姓名、固定电话、用户身份证明(User Identification,UID)、模拟显示服务接口(Analog Display Services Interface,ADSI)。
在本实施例中,对于网民身份关系网络图的生成,为了避免网络图规模的不断扩大,需要设定终止节点,所述终止节点就是本发明定义的终止身份值,同时为了网络图的扩展,需要设定核心节点,所述核心节点就是本发明设定的核心身份值。
网民身份网络图的建立主要是完成网民在不同应用中身份的关联;所述核心身份值具体可指具有跨应用连接的身份属性值,如身份证、手机号、邮箱地址等。一般地,在单个应用中存在的关联身份值往往以星型扩散,核心身份值通常为星型网络的中心点。同理,在网民身份网络图的建立过程中,某些身份值是被多人共用的如姓名、固定电话、ADSL账号;另外有些身份是只在应用中存在(UID),但不能保证在不同应用中不重复,因此,所述终止身份值具体可指用于终止网络图扩散的身份属性值。如果用终止身份值作为网络扩展的起始顶点,则会时网民的身份关系网无限扩大,进而造成网民身份的错误归一。
示例性的,基于第一身份值“手机号码”,在步骤S202中已确定出存在的关联身份值包括:网易邮箱、微信帐号、搜狐邮箱、QQ账号、姓名、固定电话号码。根据终止身份值的定义,可以将“姓名”和“固定电话号码”去除,由此将去除终止身份值后的其余关联身份值并入第二身份值集合。
步骤S204、重新检索所述身份关系数据库,获取与所述关联身份值直接构成身份关系对的新的关联身份值。
在本实施例中,为了找到身份关系数据库中所有已第一身份值关联的第二身份值,除了检索出直接与第一身份值构成身份关系对的关联身份值外,还需要进一步对所找出的关联身份值再进行检索,需要找出与关联身份值直接构成身份关系对的新的关联身份值。
步骤S205、判断是否达到检索的终止条件,若否,则返回步骤S203继续执行;若是,则执行步骤S206。
在本实施例中,所述终止条件就是检索出的新的关联身份值全部为终止身份值。具体的,步骤S205可以理解为:判断检索出的新的关联身份值是否全部为终止身份值,如果不全是终止身份值,则返回执行步骤S203并继续迭代提取第一身份值的关联身份值;如果全是终止身份,则执行步骤S206。
步骤S206、关联身份值提取结束,得到包含若干个第二身份值的第二身份值集合。
在本实施例中,如果步骤S204中检索出的新的关联身份值全部为终止身份值,则可以接收关联身份值的迭代提取,由此得到包含若干个第二身份值的第二身份值集合。
步骤S207、基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图。
本实施例二提供的一种网民身份关系网络图的生成方法,首先获取网民第一身份值的若干个第二身份值,并给出了获取第二身份值的具体过程;然后基于获取的第二身份值以及相应的身份关系信息,生成网民身份关系网络图。利用该方法,实现了第二身份值的迭代获取,节省时间,计算量小,且资源利用率高,为网民身份关系网络图的生成提供了可靠的核心身份值,简单高效。
实施例三
图3为本发明实施例三提供的一种网民身份关系网络图的生成方法的流程示意图,本发明实施例三以上述各实施例为基础,进一步的,将步骤“基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图”具体优化为:在所述第二身份值集合中确定至少两个核心身份值;以所述核心身份值为中心构建星型加权图,并确定所述核心身份值之间的连接;通过所述核心身份值之间的连接,合并所述星型加权图生成原始身份关系加权图,其中,所述原始身份关系加权图中多条边并行连接两节点,所述一个节点表示一个身份值,所述边表示在不同数据场景表中两身份值构成的身份关系对;将所述原始身份关系加权图中多条边并行连接的两节点简化为单边连接,生成网民身份关系网络图。
如图3所示,本实施例三提供的一种网民身份关系网络图的生成方法,具体包括如下操作:
步骤S310、获取网民的第一身份值,在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值。
步骤S320、在所述第二身份值集合中确定至少两个核心身份值。
在本实施例中,基于上述实施例二阐述的第二身份值的提取操作,可知第二身份值保存在第二身份值集合中。在第二身份值集合中,所有的第二身份值不是终止身份值,但不一定都是核心身份值,所以需要确定第二身份值集合中的至少两个核心身份值,用于星型加权图的建立。
步骤S330、以所述核心身份值为中心构建星型加权图,并确定所述核心身份值之间的连接。
在本实施例中,所述核心身份值具有关联网民在不同应用中的身份属性值的作用,由于核心身份值的可靠度高,所以基于核心身份值能够扩展得到网民在不同应用中的关联身份属性值,从而基于各关联身份属性值形成网民的身份关系网络图。
进一步的,图4给出了步骤S330的具体操作过程,如图4所示,包括如下操作:
步骤S3301、基于不同数据场景表中的身份关系信息,确定与所述核心身份值构成身份关系对的关联非核心身份值和所述身份关系对在不同数据场景表的权重值。
在本实施例中,基于步骤S310确定至少两个核心身份值后,对确定出的核心身份值进行步骤S3301的操作。由此可以得到与核心身份值构成身份关系对的关联身份值,在所确定的关联身份值中,可能包含有核心身份值,为了避免核心身份值星型加权图的重复构建,这里只选择关联身份值中的非核心身份值,为了便于表述,将关联身份值中的非核心身份值记为关联非核心身份值。此外,还确定了核心身份值与所述关联非核心身份值所构成身份关系对的权重值,其权重值可以记为Wt。需要注意的是,在不同数据场景中确定出的身份关系对的权重值不同。
步骤S3302、以所述核心身份值和关联非核心身份值为节点,以所述不同数据场景的身份关系对为边,基于核心身份值形成星型加权图。
在本实施例中,以核心身份值为中心节点,以关联非核心身份值为扩展节点,以基于二者在不同数据场景中构成的身份关系对为边,且相应的权重值作为边的加权值。由此基于核心身份值形成了星型加权图。
示例性的,以核心身份值A为例,确定出的关联非核心身份值包括B、C、D和E,且A与B、D形成的身份关系对在两个不同的数据场景表中都存在。同时确定出的相应权重值记为:WtAB1、WtAB2、WtAC、WtAD1、WtAD2和WtAE,其中WtXY1表示X和Y构成身份关系对在数据场景1中的权重值。此时,基于A形成的星型加权图如图5a所示。
步骤S3303、确定与所述关联非核心身份值直接构成身份关系对的新的关联非核心身份值及其相应的权重值。
在形成星型加权图后,还要继续确定与关联非核心身份值直接构成身份关系对的新的关联非核心身份值及其相应的权重值。由此实现星型加权图的迭代构建。需要说明的是,步骤S3303也只确定新的关联非核心身份值及其相应的权重值。
示例性的,接步骤S3302中的示例,确定出B的关联非核心身份值包括C和F,同样,确定出C、D和E的关联非核心身份值分别包括:C对应B和G、D对应E和G以及E对应F,其中B和C形成的身份关系对存在于两个数据场景中,同时,确定出的权重值分别有:WtBC1、WtBC2、WtBF、WtCG、WtDE、WtDG和WtEF
步骤S3304、判断所述新的关联非核心身份值是否为已确定的身份值或者是否为终止身份值,若否,则执行步骤S3305;若是,则执行步骤S3306。
在本实施例中,星型加权图的构建不能无限的扩展,需要通过终止条件进行终止,所述终止条件设置为:步骤S3303中确定的新的关联非核心身份值是否为已确定关联非核心身份值,或者步骤S3303中确定的新的关联非核心身份值是否为终止身份值,若否,则执行步骤S3305;若是,则执行步骤S3306。
示例性的,步骤S3303中确定出的新的关联非核心身份值有:B、C、E、F和G,其中经步骤S3304的判定,可以发现B、C和E为已确定的关联非核心身份值,F和G为终止身份值。
步骤S3305、将所述新的关联非核心身份值添加至所述星型加权图进行扩展,返回执行步骤S3303。
在本实施例中,对于不是已确定的关联非核心身份值又不是终止身份值的身份值来说,可以执行步骤S3305。
示例性的,接步骤S3304的示例,确定出的新的关联非核心身份值B、C、E、F和G不满足执行步骤S3305的条件。
步骤S3306、如果新的关联非核心身份值为已确定的身份值,直接停止所述对所述星型加权图的扩展操作;如果新的关联非核心身份值为终止身份值,则将所述新的关联非核心身份值添加至所述星型加权图。
在本实施例中,如果新的关联非核心身份值为已确定的身份值,则不需要对所述新的关联非核心身份值进行任何操作,可以直接停止所述对所述星型加权图的扩展操作;如果新的关联非核心身份值为终止身份值,则还需将所述身份值添加至星型加权图。
示例性的,接步骤S3305的示例,不对确定出的新的关联非核心身份值B、C和E进行任何操作,将确定出的新的关联非核心身份值F和G加入星型网络加权图进行扩展,此时,基于A形成的扩展后的星型加权图如图5b所示。
步骤S3307、基于身份关系信息确定所述核心身份值之间存在的关系进行连接。
在本实施例中,当对确定出的每个核心身份值都完成星型加权图构建后,需要通过核心身份值之间的连接对构建好的星型加权图进行合并连接。
示例性的,接步骤S3305的示例,确定出网民U的核心身份值有A和H,且核心身份值A与核心身份值H能后直接构成身份关系对,所以可以确定A和H之间存在连接。
步骤S340、通过所述核心身份值之间的连接,合并所述星型加权图生成原始身份关系加权图。
其中,所述原始身份关系加权图中多条边并行连接两节点,所述一个节点表示一个身份值,所述边表示在不同数据场景表中两身份值构成的身份关系对,且边的加权值为所述身份关系对在不同数据场景表中的权重值。
在本实施例中,在基于步骤S330构建出每个核心身份值的星型加权图,并确定各核心身份值之间的连接关系后,可以基于核心身份值之间的连接关系对各核心身份值形成的星型加权图进行合并操作。
示例性的,接步骤S3307的示例,在确定出基于核心身份值A的星型加权图(如图5b所示)和核心身份值H的星型加权图(如图5c所示)后,还确定出A和H构成身份关系对,存在连接关系,将二者的星型加权图进行合并,形成原始身份关系加权图(如图5d所示),所形成的图5d所示的原始身份关系加权图就可看作网民U的身份关系图,但由于原始身份关系加权图中的边过于繁琐,还须进一步简化。需要说明的是,图5a至图5d中,每条边代表不同数据场景中的身份关系对,边为加权边,加权值为相应身份关系对在不同数据场景中的权重值,但为了附图的清晰明了,每条边的权重值在附图中没有标出。
步骤S350、将所述原始身份关系加权图中多条边并行连接的两节点简化为单边连接,生成网民身份关系网络图。
进一步的,图6给出了步骤S350的具体操作过程,如图6所示,包括如下操作:
步骤S3501、从所述原始身份关系加权图中,获取相连两节点的所有连接通路,并确定所述连接通路的权重值。
进一步的,所述连接通路分为并行通路和串行通路;所述并行通路为直接连接两节点的多条并行边,每条边表示两节点构成的身份关系对所在的一个数据场景;所述串行通路为两节点间通过至少一个其他节点连接的串行边,每条边表示所述串行边两端节点构成的身份关系对。
示例性的,在图5e所示的原始身份关系加权图中,节点X和Y之间存在多条连接通路,首先2条并行通路,记为X1Y和X2Y,还有3条串行通路,记为XZY,XVY,XVZY和XZVY。
步骤S3502、根据所述连接通路的权重值,基于边权重值提升公式,计算所述相连两节点的关系权重值。
进一步的,如果连接通路为并行通路,则所述连接通路的权重值W等于每条边的身份关系对所在数据场景的权重值Wt;如果连接通路为串行通路,则所述连接通路的权重值W等于Wt1×Wt2×…×Wtm,其中m为两节点间存在串行边的边数,Wt1~Wtm为每个串行边两端节点的身份关系对的权重值。
进一步的,所述边权重值提升公式为:W(AB)=1-(1-W1)×(…)×(1-Wn)
其中,A、B分别指所述原始身份关系加权图中任意两个相连的节点,W(AB)为相连两节点A、B的关系权重值,n为A、B之间存在连接通路的条数,W1~Wn分别为节点A、B之间每条连接通路的权重值。
在本实施例中,Wn为相连节点A和B之间每条连接通路的权重值,所以要计算节点A和B的关系权重值W(AB),就需要计算A和B所形成的所有连接通路中,每条连接通路的权重值。对于连接通路权重值的计算,如果连接通路为并行通路,则其权重值Wn直接等于组成每条并行通路的身份关系对所在数据场景的权重值Wt;如果连接通路为串行通路,则其权重值Wn等于Wt1×Wt2×…×Wtm,其中m为两节点间存在串行边的边数,Wt1~Wtm为每个串行边两端节点的身份关系对的权重值。在计算出每条连接通路的权重值Wn后,基于边权重值提升公式,就能得到相连两节点的关系权重值。
示例性的,接步骤S3502的示例,图5e中的节点X和Y,可分别确定出2条并行通路X1Y和X2Y的连接通路权重值分别为:WtXY1和WtXY2,还能确定出4条串行通路XZY,XVY,XVZY和XZVY的连接通路权重值分别为:WtXZ×WtZY,WtXV×WtVY,WtXV×WtVZ×WtZY和WtXZ×WtZV×WtVY,然后,基于边权重值提升公式,就能得到相连两节点X和Y的关系权重值为:W(XY)=1-(1-WtXY1)×(1-WtXY2)×(1-WtXZ×WtZY)×(1-WtXV×WtVY)×(1-WtXV×WtVZ×WtZY)×(1-WtXZ×WtZV×WtVY)。
步骤S3503、将相连两节点间多条边并行连接的简化为单边连接,且所述单边的权重值为所述关系权重值,生成网民身份关系网络图。
在本实施例中,当基于步骤S3503计算出各相连两节点的关系权重值后,可以对原始身份关系加权图进行简化操作,使其多条并行连接的边简化为单边连接,且所述单边的权重值就等于该边的两节点计算所得的关系权重值,由此生成了具有关系权重值的网民身份关系网络图,基于所述网民身份关系网络图就能将网民的身份与真实身份进行重合,由此便于对网民的管理。
示例性的,图5d所示的网民U的原始身份关系网络图就可简化为图5f所示的网民U的网民身份关系网络图,两节点间边的权重值为关系权重值记为W(X,Y)。
本实施例三提供的提供的一种网民身份关系网络图的生成方法,阐述了基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图的具体操作过程,通过确定核心身份值,并基于核心身份值构建了星型加权图,然后各星型加权图通过合并形成原始身份关系图,最后通过对并行边的简化,形成了最终的网民身份关系网络图。利用生成方法,不仅确定了网民的身份关系网络图,还计算出了身份关系网络图中相连节点的关系权重值,为网民身份的归一分析提供了可靠的身份关系和数据基础;同时,同时整个网络图的生成过程为特定身份值的迭代处理,由此很大程度的节省了计算时间,还减少了处理计算的数据规模,提高了资源利用率,从而简单高效的实现了网民身份关系网络图的生成。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种网民身份关系网络图的生成方法,其特征在于,包括:
获取网民的第一身份值,在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值;
基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图;
所述已生成的身份关系数据库包括若干个数据场景表,每个数据场景表中至少包含一个身份关系信息;
其中,所述身份关系信息包括身份关系对和所述身份关系对的权重值;
在已生成的身份关系数据库中提取与所述第一身份值关联的若干个第二身份值,具体包括:
a)构建一第二身份值集合,初始为空集;
b)检索所述身份关系数据库,获取与所述第一身份值直接构成身份关系对的关联身份值;
c)去除所述关联身份值中的终止身份值,将所述关联身份值并入所述第二身份值集合;
d)重新检索所述身份关系数据库,获取与所述关联身份值直接构成身份关系对的新的关联身份值;
e)如果没有达到终止条件,则返回步骤c)继续执行;否则,提取结束,得到包含若干个第二身份值的第二身份值集合;
基于所述第二身份值和所述身份关系数据库中相应的身份关系信息,生成网民身份关系网络图,具体包括:
在所述第二身份值集合中确定至少两个核心身份值;
以所述核心身份值为中心构建星型加权图,并确定所述核心身份值之间的连接;
通过所述核心身份值之间的连接,合并所述星型加权图生成原始身份关系加权图,其中,所述原始身份关系加权图中多条边并行连接两节点,所述一个节点表示一个身份值,所述边表示在不同数据场景表中两身份值构成的身份关系对;
将所述原始身份关系加权图中多条边并行连接的两节点简化为单边连接,生成网民身份关系网络图。
2.根据权利要求1所述的方法,其特征在于,以所述核心身份值为中心构建星型加权图,并确定所述核心身份值之间的连接,具体包括:
基于不同数据场景表中的身份关系信息,确定与所述核心身份值构成身份关系对的关联非核心身份值和所述身份关系对在不同数据场景表的权重值;
以所述核心身份值和关联非核心身份值为节点,以所述不同数据场景的身份关系对为边,基于核心身份值形成星型加权图;
确定与所述关联非核心身份值直接构成身份关系对的新的关联非核心身份值及其相应的权重值;
如果所述关联非核心身份值不是已确定的身份值或者不是终止身份值,则将所述新的关联非核心身份值添加至所述星型加权图进行扩展,之后返回执行确定与所述关联非核心身份值直接构成身份关系对的新的关联非核心身份值及其相应的权重值的操作;否则,仅将所述新的不是已确定的关联非核心身份值添加至所述星型加权图;
基于身份关系信息确定所述核心身份值之间存在的关系进行连接。
3.根据权利要求1所述的方法,其特征在于,将所述原始身份关系加权图中多条边并行连接的两节点简化为单边连接,生成网民身份关系网络图,具体包括:
从所述原始身份关系加权图中,获取相连两节点的所有连接通路,并确定所述连接通路的权重值;
根据所述连接通路的权重值,基于边权重值提升公式,计算所述相连两节点的关系权重值;
将相连两节点间多条边并行连接的简化为单边连接,且所述单边的权重值为所述关系权重值,生成网民身份关系网络图。
4.根据权利要求3所述的方法,其特征在于,所述连接通路分为并行通路和串行通路;
所述并行通路为直接连接两节点的多条并行边,每条边表示两节点构成的身份关系对所在的一个数据场景;
所述串行通路为两节点间通过至少一个其他节点连接的串行边,每条边表示所述串行边两端节点构成的身份关系对。
5.根据权利要求4所述的方法,其特征在于,如果连接通路为并行通路,则所述连接通路的权重值W等于每条边的身份关系对所在数据场景的权重值Wt;
如果连接通路为串行通路,则所述连接通路的权重值W等于Wt1×Wt2×…×Wtm,其中m为两节点间存在串行边的边数,Wt1~Wtm为每个串行边两端节点的身份关系对的权重值。
6.根据权利要求5所述的方法,其特征在于,所述边权重值提升公式为:
W(AB)=1-(1-W1)×(…)×(1-Wn)
其中,A、B分别指所述原始身份关系加权图中任意两个相连的节点,W(AB)为相连两节点A、B的关系权重值,n为A、B之间存在连接通路的条数,W1~Wn分别为节点A、B之间每条连接通路的权重值。
7.根据权利要求1~6中任一项所述的方法,其特征在于,所述核心身份值具体包括:身份证、手机号、国际移动用户识别码IMSI、移动设备国际身份码IMEI、介质访问控制子层协议MAC值、腾讯QQ账号;
所述终止身份具体包括:姓名、固定电话、用户身份证明UID、模拟显示服务接口ADSI。
CN201510924776.7A 2015-12-14 2015-12-14 一种网民身份关系网络图的生成方法 Active CN105550307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510924776.7A CN105550307B (zh) 2015-12-14 2015-12-14 一种网民身份关系网络图的生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510924776.7A CN105550307B (zh) 2015-12-14 2015-12-14 一种网民身份关系网络图的生成方法

Publications (2)

Publication Number Publication Date
CN105550307A CN105550307A (zh) 2016-05-04
CN105550307B true CN105550307B (zh) 2019-07-30

Family

ID=55829496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510924776.7A Active CN105550307B (zh) 2015-12-14 2015-12-14 一种网民身份关系网络图的生成方法

Country Status (1)

Country Link
CN (1) CN105550307B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372219A (zh) * 2016-09-07 2017-02-01 大地风景(武汉)信息技术有限公司 基于异构平台的用户行为数据关联方法及系统
CN109145178A (zh) * 2017-06-16 2019-01-04 阿里巴巴集团控股有限公司 一种关系图处理方法及装置
CN108241750B (zh) * 2018-01-22 2021-08-17 中国平安人寿保险股份有限公司 网络图中连接线的优化方法、装置、存储介质及终端
CN110110218B (zh) * 2018-02-01 2023-10-31 西安华企众信科技发展有限公司 一种身份关联方法及终端
CN108536831A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于多参数的用户识别系统及方法
CN111355619B (zh) * 2020-05-26 2020-08-14 成都信息工程大学 一种多核网状协同关系的跨链协同方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075942A (zh) * 2007-06-22 2007-11-21 清华大学 基于专家值传播算法的社会网络专家信息处理系统及方法
CN103365922A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 一种用于关联图像和个人信息的方法和装置
KR20140075874A (ko) * 2012-12-10 2014-06-20 한국전자통신연구원 인맥정보 생성장치 및 인맥정보 검색장치
CN103927307A (zh) * 2013-01-11 2014-07-16 阿里巴巴集团控股有限公司 一种识别网站用户的方法和装置
CN105376223A (zh) * 2015-11-02 2016-03-02 北京锐安科技有限公司 网络身份关系的可靠度计算方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075942A (zh) * 2007-06-22 2007-11-21 清华大学 基于专家值传播算法的社会网络专家信息处理系统及方法
CN103365922A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 一种用于关联图像和个人信息的方法和装置
KR20140075874A (ko) * 2012-12-10 2014-06-20 한국전자통신연구원 인맥정보 생성장치 및 인맥정보 검색장치
CN103927307A (zh) * 2013-01-11 2014-07-16 阿里巴巴集团控股有限公司 一种识别网站用户的方法和装置
CN105376223A (zh) * 2015-11-02 2016-03-02 北京锐安科技有限公司 网络身份关系的可靠度计算方法

Also Published As

Publication number Publication date
CN105550307A (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
CN105550307B (zh) 一种网民身份关系网络图的生成方法
CN103501374B (zh) 电话簿排序方法及装置、终端
Chen et al. Socially-motivated cooperative mobile edge computing
CN106991617B (zh) 一种基于信息传播的微博社交关系提取算法
CN107193894A (zh) 数据处理方法、个体识别方法及相关装置
CN105376223B (zh) 网络身份关系的可靠度计算方法
CN105868231A (zh) 缓存数据的更新方法及装置
CN110738577A (zh) 社区发现方法、装置、计算机设备和存储介质
CN113031951B (zh) 菜单生成方法、装置、计算机设备和存储介质
CN101551922A (zh) 一种远程取号方法及系统
CN105592405A (zh) 基于派系过滤和标签传播的移动通信用户群组构造方法
CN110032603A (zh) 一种对关系网络图中的节点进行聚类的方法及装置
Hu et al. Deterministic ripple-spreading model for complex networks
CN112764920A (zh) 一种边缘应用部署方法、装置、设备和存储介质
CN109146317A (zh) 一种收益分成方法及相关设备
CN109729139A (zh) 访问请求转发方法、装置、设备及可读存储介质
CN107133339A (zh) 线路查询方法和装置以及存储介质、处理器
CN104125146B (zh) 一种业务处理方法及装置
CN109214656A (zh) 一种用于城市公交网络的节点重要性评估方法
CN102769583B (zh) 即时通讯服务器的用户分配装置和用户分配方法
CN103179014A (zh) Lldp报文的处理方法及装置
CN106325515A (zh) 一种面向服务的人机交互系统以及实现方法
CN109739859A (zh) 一种关系图谱绘制方法、系统及相关装置
CN103051476B (zh) 基于拓扑分析的网络社区发现方法
CN107733767B (zh) 一种社交关系网的建立方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method for Generating Network Graph of Internet Users' Identity Relations

Effective date of registration: 20230807

Granted publication date: 20190730

Pledgee: Bank of China Limited Beijing Xicheng Branch

Pledgor: RUN TECHNOLOGIES Co.,Ltd. BEIJING

Registration number: Y2023980051158