CN105376223B - 网络身份关系的可靠度计算方法 - Google Patents

网络身份关系的可靠度计算方法 Download PDF

Info

Publication number
CN105376223B
CN105376223B CN201510731854.1A CN201510731854A CN105376223B CN 105376223 B CN105376223 B CN 105376223B CN 201510731854 A CN201510731854 A CN 201510731854A CN 105376223 B CN105376223 B CN 105376223B
Authority
CN
China
Prior art keywords
identity
network
network identity
weight
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510731854.1A
Other languages
English (en)
Other versions
CN105376223A (zh
Inventor
陶小龙
刘中淼
王宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201510731854.1A priority Critical patent/CN105376223B/zh
Publication of CN105376223A publication Critical patent/CN105376223A/zh
Application granted granted Critical
Publication of CN105376223B publication Critical patent/CN105376223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网络身份关系的可靠度计算方法,该方法包括:获取与待查询的第一网络身份关联的若干个第二网络身份,并以每一所述第二网络身份所属的场景为联系,形成网络身份关系图;获取所述网络身份关系图中相邻网络身份关系的场景统计权重,以计算所述网络身份关系图中任意一对网络身份关系的可靠度。本发明的有益效果为:通过网络身份关系图的建立,能够更快捷地计算出一对网络身份关系的可靠度,进一步有利于网络数据的安全与维护。

Description

网络身份关系的可靠度计算方法
技术领域
本发明实施例涉及数据挖掘与计算技术领域,尤其涉及一种网络身份关系的可靠度计算方法。
背景技术
随着计算机和通讯技术的不断发展,网络应用的迅速普及,全球已经进入了互联网时代,网络已经成为人们生活中不可缺少不可分割的一部分,是人们进行获取资讯、社会交际以及生活辅助的主要媒体,随着社交网络的不断发展,其自身虚拟性、隐匿性等特点也使网民网络身份独立于网络身份之外,使一些不法分子利用网络身份在网络上实施对他人的诽谤诬蔑、传播虚假新闻引起大众恐慌、故意歪曲事实、进行传播谣言、诈骗等不法行为。
在互联网数据时代,为了网络社会的安全以及网络服务的需要,需要对网络数据进行采集和分析,以识别这些不法分子的真实身份,维护网络社会的安全以及国民生活的稳定。
目前,对于网络用户的真实身份识别,主要有关系知识库方法以及基于场景的统计的方法,其中的关系知识库方法通过可靠数据中提取可靠的关系,用这些关系作为桥去连接其他的网络身份,来达到建立个人不同身份的联系。这种方法由于可靠关系知识库覆盖范围有限,数据更新很慢,也缺乏关系可靠性的度量,应用效果不佳。
而对于基于场景的统计的方法,其试图通过场景覆盖所有的数据,对每个场景下的身份关系进行标注和打分,再对身份关系进行频率统计、时间序列统计,将统计信息与场景标注打分结合,做出对身份关系可靠性的评估,该方法形成了对身份关系可行性的评估,然而不同关系的可靠性缺乏可比性,可靠性依赖主观标注打分,主观性很高,同时场景是复杂多变的,通过人工标注,只能对有限的场景进行分析,其可分析的范围很窄,同时人工成本也相对高昂。
发明内容
本发明提供一种网络身份关系的可靠度计算方法,通过设计形成网络身份关系图并更新场景统计权重的方法,实现了对任一对网络身份的可靠度的计算,从而更方便地将网络中的不同网络身份映射到一个人的真实身份。
本发明实施例提供了一种网络身份关系的可靠度计算方法,该方法包括:
获取与待查询的第一网络身份关联的若干个第二网络身份,并以每一所述第二网络身份所属的场景为联系,形成网络身份关系图;
获取所述网络身份关系图中相邻网络身份关系的场景统计权重,以计算所述网络身份关系图中任意一对网络身份关系的可靠度。
本发明通过提取与待查询的网络身份相关联的其它网络身份并形成网络身份关系图,该图以各第一网络身份或第二网络身份为点,各第二网络身份所属的具体的实施场景为边进行连结,形成网络身份关系图,在得出或者调出每条边的场景统计权重后对该网络身份关系图的各边上的权重信息进行更新以得到图关系权重,通过该图关系权重以及根据最短路原则将网络身份关系图拆分成的串行身份通路以及并行身份通路,可计算出任意一对网络身份即网络身份关系的可靠度,从而实现了将网络身份更方便地映射到同一个人的有益效果。
附图说明
图1是本发明实施例一中网络身份可靠度计算方法的流程示意图;
图2是图1中的步骤S101的流程示意图;
图3是本发明实施例二中的网络身份关系图示意图;
图4是图3中更新网络身份关系图的场景统计权重后的示意图;
图5是本发明实施例二中的身份串行通路示意图;
图6是本发明实施例二中的身份并行通路示意图;
图7是本发明实施例二中网络身份可靠度计算的流程图;
图8是本发明实施例二中的场景统计权重计算方法及入库示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明公开了一种网络身份可靠度计算方法,能够将在网络中的各类网络身份以及现实中的生活身份映射到同一个人,即待查询用户的真实身份,其中心思想是:通过不同的网络身份以及生活身份之间的场景为联系建立网络身份关系图,并通过对网络身份以及生活身份的身份可靠度的评估,结合场景统计权重对网络身份关系图的图关系权重进行更新,以得出该网络身份关系图中任意一对身份关系的可靠度,进而判断各该网络身份或生活身份是否为同一个人的真实身份。
实施例一
如图1所示,本发明实施例所述的一种网络身份可靠度计算方法,主要包括有步骤:
S101:获取与待查询的第一网络身份关联的若干个第二网络身份,并以每一所述第二网络身份所属的场景为联系,形成网络身份关系图;
其中,待查询的第一网络身份通常为某一用户查询的相关的网络身份,亦可称之为某一身份值,获取与该待查询的第一网络身份相关联的若干第二网络身份,通常可以到身份关系数据库中,如Hbase、solr等数据库中,通常为相关部门通过集合的方式建立起来的集群服务器中包含的各大网站的用户数据,在该集群服务器中查找包含与该第一网络身份相关联的第二网络身份的身份关系,通过该身份关系进一步确定与该第一网络身份相关联的各第二网络身份。
形成网络身份关系图的过程还可以从已有的身份关系数据库中提取可靠的联系,用这些关系用作为桥去连接其它的网络身份,来达到建立个人不同身份的联系,以达到构建图的目的。
结合图1和图2所示,作为本发明实施例的优选,在获取与待查询的第一网络身份关联的若干个第二网络身份之前,还包括:
步骤S201:对待查询的第一网络身份关联的场景进行粗粒度分析,以得到若干第一场景;
在现有的场景分析中由于考虑的因素较多,各个场景中考虑因素均不相同,在本发明实施例中,为了在最后计算时的统一,对各所述第二网络身份或待查询的第一网络身份最有可能所属的场景进行整理、抽象,形成便于统计的少数几个因素,如场景是否稳固、注册账号是否对注册信息进行审核等,在本发明实施例中只考虑该少数几个因素,即对待查询的第一网络身份关联的场景进行粗粒度分析,并得到若干个第一场景。
步骤S202:通过各所述第一场景下与所述第一网络身份关联的网络身份得到若干候选第二网络身份。
场景是决定数据来源可靠性的重要因素,对于得到的若干个第一场景中,某一或者某些场景中能够得到的第二网络身份的可靠性极低,如对于在注册时不加审核的网站,又或者在每一个所述第一场景下,均可能存在有若干个与所述第一网络身份相关联的第二网络身份,在本步骤中,对于上述各情况下得到的关联的网络身份均作为候选第二网络身份。
步骤S203:从所述若干候选第二网络身份中获取与待查询的第一网络身份强关联的关联网络身份;
用户的网络身份关系是不断变化的,在上述的Hbase或solr数据库中存在的既有网络身份也不可能是实时保持在最新状态,因此需要对候选的第二网络身份进行二次筛选,在本步骤中,通过是否与所述第一网络身份具有强关联来对候选第二网络身份进行二次选取,其中的强关联是指:根据各网络身份所属的用户内容评价值、用户行为评价值以及用户信誉值等,充分考虑各种对其关联性影响的各种因素,以对所述的第二网络身份的强关联或者弱关联进行划分,对于其中的用户内容评价值、用户行为评价值和/或用户信誉值的数值高于一定阈值(可由数据库或用户自行设定)的则判定该网络身份为具有强关联的网络身份,与强关联相对应的为弱关联,即前述数据低于所述阈值,则在本发明实施例中从所述若干个候选第二网络身份中去除不再采用。
具体地,结合图3中所示,当第一网络身份为“手机号码”,与该第一网络身份有关的第二网络身份可能包括有,网易邮箱、微信账号、搜狐邮箱、QQ号码以及其它的第三方关联邮箱信息,其中的网络身份为同一种关联身份的同时,通过各所述第一场景下与所述第一网络身份关联的网络身份得到若干个候选第二网络身份,对候选第二网络身份进行强关联的第二次选取,即去除其中的第三方关联邮箱信息,保留其中的其它三个具有强关联的网易邮箱、微信账号、QQ号码等,作为手机号码该第一网络身份的相关联的第二网络身份。
步骤S204:在关联网络身份中去除终止身份,并以所述关联网络身份重新进行检索,得到新的关联网络身份集合;
其中的终止身份指的是在建立所述网络身份关系图的过程中,某些网络身份不作为起始点进行建网,只作为网络身份关系图的终点,例如,隶属于百度账号的某一贴吧账号,由于在较多场景中均采用百度账号作为其直属场景,而通过该贴吧账号并不能引申出与之具有关联的第二网络身份,因此,在该步骤中该贴吧账号作为一终止身份被去除。
第一次去除终止身份以后将得到一次过滤的关联网络身份,对该关联网络身份重新进行检索,并得到新的关联网络身份集合,在新的关联网络身份集合中再次去除终止身份,并循环执行上述步骤,以确保得到的关联网络身份中终止身份完全被去除。
在重新检索时检测不到终止身份,即达到终止条件,至此对于候选第二网络身份的提取过程结束,得到的若干个关联网络身份作为所述若干个第二网络身份。
该终止条件还可以为:再次提取的新的关联网络身份中不再包含有终止身份,或者是新的关联网络身份中个数等于预设的阈值,则不再从其中去除终止身份,以防止构建网络身份关系图失败。
在本发明实施例中,上述的形成网络身份关系图具体可为:以所述第一网络身份和每一所述第二网络身份为节点,相邻的所述第一网络身份与第二网络身份之间的第一网络身份关系,以及相邻的第二网络身份之间的第二网络身份关系为边,形成所述网络身份关系图,在提取各所述第二网络身份的过程中,各所述第二网络身份包含的场景信息字段即可确定该各第二网络身份所属的场景,通过该场景也可依次建立与之相关联的另一第二网络身份的联系,进而形成所述网络身份关系图。
步骤S102:获取所述网络身份关系图中相邻网络身份关系的场景统计权重,以计算所述网络身份关系图中任意一对网络身份关系的可靠度。
计算出该网络身份关系图中的每条边上的场景统计权重,以对该网络身份关系图中的每条边上的图关系权重进行更新,通过各所述场景统计权重,以及建立起来的网络身份关系,可计算出任意一对身份关系的可靠度。
其中的场景统计权重,可通过各所述第二网络身份所属的场景进行预设,即将各场景初始权重作为网络身份关系图的图关系权重,为了进一步地提升最终计算结果的准确度,也可结合该场景初始权重以及各对应的第二网络身份的身份统计权重综合得出所述场景统计权重,以得出网络身份图中的任意一对网络身份关系的可靠度。
本发明实施例可达到的有益效果为:提取与待查询的网络身份相关联的其它网络身份并形成网络身份关系图,该图以各第一网络身份或第二网络身份为点,各第二网络身份所属的具体的实施场景为边进行连结,形成网络身份关系图,在得出或者调出每条边的场景统计权重后对该网络身份关系图的各边上的权重信息进行更新以得到图关系权重,通过该图关系权重以及根据最短路原则将网络身份关系图拆分成的串行身份通路以及并行身份通路,可计算出任意一对网络身份即网络身份关系的可靠度。
实施例二
在上述实施例的基础上,本发明实施例中获取所述网络身份关系图中相邻网络身份关系的场景统计权重,包括:
根据各所述第二网络身份所属场景的属性信息得出各相邻网络身份关系的场景初始权重;
通常地,在各该第二网络身份所属场景的属性信息中包含有该场景的预设的场景初始权重字段,在进行粗粒度分析以及对候选第二网络身份进行筛选时,也可通过对该字段中的场景初始权重的大小进行筛选,但在本发明实施例中,该场景初始权重为一针对该具体场景预设的一个可靠度值,通常为0~1之间的实数,并作为后续计算的基础。
以及,获取各所述第二网络身份的身份统计权重;
在该步骤中,一般地为各所述第二网络身份提供一用于度量的标准身份权重,通过该标准身份权重对所述网络身份关系图中存在的各第二网络身份以及第一网络身份的可靠度进行评价;
在获取各所述第二网络身份的身份统计权重时,还包括:
统计各所述第二网络身份出现的频率值,根据该频率值提升或降低对应的第二网络身份的第一身份权重;
在本发明实施例中,可通过设计一频率因子来实现出现频率对网络身份的可靠度的影响,例如通过频率因子来提升或者降低对应的第二网络身份的第一身份权重。
统计各所述第二网络身份最后一次出现的时间,根据该时间提升或降低对应的第二网络身份的第二身份权重;
在本发明实施例中,可通过设计一衰减因子的方式来实现对应的网络身份最后出现的时间对该网络身份的影响,例如根据该网络身份最后一次出现的时间的长短来相应地降低或者提升对应的第二网络身份的第二身份权重。
通过频率因子以及衰减因子来确定第一身份权重或第二身份权重的过程,可以为:通过如阶梯函数来实现,根据经验预设一阶梯函数,在该阶梯函数中预设有各频率值以及衰减时间对应的第一身份权重或第二身份权重的数值,不同的频率值或衰减时间对应不同的权重值,在具体实施过程中,根据各频率值或者衰减时间所属的范围,调回该范围对应的第一身份权重或者第二身份权重,在本发明实施例中,频率值或者衰减时间的大小与权重值的大小成正比。
根据频率因子获得的所述第一身份权重、衰减因子获得的所述第二身份权重以及所述标准身份权重三个评价标准获得各所述第二网络身份的身份统计权重,其中,对于身份关系可靠度的简易计算来讲,在获取各第二网络身份的身份统计权重时,也可仅提取上述三个评价标准中的一个或者两个。
根据所述标准身份权重D0、第一身份权重D1以及所述第二身份权重D2,通常地,D0×D1×D2得出的结果即为各所述第二网络身份的身份统计权重。
综合网络身份关系图中各条边的场景初始权重以及提取对应的所述第二网络身份的身份统计权重,即得出所述网络身份关系图中相邻网络身份关系的场景统计权重,将该场景统计权重代入到网络身份关系图中更新,即得到带有图关系权重的网络身份关系图,根据各边上的图关系权重,以及将所述网络身份关系图拆分的各身份串行通路以及身份并行通路,可得出任意两个网络身份即一对网络身份关系之间的可靠度。
如图3所示,为本发明实施例中的网络身份关系图示意图,如图所示,以其中的“搜狐邮箱”为待查询的第一网络身份,则获取的“手机”号码为该第一网络身份相关联的第一个第二网络身份,一次性获取与该第一网络身份相关联的所有第二网络身份,并使所有第二网络身份中有场景联系的网络身份建立连接以构建成网络身份关系图,又或者以每一个第二网络身份为基准,通过该第二网络身份的场景建立与该第二网络身份关联的另一第二网络身份,以此构建网络身份关系图,两者的途径不同,通过前述对网络身份的筛选过程,最终达成的网络身份关系图相同。
如图4所示,为本发明实施例中网络身份关系图的每条边上的场景统计权重更新以后的示意图,其中,每相邻的两个网络身份形成的一对身份关系,其场景统计权重分别以Q1~Q14的数值进行表示。
结合图3和图4所示,创建网民身份关系网络图中一个点(如图3或图4中的一个圈)即为一个网民身份,两点(圈)之间的连线,为一对网民身份建立关系的具体场景应用,其中的网络身份为某一网民用户在网络上注册的虚拟身份,其可以是但不限于微博账号、搜狐邮箱、固定电话、身份证号码、微信号、QQ号、网易邮箱、银行卡号、家庭地址等等,其中的场景可以是但不限于账号绑定、手机号码注册、银行卡开户、微信支付、手机开户等等,其中的网民身份可以根据多种身份关系之间具有多种网络拓扑,在实际的运用情形也远比本发明实施中图示更为复杂,但无论何种网络身份关系图,其均处于本发明的保护范围之内。
结合图3以及图4所示,在本发明实施例中所述计算所述网络身份关系图中任意一对网络身份关系为同一个真实身份的可靠度包括:
从所述网络身份关系图中获取所述一对网络身份关系对应的身份通路,所述身份通路包括至少一个相邻网络身份关系;
身份关系一般是指,在网络身份关系图中的任意两个网络身份,包括所述第一网络身份和所述第二网络身份之间,以及两个所述第二网络身份之间,即形成一对网络身份关系。根据最短路原则,一对网络身份关系即是指在最短途径中形成的身份关系,例如图3或图4中,从搜狐邮箱到家庭住址之间的身份通路,按照最短路原则选择从搜狐邮箱→手机号码→身份证号码→家庭住址,而不是搜狐邮箱→手机号码→微信号码→银行卡号→身份证号→家庭住址。
根据所述身份通路中包括的至少一个相邻网络身份关系的场景统计权重获取所述网络身份关系图中任意一对网络身份关系的可靠度。
例如,如果要计算搜狐邮箱与家庭住址这一对身份关系的可靠度,则根据拆分的最短通路,得出的可靠度Q=Q1×Q8×Q13,其中的Q1/Q8/Q13为通过场景统计权重更新的各条边上的图关系权重。
本发明实施例中根据图算法对网络身份关系图中的一对网络身份关系之间的可靠度进行计算,图中根据场景统计权重更新边的图关系权重,最终得到带有图关系权重的网络身份关系图,对该网络身份关系图进行拆分,可得到或长或短的各类型身份通路,如串行身份通路或并行身份通路,在实际运用场景中,任何一复杂的网络身份关系图均可以拆分成前述两种身份通路,并根据最短路原则对各身份通路中的任意两个身份进行可靠度的计算。
如图5所示,为根据网络身份关系图拆分成的串行身份通路中的任意一对身份关系的可靠度的计算方法,所述根据所述串行身份通路中包括的至少一个相邻网络身份关系的可靠度获取所述网络身份关系图中任意一对网络身份的关系可靠度计算方式为:
P(AB)=P1×…×PN 公式一
其中,A、B分别指所述身份关系网络图中的任意两个网络身份,P1~PN为A、B之间的其它网络身份关系的各场景统计权重,N为A、B之间存在的场景统计权重的个数。
根据最短路原则,结合图4中的微博号与银行卡号之间的串行身份通路为:微博号→网易邮箱→手机号码→身份证号→银行卡号。
对应的计算公式为:Q(微博号→银行卡号)=Q2×Q4×Q8×Q10.
根据所述并行身份通路中包括的至少一个相邻网络身份关系的可靠度获取所述网络身份关系图中任意一对网络身份的关系可靠度的计算方式为:
P(AB)=1-(1-P1)×(…)×(1-PN) 公式二
其中,A、B分别指所述身份关系网络图中的任意两个网络身份,P1~PN为A、B之间的各场景统计权重,N为A、B之间存在的场景统计权重的个数。
如图所示,从网易邮箱到手机号码之间的并行身份通路之间,包括有Q3和Q4两个场景统计权重,则对应的计算公式为:
Q(网易邮箱→手机号码)=1-(1-Q3)×(1-Q4);
而对于两个网络身份之间既存在串行身份通路又存在并行身份通路时,则首先应计算其中一条串行身份通路上的场景统计权重,然后再计算由串行身份通路组成的并行身份通路各并行线路上的场景统计权重,得出一对身份关系的可靠度。
具体地,结合图4中的微博号到身份证号之间的并行通路包括有:
微博号→网易邮箱→手机号码→身份证号,此为其一个串行身份通路,该串行线路上场景统计权重为Q2×Q4×Q8;以及
微博号→网易邮箱→QQ号→微信号→银行卡号→身份证号,此为其另一个身份通路,该串行线路上场景统计权重为Q2×Q5×Q6×Q9×Q10;
则微博号到身份证号为一个人的真实身份的可靠度的计算公式为:
Q(微博号→身份证号)=1-(1-Q2×Q4×Q8)(1-Q2×Q5×Q6×Q9×Q10)
其中的Q1~Q14以及P1~PN等均可为0到1之间的实数,或者通过百分比更直观地表示。
结合图7所示,为本发明实施例的网络身份的可靠度计算方法的简易流程图,如图中所示,用户欲查询某一待查询的第一网络身份(如身份A),可以到身份关系数据库如HBASE或者solr中查询含有身份A的关系,以及跟该第一网络身份A有关的其它的第二网络身份如B、C、D……,一方面首先构建A、B、C、D……等的网络身份关系图,另一方面,根据各第二网络身份如B、C、D……的场景信息字段得出场景初始权重,再根据对各第二网络身份包括A、B、C、D……等的身份统计权重,得到与网络身份A有关系的各条边的场景统计权重,根据关系网络更新网络身份关系图中的各条边的权重信息,最终形成带有权重的网络身份关系图,根据各边上的图关系权重可计算出图中任意一对网络身份的图关系权重,该网络身份关系图可直接用于展示,或者将该图转换成数据格式供其它系统使用。
如图8所示,为本发明实施例下将各场景统计权重存入数据库以方便后期计算的流程图,其过程是,首先根据预先设定的场景,如场景1、场景2……场景n,计算过程中首先要得出场景初始权重以及统计的身份统计权重,进一步得出场景统计权重,并将各场景统计权重输入数据库中保存,以利于在下一次的用户查询中可以直接调用与此次查询及计算过程相关的场景统计权重。
在本实施例中,仅以最短路原则,以及两个网络身份之间存在的最简单串行通路以及并行通路进行举例说明,但在实际运用中,一对的网络身份关系之间可能存在多种复杂的串行或者并行通路,其实际的算法也更为复杂,因此,本发明实施例中并不能予以穷举。
上述的各本发明实施例中,对于在网络身份所属的场景中,对于其中的一些场景,例如必须通过身份证号码才能注册的账号,如公务员考试网账号,其中的虚假信息一经查到,则有较严厉的行政或者刑事处罚,因此,在该网站上注册的账号一般具有较高的可靠度,又如微信账号,或者固话缴费单,通常对于一个固定的依据或通过移动手机号码注册而成,因此也具有较高的可靠度,通常可以在该些场景下对提取相关联的第二网络身份。
对于在该网络身份关系图中的各网络身份可以是,各网络场景下的注册的网络身份账号,如微博账号、微信账号以及各大网站注册的邮箱账号等;又或者是在各现实生活中具有的生活身份,如固定电话号码、水电缴费账号或者是通过身份关系建立起来的银行号码等等在生活中具有的身份关系,由于其在网络中也存在有相应的数据,因此,在本发明中,将上述的网络身份以及生活身份统一称为网络身份。
其中,建立起来的身份关系,可以是直接关系,如通过身份证号码绑定的银行卡号、通过手机号码绑定的微信账号或固话缴费单对应的地址,等等,也可以是间接联系,如在注册第一邮箱账号时用另外一个第二邮箱账号作为联系,该第二邮箱账号又由手机号码绑定,则该第一邮箱账号与该手机号码之间则为间接关系。
对于获取网络身份关系图的方法,可以采用本发明实施例中的利用粗粒度分析得到,也可以采用传统的关系知识库方法,通过在可靠的场景数据中提取可靠的关系,并利用这些关系作为桥去连接其它的网络身份,并对每个场景下的身份关系做出可靠性评估的方法,来建立个人不同身份的联系,但优选地,本发明实施例采用如图2中所示的方法创建网络身份关系图。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种网络身份关系的可靠度计算方法,其特征在于,该方法包括:
获取与待查询的第一网络身份关联的若干个第二网络身份,并以每一所述第二网络身份所属的场景为联系,形成网络身份关系图;
获取所述网络身份关系图中相邻网络身份关系的场景统计权重,以计算所述网络身份关系图中任意一对网络身份关系的可靠度;
其中,所述以每一所述第二网络身份所属的场景为联系,形成网络身份关系图,包括:
以所述第一网络身份和每一所述第二网络身份为节点,相邻的所述第一网络身份与第二网络身份之间的第一网络身份关系,以及相邻的第二网络身份之间的第二网络身份关系为边,形成所述网络身份关系图。
2.根据权利要求1所述的计算方法,其特征在于,所述获取与待查询的第一网络身份关联的若干个第二网络身份之前,还包括:
对待查询的第一网络身份关联的场景进行粗粒度分析,以得到若干第一场景;
通过各所述第一场景下与所述第一网络身份关联的网络身份得到若干候选第二网络身份。
3.根据权利要求2所述的计算方法,其特征在于,所述获取与待查询的第一网络身份关联的若干个第二网络身份,包括:
步骤S203、从所述若干候选第二网络身份中获取与待查询的第一网络身份强关联的关联网络身份;
步骤S204、在关联网络身份中去除终止身份,并以所述关联网络身份重新进行检索,得到新的关联网络身份集合;
循环执行上述步骤S203-S204;
达到终止条件时,提取结束,得到的若干个关联网络身份作为所述若干个第二网络身份。
4.根据权利要求1所述的计算方法,其特征在于,获取所述网络身份关系图中相邻网络身份关系的场景统计权重,包括:
根据各所述第二网络身份所属场景的属性信息得出各相邻网络身份关系的场景初始权重;
获取各所述第二网络身份的身份统计权重;
根据各所述场景初始权重以及各所述第二网络身份的身份统计权重获取所述网络身份关系图中相邻网络身份关系的场景统计权重。
5.根据权利要求4所述的计算方法,其特征在于,所述获取各所述第二网络身份的身份统计权重,包括:
统计各所述第二网络身份出现的频率值,根据该频率值提升或降低对应的第二网络身份的第一身份权重;
统计各所述第二网络身份最后一次出现的时间,根据该时间提升或降低对应的第二网络身份的第二身份权重;
根据所述第一身份权重和所述第二身份权重获得各所述第二网络身份的身份统计权重。
6.根据权利要求5所述的计算方法,其特征在于,获取各所述第二网络身份的身份统计权重,该步骤中还包括:
提供一用于对各所述第二网络身份度量的标准身份权重;
根据该标准身份权重以及所述第一身份权重、第二身份权重,得出各所述第二网络身份的身份统计权重。
7.根据权利要求1所述的计算方法,其特征在于,所述计算所述网络身份关系图中任意一对网络身份关系为同一个真实身份的可靠度包括:
从所述网络身份关系图中获取所述一对网络身份关系对应的身份通路,所述身份通路包括至少一个相邻网络身份关系;
根据所述身份通路中包括的至少一个相邻网络身份关系的场景统计权重获取所述网络身份关系图中任意一对网络身份关系的可靠度。
8.根据权利要求7所述的计算方法,其特征在于,所述身份通路包括并行身份通路或串行身份通路;
其中,所述根据所述并行身份通路中包括的至少一个相邻网络身份关系的可靠度获取所述网络身份关系图中任意一对网络身份的关系可靠度包括:
P(AB)=1-(1-P1)×(…)×(1-PN)
其中,A、B分别指所述身份关系网络图中的任意两个网络身份,P1~PN为A、B之间的各场景统计权重,N为A、B之间存在的场景统计权重的个数;
所述根据所述串行身份通路中包括的至少一个相邻网络身份关系的可靠度获取所述网络身份关系图中任意一对网络身份的关系可靠度包括:
P(AB)=P1×…×PN
其中,A、B分别指所述身份关系网络图中的任意两个网络身份,P1~PN为A、B之间的其它网络身份关系的各场景统计权重,N为A、B之间存在的场景统计权重的个数。
CN201510731854.1A 2015-11-02 2015-11-02 网络身份关系的可靠度计算方法 Active CN105376223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510731854.1A CN105376223B (zh) 2015-11-02 2015-11-02 网络身份关系的可靠度计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510731854.1A CN105376223B (zh) 2015-11-02 2015-11-02 网络身份关系的可靠度计算方法

Publications (2)

Publication Number Publication Date
CN105376223A CN105376223A (zh) 2016-03-02
CN105376223B true CN105376223B (zh) 2018-10-12

Family

ID=55378028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510731854.1A Active CN105376223B (zh) 2015-11-02 2015-11-02 网络身份关系的可靠度计算方法

Country Status (1)

Country Link
CN (1) CN105376223B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550307B (zh) * 2015-12-14 2019-07-30 北京锐安科技有限公司 一种网民身份关系网络图的生成方法
CN107679240B (zh) * 2017-10-27 2020-11-10 中国计量大学 一种虚拟身份挖掘方法
CN107943935B (zh) * 2017-11-23 2021-02-02 北京天广汇通科技有限公司 数据的处理方法、装置和计算机可读存储介质
CN110110218B (zh) * 2018-02-01 2023-10-31 西安华企众信科技发展有限公司 一种身份关联方法及终端
CN109978016B (zh) * 2019-03-06 2022-08-23 重庆邮电大学 一种网络用户身份识别方法
CN112367663B (zh) * 2019-07-23 2023-04-07 中国移动通信集团广东有限公司 一种确定宽带接入用户号码的方法、装置及设备
CN112085322B (zh) * 2020-07-30 2024-01-23 北京明略软件系统有限公司 基于鲜活度指标的关联可信度评估方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101466098A (zh) * 2009-01-21 2009-06-24 中国人民解放军信息工程大学 网络信任度评估方法、装置和通信系统
CN103748582A (zh) * 2011-08-24 2014-04-23 国际商业机器公司 基于与共同实体的关系的实体解析
CN103917973A (zh) * 2011-09-08 2014-07-09 谷歌公司 用于确认文档的作者身份的系统和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752542B2 (en) * 2006-09-20 2010-07-06 International Business Machines Corporation Dynamic external entity resolution in an XML-based content management system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101466098A (zh) * 2009-01-21 2009-06-24 中国人民解放军信息工程大学 网络信任度评估方法、装置和通信系统
CN103748582A (zh) * 2011-08-24 2014-04-23 国际商业机器公司 基于与共同实体的关系的实体解析
CN103917973A (zh) * 2011-09-08 2014-07-09 谷歌公司 用于确认文档的作者身份的系统和方法

Also Published As

Publication number Publication date
CN105376223A (zh) 2016-03-02

Similar Documents

Publication Publication Date Title
CN105376223B (zh) 网络身份关系的可靠度计算方法
CN106372072B (zh) 一种基于位置的移动社会网络用户关系的识别方法
US10484413B2 (en) System and a method for detecting anomalous activities in a blockchain network
De Meo et al. On Facebook, most ties are weak
CN109784636A (zh) 欺诈用户识别方法、装置、计算机设备及存储介质
CN105824813B (zh) 一种挖掘核心用户的方法及装置
CN104717124B (zh) 一种好友推荐方法、装置及服务器
CN110413707A (zh) 互联网中欺诈团伙关系的挖掘与排查方法及其系统
CN109598509A (zh) 风险团伙的识别方法和装置
CN110457404A (zh) 基于复杂异质网络的社交媒体账户分类方法
CN108833453A (zh) 一种确定应用账号的方法及设备
CN107193894A (zh) 数据处理方法、个体识别方法及相关装置
CN103250151B (zh) 信息管理服务器、信息管理方法
CN113572752B (zh) 异常流量的检测方法和装置、电子设备、存储介质
CN108765179A (zh) 一种基于图计算的可信社交关系分析方法
Yeshwanth et al. Evolutionary churn prediction in mobile networks using hybrid learning
CN109522416A (zh) 一种金融风险控制知识图谱的构建方法
CN106960391A (zh) 一种用户信息聚合方法、系统和装置
KR102086936B1 (ko) 사용자 데이터 공유 방법 및 디바이스
CN108268886A (zh) 用于识别外挂操作的方法及系统
CN113641827A (zh) 一种基于知识图谱的网络诈骗识别方法及系统
CN110648172A (zh) 一种融合多种移动设备的身份识别方法和系统
CN115333966A (zh) 一种基于拓扑的Nginx日志分析方法、系统及设备
WO2017000817A1 (zh) 获取数据之间的匹配关系的方法和装置
CN104965846A (zh) MapReduce平台上的虚拟人建立方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method for Calculating the Reliability of Network Identity Relationships

Effective date of registration: 20230807

Granted publication date: 20181012

Pledgee: Bank of China Limited Beijing Xicheng Branch

Pledgor: RUN TECHNOLOGIES Co.,Ltd. BEIJING

Registration number: Y2023980051158

PE01 Entry into force of the registration of the contract for pledge of patent right