CN105279282A - 一种身份关系数据库的生成方法及装置 - Google Patents

一种身份关系数据库的生成方法及装置 Download PDF

Info

Publication number
CN105279282A
CN105279282A CN201510799619.8A CN201510799619A CN105279282A CN 105279282 A CN105279282 A CN 105279282A CN 201510799619 A CN201510799619 A CN 201510799619A CN 105279282 A CN105279282 A CN 105279282A
Authority
CN
China
Prior art keywords
personal status
status relationship
weighted value
data
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510799619.8A
Other languages
English (en)
Inventor
陶小龙
刘中淼
王宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201510799619.8A priority Critical patent/CN105279282A/zh
Publication of CN105279282A publication Critical patent/CN105279282A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures

Abstract

本发明公开了一种身份关系数据库的生成方法及装置,该方法包括:采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值和矫正权重值;基于所述场景权重值和矫正权重值,计算所述身份关系的当前综合权重值;将所述身份关系及对应的综合权重值存入身份关系数据库。利用该方法,可以实现身份关系数据库的生成,所生成的身份关系数据库因身份关系具有确定的权重值,而使数据库具有了高可靠性、高广泛性以及可实时更新的特点,且生成的身份关系数据库为之后网民身份的归一化提供了有效的数据关系依据。

Description

一种身份关系数据库的生成方法及装置
技术领域
本发明涉及计算机应用技术领域,具体涉及一种身份关系数据库的生成方法和装置。
背景技术
随着计算机和通信技术的发展,网络应用迅速普及,已成为人们生活中不可或缺的部分。与此同时,网络的安全防护也越来越得到人们的重视,由此出现了针对网络安全的网络数据分析,特别是对网民在不同网络应用的行为分析,从而基于分析结果实现网民的网络身份和现实身份一一对应的关系。
在实现网络身份与现实身份的对应关系中,建立身份关系知识库是最重要的步骤,因为通过建立的身份关系知识库可以很快将网民的现实身份和真实身份进行匹配。传统的建立身份关系知识库的方法是直接在可靠的数据源中提取可靠的身份关系,基于提取的身份关系可以建立身份关系数据库。由于数据获取的可靠度无法度量,且数据的覆盖范围较窄,更新也很缓慢,从而使建立的身份关系库的可靠性、广泛性、实时性等也受到影响。
发明内容
本发明实施例提出一种身份关系数据库的方法和装置,以实现高可靠性、高广泛性且可实时更新的网民身份关系数据库的生成。
一方面,本发明实施例提供了一种身份关系数据库的生成方法,包括:
采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;
获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt;
基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1;
将所述身份关系及对应的综合权重值存入身份关系数据库。
另一方面,本发明实施例提供了一种身份关系数据库的生成装置,包括:
数据场景形成模块,用于采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;
中间值计算模块,用于获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt;
综合权重值计算模块,用于基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1;
身份关系存储模块,用于将所述身份关系及对应的综合权重值存入身份关系数据库。
本发明实施例中提供的一种身份关系数据库的生成方法及装置,首先根据所采集网络数据的数据来源进行数据场景的划分;然后在不同的数据场景中,获取相应数据场景的身份关系,并计算身份关系的场景权重值和矫正权重值;之后基于场景权重值和矫正权重值计算身份关系的当前综合权重值;最后将身份关系及对应的综合权重值存入身份关系数据库。利用该方法,可以实现身份关系数据库的生成,所生成的身份关系数据库因其中每个身份关系具有确定的权重值,而使数据库具有了高可靠性、高广泛性以及可实时更新的特点,且生成的身份关系数据库为之后实现网民身份的归一化提供了有效的数据关系依据。
附图说明
图1为本发明实施例一提供的一种身份关系数据库的生成方法的流程示意图;
图2为本发明实施例二提供的一种身份关系数据库的生成方法的流程示意图;
图3为本发明实施例三提供的一种身份关系数据库的生成方法的流程示意图;
图4为本发明实施例四提供的一种身份关系数据库的生成装置的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种身份关系数据库的生成方法的流程示意图,本发明实施例适用于生成网民身份关系数据库的情况,该方法可以由身份关系数据库的生成装置执行,其中该装置可由软件和/或硬件实现。
如图1所示,本发明实施例提供的一种身份关系数据库的生成方法,包括如下操作步骤:
步骤S101、采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据。
在本实施例中,所述网络数据具体可指与网民身份信息相关联的上网数据。示例性的,可以是网民在各种应用程序上的注册帐号、网民注册帐号时相关的邮箱、手机号、身份证等网络数据。
在本实施例中,所述数据来源具体指所采集的网络数据的来源,示例性的,可以是采集手机上网的数据、采集固定网络的上网数据、采集网吧的上网数据以及采集宾馆的上网数据等。基于网络数据采集方式的不同将网络数据划分为多个数据场景的网络数据。
步骤S102、获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt。
在本实施例中,基于数据来源划分数据场景后,需要对每个数据场景中的网络数据进行身份关系的权重计算操作。在权重计算之前需要先对数据场景的网络数据中网民身份相关联的上网数据进行一对一的关联,在数据场景中构成至少一个身份关系。
在本实施例中,所述身份关系的场景权重值WSt主要用于衡量网络数据所包含的身份关系在相应数据场景中的可靠度,一般基于场景可靠度影响因子计算求得。所述身份关系的矫正权重值WTt从身份关系本身的可靠度出发,主要用于对身份关系的场景权重值进行矫正,一般基于可靠度矫正因子计算得到。
进一步的,所述身份关系包括:网络数据中含有的身份证号、手机号、邮箱以及应用注册帐号中任意两个相关联形成的关系;或,所述身份证号、手机号、邮箱以及应用注册帐号的任一个与网络数据中含有的地址信息或上网设备信息相关联形成的关系。
在本实施例中,所述网络数据中含有的地址信息具体为网民进行应用程序注册时填写的居住地的地址信息。所述上网设备信息具体为采集数据时基于不同数来源采集网络数据的上网设备的信息,示例性的,如手机或计算机的物理地址。具体的,数据场景中的身份关系的组成可以是身份证号-手机号、身份证号-邮箱、身份证号-应用注册帐号、手机号-邮箱以及邮箱-应用注册帐号等等两两形成的关系对。
步骤S103、基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1。
在本实施例中,所述身份关系的当前综合权重值具体为基于场景权重值和矫正权重值得到的身份关系在存入数据库前的最终权重值,需要注意的是,当前综合权重值为大于0小于1的值。
示例性的,当前综合权重值Wt的计算公式为Wt=WSt*WTt,其中WSt和WTt分别为相应身份关系的场景权重值和矫正权重值。
步骤S104、将所述身份关系及对应的综合权重值存入身份关系数据库。
在本实施例中,当找出数据场景中的身份关系及其权重之后,可将其存入身份关系数据库中。身份关系数据库可作为网民身份和现实身份归一化的数据依据。
本实施例一提供的一种身份关系数据库的生成方法,首先根据所采集网络数据的数据来源进行数据场景的划分;然后在不同的数据场景中,获取相应数据场景的身份关系,并计算身份关系的场景权重值和矫正权重值;之后基于场景权重值和矫正权重值计算身份关系的当前综合权重值;最后将身份关系及对应的综合权重值存入身份关系数据库。利用该方法,可以实现身份关系数据库的生成,所生成的身份关系数据库因其中每个身份关系具有确定的权重值,而使数据库具有了高可靠性、高广泛性以及可实时更新的特点,且生成的身份关系数据库为之后实现网民身份的归一化提供了数据依据。
实施例二
图2为本发明实施例二提供的一种身份关系数据库的生成方法的流程示意图,本发明实施例以上述实施例一为基础,进一步的,将步骤“对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据”具体优化为:判定所采集网络数据的数据来源;将所述数据来源相同的网络数据划分到同一个数据场景中,形成多个数据场景的网络数据。
进一步的,还将步骤“将所述身份关系及对应的综合权重值存入身份关系数据库”具体优化为:判定身份关系数据库中是否已存在所述身份关系;如果不存在,则直接将所述身份关系及其当前综合权重值Wt存入身份关系数据库;否则,基于权重值合并公式,计算所述身份关系的最新综合权重值Wt1,并将所述身份关系及其最新的综合权重值Wt1存入身份关系数据库进行信息更新。
如图2所示,本发明实施例二提供的一种身份关系数据库的生成方法,包括如下操作:
步骤S201、采集网民上网的网络数据,判定所采集网络数据的数据来源。
本实施例主要以数据包的形式获取网络数据,在获取的数据包中,可通过数据包的字段内容判定网络数据所对应的数据来源。
步骤S202、将所述数据来源相同的网络数据划分到同一个数据场景中,形成多个数据场景的网络数据。
在判定网络数据的数据来源后,将相同数据来源的网络数据划分到一个数据场景中,由此可以将采集的网络数据划分为多个数据场景。并且基于不同的数据场景可对相应的网络数据进行操作处理,由此得到建立身份关系库所需的身份关系及其权重值。
步骤S203、获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt。
在本实施例的一个数据场景中,通过对网络数据进行标注,确定数据场景中含有的身份关系。一般地,一个数据场景中能确定的身份关系对至少为一个。
步骤S204、基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1。
步骤S205、判定身份关系数据库中是否已存在所述身份关系,若存在,则执行步骤S206;若否,则执行步骤S207。
在经过步骤S204计算出身份关系的当前综合权重值后,需要将身份关系及其相应权重值存入身份关系数据库,由于所建立的身份关系数据库具有实时更新的特性,所以当对采集的网络数据进行身份关系标注及其权重计算后,有可能所标注的身份关系已在身份关系数据库中存在,而存在的身份关系也已具有相应的权重值,所以在将身份关系存入身份关系数据库前需要先判断身份关系数据库中是否已存在。
步骤S206、基于权重值合并公式,计算所述身份关系的最新综合权重值Wt1,并将所述身份关系及其最新的综合权重值Wt1存入身份关系数据库进行信息更新。
在本实施例中,如果身份关系已存在身份关系数据库中,需要执行步骤S206进行信息更新。
进一步的,所述权重值合并公式为:最新综合权重值Wt1=0.8*原综合权重值Wt’+0.2*当前综合权重值Wt。
在本实施例中,当前综合权重值Wt为经过步骤S204所得出的权重值。当身份关系及其权重值在身份关系数据库中已存在时,基于权重值合并公式,就能计算出身份关系所对应的最新综合权重值Wt1。之后需要对身份关系数据库中该身份关系的权重值进行更新,将其更新为最新综和权重值Wt1的大小。
步骤S207、直接将所述身份关系及其当前综合权重值Wt存入身份关系数据库。
在本实施例中,如果身份关系数据库中不存在所要存入的身份关系,则执行步骤S207将身份关系及其通过步骤S204计算得到的权重值存入身份关系数据库即可。
本发明实施例二提供的一种身份关系数据库的生成方法,将采集的网络数据基于数据源的划分步骤进行了具体化,使网络数据可以根据数据来源判定所属的数据场景,由此划分出多个数据场景网络数据;同时也将身份关系及其综合权重值的存放过程进行了具体化,使其存入身份关系数据库之前增加了权重值的处理步骤。从而增强了生成身份关系数据库时数据来源的高可靠性,也体现出了身份关系数据库中身份关系及其权重值的实时更新的特点。
实施例三
图3为本发明实施例三提供的一种身份关系数据库的生成方法的流程示意图,本发明实施例以上述是实施例为基础,进一步的,将步骤“计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt”具体优化为:确定所述至少一个身份关系的场景可靠度影响因子及可靠度矫正因子的大小;根据所述至少一个身份关系的场景可靠度影响因子计算至少一个身份关系的场景权重值WSt;根据所述至少一个身份关系的可靠度矫正因子的大小计算至少一个身份关系的矫正权重值WTt。
如图3所示,本发明实施例三提供的一种身份关系数据库的生成方法,包括如下操作步骤:
步骤S301、采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据。
步骤S302、获取所述数据场景中相应网络数据构成的至少一个身份关系。
步骤S303、确定所述至少一个身份关系的场景可靠度影响因子及可靠度矫正因子的大小。
在本实施例中,场景权重值的计算主要依据场景可靠度影响因子的大小,以及矫正权重值的计算主要基于可靠度矫正因子的大小。因此,在计算场景权重值和矫正权重值之前,需要确定相应场景可靠度影响因子和可靠度矫正因子的大小值。
进一步的,所述场景可靠度影响因子包括:身份关系中相关网络数据的数据来源可靠度WSs、数据获取方式可靠度WSg以及数据内容可靠度WSc。
在本实施例中,所述数据来源可靠度的大小,主要由采集网络数据的数据来源决定,其数据来源包括:手机上网数据、固网上网数据、网吧上网数据、宾馆上网数据以及直接上报的网络数据等多种数据来源。对于不同的数据来源,本发明方法都会为其分配一个可靠度值,其可靠度值的分配主要根据历史经验值确定。示例性的,基于历史经验值可设置手机上网获取的数据的可靠度值为0.8,而通过网吧或宾馆获取的上网数据的可靠度值只有0.3。由此可知,数据来源不同,本方法为其分配的可靠度值也不同,还可以看出,手机上网获取的网络数据的可靠度明显高于网吧或宾馆的可靠度。
所述数据获取方式可靠度,该可靠度的大小主要由网络数据的获取方式决定,其可靠度的大小也是基于相应的历史经验值分配。示例性的,可以直接从上网设备(如手机、计算机)上直接获取网络数据,该种方式下分配到的可靠度值最高;其获取方式也可以是通过软件间的相互关联得到的网络数据,该种方式下分配到的可靠度值就相对较低。
所述数据内容的可靠度,该可靠度的大小主要由网络数据包含内容的真实性决定,其可靠度的大小也是基于相应的历史经验值分配。示例性的,在网民填写应用注册信息时,如果所填写的信息能够得到邮箱验证或者手机短信验证,就能说明内容的真实性较高,相比于所采集的没有经过身份验证的网络数据,其经过验证的网络数据的可靠度明显较高。
综上所述,场景可靠度影响因子的大小需要根据数据来源可靠度、数据获取方式可靠度以及数据内容可靠度的大小来确定。
进一步的,所述身份关系矫正因子包括:身份关系的频率矫正因子WTp、身份关系的冲突矫正因子WTc以及身份关系的衰减矫正因子WTd。
在本实施例中,所述身份关系的频率矫正因子,具体可指在一段时间内所获取的网络数据中该身份关系出现的次数。如果身份关系在一段时间内出现的次数很多,则认为该身份关系的可靠性较高,此时频率矫正因子为身份关系的确定起到激励作用,该频率矫正因子的大小可设置为一个大于等于1且又能使身份关系的综合权重值能够处于0~1范围的值。
同理,如果身份关系在一段时间内不再出现,说明该身份关系的可靠性较低,可为该身份关系设置一个身份关系的衰减矫正因子,以达到矫正该身份关系场景权重值的目的。所述衰减矫正因子的大小设置为大于0小于1的值。
在本实施例中,所述身份关系的冲突矫正因子,具体可指组成身份关系对中的一个元素与另外一个元素的多个元素值都相关联,由此造成身份关系唯一性冲突的矫正因子。示例性的,在“手机号-QQ帐号”这对身份关系中,一个手机号码与多个QQ帐号都形成了“手机号-QQ帐号”的身份关系对,由此使得手机号与多个QQ帐号造成了身份关系的冲突。所述冲突矫正因子也为大于0小于1的值。
需要说明的是,上述频率矫正因子、衰减矫正因子以及冲突矫正因子值大小的设定也是基于历史经验值的设置。
步骤S304、根据所述至少一个身份关系的场景可靠度影响因子计算至少一个身份关系的场景权重值WSt。
进一步的,所述基于场景可靠度影响因子,计算场景权重值WSt具体为,场景权重值WSt=数据来源可靠度WSs*数据获取方式可靠度WSg*数据内容可靠度WSc。
在本实施例中,基于步骤S303可知,场景可靠度影响因子包括数据来源可靠度、数据获取方式可靠度以及数据内容可靠度。因此基于上述场景可靠度影响因子的大小值可以计算场景权重值WSt,即WSt=WSs*WSg*WSc,其中,WSs、WS和WSc分别表示数据来源可靠度、数据获取方式可靠度以及数据内容可靠度。
步骤S305、根据所述至少一个身份关系的可靠度矫正因子的大小计算至少一个身份关系的矫正权重值WTt。
进一步的,所述根据可靠度矫正因子,计算矫正权重值WTt具体为,矫正权重值WTt=频率矫正因子WTp*冲突矫正因子WTc*衰减矫正因子WTd。
同理,在本实施例中,基于步骤S303可知,可靠度矫正因子包括身份关系的频率矫正因子、身份关系的冲突矫正因子以及身份关系的衰减矫正因子。因此基于上述可靠度矫正因子的大小值也可以计算矫正权重值WTt,即WTt=WTp*WTc*WTd,其中WTp、WTc和WTd分别表示频率矫正因子、冲突矫正因子以及衰减矫正因子。
步骤S306、基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt。
示例性的,身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1。
步骤S307、判定身份关系数据库中是否已存在所述身份关系,若存在,则执行步骤S308;若否,则执行步骤S309。
步骤S308、基于权重值合并公式,计算所述身份关系的最新综合权重值Wt1,并将所述身份关系及其最新的综合权重值Wt1存入身份关系数据库。
步骤S309、直接将所述身份关系及其当前综合权重值Wt存入身份关系数据库。
本发明实施例三提供的一种身份关系数据库的生成方法,将计算至少一个身份关系的场景权重值和矫正权重值的步骤具体化为先确定身份关系的场景可靠度影响因子及可靠度矫正因子的大小,然后基于场景可靠度影响因子及可靠度矫正因子的大小值确定身份关系的场景权重值和矫正权重值。从而达到了高精确度计算身份关系权重值的目的,由此使生成的身份关系数据库具有高可靠性和高精确性,为之后网民身份归一化提供了有效的数据关系依据。
实施例四
图4为本发明实施例四提供的一种身份关系数据库的生成装置的结构示意图,本发明实施例适用于生成网民身份关系数据库的情况,该装置可由软件和/或硬件实现。
如图4所示,本发明实施例提供的一种身份关系数据库的生成装置,具体包括:数据场景形成模块401、中间值计算模块402、综合权重值计算模块403以及身份关系存储模块404。其中,
数据场景形成模块401,用于采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据。
中间值计算模块402,用于获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt。
综合权重值计算模块403,用于基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1。
身份关系存储模块404,用于将所述身份关系及对应的综合权重值存入身份关系数据库。
在本实施例中,该装置首先通过数据场景形成模块401采集网民上网的数据,并判定所采集的网络数据的数据来源,将数据来源相同的网络数据划分到同一个数据场景中,形成多个数据场景下的网络数据;其次对不同的数据场景网络数据通过中间值计算模块402获取数据场景中相应网络数据构成的至少一个身份关系,计算至少一个身份关系的中间权重值,如场景权重值和矫正权重值;再次通过综合权重值计算模块403基于场景权重值和矫正权重值计算所对应身份关系的综合权重值;最后通过身份关系存储模块404先判断身份关系是否已存储在身份关系数据库中,如果已存在则需要基于权重值合并公式计算身份关系的最新综合权重值,并将身份关系及其最新综和权重值存入身份关系数据库;如果身份关系不存在,则可直接将身份关系及其相应计算出的综合权重值存入身份关系数据库。
本发明实施例四提供的一种身份关系数据库的生成装置,首先根据所采集网络数据的数据来源进行数据场景的划分;然后在不同的数据场景中,获取相应数据场景的身份关系,并计算身份关系的场景权重值和矫正权重值;之后基于场景权重值和矫正权重值计算身份关系的当前综合权重值;最后将身份关系及对应的综合权重值存入身份关系数据库。利用该生成装置,可以实现身份关系数据库的生成,所生成的身份关系数据库因其中每个身份关系具有确定的权重值,而使数据库具有了高可靠性、高广泛性以及可实时更新的特点,且生成的身份关系数据库为之后实现网民身份的归一化提供了有效的数据关系依据。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种身份关系数据库的生成方法,其特征在于,包括:
采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;
获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt;
基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1;
将所述身份关系及对应的综合权重值存入身份关系数据库。
2.根据权利要求1所述的方法,其特征在于,所述对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据,具体包括:
判定所采集网络数据的数据来源;
将所述数据来源相同的网络数据划分到同一个数据场景中,形成多个数据场景的网络数据。
3.根据权利要求2所述的方法,其特征在于,所述计算至少一个身份关系的场景权重值WSt和矫正权重值WTt包括:
确定所述至少一个身份关系的场景可靠度影响因子及可靠度矫正因子的大小;
根据所述至少一个身份关系的场景可靠度影响因子计算至少一个身份关系的场景权重值WSt;
根据所述至少一个身份关系的可靠度矫正因子的大小计算至少一个身份关系的矫正权重值WTt。
4.根据权利要求3所述的方法,其特征在于,
所述场景可靠度影响因子包括:身份关系中相关网络数据的数据来源可靠度WSs、数据获取方式可靠度WSg以及数据内容可靠度WSc;
所述根据场景可靠度影响因子,计算场景权重值WSt具体为,场景权重值WSt=数据来源可靠度WSs*数据获取方式可靠度WSg*数据内容可靠度WSc。
5.根据权利要求3所述的方法,其特征在于,
所述身份关系矫正因子包括:身份关系的频率矫正因子WTp、身份关系的冲突矫正因子WTc以及身份关系的衰减矫正因子WTd;
所述根据可靠度矫正因子,计算矫正权重值WTt具体为,矫正权重值WTt=频率矫正因子WTp*冲突矫正因子WTc*衰减矫正因子WTd。
6.根据权利要求1所述的方法,其特征在于,所述将所述身份关系及对应的综合权重值存入身份关系数据库具体包括:
判定身份关系数据库中是否已存在所述身份关系;
如果不存在,则直接将所述身份关系及其当前综合权重值Wt存入身份关系数据库;否则,基于权重值合并公式,计算所述身份关系的最新综合权重值Wt1,并将所述身份关系及其最新的综合权重值Wt1存入身份关系数据库进行信息更新。
7.根据权利要求6所述的方法,其特征在于,所述权重值合并公式为:
最新综合权重值Wt1=0.8*原综合权重值Wt’+0.2*当前综合权重值Wt。
8.根据权利要求1~7任一所述的方法,其特征在于,所述身份关系包括:网络数据中含有的身份证号、手机号、邮箱以及应用注册帐号中任意两个相关联形成的关系;或,所述身份证号、手机号、邮箱以及应用注册帐号的任一个与网络数据中含有的地址信息或上网设备信息相关联形成的关系。
9.一种身份关系数据库的生成装置,其特征在于,包括:
数据场景形成模块,用于采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;
中间值计算模块,用于获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt;
综合权重值计算模块,用于基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1;
身份关系存储模块,用于将所述身份关系及对应的综合权重值存入身份关系数据库。
CN201510799619.8A 2015-11-19 2015-11-19 一种身份关系数据库的生成方法及装置 Pending CN105279282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510799619.8A CN105279282A (zh) 2015-11-19 2015-11-19 一种身份关系数据库的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510799619.8A CN105279282A (zh) 2015-11-19 2015-11-19 一种身份关系数据库的生成方法及装置

Publications (1)

Publication Number Publication Date
CN105279282A true CN105279282A (zh) 2016-01-27

Family

ID=55148296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510799619.8A Pending CN105279282A (zh) 2015-11-19 2015-11-19 一种身份关系数据库的生成方法及装置

Country Status (1)

Country Link
CN (1) CN105279282A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036435A (zh) * 2018-08-15 2018-12-18 深圳平安综合金融服务有限公司上海分公司 基于声纹信息的身份认证及识别方法
CN109542986A (zh) * 2018-11-30 2019-03-29 北京锐安科技有限公司 网络数据的要素归一化方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185931B1 (en) * 2008-12-19 2012-05-22 Quantcast Corporation Method and system for preserving privacy related to networked media consumption activities
CN103368917A (zh) * 2012-04-01 2013-10-23 阿里巴巴集团控股有限公司 一种网络虚拟用户的风险控制方法及系统
CN104639649A (zh) * 2015-02-13 2015-05-20 仓剑 一种计算个人网络属性值的方法及其系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185931B1 (en) * 2008-12-19 2012-05-22 Quantcast Corporation Method and system for preserving privacy related to networked media consumption activities
CN103368917A (zh) * 2012-04-01 2013-10-23 阿里巴巴集团控股有限公司 一种网络虚拟用户的风险控制方法及系统
CN104639649A (zh) * 2015-02-13 2015-05-20 仓剑 一种计算个人网络属性值的方法及其系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036435A (zh) * 2018-08-15 2018-12-18 深圳平安综合金融服务有限公司上海分公司 基于声纹信息的身份认证及识别方法
CN109036435B (zh) * 2018-08-15 2022-12-20 深圳平安综合金融服务有限公司上海分公司 基于声纹信息的身份认证及识别方法
CN109542986A (zh) * 2018-11-30 2019-03-29 北京锐安科技有限公司 网络数据的要素归一化方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108564460B (zh) 互联网信贷场景下的实时欺诈检测方法及装置
CN106161372B (zh) 一种基于地址匹配的风险识别方法及装置
CN107566124A (zh) 基于抽签机制的共识建立方法、区块链系统及存储介质
CN104239162A (zh) 数据校验方法及装置
CN107392618A (zh) 植入智能合约的方法和设备
CN108334774A (zh) 一种检测攻击的方法、第一服务器及第二服务器
CN105915535B (zh) 一种基于用户身份的虚拟化资源访问控制方法
CN110166344B (zh) 一种身份标识识别方法、装置以及相关设备
CN106960143A (zh) 用户账号的识别方法及装置、存储介质、电子设备
CN110110509A (zh) 权限管理方法及相关产品
CN105279282A (zh) 一种身份关系数据库的生成方法及装置
CN113011883A (zh) 一种数据处理方法、装置、设备及存储介质
CN103002455A (zh) 一种基于社交网络和博弈论的认知无线电频谱共享模型
CN114169387A (zh) 模型训练方法和装置、电子设备、存储介质
CN109684033A (zh) 云平台裸机管理方法、存储介质、电子设备及系统
CN110297948B (zh) 关系网络构建方法以及装置
CN106372267A (zh) 基于浏览器的页面加载方法及装置
CN114492849B (zh) 一种基于联邦学习的模型更新方法及装置
CN109274681A (zh) 一种信息同步方法、装置、存储介质和服务器
CN110099442A (zh) 网络设备的位置变化确定方法、装置、计算机设备及介质
CN106250112A (zh) 一种软件开发辅助系统、方法及软件开发系统
CN113487148B (zh) 一种获取网络评价结果的方法及装置
CN105187140A (zh) 认知无线网络中的分布式可信频谱协作感知方法
CN113032823B (zh) 设备id的生成方法及装置
CN109067716A (zh) 一种识别暗链的方法与系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160127