CN113254726B - 账号分组方法、装置、电子设备及存储介质 - Google Patents
账号分组方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113254726B CN113254726B CN202110632956.3A CN202110632956A CN113254726B CN 113254726 B CN113254726 B CN 113254726B CN 202110632956 A CN202110632956 A CN 202110632956A CN 113254726 B CN113254726 B CN 113254726B
- Authority
- CN
- China
- Prior art keywords
- account
- relationship
- target
- numbers
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000008569 process Effects 0.000 claims description 38
- 238000004891 communication Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供了一种账号分组方法、装置、电子设备及存储介质。方法包括:确定多个账号中存在负向关系的账号,其中,存在负向关系的账号属于不同的自然人;从存在负向关系的账号中选出种子账号,并将一个种子账号分配给一个分组,得到多个分组,其中,任意两个种子账号之间存在负向关系;将未分配账号分配给与未分配账号不存在负向关系的分组;其中,未分配账号包括账号中除种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。因此,本公开实施例的方案,提升了基于账号归属的自然人对账号进行分组的准确率较低。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种账号分组方法、装置、电子设备及存储介质。
背景技术
在实际应用中,一个自然人可能会拥有多个不同的用户账号,用户账号之间可以通过共同使用的设备、通讯号码、共同出现的地理位置信息等方式进行关联。因此,通过账号之间的这些关联关系,可以建立账号之间的正向关系和负向关系,其中,正向关系用于表征两个账号被同一个人使用的关系;负向关系用于表征两个账号不是被同一个人使用的关系。
其中,通过正向关系可以得到多个簇,其中,一个簇中包括的账号一般属于一个自然人。但存在一些情况会使多个人的账号被聚合到一个簇中,例如一个设备先后被多个人使用、共用设备以及共用账号的情况。因此,通过共同使用的设备、通讯号码、共同所处的地理位置这些信息得到的账号之间的正向关系往往准确率较低。
例如两个账号之间存在负向关系,但是若这两个账号分别还与其他账号存在正向关系时,则可能通过与其他账号之间的正向关系的传递重新关联起来,最终使得这两个属于不同自然人的账号被聚合到一个簇中。
由此可见,在现有技术中,若两个账号之间存在负向关系,并且这两个账号还分别与其他账号存在正向关系,则这两个账号仍然会被归属为同一个自然人,进而使得这两个账号被划为到一个分组中。因此,相关技术基于账号归属的自然人对账号进行分组的准确率较低。
发明内容
为了解决背景技术中记载的技术问题,本公开实施例提供了一种账号分组方法、装置、电子设备及存储介质,本公开的技术方案如下:
根据本公开实施例的第一方面,提供了一种账号分组方法,所述方法包括:
确定多个账号中存在负向关系的账号,其中,存在所述负向关系的账号属于不同的自然人;
从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组,其中,任意两个所述种子账号之间存在所述负向关系;
将未分配账号分配给与所述未分配账号不存在所述负向关系的分组;
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。
可选的,所述方法还包括:
确定不存在所述负向关系的所述账号之间的亲密度,其中,所述亲密度表示两个所述账号属于同一自然人的概率;
所述将未分配账号分配给与所述未分配账号不存在所述负向关系的分组,包括:
根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
可选的,所述确定多个账号中存在负向关系的账号,包括:
确定所述多个账号中存在正向关系的账号,其中,所述正向关系表示属于同一自然人;
将存在所述正向关系的所述账号作为顶点,并将存在所述正向关系的顶点连接,构建正向关系图;
获取所述正向关系图的最大连通子图,并将一个最大连通子图中包括的所述账号组成一个关系簇,得到至少一个关系簇;
确定每一个所述关系簇内部的所述账号中存在所述负向关系的账号。
可选的,所述确定不存在所述负向关系的所述账号之间的亲密度,包括:
针对每一个所述关系簇执行如下过程:
计算第一关系簇中的所述账号之间的亲密度,作为所述第一关系簇的亲密度;
其中,所述第一关系簇为所述至少一个关系簇中的其中一个。
可选的,所述计算第一关系簇中的所述账号之间的亲密度,包括:
计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度;
其中,符合所述预设条件的两个所述账号在目标图中通过小于第一预设数量的连接边连接,所述目标图为由所述第一关系簇中的所述账号形成的最大连通子图。
可选的,所述计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度,包括:
计算所述目标图中每一条连接边所连接的两个顶点表示的所述账号之间的亲密度,作为所述目标图中每一条连接边的第一参数;
在第一顶点与第二顶点之间存在至少两条第一路径时,计算每一条所述第一路径包括的多条连接边的所述第一参数的乘积,作为每一条所述第一路径的第二参数,并选择最大的所述第二参数作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
在所述第一顶点与所述第二顶点之间存在一条第二路径时,计算所述第二路径包括的多条连接边的所述第一参数的乘积,作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
其中,所述第一顶点和所述第二顶点为所述目标图中符合所述预设条件的所述账号在所述目标图中的两个顶点。
可选的,计算所述目标图中的一条连接边所连接的两个顶点所表示的所述账号之间的亲密度的过程,包括:
获取第一账号与第二账号的至少一个共用对象,其中,所述共用对象包括共用设备和共用通讯号码中的至少一者;
在i取1~N中的每一个整数时,执行如下过程:
获取在预设时间段内所述第一账号在第i个所述共用对象上的登陆次数,与在所述预设时间段内所述第一账号的总登陆次数的比值,作为第一登录比例;
获取在所述预设时间段内所述第二账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第二账号的总登陆次数的比值,作为第二登录比例;
计算所述第一登录比例与所述第二登录比例的乘积,作为第i个所述共用对象的第三参数;
从第1~N个所述共用对象的所述第三参数中,选出最大的所述第三参数,作为所述第一账号与所述第二账号之间的亲密度;
其中,N为所述共用对象的数量,所述第一账号和所述第二账号为所述目标图中的其中一条连接边所连接的两个顶点表示的所述账号。
可选的,所述从存在所述负向关系的账号中选出种子账号,包括:
针对每一个所述关系簇执行如下过程:
将所述第一关系簇中存在所述负向关系的所述账号作为顶点,并将存在所述负向关系的顶点连接,构建负向关系图;
确定所述负向关系图的最大完全图,并将其中一个所述最大完全图中的所述账号确定为所述第一关系簇中的所述种子账号。
可选的,所述根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组,包括:
针对每一个所述关系簇执行如下过程:
根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组;
其中,所述目标分组为所述第一关系簇的所述种子账号所在的分组,所述目标未分配账号为所述第一关系簇中除所述种子账号之外的账号。
可选的,所述根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组,包括:
从所述目标分组包括的账号与所述目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分;
在第三账号与第四账号所在的所述目标分组不存在所述负向关系时,将所述第三账号分配给所述第四账号所在的所述目标分组,并将所述第三账号从所述第一关系簇中删除,将所述种子账号与所述第三账号之间的所述亲密度删除,其中,所述第四账号为所述目标得分关联的账号中属于所述目标分组的账号,所述第三账号为所述目标得分关联的账号中的所述目标未分配账号;
在所述第三账号与所述第四账号所在的所述目标分组中的其中一个账号存在所述负向关系时,将所述目标得分删除;
返回从目标分组中包括的账号与目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分的步骤,直到所述第一关系簇中剩余的所述亲密度的数量为零。
可选的,所述方法还包括:
当所述第一关系簇中剩余的所述亲密度的数量为零,且所述第一关系簇中仍剩余所述目标未分配账号时,为所述第一关系簇剩余的每一个所述目标未分配账号,分别建立新的分组。
根据本公开实施例的第二方面,提供了一种账号分组装置,所述装置包括:
负向关系确定模块,被配置为确定多个账号中存在负向关系的账号,其中,存在所述负向关系的账号属于不同的自然人;
种子账号选择模块,被配置为从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组,其中,任意两个所述种子账号之间存在所述负向关系;
分组模块,被配置为将未分配账号分配给与所述未分配账号不存在所述负向关系的分组;
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。
可选的,所述装置还包括:
亲密度确定模块,被配置为确定不存在所述负向关系的所述账号之间的亲密度,其中,所述亲密度表示两个所述账号属于同一自然人的概率;
所述分组模块包括:
分组子模块,被配置根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
可选的,所述负向关系确定模块包括:
正向关系确定子模块,被配置为确定所述多个账号中存在正向关系的账号,其中,所述正向关系表示属于同一自然人;
正向关系图建立子模块,被配置为将存在所述正向关系的所述账号作为顶点,并将存在所述正向关系的顶点连接,构建正向关系图;
关系簇获取子模块,被配置为获取所述正向关系图的最大连通子图,并将一个最大连通子图中包括的所述账号组成一个关系簇,得到至少一个关系簇;
负向关系确定子模块,被配置为确定每一个所述关系簇内部的所述账号中存在所述负向关系的账号。
可选的,所述亲密度确定模块具体被配置为:
针对每一个所述关系簇执行如下过程:
计算第一关系簇中的所述账号之间的亲密度,作为所述第一关系簇的亲密度;
其中,所述第一关系簇为所述至少一个关系簇中的其中一个。
可选的,所述亲密度确定模块在计算第一关系簇中的所述账号之间的亲密度时,具体被配置为:
计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度;
其中,符合所述预设条件的两个所述账号在目标图中通过小于第一预设数量的连接边连接,所述目标图为由所述第一关系簇中的所述账号形成的最大连通子图。
可选的,所述亲密度确定模块在计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度时,具体被配置为:
计算所述目标图中每一条连接边所连接的两个顶点表示的所述账号之间的亲密度,作为所述目标图中每一条连接边的第一参数;
在第一顶点与第二顶点之间存在至少两条第一路径时,计算每一条所述第一路径包括的多条连接边的所述第一参数的乘积,作为每一条所述第一路径的第二参数,并选择最大的所述第二参数作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
在所述第一顶点与所述第二顶点之间存在一条第二路径时,计算所述第二路径包括的多条连接边的所述第一参数的乘积,作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
其中,所述第一顶点和所述第二顶点为所述目标图中符合所述预设条件的所述账号在所述目标图中的两个顶点。
可选的,所述亲密度确定模块在计算所述目标图中的一条连接边所连接的两个顶点所表示的所述账号之间的亲密度时,具体被配置为:
获取第一账号与第二账号的至少一个共用对象,其中,所述共用对象包括共用设备和共用通讯号码中的至少一者;
在i取1~N中的每一个整数时,执行如下过程:
获取在预设时间段内所述第一账号在第i个所述共用对象上的登陆次数,与在所述预设时间段内所述第一账号的总登陆次数的比值,作为第一登录比例;
获取在所述预设时间段内所述第二账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第二账号的总登陆次数的比值,作为第二登录比例;
计算所述第一登录比例与所述第二登录比例的乘积,作为第i个所述共用对象的第三参数;
从第1~N个所述共用对象的所述第三参数中,选出最大的所述第三参数,作为所述第一账号与所述第二账号之间的亲密度;
其中,N为所述共用对象的数量,所述第一账号和所述第二账号为所述目标图中的其中一条连接边所连接的两个顶点表示的所述账号。
可选的,所述种子账号选择模块具体被配置为:
针对每一个所述关系簇执行如下过程:
将所述第一关系簇中存在所述负向关系的所述账号作为顶点,并将存在所述负向关系的顶点连接,构建负向关系图;
确定所述负向关系图的最大完全图,并将其中一个所述最大完全图中的所述账号确定为所述第一关系簇中的所述种子账号。
可选的,所述分组子模块具体被配置为:
针对每一个所述关系簇执行如下过程:
根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组;
其中,所述目标分组为所述第一关系簇的所述种子账号所在的分组,所述目标未分配账号为所述第一关系簇中除所述种子账号之外的账号。
可选的,所述分组子模块在根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组时,具体被配置为:
从所述目标分组包括的账号与所述目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分;
在第三账号与第四账号所在的所述目标分组不存在所述负向关系时,将所述第三账号分配给所述第四账号所在的所述目标分组,并将所述第三账号从所述第一关系簇中删除,将所述种子账号与所述第三账号之间的所述亲密度删除,其中,所述第四账号为所述目标得分关联的账号中属于所述目标分组的账号,所述第三账号为所述目标得分关联的账号中的所述目标未分配账号;
在所述第三账号与所述第四账号所在的所述目标分组中的其中一个账号存在所述负向关系时,将所述目标得分删除;
返回从目标分组中包括的账号与目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分的步骤,直到所述第一关系簇中剩余的所述亲密度的数量为零。
可选的,所述分组子模块还被配置为:
当所述第一关系簇中剩余的所述亲密度的数量为零,且所述第一关系簇中仍剩余所述目标未分配账号时,为所述第一关系簇剩余的每一个所述目标未分配账号,分别建立新的分组。
根据本公开实施例的第三方面,提供一种电子设备,该电子设备包括:
处理器;
用于存储该处理器可执行指令的存储器;
其中,该处理器被配置为执行所述指令,以实现本公开提供的账号分组方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备实现本公开提供的账号分组方法。
本公开实施例提供的技术方案,通过确定多个账号之间存在负向关系的账号,然后,从存在负向关系的账号中选出种子账号,其中,任意两个种子账号之间存在负向关系,而存在所述负向关系的账号属于不同的自然人,因此,本公开实施例中的种子账号分别属于不同的自然人。此外,确定出种子账号之后,本公开的实施例还会进一步将未分配账号分配给与未分配账号不存在负向关系的分组,即确定除种子账号之外的其他账号与哪一个种子账号属于同一个自然人。
由此可见,本公开的实施例,从账号之间的负向关系出发,确定出任意两者均存在负向关系的种子账号,将一个种子账号分配给一个分组,进而将除种子账号之外的账号,分配给与其不存在负向关系的分组。因此,本公开的实施例中,任意两个存在负向关系的账号都不可能被分为一组,从而不会被确定为属于同一个自然人。因而,即使两个账号分别与其他账号存在正向关系,但这两个账号之间存在负向关系,在本公开的实施例中,这两个账号也不会被归属为同一个自然人,从而提升了基于账号归属的自然人对账号进行分组的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
图1是根据一示例性实施例示出的一种账号分组方法的流程图;
图2是根据一示例性实施例示出的另一种账号分组方法的流程图;
图3是根据一示例性实施例示出的正向关系图的示意图;
图4是根据一示例性实施例示出的负向关系图的示意图;
图5是根据一示例性实施例示出的将未分配账号分配给与其不存在负向关系的分组的过程示意图;
图6是根据一示例性实施例示出的一种账号分组装置的框图;
图7是根据一示例性实施例示出的另一种账号分组装置的框图;
图8是根据一示例性实施例示出的一种电子设备的框图;
图9是根据一示例性实施例示出的另一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
为了解决在现有技术中,两个账号之间存在负向关系,但这两个账号还分别与其他账号存在正向关系时,这两个账号仍然会被归属为同一个自然人,导致无法准确识别账号归属的自然人的问题,本公开实施例提供了一种账号分组方法、装置、系统、电子设备及存储介质。
根据本公开实施例的第一方面,提供了一种账号分组方法,该方法可以应用于电子设备,例如电脑、手机等终端设备。如图1所示,该账号分组方法可以包括以下步骤:
步骤101:确定多个账号中存在负向关系的账号。
其中,存在所述负向关系的账号属于不同的自然人,例如两个账号之间存在负向关系,则表示这两个账号属于不同的自然人。
另外,所述账号可以为自然人在多个社交平台注册的账号。
此外,若两个账号的登录时间的间隔小于第一阈值,且登录地点的距离大于第二阈值,则表示两个账号存在负向关系。其中,一个自然人不可能在很短的时间内先后在距离很远的两个地点登录两个账号,或者同一个自然人不可能同时在不同地点登录两个账号,因此,如果两个账号的登录时间的间隔小于第一阈值,且登录地点的距离大于第二阈值,则可以确定这两个账号属于不同的自然人。
步骤102:从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组。
其中,任意两个所述种子账号之间存在所述负向关系,例如A、B、C三个账号中任意两者之间均存在负向关系,则A、B、C三个账号均属于种子账号,则可以将A账号分配给第一分组,将B账号分配给第二分组,将C账号分配给第三分组。
步骤103:将未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号。一个分组中的账号属于同一自然人。因此,本公开实施例中,将未分配账号分配给与所述未分配账号不存在负向关系的分组,即为确定未分配账号与哪个分组中的账号属于同一自然人。
另外,未分配账号与分组不存在负向关系,是指未分配账号与分组中包括的账号均不存在负向关系。即一个未分配账号与一个分组中包括的每一个账号均不存在负向关系,则该未分配账号与该分组不存在负向关系。
例如存在A、B、C、D、E五个账号,且A、B、C分别属于种子账号,A账号处于第一分组、B账号处于第二分组、C账号处于第三分组,则需要将D、E账号分配给第一至第三分组中与自身不存在负向关系的分组,即需要分别确定D、E账号分别属于第一分组、第二分组和第三分组中的哪一个分组,亦即需要确定D、E账号分别与A、B、C这三个种子账号中的哪一个账号属于同一自然人。
由上述可知,本公开实施例的账号分组方法,通过确定多个账号之间存在负向关系的账号,从存在负向关系的账号中选出种子账号,其中,任意两个种子账号之间存在负向关系,而存在所述负向关系的账号属于不同的自然人,因此,本公开实施例中的种子账号分别属于不同的自然人。此外,确定出种子账号之后,本公开的实施例还会进一步将未分配账号分配给与未分配账号不存在负向关系的分组,即确定除种子账号之外的其他账号与哪一个种子账号属于同一个自然人。
由此可见,本公开实施例的账号分组方法,从账号之间的负向关系出发,确定出任意两者均存在负向关系的种子账号,将一个种子账号分配给一个分组,进而将除种子账号之外的账号,分配给与其不存在负向关系的分组。
因此,在本公开实施例的账号分组方法中,任意两个存在负向关系的账号都不可能被分为一组,从而不会被确定为属于同一个自然人。因而,即使两个账号分别与其他账号存在正向关系,但这两个账号之间存在负向关系,在本公开的实施例中,这两个账号也不会被归属为同一个自然人,从而提升了基于账号归属的自然人对账号进行分组的准确率。
根据本公开实施例的第二方面,提供了一种账号分组方法,如图2所示,该账号分组方法可以包括以下步骤:
步骤201:确定多个账号中存在负向关系的账号。
其中,存在所述负向关系的账号属于不同的自然人,例如两个账号之间存在负向关系,则表示这两个账号属于不同的自然人。
另外,账号可以为自然人在多个社交平台注册的账号。
此外,若两个账号的登录时间的间隔小于第一阈值,且登录地点的距离大于第二阈值,则表示两个账号存在负向关系。其中,一个自然人不可能在很短的时间内先后在距离很远的两个地点登录两个账号,或者同一个自然人不可能同时在不同地点登录两个账号,因此,如果两个账号的登录时间的间隔小于第一阈值,且登录地点的距离大于第二阈值,则可以确定这两个账号属于不同的自然人。
此处需要说明的是,对于确定两个账号是否存在负向关系的具体方式并不局限于此处的描述,还可根据实际账号的应用场景使用不同的数据进行确定。
步骤202:从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组。
其中,任意两个所述种子账号之间存在所述负向关系,例如A、B、C三个账号中任意两者之间均存在负向关系,则A、B、C三个账号均属于种子账号,则可以将A账号分配给第一分组,将B账号分配给第二分组,将C账号分配给第三分组。
步骤203:确定不存在所述负向关系的所述账号之间的亲密度。
其中,所述亲密度表示两个所述账号属于同一自然人的概率。
另外,两个账号之间若不存在负向关系,则表示这两个账号可能属于同一自然人。而本公开的实施例中,通过计算不存在负向关系的账号之间的亲密度,以确定不存在负向关系的账号属于同一自然人的概率。
步骤204:根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号。一个所述分组中的所述账号属于同一自然人。未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系,即一个未分配账号与一个分组中包括的每一个账号均不存在负向关系,则该未分配账号与该分组不存在负向关系。
例如若存在A、B、C、D、E五个账号,且A、B、C分别属于种子账号,A账号处于第一分组、B账号处于第二分组、C账号处于第三分组,则需要将D、E账号分配给第一至第三分组中与自身不存在负向关系的分组,即需要根据这五个账号中不存在负向关系的账号之间的亲密度,分别确定D、E账号分别属于第一分组、第二分组和第三分组中的哪一个分组,亦即需要确定D、E账号分别与A、B、C这三个种子账号中的哪一个账号属于同一自然人。
一个实施例中,亲密度表示两个账号属于同一自然人的概率,因此,根据亲密度,将未分配账号分配给与其不存在负向关系的分组,以将未分配账号分配给与其亲密关系最大(即属于同一自然人的概率最大)的一个分组,亦即以将亲密关系最大的账号归属为一个自然人,从而进一步提升基于账号归属的自然人对账号进行分组的准确率。
可选的,所述确定多个账号中存在负向关系的账号,包括:
确定所述多个账号中存在正向关系的账号,其中,所述正向关系表示属于同一自然人;
将存在所述正向关系的所述账号作为顶点,并将存在所述正向关系的顶点连接,构建正向关系图;
获取所述正向关系图的最大连通子图,并将一个最大连通子图中包括的所述账号组成一个关系簇,得到至少一个关系簇;
确定每一个所述关系簇内部的所述账号中存在所述负向关系的账号。
其中,可以根据账号之间的共用设备、共用通讯号码的情况,提取账号之间的正向关系,即若两个账号之间存在共用设备或者共用通讯号码,则表示二者之间存在正向关系,即表示二者属于同一自然人。
另外,最大连通子图为正向关系图的连通子图中,包括账号的数量最多的连通子图。
例如A、B、C、D、E、F、G这七个账号中,若A与D、D与B、B与E、A与E、C与F、B与F之间分别存在正向关系,则得到的正向关系图可如图3所示。其中,图3中所示的A、D、B、E、C、F这六个账号连接而成的图属于该正向关系图的最大连通子图,这六个账号组成一个关系簇。
由上述可知,本公开的实施例中,可以根据账号之间的正向关系建立正向关系图,从而将正向关系图中的一个最大连通子图作为一个关系簇,从而针对每一个关系簇,确定关系簇内部的账号中是否存在负向关系,以缩小检验负向关系的范围,解决无法在开放性环境中计算某些类型关系的问题,并且能够覆盖更全面。
可选的,所述确定不存在所述负向关系的所述账号之间的亲密度,包括:
针对每一个所述关系簇执行如下过程:
计算第一关系簇中的所述账号之间的亲密度,作为所述第一关系簇的亲密度;
其中,所述第一关系簇为所述至少一个关系簇中的其中一个。
由此可知,根据账号之间的正向关系建立正向关系图,进而得到至少一个关系簇后,可以针对每一个关系簇,计算关系簇内部的各个账号中不存在负向关系的账号之间的亲密度,从而确定每一个关系簇内部的各个账号之间属于同一自然人的概率。
其中,针对每一个关系簇,计算关系簇内部的各个账号中不存在负向关系的账号之间的亲密度,缩小了计算亲密度的范围,从而不必计算所有账号中任意两者之间的亲密度,进而提升了数据处理速度。
可选的,所述计算第一关系簇中的所述账号之间的亲密度,包括:
计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度;
其中,符合所述预设条件的两个所述账号在目标图中通过小于第一预设数量的连接边连接,所述目标图为由所述第一关系簇中的所述账号形成的最大连通子图。
另外,在一个最大连通子图中,两个顶点之间存在的连接边的数量越多,表示这两个顶点所表示的账号之间的正向关系越弱,即这两个顶点所表示的账号属于同一个自然人的概率越小。因此,计算一个最大联通图中通过小于第一预设数量的连接边连接的两个顶点表示的账号之间的亲密度,从而减少计算量,加快账号的分组过程。
此外,可选的,上述第一预设数量可以为3,则需要计算一个最大联通图中任意两个直接相连的顶点表示的账号之间的亲密度、以及任意两个通过两条连接边连接的顶点表示的账号之间的亲密度。或者,上述第一预设数量可以为2,则只需要计算一个最大联通图中任意两个直接相连的顶点表示的账号之间的亲密度即可。
可选的,所述计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度,包括:
计算所述目标图中每一条连接边所连接的两个顶点表示的所述账号之间的亲密度,作为所述目标图中每一条连接边的第一参数;
在第一顶点与第二顶点之间存在至少两条第一路径时,计算每一条所述第一路径包括的多条连接边的所述第一参数的乘积,作为每一条所述第一路径的第二参数,并选择最大的所述第二参数作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
在所述第一顶点与所述第二顶点之间存在一条第二路径时,计算所述第二路径包括的多条连接边的所述第一参数的乘积,作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
其中,所述第一顶点和所述第二顶点为所述目标图中符合所述预设条件的所述账号在所述目标图中的两个顶点。
当上述第一预设数量为3时,对于图3中所示的A、D、B、E、C、F这六个账号连接而成的最大连通子图(即一个关系簇),计算每两个符合预设条件的账号之间的亲密度的过程如下所述:
计算图3中所示的最大连通子图中的六个顶点中,每两个直接相连的顶点表示的账号之间的亲密度;
对于该最大连通子图中存在至少两条路径的两个账号,例如A、B账号之间存在A-D-B、A-E-B两条路径,则计算A-D-B路径的第二参数=WAD* WDB,A-E-B路径的第二参数=WAE*WEB,然后取这两条路径的第二参数中较大的一者作为A、B账号之间的亲密度,其中,WAD表示A、D账号之间的亲密度,WDB表示D、B账号之间的亲密度, WAE表示A、E账号之间的亲密度,WEB表示E、B账号之间的亲密度;
对于该最大连通子图中存在一条路径的两个顶点,例如B与C两个顶点之间只存在B-F-C一条路径,则B、C账号之间的亲密度= WBF* WFC,其中,WBF表示B、F账号之间的亲密度,WFC表示F、C账号之间的亲密度。
由上述可知,本公开的实施例中,对于在最大连通子图中未直接连接的两个账号之间的亲密度,取决于这两个账号之间的路径的第二参数,而一条路径的第二参数的大小取决于该路径包括的连接边的第一参数的大小。由此可见,本公开的实施例中,计算两个账号之间的亲密度时,根据两个账号在最大连通子图中的实际连接情况进行计算,从而使得两个账号之间的亲密度能够更加准确地表示两个账号属于同一自然人的概率。
可选的,计算所述目标图中的一条连接边所连接的两个顶点所表示的所述账号之间的亲密度的过程,包括:
获取第一账号与第二账号的至少一个共用对象,其中,所述共用对象包括共用设备和共用通讯号码中的至少一者;
在i取1~N中的每一个整数时,执行如下过程:
获取在预设时间段内所述第一账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第一账号的总登陆次数的比值,作为第一登录比例;
获取在所述预设时间段内所述第二账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第二账号的总登陆次数的比值,作为第二登录比例;
计算所述第一登录比例与所述第二登录比例的乘积,作为第i个所述共用对象的第三参数;
从第1~N个所述共用对象的所述第三参数中,选出最大的所述第三参数,作为所述第一账号与所述第二账号之间的亲密度;
其中,N为所述共用对象的数量,所述第一账号和所述第二账号为所述目标图中的其中一条连接边所连接的两个顶点表示的所述账号。
例如计算图3中所示的最大连通子图中A、D账号之间的亲密度的过程为:
确定A、D账号共用的对象,例如A、D账号存在第一设备和第二设备这两个共用设备;
计算在预设时间段内(例如一个星期内)A账号在第一设备上的登录次数、与在该预设时间段内A账号的总登录次数(即A账号在所有设备上的登录次数)的比值,例如为X1;同理,计算在预设时间段内D账号在第一设备上的登录次数、与在该预设时间段内D账号的总登录次数(即D账号在所有设备上的登录次数)的比值,例如为Y1;进而计算X1*Y1,作为第一设备的第三参数;
计算在预设时间段内A账号在第二设备上的登录次数、与在该预设时间段内A账号的总登录次数(即A账号在所有设备上的登录次数)的比值,例如为X2;同理,计算在预设时间段内D账号在第二设备上的登录次数、与在该预设时间段内D账号的总登录次数(即D账号在所有设备上的登录次数)的比值,例如为Y2;进而计算X2*Y2,作为第二设备的第三参数;
取第一设备的第三参数和第二设备的第三参数中较大的一个,作为A、D账号之间的亲密度。
由上述可知,本公开的实施例中,在计算在最大连通子图中直接连接的两个账号的亲密度时,根据这两个账号对共用对象的实际使用情况进行计算,从而使得这两个账号之间的亲密度能够更加准确的表示两个账号属于同一自然人的概率。
此外,对于在最大连通子图中直接连接的两个账号的亲密度的具体计算方法并不局限于此处的描述,还可根据实际账号的应用场景使用不同的数据进行计算。
可选的,所述从存在所述负向关系的账号中选出种子账号,包括:
针对每一个所述关系簇执行如下过程:
将所述第一关系簇中存在所述负向关系的所述账号作为顶点,并将存在所述负向关系的顶点连接,构建负向关系图;
确定所述负向关系图的最大完全图,并将其中一个所述最大完全图中的所述账号确定为所述第一关系簇中的所述种子账号。
其中,在一个完全图中,任意一个顶点都存在与其他每一个顶点之间的连接边,因此,本公开实施例中,构建的负向关系图中的最大完全图中,任意一个顶点表示的账号均与其他顶点表示的账号存在负向关系,因此,该最大完全图中的顶点即为种子账号。
例如经确定图3中所示的最大连通子图中包括的A、B、C、D、E、F这六个账号之间的负向关系图如图4所示,则图4中所示的负向关系图的最大完全图为A、B、C这三个账号连接而成的图,则A、B、C、D、E、F这六个账号组成的关系簇的种子账号为A、B、C三个账号。
由上述可知,本公开的实施例中,通过构建负向关系图,进而将负向关系图的最大完全图中包括的顶点表示的账号作为种子账号,该方法简单方便。另外,针对每一个关系簇建立一个负向关系图,缩小了建立负向关系图的范围,进而提升了数据处理速度。
可选的,所述根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组,包括:
针对每一个所述关系簇执行如下过程:
根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组;
其中,所述目标分组为所述第一关系簇的所述种子账号所在的分组,所述目标未分配账号为所述第一关系簇中除所述种子账号之外的账号。
即每一个关系簇中都存在种子账号和除种子账号之外的未分配账号,且每个种子账号处于一个分组中,则可以根据一个关系簇中的未分配账号与该关系簇关联的各个分组中包括的账号之间的亲密度,来将该关系簇中的未分配账号分配给与其不存在负向关系的分组。
可选的,所述根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组,包括:
从所述目标分组包括的账号与所述目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分;
在第三账号与第四账号所在的所述目标分组不存在所述负向关系时,将所述第三账号分配给所述第四账号所在的所述目标分组,并将所述第三账号从所述第一关系簇中删除,将所述种子账号与所述第三账号之间的所述亲密度删除,其中,所述第四账号为所述目标得分关联的账号中属于所述目标分组的账号,所述第三账号为所述目标得分关联的账号中的所述目标未分配账号;
在所述第三账号与所述第四账号所在的所述目标分组中的其中一个账号存在所述负向关系时,将所述目标得分删除;
返回从目标分组中包括的账号与目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分的步骤,直到所述第一关系簇中剩余的所述亲密度的数量为零。
可选的,所述方法还包括:
当所述第一关系簇中剩余的所述亲密度的数量为零,且所述第一关系簇中仍剩余所述目标未分配账号时,为所述第一关系簇剩余的每一个所述目标未分配账号,分别建立新的分组。
例如一个关系簇的种子账号为A、B、C三个账号,且D、E、F三个账号属于未分配账号,E、B账号之间存在负向关系,计算得到的亲密度具体如下
:WAD=0.6、WBD=0.8、WCF=0.5、WEB=0.7、WEA=0.3;
其中,WAD表示A、D账号之间的亲密度,WBD表示B、D账号之间的亲密度,WCF表示C、F账号之间的亲密度;WEB表示E、B账号之间的亲密度,WEA表示E、A账号之间的亲密度;
则确定D、E、F这三个账号分别属于A、B、C这三个种子账号所在的哪一个分组的过程可如图5所示:
从前述计算得到的亲密度(即WAD=0.6、WBD=0.8、WCF=0.5、WEB=0.7、WEA=0.3)中找到最大值,即为WBD=0.8,其中,由于D账号与B账号所在的分组中包括的账号之间均不存在负向关系,因此,将D账号归属为B账号所在的分组,并将D账号从未分配账号中删除,将种子账号(即A、B、C账号)与D账号之间的亲密度删除(即将WAD、WBD删除);
从剩余的亲密度(即WCF=0.5、WEB=0.7、WEA=0.3)中,找到最大值,即为WEB=0.7,然而,由于E与D账号之间存在负向关系,且D账号处于B账号所在的分组中,所以此时需要舍弃WEB,即将WEB删除;
从剩余的亲密度(即WCF=0.5、WEA=0.3)中,找到最大值,即为WCF=0.5,其中,由于F账号与C账号所在的分组中包括账号之间均不存在负向关系,因此,将F账号归属为C账号所在的分组,并将F账号从未分配账号中删除,将种子账号(即A、B、C账号)与F账号之间的亲密度删除(即将WCF删除);
剩余的亲密度只有WEA=0.3,其中,由于E账号与A账号所在的分组中已存在的账号之间均不存在负向关系,因此,将E账号归属为A账号所在的分组,并将E账号从未分配账号中删除,将种子账号(即A、B、C账号)与E账号之间的亲密度删除(即将WEA删除);
至此,D、E、F这三个账号全部分配完毕。即A、E账号处于同一分组,B、D账号处于同一分组,C、F账号处于同一分组。
其中,需要说明的是,若前述计算得到的亲密度中并不包括WEA,则在前述过程中,将F账号归属为C账号所在的分组,并将F账号从未分配账号中删除,将种子账号(即A、B、C账号)与F账号之间的亲密度删除(即将WCF删除)之后,已无剩余的亲密度,则需要为E账号建立新的分组,即将E账号归属为一个新的分组。
由上述可知,本公开的实施例,在根据亲密度,将未分配账号分配给与其不存在负向关系的分组时,采用“账号挂靠”的方式,即针对每一个关系簇,每次提取未分配账号与分组包括的账号之间的亲密度中的最大值,并保证该最大值关联的未分配账号,与该最大值关联的已分配账号(即目前存在于分组中的账号)所在的分组包括的账号均不存在负向关系,从而可以将一个账号归属为与其亲密关系最大的一个分组,并有效避免出现两个账号之间存在负向关系,且这两个账号还分别与其他账号存在正向关系时,将这两个账号被归属为同一个自然人的情况。
综上所述,本公开的实施例,可以先通过正向关系进行最大连通子图计算,得到关系簇,从而在簇中对两两用户账户对进行负向关系检查,这样可以避免短视问题(假设AB、BC之间存在正向关系,只检查AB、BC,而不检查BC则为短视),达到全面发现负向关系的目标;并且,负向关系收集完毕以后,通过构建负向关系图以及账号挂靠的方式,对账号进行分组,即根据所有的正向关系和负向关系,在关系簇内进行负向拆分、正向靠拢,可以实现彻底拆分,解决了传递性问题(即有效避免出现两个账号之间存在负向关系,且这两个账号还分别与其他账号存在正向关系时,将这两个账号被归属为同一个自然人的情况)。
此外,本公开的实施例的上述整个计算过程允许通过分布式计算高效快速完成关系簇中的自然人拆分。
由上述可知,本公开实施例的账号分组方法的具体实施方式可如下所述:
根据不同账号之间共用设备、共用通讯号码的情况,提取账号之间的正向关系,将将存在正向关系的账号作为顶点,并将存在正向关系的顶点连接,构建正向关系图,从而获取正向关系图的最大连通子图,进而将每一个最大连通子图中包括的账号组成一个关系簇;
针对每一个关系簇,确定关系簇内部存在负向关系的
账号;
针对每一个关系簇,将关系簇中存在负向关系的账号作为顶点,并将存在负向关系的顶点连接,构建负向关系图,从而获取负向关系图的最大完全图,进而将其中一个最大完全图中包括的账号确定为该关系簇的种子账号,并将每一个种子账号分配给一个分组;
针对每一个关系簇,计算关系簇内部每两个符合预设条件的账号之间的亲密度,其中,符合所述预设条件的两个所述账号,在其所属关系簇组成的最大联通图中通过小于第一预设数量的连接边连接;另外,计算亲密度的具体方法详见前文,此处不再赘述;
至此前述种子账号为已分配账号,除种子账号之外的账号为未分配账号;
接着,针对每一个关系簇,每次从关系簇内部未分配账号中选取一个和该关系簇内部已分配账号亲密度最高的账号,即从未分配账号与已分配账号之间的亲密度中选出一个最大值,同时该账号需要保证和这个组(即这个最大值关联的已分配账号所在的分组)中所有已分配账号都不存在负向关系,将该账号纳入该组,否则将这个最大值删除;
直至所有账号分配完毕,或者,剩余的亲密度的数量为零时,仍存在未分配账号时,为剩余的每一个未分配账号分别建立新的分组;
至此,整个划分过程结束,每一个分组即属于一个自然人。
此外,在相关技术中,直接在正向关系集合中验证是否存在负向关系,若存在则消除正向关系的方式无法解决短视性和传递性问题。其中,短视性问题,即A与B账号、A与C账号之间存在正向关系,则只检测A与B账号、A与C账号是否存在负向关系,不检查B与C账号;传递性问题,即A与B账号、A与C账号、B与C账号之间存在正向关系,检测出B与C账号之间存在负向关系时,只消除B与C账号之间的正向关系,但B与C账号又会通过A账号连接起来,无法真正达到拆分B和C账号的目的。此外,某些类型关系的计算无法在开放性环境中进行,需要先缩小范围,比如无法在全量用户中计算所有的用户之间的负向关系。
而本公开的实施例,先聚合关系簇,以此达到缩小搜索范围,解决无法在开放性环境中计算某些类型关系的问题,并且能够覆盖更全面;然后,在关系簇中寻找两两用户账户的亲密度和是否存在负向关系,解决了短视性问题,并通过负向关系图解决了传递性问题。其中,解决了短视性问题以及传递性问题,则可以有效避免出现两个账号之间存在负向关系,且这两个账号还分别与其他账号存在正向关系时,将这两个账号被归属为同一个自然人的情况,从而提升基于账号归属的自然人对账号进行分组的准确率较低。
另外,本公开的实施例,根据账号之间的亲密度,将未分配账号分配给与该未分配账号不存在负向关系的分组,进一步提升了账号分组的准确性。此外,本公开实施例的整个过程自动化、流程化,无需人工参与。
由此可见,本公开的实施例提升了基于账号归属的自然人对账号进行分组的准确率较低,以及推荐、风控等多种业务场景下的服务能力。
根据本公开实施例的第三方面,提供了一种账号分组装置,如图6所示,该账号分组装置包括:
负向关系确定模块601,被配置为确定多个账号中存在负向关系的账号,其中,存在所述负向关系的账号属于不同的自然人;
种子账号选择模块602,被配置为从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组,其中,任意两个所述种子账号之间存在所述负向关系;
分组模块603,被配置为将未分配账号分配给与所述未分配账号不存在所述负向关系的分组;
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。
由上述可知,本公开的实施例,通过确定多个账号之间存在负向关系的账号,然后,从存在负向关系的账号中选出种子账号,其中,任意两个种子账号之间存在负向关系,而存在所述负向关系的账号属于不同的自然人,因此,本公开实施例中的种子账号分别属于不同的自然人。此外,确定出种子账号之后,本公开的实施例还会进一步将未分配账号分配给与未分配账号不存在负向关系的分组,即确定除种子账号之外的其他账号与哪一个种子账号属于同一个自然人。
由此可见,本公开的实施例,从账号之间的负向关系出发,确定出任意两者均存在负向关系的种子账号,将一个种子账号分配给一个分组,进而将除种子账号之外的账号,分配给与其不存在负向关系的分组。因此,本公开的实施例中,任意两个存在负向关系的账号都不可能被分为一组,从而不会被确定为属于同一个自然人。因而,即使两个账号分别与其他账号存在正向关系,但这两个账号之间存在负向关系,在本公开的实施例中,这两个账号也不会被归属为同一个自然人,从而提升了基于账号归属的自然人对账号进行分组的准确率。
根据本公开实施例的第四方面,提供了一种账号分组装置,如图7所示,该账号分组装置包括:
负向关系确定模块701,被配置为确定多个账号中存在负向关系的账号,其中,存在所述负向关系的账号属于不同的自然人;
种子账号选择模块702,被配置为从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组,其中,任意两个所述种子账号之间存在所述负向关系;
分组模块703,被配置为将未分配账号分配给与所述未分配账号不存在所述负向关系的分组;
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。
可选的,所述装置还包括:
亲密度确定模块704,被配置为确定不存在所述负向关系的所述账号之间的亲密度,其中,所述亲密度表示两个所述账号属于同一自然人的概率;
所述分组模块703包括:
分组子模块7031,被配置根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
可选的,所述负向关系确定模块701包括:
正向关系确定子模块7011,被配置为确定所述多个账号中存在正向关系的账号,其中,所述正向关系表示属于同一自然人;
正向关系图建立子模块7012,被配置为将存在所述正向关系的所述账号作为顶点,并将存在所述正向关系的顶点连接,构建正向关系图;
关系簇获取子模块7013,被配置为获取所述正向关系图的最大连通子图,并将一个最大连通子图中包括的所述账号组成一个关系簇,得到至少一个关系簇;
负向关系确定子模块7014,被配置为确定每一个所述关系簇内部的所述账号中存在所述负向关系的账号。
可选的,所述亲密度确定模块704具体被配置为:
针对每一个所述关系簇执行如下过程:
计算第一关系簇中的所述账号之间的亲密度,作为所述第一关系簇的亲密度;
其中,所述第一关系簇为所述至少一个关系簇中的其中一个。
可选的,所述亲密度确定模块704在计算第一关系簇中的所述账号之间的亲密度时,具体被配置为:
计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度;
其中,符合所述预设条件的两个所述账号在目标图中通过小于第一预设数量的连接边连接,所述目标图为由所述第一关系簇中的所述账号形成的最大连通子图。
可选的,所述亲密度确定模块704在计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度时,具体被配置为:
计算所述目标图中每一条连接边所连接的两个顶点表示的所述账号之间的亲密度,作为所述目标图中每一条连接边的第一参数;
在第一顶点与第二顶点之间存在至少两条第一路径时,计算每一条所述第一路径包括的多条连接边的所述第一参数的乘积,作为每一条所述第一路径的第二参数,并选择最大的所述第二参数作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
在所述第一顶点与所述第二顶点之间存在一条第二路径时,计算所述第二路径包括的多条连接边的所述第一参数的乘积,作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
其中,所述第一顶点和所述第二顶点为所述目标图中符合所述预设条件的所述账号在所述目标图中的两个顶点。
可选的,所述亲密度确定模块704在计算所述目标图中的一条连接边所连接的两个顶点所表示的所述账号之间的亲密度时,具体被配置为:
获取第一账号与第二账号的至少一个共用对象,其中,所述共用对象包括共用设备和共用通讯号码中的至少一者;
在i取1~N中的每一个整数时,执行如下过程:
获取在预设时间段内所述第一账号在第i个所述共用对象上的登陆次数,与在所述预设时间段内所述第一账号的总登陆次数的比值,作为第一登录比例;
获取在所述预设时间段内所述第二账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第二账号的总登陆次数的比值,作为第二登录比例;
计算所述第一登录比例与所述第二登录比例的乘积,作为第i个所述共用对象的第三参数;
从第1~N个所述共用对象的所述第三参数中,选出最大的所述第三参数,作为所述第一账号与所述第二账号之间的亲密度;
其中,N为所述共用对象的数量,所述第一账号和所述第二账号为所述目标图中的其中一条连接边所连接的两个顶点表示的所述账号。
可选的,所述种子账号选择模块702具体被配置为:
针对每一个所述关系簇执行如下过程:
将所述第一关系簇中存在所述负向关系的所述账号作为顶点,并将存在所述负向关系的顶点连接,构建负向关系图;
确定所述负向关系图的最大完全图,并将其中一个所述最大完全图中的所述账号确定为所述第一关系簇中的所述种子账号。
可选的,所述分组子模块7031具体被配置为:
针对每一个所述关系簇执行如下过程:
根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组;
其中,所述目标分组为所述第一关系簇的所述种子账号所在的分组,所述目标未分配账号为所述第一关系簇中除所述种子账号之外的账号。
可选的,所述分组子模块7031在根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组时,具体被配置为:
从所述目标分组包括的账号与所述目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分;
在第三账号与第四账号所在的所述目标分组不存在所述负向关系时,将所述第三账号分配给所述第四账号所在的所述目标分组,并将所述第三账号从所述第一关系簇中删除,将所述种子账号与所述第三账号之间的所述亲密度删除,其中,所述第四账号为所述目标得分关联的账号中属于所述目标分组的账号,所述第三账号为所述目标得分关联的账号中的所述目标未分配账号;
在所述第三账号与所述第四账号所在的所述目标分组中的其中一个账号存在所述负向关系时,将所述目标得分删除;
返回从目标分组中包括的账号与目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分的步骤,直到所述第一关系簇中剩余的所述亲密度的数量为零。
可选的,所述分组子模块7031还被配置为:
当所述第一关系簇中剩余的所述亲密度的数量为零,且所述第一关系簇中仍剩余所述目标未分配账号时,为所述第一关系簇剩余的每一个所述目标未分配账号,分别建立新的分组。
由上述可知,本公开的实施例,通过确定多个账号之间存在负向关系的账号,然后,从存在负向关系的账号中选出种子账号,其中,任意两个种子账号之间存在负向关系,而存在所述负向关系的账号属于不同的自然人,因此,本公开实施例中的种子账号分别属于不同的自然人。此外,确定出种子账号之后,本公开的实施例还会进一步将未分配账号分配给与未分配账号不存在负向关系的分组,即确定除种子账号之外的其他账号与哪一个种子账号属于同一个自然人。
由此可见,本公开的实施例,从账号之间的负向关系出发,确定出任意两者均存在负向关系的种子账号,将一个种子账号分配给一个分组,进而将除种子账号之外的账号,分配给与其不存在负向关系的分组。因此,本公开的实施例中,任意两个存在负向关系的账号都不可能被分为一组,从而不会被确定为属于同一个自然人。因而,即使两个账号分别与其他账号存在正向关系,但这两个账号之间存在负向关系,在本公开的实施例中,这两个账号也不会被归属为同一个自然人,从而提升了基于账号归属的自然人对账号进行分组的准确率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本公开实施例的第五方面,提供了一种电子设备。参照图8,该电子设备包括:
处理器810;
用于存储所述处理器可执行指令的存储器820;
其中,所述处理器被配置为执行所述指令,以实现上述所述的账号分组方法。
根据本公开实施例的第六方面,还提供了一种电子设备。如图9所示,该电子设备900可以是移动电话,计算机,数字广播电子设备,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图9,电子设备900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/ O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制电子设备900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在电子设备900的操作。这些数据的示例包括用于在电子设备900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为电子设备900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为电子设备900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述电子设备900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当电子设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当电子设备900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/ O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为电子设备900提供各个方面的状态评估。例如,传感器组件914可以检测到电子设备900的打开/关闭状态,组件的相对定位,例如所述组件为电子设备900的显示器和小键盘,传感器组件914还可以检测电子设备900或电子设备900一个组件的位置改变,用户与电子设备900接触的存在或不存在,电子设备900方位或加速/减速和电子设备900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于电子设备900和其他设备之间有线或无线方式的通信。电子设备900可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、9G或5G),或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述所述的账号分组方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由电子设备900的处理器920执行以完成上述方法。可选地,例如,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开实施的又一方面,本公开实施例还提供了一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述所述的账号分组方法。
在此提供的账号分组方案不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的信息提取方案中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (24)
1.一种账号分组方法,其特征在于,所述方法包括:
确定多个账号中存在负向关系的账号,其中,存在所述负向关系的账号属于不同的自然人;
从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组,其中,任意两个所述种子账号之间存在所述负向关系;
将未分配账号分配给与所述未分配账号不存在所述负向关系的分组;
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。
2.根据权利要求1所述的账号分组方法,其特征在于,所述方法还包括:
确定不存在所述负向关系的所述账号之间的亲密度,其中,所述亲密度表示两个所述账号属于同一自然人的概率;
所述将未分配账号分配给与所述未分配账号不存在所述负向关系的分组,包括:
根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
3.根据权利要求2所述的账号分组方法,其特征在于,所述确定多个账号中存在负向关系的账号,包括:
确定所述多个账号中存在正向关系的账号,其中,所述正向关系表示属于同一自然人;
将存在所述正向关系的所述账号作为顶点,并将存在所述正向关系的顶点连接,构建正向关系图;
获取所述正向关系图的最大连通子图,并将一个最大连通子图中包括的所述账号组成一个关系簇,得到至少一个关系簇;
确定每一个所述关系簇内部的所述账号中存在所述负向关系的账号。
4.根据权利要求3所述的账号分组方法,其特征在于,所述确定不存在所述负向关系的所述账号之间的亲密度,包括:
针对每一个所述关系簇执行如下过程:
计算第一关系簇中的所述账号之间的亲密度,作为所述第一关系簇的亲密度;
其中,所述第一关系簇为所述至少一个关系簇中的其中一个。
5.根据权利要求4所述的账号分组方法,其特征在于,所述计算第一关系簇中的所述账号之间的亲密度,包括:
计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度;
其中,符合所述预设条件的两个所述账号在目标图中通过小于第一预设数量的连接边连接,所述目标图为由所述第一关系簇中的所述账号形成的最大连通子图。
6.根据权利要求5所述的账号分组方法,其特征在于,所述计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度,包括:
计算所述目标图中每一条连接边所连接的两个顶点表示的所述账号之间的亲密度,作为所述目标图中每一条连接边的第一参数;
在第一顶点与第二顶点之间存在至少两条第一路径时,计算每一条所述第一路径包括的多条连接边的所述第一参数的乘积,作为每一条所述第一路径的第二参数,并选择最大的所述第二参数作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
在所述第一顶点与所述第二顶点之间存在一条第二路径时,计算所述第二路径包括的多条连接边的所述第一参数的乘积,作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
其中,所述第一顶点和所述第二顶点为所述目标图中符合所述预设条件的所述账号在所述目标图中的两个顶点。
7.根据权利要求6所述的账号分组方法,其特征在于,计算所述目标图中的一条连接边所连接的两个顶点所表示的所述账号之间的亲密度的过程,包括:
获取第一账号与第二账号的至少一个共用对象,其中,所述共用对象包括共用设备和共用通讯号码中的至少一者;
在i取1~N中的每一个整数时,执行如下过程:
获取在预设时间段内所述第一账号在第i个所述共用对象上的登陆次数,与在所述预设时间段内所述第一账号的总登陆次数的比值,作为第一登录比例;
获取在所述预设时间段内所述第二账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第二账号的总登陆次数的比值,作为第二登录比例;
计算所述第一登录比例与所述第二登录比例的乘积,作为第i个所述共用对象的第三参数;
从第1~N个所述共用对象的所述第三参数中,选出最大的所述第三参数,作为所述第一账号与所述第二账号之间的亲密度;
其中,N为所述共用对象的数量,所述第一账号和所述第二账号为所述目标图中的其中一条连接边所连接的两个顶点表示的所述账号。
8.根据权利要求4至7中任一项所述的账号分组方法,其特征在于,所述从存在所述负向关系的账号中选出种子账号,包括:
针对每一个所述关系簇执行如下过程:
将所述第一关系簇中存在所述负向关系的所述账号作为顶点,并将存在所述负向关系的顶点连接,构建负向关系图;
确定所述负向关系图的最大完全图,并将其中一个所述最大完全图中的所述账号确定为所述第一关系簇中的所述种子账号。
9.根据权利要求8所述的账号分组方法,其特征在于,所述根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组,包括:
针对每一个所述关系簇执行如下过程:
根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组;
其中,所述目标分组为所述第一关系簇的所述种子账号所在的分组,所述目标未分配账号为所述第一关系簇中除所述种子账号之外的账号。
10.根据权利要求9所述的账号分组方法,其特征在于,所述根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组,包括:
从所述目标分组包括的账号与所述目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分;
在第三账号与第四账号所在的所述目标分组不存在所述负向关系时,将所述第三账号分配给所述第四账号所在的所述目标分组,并将所述第三账号从所述第一关系簇中删除,将所述种子账号与所述第三账号之间的所述亲密度删除,其中,所述第四账号为所述目标得分关联的账号中属于所述目标分组的账号,所述第三账号为所述目标得分关联的账号中的所述目标未分配账号;
在所述第三账号与所述第四账号所在的所述目标分组中的其中一个账号存在所述负向关系时,将所述目标得分删除;
返回从目标分组中包括的账号与目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分的步骤,直到所述第一关系簇中剩余的所述亲密度的数量为零。
11.根据权利要求10所述的账号分组方法,其特征在于,所述方法还包括:
当所述第一关系簇中剩余的所述亲密度的数量为零,且所述第一关系簇中仍剩余所述目标未分配账号时,为所述第一关系簇剩余的每一个所述目标未分配账号,分别建立新的分组。
12.一种账号分组装置,其特征在于,所述装置包括:
负向关系确定模块,被配置为确定多个账号中存在负向关系的账号,其中,存在所述负向关系的账号属于不同的自然人;
种子账号选择模块,被配置为从存在所述负向关系的账号中选出种子账号,并将一个所述种子账号分配给一个分组,得到多个分组,其中,任意两个所述种子账号之间存在所述负向关系;
分组模块,被配置为将未分配账号分配给与所述未分配账号不存在所述负向关系的分组;
其中,所述未分配账号包括所述账号中除所述种子账号之外的账号,未分配账号与分组不存在负向关系是指未分配账号与分组中包括的账号均不存在负向关系。
13.根据权利要求12所述的账号分组装置,其特征在于,所述装置还包括:
亲密度确定模块,被配置为确定不存在所述负向关系的所述账号之间的亲密度,其中,所述亲密度表示两个所述账号属于同一自然人的概率;
所述分组模块包括:
分组子模块,被配置根据所述亲密度,将所述未分配账号分配给与所述未分配账号不存在所述负向关系的分组。
14.根据权利要求13所述的账号分组装置,其特征在于,所述负向关系确定模块包括:
正向关系确定子模块,被配置为确定所述多个账号中存在正向关系的账号,其中,所述正向关系表示属于同一自然人;
正向关系图建立子模块,被配置为将存在所述正向关系的所述账号作为顶点,并将存在所述正向关系的顶点连接,构建正向关系图;
关系簇获取子模块,被配置为获取所述正向关系图的最大连通子图,并将一个最大连通子图中包括的所述账号组成一个关系簇,得到至少一个关系簇;
负向关系确定子模块,被配置为确定每一个所述关系簇内部的所述账号中存在所述负向关系的账号。
15.根据权利要求14所述的账号分组装置,其特征在于,所述亲密度确定模块具体被配置为:
针对每一个所述关系簇执行如下过程:
计算第一关系簇中的所述账号之间的亲密度,作为所述第一关系簇的亲密度;
其中,所述第一关系簇为所述至少一个关系簇中的其中一个。
16.根据权利要求15所述的账号分组装置,其特征在于,所述亲密度确定模块在计算第一关系簇中的所述账号之间的亲密度时,具体被配置为:
计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度;
其中,符合所述预设条件的两个所述账号在目标图中通过小于第一预设数量的连接边连接,所述目标图为由所述第一关系簇中的所述账号形成的最大连通子图。
17.根据权利要求16所述的账号分组装置,其特征在于,所述亲密度确定模块在计算所述第一关系簇中每两个符合预设条件的所述账号之间的亲密度时,具体被配置为:
计算所述目标图中每一条连接边所连接的两个顶点表示的所述账号之间的亲密度,作为所述目标图中每一条连接边的第一参数;
在第一顶点与第二顶点之间存在至少两条第一路径时,计算每一条所述第一路径包括的多条连接边的所述第一参数的乘积,作为每一条所述第一路径的第二参数,并选择最大的所述第二参数作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
在所述第一顶点与所述第二顶点之间存在一条第二路径时,计算所述第二路径包括的多条连接边的所述第一参数的乘积,作为所述第一顶点和所述第二顶点表示的所述账号之间的亲密度;
其中,所述第一顶点和所述第二顶点为所述目标图中符合所述预设条件的所述账号在所述目标图中的两个顶点。
18.根据权利要求17所述的账号分组装置,其特征在于,所述亲密度确定模块在计算所述目标图中的一条连接边所连接的两个顶点所表示的所述账号之间的亲密度时,具体被配置为:
获取第一账号与第二账号的至少一个共用对象,其中,所述共用对象包括共用设备和共用通讯号码中的至少一者;
在i取1~N中的每一个整数时,执行如下过程:
获取在预设时间段内所述第一账号在第i个所述共用对象上的登陆次数,与在所述预设时间段内所述第一账号的总登陆次数的比值,作为第一登录比例;
获取在所述预设时间段内所述第二账号在第i个所述共用对象上的登陆次数、与在所述预设时间段内所述第二账号的总登陆次数的比值,作为第二登录比例;
计算所述第一登录比例与所述第二登录比例的乘积,作为第i个所述共用对象的第三参数;
从第1~N个所述共用对象的所述第三参数中,选出最大的所述第三参数,作为所述第一账号与所述第二账号之间的亲密度;
其中,N为所述共用对象的数量,所述第一账号和所述第二账号为所述目标图中的其中一条连接边所连接的两个顶点表示的所述账号。
19.根据权利要求15至18中任一项所述的账号分组装置,其特征在于,所述种子账号选择模块具体被配置为:
针对每一个所述关系簇执行如下过程:
将所述第一关系簇中存在所述负向关系的所述账号作为顶点,并将存在所述负向关系的顶点连接,构建负向关系图;
确定所述负向关系图的最大完全图,并将其中一个所述最大完全图中的所述账号确定为所述第一关系簇中的所述种子账号。
20.根据权利要求19所述的账号分组装置,其特征在于,所述分组子模块具体被配置为:
针对每一个所述关系簇执行如下过程:
根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组;
其中,所述目标分组为所述第一关系簇的所述种子账号所在的分组,所述目标未分配账号为所述第一关系簇中除所述种子账号之外的账号。
21.根据权利要求20所述的账号分组装置,其特征在于,所述分组子模块在根据目标分组包括的账号与目标未分配账号之间的所述亲密度,将所述目标未分配账号分配给与所述目标未分配账号不存在所述负向关系的所述目标分组时,具体被配置为:
从所述目标分组包括的账号与所述目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分;
在第三账号与第四账号所在的所述目标分组不存在所述负向关系时,将所述第三账号分配给所述第四账号所在的所述目标分组,并将所述第三账号从所述第一关系簇中删除,将所述种子账号与所述第三账号之间的所述亲密度删除,其中,所述第四账号为所述目标得分关联的账号中属于所述目标分组的账号,所述第三账号为所述目标得分关联的账号中的所述目标未分配账号;
在所述第三账号与所述第四账号所在的所述目标分组中的其中一个账号存在所述负向关系时,将所述目标得分删除;
返回从目标分组中包括的账号与目标未分配账号之间的所述亲密度中,获得最大的亲密度,作为目标得分的步骤,直到所述第一关系簇中剩余的所述亲密度的数量为零。
22.根据权利要求21所述的账号分组装置,其特征在于,所述分组子模块还被配置为:
当所述第一关系簇中剩余的所述亲密度的数量为零,且所述第一关系簇中仍剩余所述目标未分配账号时,为所述第一关系簇剩余的每一个所述目标未分配账号,分别建立新的分组。
23.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至11中任一项所述的账号分组方法。
24.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够实现如权利要求1至11中任一项所述的账号分组方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110632956.3A CN113254726B (zh) | 2021-06-07 | 2021-06-07 | 账号分组方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110632956.3A CN113254726B (zh) | 2021-06-07 | 2021-06-07 | 账号分组方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254726A CN113254726A (zh) | 2021-08-13 |
CN113254726B true CN113254726B (zh) | 2021-09-10 |
Family
ID=77186906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110632956.3A Active CN113254726B (zh) | 2021-06-07 | 2021-06-07 | 账号分组方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254726B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111309787B (zh) * | 2020-03-02 | 2021-10-19 | 广州大学 | 一种基于Apriori算法挖掘二维数据间关联规则的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930501A (zh) * | 2016-05-09 | 2016-09-07 | 深圳市永兴元科技有限公司 | 网络账号关联方法和装置 |
CN110222790A (zh) * | 2019-06-17 | 2019-09-10 | 南京中孚信息技术有限公司 | 用户身份识别方法、装置及服务器 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10078870B2 (en) * | 2012-01-13 | 2018-09-18 | Retirement Clearinghouse, Llc | System and method for automated consolidation of individual retirement accounts |
-
2021
- 2021-06-07 CN CN202110632956.3A patent/CN113254726B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930501A (zh) * | 2016-05-09 | 2016-09-07 | 深圳市永兴元科技有限公司 | 网络账号关联方法和装置 |
CN110222790A (zh) * | 2019-06-17 | 2019-09-10 | 南京中孚信息技术有限公司 | 用户身份识别方法、装置及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN113254726A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106651955B (zh) | 图片中目标物的定位方法及装置 | |
US20170193399A1 (en) | Method and device for conducting classification model training | |
CN111431727B (zh) | 一种群组展示方法、装置、终端、服务器及系统 | |
CN108875993B (zh) | 邀请行为预测方法及装置 | |
CN106713734B (zh) | 自动对焦方法及装置 | |
US20170118298A1 (en) | Method, device, and computer-readable medium for pushing information | |
CN109543566B (zh) | 信息处理方法及装置、电子设备和存储介质 | |
CN109241441B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN105814587A (zh) | 本地实时面部识别 | |
CN109522937B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113254726B (zh) | 账号分组方法、装置、电子设备及存储介质 | |
CN106533907B (zh) | 信息发送方法及装置 | |
US20160112498A1 (en) | Methods and devices for acquiring user information | |
CN107480773B (zh) | 训练卷积神经网络模型的方法、装置及存储介质 | |
CN112153568B (zh) | 基于业务场景的Wi-Fi识别、绑定方法、装置及设备 | |
CN105488074B (zh) | 照片聚类的方法及装置 | |
CN113128437A (zh) | 身份识别方法及装置、电子设备和存储介质 | |
CN110913276B (zh) | 数据处理的方法、装置、服务器、终端及存储介质 | |
CN111651627A (zh) | 数据处理方法及装置、电子设备和存储介质 | |
CN111797746A (zh) | 人脸识别方法、装置及计算机可读存储介质 | |
CN116127353A (zh) | 分类方法、分类模型训练方法、设备及介质 | |
WO2023082569A1 (zh) | 视频信息提取方法及装置 | |
CN105653623B (zh) | 图片收集方法及装置 | |
CN110659726B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN110046035B (zh) | 系统切换方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |