CN111666501A - 异常社团识别方法、装置、计算机设备和存储介质 - Google Patents
异常社团识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111666501A CN111666501A CN202010613527.7A CN202010613527A CN111666501A CN 111666501 A CN111666501 A CN 111666501A CN 202010613527 A CN202010613527 A CN 202010613527A CN 111666501 A CN111666501 A CN 111666501A
- Authority
- CN
- China
- Prior art keywords
- community
- interactive user
- undetermined
- main body
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 253
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 230000002452 interceptive effect Effects 0.000 claims abstract description 319
- 230000003993 interaction Effects 0.000 claims description 63
- 238000001914 filtration Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 23
- 230000006399 behavior Effects 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013138 pruning Methods 0.000 description 4
- 208000001613 Gambling Diseases 0.000 description 3
- 208000003443 Unconsciousness Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及一种异常社团识别方法、装置、计算机设备和存储介质。所述方法包括:获取各个主体标识对应的属性信息和交互用户信息;基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;对异构信息网络进行社团划分,得到各个待定性社团;提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。采用本方法能够提高了对黑产团伙的识别效率,并且节省网络资源。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及一种异常社团识别方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,出现了网络黑产。网络黑产是指以互联网为媒介,以网络技术为主要手段,为计算机信息系统安全和网络空间管理秩序,甚至国家安全、社会政治稳定带来潜在威胁(重大安全隐患)的非法行为。比如,赌博、色情、微盘、套现、传销和返利等网络非法行为。目前在识别从事网络黑产的主体运营者和参与用户时,通常是对主体运营者或者参与用户一一进行识别。然而,由于网络黑产逐渐向团伙模式进行转移,导致对主体运营者或者一一进行识别的效率低下,并且当需要识别网络黑产主体运营者团伙时,需要花费大量的网络资源。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高识别效率和节省网络资源的异常社团识别方法、装置、计算机设备和存储介质。
一种异常社团识别方法,所述方法包括:
获取各个主体标识对应的属性信息和交互用户信息;
基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;
对异构信息网络进行社团划分,得到各个待定性社团;
提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。
在其中一个实施例中,在当相似程度符合预设阈值时,将对应的待定性社团作为异常社团之后,还包括:
获取历史异常社团对应的历史异常社团标识,并生成异常社团对应的异常社团标识;
根据历史异常社团标识和异常社团标识生成异常社团标识序列。
在其中一个实施例中,提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团,包括:
获取各个待定性社团中节点的标签数据,根据节点的标签数据中的标签确定各个待定性社团中的异常社团。
一种异常社团识别装置,所述装置包括:
获取模块,用于获取各个主体标识对应的属性信息和交互用户信息;
网络建立模块,用于基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;
划分模块,用于对异构信息网络进行社团划分,得到各个待定性社团;
异常确定模块,用于提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。
在一个实施例中,网络建立模块,包括:
核心关联得到单元,用于根据交互用户信息确定各个主体标识之间的共同交互用户标识数,将共同交互用户标识数作为各个主体标识之间的核心关联信息;
辅助关联得到单元,用于根据各个主体标识对应的属性信息确定相同主体属性,将相同主体属性作为各个主体标识之间的辅助关联信息;
第一关系得到单元,用于根据核心关联信息和辅助关联信息确定各个主体标识之间的第一关联关系;
第一网络建立单元,用于根据各个主体标识和各个主体标识之间的第一关联关系建立第一异构信息网络。
在一个实施例中,核心关联得到单元还用于根据交互用户信息确定各个主体标识对应的交互用户标识总数;计算共同交互用户标识数与交互用户标识总数的比值;当比值符合预设阈值条件时,将比值和相同交互用户标识数作为各个主体标识之间的第一核心关联信息。
在一个实施例中,核心关联得到单元还用于获取交互用户信息中的交互数据,当交互数据满足预设过滤条件时,获取对应的待过滤交互用户标识;获取各个主体标识之间的共同交互用户标识,将共同交互用户标识中的待过滤交互用户标识进行过滤,得到目标交互用户标识;统计目标交互用户标识数,将目标交互用户标识数作为各个主体标识之间的第二核心关联信息。
在一个实施例中,划分模块还用于初始化异构信息网络中节点对应的社团;计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团;计算更新后异构信息网络中节点的更新模块度,并计算初始模块度与更新模块度的差值;当差值符合预设差值条件时,得到异构信息网络对应的更新社团;根据异构信息网络对应的更新社团建立更新后的异构信息网络,并返回计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团的步骤执行,当更新后的异构信息网络符合预设划分完成条件时,得到各个待定性社团。
在一个实施例中,异常确定模块还用于提取各个待定性社团中主体节点对应的主体节点特征,根据主体节点特征确定主体节点对应的主体可信程度;根据主体节点的主体可信程度确定各个待定性社团的社团可信程度,当社团可信程度符合预设可信程度条件时,将社团可信程度未超过预设可信程度阈值的待定性社团作为异常社团。
在一个实施例中,异常确定模块还用于统计各个待定性社团中主体节点对应的边数和邻居数;根据各个待定性社团中主体节点对应的边数和邻居数计算各个待定性社团对应的社团稠密度,根据社团稠密度确定社团结构特征;根据社团结构特征确定各个待定性社团中的异常社团。
在一个实施例中,异常社团识别装置,还包括:
相似计算模块,用于获取历史异常社团,计算历史异常社团与各个待定性社团的相似程度;
异常社团得到模块,用于当相似程度符合预设阈值时,将对应的待定性社团作为异常社团。
在一个实施例中,异常社团识别装置,还包括:
标识序列生成模块,用于获取历史异常社团对应的历史异常社团标识,并生成异常社团对应的异常社团标识;根据历史异常社团标识和异常社团标识生成异常社团标识序列。
在一个实施例中,相似计算模块还用于从各个待定性社团中确定目标待定性社团,将历史异常社团中的历史主体标识与目标待定性社团中的目标主体标识进行匹配,得到匹配一致的主体标识。统计匹配一致的主体标识对应的主体标识数,根据匹配一致的主体标识对应的主体标识数确定历史异常社团与目标待定性社团的相似程度。
在一个实施例中,相似计算模块还用于获取历史异常社团中历史主体标识对应的各个历史交互用户标识;从各个待定性社团中确定目标待定性社团,获取目标待定性社团中目标主体标识对应的各个目标交互用户标识;基于各个历史交互用户标识和各个目标交互用户标识确定共同交互用户标识,统计共同交互用户标识对应的共同交互用户标识数;根据共同交互用户标识对应的共同交互用户标识数确定历史异常社团与目标待定性社团的相似程度。
在一个实施例中,网络建立模块,包括:
第二关系确定单元,用于获取交互用户信息中的交互数据,根据交互数据确定各个主体标识与交互用户信息中交互用户标识之间的第二关联关系;
第二网络建立单元,用于根据各个主体标识、交互用户信息中交互用户标识和第二关联关系建立第二异构信息网络。
在一个实施例中,划分模块还用于获取第二异构信息网络中节点对应的标签数据,标签数据包括标签和标签归属概率;根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据;当标签数据中的标签归属概率未符合预设概率条件时,删除对应的标签数据;返回根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据的步骤执行,当达到预设终止条件时,得到各个待定性社团。
在一个实施例中,异常确定模块还用于获取各个待定性社团中节点的标签数据,根据节点的标签数据中的标签确定各个待定性社团中的异常社团。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取各个主体标识对应的属性信息和交互用户信息;
基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;
对异构信息网络进行社团划分,得到各个待定性社团;
提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取各个主体标识对应的属性信息和交互用户信息;
基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;
对异构信息网络进行社团划分,得到各个待定性社团;
提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。
上述异常社团识别方法、装置、计算机设备和存储介质,通过获取各个主体标识对应的属性信息和交互用户信息,根据各个主体标识对应的属性信息和交互用户信息建立异构信息网络,然后对异构信息网络进行社团划分,并从划分后的社团中确定异常社团,从而能够对黑产团伙进行整体的识别,避免了一一识别效率低下和浪费网络资源的问题,提高了对黑产团伙的识别效率,并且节省了网络资源。
附图说明
图1为一个实施例中异常社团识别方法的应用环境图;
图2为一个实施例中异常社团识别方法的流程示意图;
图3为一个实施例中建立第一异构信息网络的流程示意图;
图4为一个具体实施例中建立的第一异构信息网络的部分示意图;
图5为一个实施例中得到第一核心关联信息的流程示意图;
图6为一个实施例中得到第二核心关联信息的流程示意图;
图7为一个实施例中得到各个待定性社团的流程示意图;
图8为一个实施例中得到异常社团的流程示意图;
图9为一个具体实施例中星型结构的异常社团示意图;
图10为一个具体实施例中环状结构的异常社团示意图;
图11为一个具体实施例中节点边数和邻居数服从幂律分布的示意图;
图12为另一个实施例中得到异常社团的流程示意图;
图13为一个实施例中确定相似程度的流程示意图;
图14为一个实施例中建立第二异构信息网络的流程示意图;
图15为一个具体实施例中建立的第二异构信息网络的部分示意图;
图16为另一个实施例中得到各个待定性社团的流程示意图;
图17为一个具体实施例中异常社团识别方法的流程示意图;
图18为图17具体实施例中异常社团标识序列对应的异常社团示意图;
图19为另一个具体实施例中异常社团识别方法的流程示意图;
图20为一个实施例中异常社团识别装置的结构框图;
图21为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的异常社团识别方法,可以应用于如图1所示的应用环境中。其中,管理终端102通过网络与服务器104进行通信。获取各个主体标识对应的属性信息和交互用户信息;基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;对异构信息网络进行社团划分,得到各个待定性社团;提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。其中,管理终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种异常社团识别方法,以该方法应用于图1中的服务器为例进行说明,可以理解的是,该方法也可以应用于终端中,包括以下步骤:
步骤202,获取各个主体标识对应的属性信息和交互用户信息。
其中,主体标识用于唯一标识主体,可以是名称、编号和字符串等等,主体是指进行运营活动的商家或者运营者,比如,公众号、运营网站、网络商家、小程序、微信应用群、QQ群等等。属性信息是指主体标识对应的主体的属性,包括注册时间、注册地域、运营时间、主体运营信息等等。交互用户信息是指用户与主体交互的信息,交互用户信息包括与主体进行交互的用户标识和具体的交互数据,交互用户标识用于唯一标识与主体进行交互的用户,可以是名称、编号和字符串等等,交互数据是指用户与主体之间具体的交互行为数据,在不同的场景下有不同的交互行为数据,比如,交互数据可以是用户关注公众号的关注数据、用户点击公众号的文章的点击数据、用户浏览运营网站的浏览信息、用户与网络商家的交易信息、用户使用小程序的数据等等。
具体地,服务器获取到各个主体标识对应的属性信息和交互用户信息,该主体标识是需要进行异常识别的,判断是否为黑产主体。其中,该各个主体标识对应的属性信息和交互用户信息是预先保存到服务器中的,也可以是实时获取到的。比如,服务器实时监控各个主体标识,获取到主体标识对应的属性信息和交互用户信息。
在一个实施例中,服务器可以获取到预先设置好的周期内的各个主体标识对应的属性信息和交互用户信息,比如,预先设置好的周期可以是每天或者一周等等。
在一个实施例中,服务器可以根据获取到各个主体标识对应的属性信息和交互用户信息对各个主体标识进行剪枝处理,得到剪枝后的各个主体标识,使用剪枝后的各个主体标识对应的属性信息和交互用户信息进行后续的处理。其中,可以根据各个主体标识对应的属性信息中的注册时间对主体标识进行删除,比如,删除注册时间在一年以上的主体标识,得到删除后的各个主体标识。还可以根据各个主体标识对应的交互用户信息中的交互用户标识数量对主体标识进行删除。比如,对交互用户标识数量在10万以上的主体标识进行删除,得到删除后的各个主体标识。还可以根据各个主体标识对应的交互用户信息中的交互数据对主体标识进行删除,比如,对交易信息在10万条以上的主体标识进行删除,得到删除后的各个主体标识。对获取到各个主体标识进行剪枝处理,能够提高后续的处理效率。
步骤204,基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系。
其中,异构信息网络是指对象的类型总数或者链接的类型总数大于一的信息网络。
具体地,服务器可以根据各个主体标识对应的属性信息和交互用户信息中的用户标识确定各个主体标识之间的第一关联关系,该第一关联关系是指主体标识与主体标识之间的关系,可以根据相同的属性信息和交互用户信息确定主体标识之间的关系,比如,同地域的主体标识,将该地域作为第一关联关系,具有相同交互用户信息,将相同交互用户信息作为第一关联关系。然后使用各个主体标识和第一关联关系生成第一异构信息网络,第一异构信息网络用于表征主体与主体之间的关联关系。
服务器也可以根据各个主体标识对应的属性信息和交互用户信息中的用户标识确定各个主体标识与交互用户信息中交互用户标识之间的第二关联关系,该第二关联关系是指主体标识与交互用户标识之间的关系,其中,一个主体标识可以与多个交互用户标识之间有第二关联关系。可以根据交互数据确定主体标识与交互用户标识之间的关系。比如,可以将用户浏览公众号的次数作为用户与公众号的关系,可以将用户关注公众号的行为作为用户与公众号的关系,可以将用户与网络商户的交易信息作为用户与网络商户的关系,可以将用户浏览运营网站的时间作为用户与运营网站的关系,可以将用户使用小程序的次数作为用户与小程序的关系等等。然后使用主体标识、交互用户信息中交互用户标识和对应的第二关联关系生成第二异构信息网络,第二异构信息网络用于表征主体与用户之间的关联关系。
在一个实施例中,服务器也可以根据第一关联关系和第二关联关系建立第三异构信息网络,该第三异构信息网络中的节点包括了各个主体标识和交互用户信息中的交互用户标识,该异构信息网络中的关联关系包括各个主体标识之间的第一关联关系和主体标识与交互用户标识之间的第二关联关系。第三异构信息网络用于表征主体与主体以及主体与用户之间的关联关系。
步骤206,对异构信息网络进行社团划分,得到各个待定性社团。
其中,社团划分是指使用社团发现算法对异构信息网络进行划分。社团发现算法包括非重叠社团发现算法和重叠社团发现算法,其中,非重叠社团发现算法包括但不限于模块度优化算法、基于谱分析的社团发现算法、基于标号传播的社团发现算法和基于信息论的社团发现算法等等,比如,Fast Unfolding(快速展开)算法和GN(Givern-Newman)算法、EO算法、CNM算法、COPRA(重叠社区发现算法)算法。待定性社团是指需要进行异常社团确定的社团。
具体地,服务器使用社团发现算法对异构信息网络进行社团划分,划分结束后就得到了各个待定性社团。在一个具体的实施例中,可以使用并行的Fast Unfolding算法对异构信息网络进行社团划分,得到各个待定性社团。
步骤208,提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。
其中,社团特征用于表征社团,包括社团结构特征和节点特征中的至少一种,社团结构特征是指待定性社团的网络结构特征,比如星型网络结构、环状网络结构和其他网络结构等等。节点特征包括主体节点特征和用户节点特征,主体节点特征用于表征主体的属性信息,比如,主体的地域、注册时间、运营时间等等,用户节点特征用户表征用户的属性信息,比如用户为黑产用户的标签。异常社团是指进行黑产行为的社团,该社团中的节点是指具有黑产行为的节点。
具体地,服务器提取到各个待定性社团对应的社团特征,可以并行提取,也可以一一进行提取。然后根据每个待定性社团对应的社团特征确定各个待定性社团中的异常社团。其中,可以根据社团结构特征确定各个待定性社团中的异常社团,比如,星型网络结构的待定性社团为异常社团。
具体地,服务器可以并行提取各个待定性社团对应的社团特征,其中,可以根据各个主体标识对应的属性信息和交互用户信息来提取到社团特征中的节点特征,可以根据各个待定性社团中节点与边的关系提取到社团特征中的社团结构特征,然后根据提取到的社团特征确定各个待定性社团中的异常社团。
上述异常社团识别方法中,通过获取各个主体标识对应的属性信息和交互用户信息,根据各个主体标识对应的属性信息和交互用户信息建立异构信息网络,然后对异构信息网络进行社团划分,并从划分后的社团中确定异常社团,从而能够对黑产团伙进行整体的识别,避免了一一识别效率低下和浪费网络资源的问题,提高了对黑产团伙的识别效率,并且节省了网络资源。
在一个实施例中,关联关系包括第一关联关系。如图3所示,步骤204,基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,包括:
步骤302,根据交互用户信息确定各个主体标识之间的共同交互用户标识数,将共同交互用户标识数作为各个主体标识之间的核心关联信息。
其中,共同交互用户标识是指主体标识对应的交互用户信息中相同的交互用户标识。共同交互用户标识数是指共同交互用户标识的总数量。比如,主体A有对应的交互用户标识(a1,a2,a3,a4,a5),主体B对应的交互用户标识有(b1,a2,b3,a4,a5),其中,共同交互用户标识就为(a2,a4,a5),则主体A与主体B的共同交互用户标识数为3。核心关联信息是指能够体现主体标识之间最主要关系的信息。
具体地,服务器根据各个主体标识对应的交互用户信息查找到对应的交互用户标识,匹配是否有相同的交互用户标识,当存在相同的交互用户标识时,将相同的交互用户标识作为主体标识之间的共同交互用户标识,统计出共同交互用户标识数,并将共同交互用户标识数作为各个主体标识之间的核心关联信息。比如,直接将共同交互用户标识数3作为主体A与主体B之间的核心关联信息。
在一个实施例中,可以直接将共同交互用户标识数作为各个主体标识之间的第一关联关系,然后根据各个主体标识和第一关联关系建立第一异构信息网络。
步骤304,根据各个主体标识对应的属性信息确定相同主体属性,将相同主体属性作为各个主体标识之间的辅助关联信息。
其中,相同主体属性是指各个主体标识对应的属性信息中相同的属性信息,比如,主体A中地域为“深圳”,主体B中地域为“深圳”,则“深圳”为主体A与主体B的相同主体属性。辅助关联信息是用于辅助体现主体标识之间关系的信息。
具体地,服务器匹配各个主体标识对应的属性信息,当存在一致的属性信息时,将一致的属性信息作为相同主体属性,即得到的了各个主体标识之间的辅助关联信息。比如,讲“深圳”作为主体A与主体B之间的辅助关联信息。
步骤306,根据核心关联信息和辅助关联信息确定各个主体标识之间的第一关联关系。
步骤308,根据各个主体标识和各个主体标识之间的第一关联关系建立第一异构信息网络。
具体地,服务器根据核心关联信息和辅助关联信息确定各个主体标识之间的第一关联关系,其中,各个主体标识之间的第一关联关系可以核心关联信息,也可以是辅助关联信息,还可以是核心关联信息和辅助关联信息。然后,服务器根据各个主体标识和各个主体标识之间的第一关联关系建立各个三元组,然后根据各个三元组生成第一异构信息网络。其中,三元组是指(实体,关系,实体)的组合,比如,生成的三元组可以是(第一主体标识,第一关联关系,第二主体标识),该第一主体标识和第二主体标识是指不同的主体标识。
在一个具体的实施例中,如图4所示,建立的第一异构信息网络的部分示意图,其中,每个节点是不同的主体标识,主体节点包括(A,B,C,D,E,F,G,H,…),每条边上有主体标识之间的第一关联关系包括(a,b,c,d,e,f,g,h,…)。
在上述实施例中,通过核心关联信息和辅助关联信息确定第一关联关系,然后建立第一异构信息网络,能够得到准确的各个主体标识对应的第一异构信息网络,方便后续的使用。
在一个实施例中,如图5所示,步骤302,根据交互用户信息确定各个主体标识之间的共同交互用户标识数,将共同交互用户标识数作为各个主体标识之间的核心关联信息,包括:
步骤502,根据交互用户信息确定各个主体标识对应的交互用户标识总数。
其中,交互用户标识总数是指主体标识对应的交互用户信息中交互用户标识的总数量。
具体地,服务器根据每个主体标识对应的交互用户信息统计交互用户标识的数量,得到每个主体标识对应的交互用户标识总数。
步骤504,计算共同交互用户标识数与交互用户标识总数的比值。
步骤506,当比值符合预设阈值条件时,将比值和相同交互用户标识数作为各个主体标识之间的第一核心关联信息。
其中,预设阈值条件是指预先设置好的比值条件,可以是预先设置的比值区间。第一核心关联信息是指包括有比值和相同交互用户标识数的关联信息。
具体地,服务器计算每个主体标识对应的共同交互用户标识数与交互用户标识总数的比值,得到每个主体标识对应的比值,将每个主体标识对应的比值与预设阈值条件进行比较,当比值符合预设阈值条件时,将比值和相同交互用户标识数作为各个主体标识之间的第一核心关联信息,将比值不符合预设条件时,将相同交互用户标识数作为各个主体标识之间的核心关联信息。
在上述实施例中,通过计算共同交互用户标识数与交互用户标识总数的比值,当比值符合预设阈值条件时,将比值和相同交互用户标识数作为各个主体标识之间的第一核心关联信息,提高了得到的第一核心关联信息的精准性,进一步使得建立的异构信息网络更加的精准。
在一个实施例中,如图6所示,步骤302,根据交互用户信息确定各个主体标识之间的共同交互用户标识数,将共同交互用户标识数作为各个主体标识之间的核心关联信息,包括:
步骤602,获取交互用户信息中的交互数据,当交互数据满足预设过滤条件时,获取对应的待过滤交互用户标识。
其中,预设过滤条件是指预先设置好的过滤共同交互用户标识的条件,比如,交互数据中交互时间少于预设时长或者交互次数少于预设次数或者交易金额少于预设金额等等。待过滤交互用户标识是指需要判断是否进行过滤的交互用户标识。
具体地,服务器获取到交互用户信息中主体标识与交互用户标识之间的交互数据,当交互数据未满足预设过滤条件,其对应的交互用户标识不做处理。当交互数据满足预设过滤条件时,将对应的交互用户标识作为待过滤交互用户标识。比如,获取到主体A与对应的交互用户信息中交互用户M和交互用户O之间的交互数据,该交互数据包括交互用户M和交互用户O的交互时长。预设过滤条件可以是交互时长少于预设时长。当交互用户M的交互时长超过预设时长时,不做处理,当交互用户O的交互时长未超过预设时长时,将交互用户O作为待过滤交互用户O。
步骤604,获取各个主体标识之间的共同交互用户标识,将共同交互用户标识中的待过滤交互用户标识进行过滤,得到目标交互用户标识。
其中,目标交互用户标识是指过滤共同交互用户标识中满足预设过滤条件的交互用户标识后得到的交互用户标识。
具体地,服务器获取到各个主体标识之间的共同交互用户标识,在共同交互用户标识中匹配待过滤交互用户标识,当匹配到一致的待过滤交互用户标识时,将待过滤交互用户标识从对应的共同交互用户标识中过滤,即做删除处理。比如,主体A与主体B之间的各个共同交互用户标识中有共同交互用户O,此时使用待过滤交互用户O匹配到共同交互用户O,此时,就从主体A与主体B之间的各个共同交互用户标识中删除共同交互用户O,就得到主体A与主体B之间的目标交互用户标识。
步骤606,统计目标交互用户标识数,将目标交互用户标识数作为各个主体标识之间的第二核心关联信息。
其中,第二核心关联信息是指根据目标交互用户标识的数量得到的关联信息。
具体地,服务器统计目标交互用户标识的数量,得到目标交互用户标识数,将目标交互用户标识数作为各个主体标识之间的第二核心关联信息。
在上述实施例中,通过将交互数据中满足预设过滤条件的共同交互用户标识进行过滤,得到目标交互用户标识,进而根据目标交互用户标识得到第二核心关联信息,使得到的第二核心关联信息更加的准确,提升了建立的异构信息网络的准确性,从而提升了识别异常社团的准确性。
在一个实施例中,如图7所示,步骤206,对异构信息网络进行社团划分,得到各个待定性社团,包括:
步骤702,初始化异构信息网络中节点对应的社团。
具体地,服务器将异构信息网络中的每个节点都划分到不同的社团中进行初始化。
步骤704,计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团。
其中,模块度用于评估异构信息网络的划分。初始模块度是指异构信息网络中节点进行社团划分前的模块度。
具体地,服务器计算初始化后异构信息网络中每个节点对应的社团的初始模块度,然后根据异构信息网络中每个节点对应的邻居社团更新异构信息网络中节点对应的社团,即服务器将构信息网络中每个节点划分到邻居节点所在的社团中,得到更新后的异构信息网络。在一个具体的实施例中,服务器可以使用如下公式(1)计算模块度。
其中,m表示网络中所有边的权重,Ai,j表示节点i和节点j之间的权重,ki表示节点i所相连的边的权值和,kj表示节点j所相连的边的权值和,ci表示节点i被分到的社团,cj表示节点j被分到的社团,δ(ci,cj)表示当节点i和节点j在同一个社团内时,返回1否则,返回0。
在一个实施例中,服务器可以根据所有节点同时根据节点对应的邻居社团更新异构信息网络中节点对应的社团,从而避免同一时间只能使用一个节点对应的邻居社团更新异构信息网络中节点对应的社团,提高划分效率。
步骤706,计算更新后异构信息网络中节点的更新模块度,并计算初始模块度与更新模块度的差值。
步骤708,当差值符合预设差值条件时,得到异构信息网络对应的更新社团。
具体地,服务器计算划分前和划分后节点模块度的变化值,即计算更新后异构信息网络中节点的更新模块度,并计算初始模块度与更新模块度的差值。服务器继续进行迭代划分,直到差值符合预设差值条件时,得到异构信息网络对应的更新社团。
步骤710,根据异构信息网络对应的更新社团建立更新后的异构信息网络。
具体地,服务器将异构信息网络对应的更新社团中的每个社团作为节点建立更新后的异构信息网络,即将异构信息网络对应的更新社团作为更新后的异构信息网络中的节点。
步骤712,判断更新后的异构信息网络是否符合预设划分完成条件,当符合预设划分完成条件时,执行步骤714。当未符合预设划分完成条件,返回步骤704执行。
步骤714,得到各个待定性社团。
其中,预设划分完成条件是指预先设置的完成社团划分的条件,比如,可以是划分后的社区结构不再发生变化。
具体地,服务器判断更新后的异构信息网络是否符合预设划分完成条件,当未符合预设划分完成条件时,继续迭代执行,即返回步骤704继续进行执行,当符合预设划分完成条件时,得到各个待定性社团。
在上述实施例中,使用模块度对异构信息网络进行划分,得到各个待定性社团,能够使得到的划分结果更加的准确。
在一个实施例中,社团特征包括主体节点特征,步骤208,提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团,包括:
提取各个待定性社团中主体节点对应的主体节点特征,根据主体节点特征确定主体节点对应的主体可信程度。根据主体节点的主体可信程度确定各个待定性社团的社团可信程度,当社团可信程度符合预设可信程度条件时,将社团可信程度未超过预设可信程度阈值的待定性社团作为异常社团。
其中,主体节点是指主体标识对应的待定性社团中的网络节点。主体可信程度是指对应的主体标识未存在异常行为的信任程度。社团可信程度用于表示对待定性社团非异常的信任程度。预设可信程度条件是指预先设置好的判断待定性社团是否为异常社团的条件,比如,可信程度小于阈值时,待定性社团为异常社团。
具体地,服务器提取各个待定性社团中主体节点对应的主体节点特征,其中,可以根据主体标识对应的属性信息中注册时间和注册地域提取到注册特征,根据主体运营信息提取到主体行为特征等等。根据主体节点特征确定主体节点对应的主体可信程度,比如,根据注册特征得到注册评分,其中,注册地域为网络黑产行为高发地时注册评分降低。比如,根据主体行为特征确定对应的异常等级,其中,根据主体运营信息与网络黑产行为的相关性确定对应的异常等级,与黑产行业越相关,异常等级越高。最后可以根据注册评分和异常等级确定主体节点对应的主体可信程度。
服务器计算出待定性社团中每个主体节点的主体可信程度,计算所有主体节点对应主体可信程度的平均值,得到社团可信程度,并计算出每个待定性社团的社团可信程度。判断每个待定性社团的社团可信程度是否符合预设可信程度条件,当社团可信程度符合预设可信程度条件时,将社团可信程度未超过预设可信程度阈值的待定性社团作为异常社团。
在上述实施例中,通过主体节点特征计算待定性社团的可信程度,根据待定性社团的可信程度来确定异常社团,提高了得到异常社团的准确性。
在一个实施例中,社团特征包括社团结构特征。如图8所示,步骤208,提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团,包括:
步骤802,统计各个待定性社团中主体节点对应的边数和邻居数。
步骤804,根据各个待定性社团中主体节点对应的边数和邻居数计算各个待定性社团对应的社团稠密度,根据社团稠密度确定社团结构特征。
其中,社团稠密度用于衡量社团结构,可以通过度中心性或者中介中心性,或者接近中心性来计算社团稠密度。比如,使用度中心性进行度量时,可以使用公式(2)进行计算:
2*E/(N*(N-1)) 公式(2)
其中,E为边数,N为邻居数,
具体地,服务器统计各个待定性社团中每个主体节点对应的边数和邻居数,根据各个待定性社团中主体节点对应的边数和邻居数计算各个待定性社团对应的社团稠密度,根据各个待定性社团对应社团稠密度确定各个待定性社团对应的社团结构特征。
步骤806,根据社团结构特征确定各个待定性社团中的异常社团。
具体地,服务器根据社团结构特征确定各个待定性社团中的异常社团,比如,当社团结构特征为星型结构时,将对应的待定性社团作为异常社团,如图9所示,为一个具体实施例中的星型结构的异常社团示意图。当社团结构特征为环状结构时,将对应的待定性社团作为异常社团,如图10所示,为一个具体实施例中的环状结构的异常社团示意图。
在一个具体的实施例中,当得到各个待定性社团中主体节点对应的边数和邻居数时,当各个待定性社团中主体节点对应的边数和邻居数符合幂律分布时,可以使用公式(3)进行计算出幂律系数:
其中,Ei是指主体节点i的边数,Ni是指主体节点i的邻居数。α为幂律系数。服务器根据主体节点对应的边数和邻居数计算出幂律系数,当幂律系数符合预设条件时,该预设条件是指预先设置好的幂律系数阈值,当小于预先设置好的幂律系数阈值,将对应的待定性社团作为异常社团。如图11所示,为节点i对应的边数和邻居数符合幂律分布的示意图。其中,当幂律系数越接近1(图中1102)时,主体节点社团结构特征越呈现星型,当幂律系数越接近2(图中1104)时,主体节点社团结构特征越呈现环状。
在上述实施例中,通过边数和邻居数计算各个待定性社团对应的社团稠密度,根据社团稠密度确定社团结构特征,然后根据社团结构特征确定异常社团,能够提高得到异常社团的准确性。
在一个实施例中,如图12所示,异常社团识别方法,还包括:
步骤1202,获取历史异常社团,计算历史异常社团与各个待定性社团的相似程度。
其中,历史异常社团是指历史已经确定为异常的社团,可以是根据人为经验确定的,也可以是预先配置好的。相似程度用于表征历史异常社团与各个待定性社团的相似程度,相似程度越高,对应的待定性社团为异常社团的可能性就越大。
具体地,服务器获取到历史异常社团,可以根据历史异常社团中各个节点对应的属性信息和交互用户信息计算与各个待定性社团的相似程度。其中,可以计算历史异常社团中节点对应的主体节点标识与待定性社团中主体节点标识的主体节点相似程度,根据主体节点相似程度得到历史异常社团与待定性社团的相似程度。可以计算历史异常社团中节点对应的交互用户信息与待定性社团中节点对应的交互用户信息的交互用户相似程度,根据交互用户相似程度得到历史异常社团与待定性社团的相似程度。
步骤1204,当相似程度符合预设阈值时,将对应的待定性社团作为异常社团。
具体地,服务器判断每个相似程度是否符合预设阈值。当不符合预设阈值时,将对应的待定性社团作为异常社团。当符合预设阈值时,则对应的待定性社团作为正常社团。该正常社团是指未存在网络黑产行为的社团。
在上述实施例中,通过计算历史异常社团与各个待定性社团的相似程度。从而确定异常社团,能够提高得到异常社团的准确度。
在一个实施例中,服务器将根据相似程度确定的异常社团和根据社团特征确定异常社团进行匹配,将匹配一致的异常社团作为最终确认的异常社团。
在一个实施例中,在步骤1204之后,在当相似程度符合预设阈值时,将对应的待定性社团作为异常社团之后,还包括:
获取历史异常社团对应的历史异常社团标识,并生成异常社团对应的异常社团标识。根据历史异常社团标识和异常社团标识生成异常社团标识序列。
其中,历史异常社团标识用于唯一标识历史异常社团。异常社团标识用于唯一标识异常社团。异常社团标识序列是指历史异常社团标识和异常社团标识生成的标识序列,
具体地,服务器获取历史异常社团对应的历史异常社团标识,并生成异常社团对应的异常社团标识,将历史异常社团标识和异常社团标识进行拼接得到异常社团标识序列,比如,历史异常社团标识1,异常社团标识为2,则异常社团标识序列(1,2)。
在一个实施例中,可以获取到连续时间周期内得到的各个异常社团标识,将各个异常社团标识进行拼接得到异常社团标识序列。比如,获取到连续4个时间周期内得到的异常社团标识3,异常社团标识4,异常社团标识5和异常社团标识6,得到的异常社团标识序列为(3,4,5,6)。然后服务器可以提取其中的相同节点,即获取到在连续时间周期内的共同交互用户标识和共同主体标识,就得到的该黑产团伙的整体变动情况。
在该实施例中,通过生成异常社团标识序列,可以更方便的查看一段时间内的异常社团,方便对黑产团伙进行持续的打击,比如,对异常社团中的节点对应的主体的进行限制,比如主体是公众号时,可以限制公众号发表文章的数量,可以限制公众号推送文章的用户数量等等。公众号是指在公众平台上的应用账号,公众号运营者通过公知号可实现与特定群体的文字、图片、语音和视频等全方位的沟通和互动。
在一个实施例中,步骤1202,计算历史异常社团与各个待定性社团的相似程度,包括:
从各个待定性社团中确定目标待定性社团,将历史异常社团中的历史主体标识与目标待定性社团中的目标主体标识进行匹配,得到匹配一致的主体标识;统计匹配一致的主体标识对应的主体标识数,根据匹配一致的主体标识对应的主体标识数确定历史异常社团与目标待定性社团的相似程度。
其中,目标待定性社团是指当前需要进行异常判断的社团。历史主体标识用于唯一标识历史异常社团中的主体节点。
具体地,服务器将历史异常社团中的历史主体标识与目标待定性社团中的目标主体标识进行匹配,得到匹配一致的主体标识,即相同的主体标识,统计匹配一致的主体标识对应的主体标识数,可以直接将主体标识数作为历史异常社团与目标待定性社团的相似程度。在一个实施例中,服务器获取到历史异常社团中主体标识的总数量。计算匹配一致的主体标识对应的主体标识数与历史异常社团中主体标识总数量的比值,当该比值超过预先设置好的阈值时,将主体标识数作为历史异常社团与目标待定性社团的相似程度。通过将相同的主体标识的数量作为历史异常社团与目标待定性社团的相似程度,能够提高得到相似程度的效率。
在一个实施例中,如图13所示,步骤1202,计算历史异常社团与各个待定性社团的相似程度,包括:
步骤1302,获取历史异常社团中历史主体标识对应的各个历史交互用户标识。
步骤1304,从各个待定性社团中确定目标待定性社团,获取目标待定性社团中目标主体标识对应的各个目标交互用户标识。
其中,历史交互用户标识用于唯一标识历史交互用户。目标待定性社团是指当前需要进行异常定性的社团。目标主体标识是指目标待定性社团中主体节点对应的主体标识。目标交互用户标识用于唯一标识目标交互用户,目标交互用户是指目标主体标识对应的交互用户信息中的交互用户。
具体地,服务器根据历史异常社团中每个历史主体标识获取到对应的各个历史交互用户标识。然后获取到目标待定性社团中每个目标主体标识对应的各个目标交互用户标识。
步骤1306,基于各个历史交互用户标识和各个目标交互用户标识确定共同交互用户标识,统计共同交互用户标识对应的共同交互用户标识数。
步骤1308,根据共同交互用户标识对应的共同交互用户标识数确定历史异常社团与目标待定性社团的相似程度。
具体地,服务器将各个历史交互用户标识与各个目标交互用户标识进行匹配,确定相同的交互用户标识,即共同交互用户标识,统计得到共同交互用户标识数,将共同交互用户标识数作为历史异常社团与目标待定性社团的相似程度,提高了得到相似程度的准确性。
在一个实施例中,关联关系包括第二关联关系。如图14所示,步骤204,基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,包括:
步骤1402,获取交互用户信息中的交互数据,根据交互数据确定各个主体标识与交互用户信息中交互用户标识之间的第二关联关系。
具体地,服务器获取到各个主体标识交互用户信息中的交互数据,根据交互数据确定各个主体标识与交互用户信息中交互用户标识之间的第二关联关系,比如,主体标识是公众号时,交互数据可以时是用户关注公众号的行为数据,用户浏览公众号发布信息的行为数据等等,将关注的行为数据或者浏览的行为数据作为用户与公众号之间的第二关联关系,例如将浏览次数或者关注时长作为用户与公众号之间的第二关联关系。比如,主体标识是网络商家时,交互数据可以是用户与网络商家之间进行交易的行为数据,将交易行为数据作为用户与网络商家之间的第二关联关系,例如将交易金额作为用户与网络商家之间的第二关联关系。
步骤1404,根据各个主体标识、交互用户信息中交互用户标识和第二关联关系建立第二异构信息网络。
具体地,服务器根据各个主体标识、交互用户信息中交互用户标识和第二关联关系生成各个三元组,该三元组是指(主体标识,第二关联关系,交互用户标识)。根据生成的各个三元组建立第二异构信息网络。
在一个具体的实施例中,如图15所示,为第二异构信息网络的部分示意图,其中,第二异构信息网络节点中包括了用户节点和主体节点,用户节点是指交互用户标识对应的网络节点。具体地,用户节点包括用户A,用户C、用户B,以及用户H等等。主体节点包括主体A,主体B和主体C等等。主体第二关联关系包括主体A与用户B之间的关系5,主体A与用户A之间的关系4,主体B与用户D之间的关系6,主体A与用户H之间的关系3,主体C与用户D之间的关系2以及主体C与用户C之间的关系1等。
在一个实施例中,如图16所示,步骤206,对异构信息网络进行社团划分,得到各个待定性社团,包括:
步骤1602,获取第二异构信息网络中节点对应的标签数据,标签数据包括标签和标签归属概率。
其中,标签是指预先设置好的用于表示第二异构信息网络中节点是否异常,包括异常标签和正常标签,异常标签是指具有网络黑产行为的标签,包括赌博,色情,微盘,套现,传销,返利等标签。正常标签是指未存在网络黑产行为的标签。标签归属概率是指该节点属于标签对应社团的概率。
具体地,服务器获取到第二异构信息网络中每个节点对应的标签数据,其中,主体节点的标签数据有且仅有一个。用户节点的标签数据可以有多组,也可以只有一组。标签数据是指(标签,标签归属概率)组成的集合,用户节点的标签数据可以是[(标签1,标签归属概率2),(标签2,标签归属概率2),(标签3,标签归属概率3)]组成的集合。服务器初始化第二异构信息网络中的每个节点,即将每个节点都划分为一个社区,同时初始的标签归属概率设置为1。
步骤1604,根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据。
具体地,服务器根据第二异构信息网络中每个节点的邻居节点对应的标签数据去更新第二异构信息网络中每个节点的标签数据,即针对每个节点,更新后的标签数据中的标签是邻居节点前一次迭代时保留的标签并集,同时使用公式(4)计算更新后的标签数据中每个标签的标签归属概率:
步骤1606,当标签数据中的标签归属概率未符合预设概率条件时,删除对应的标签数据。
具体地,预设概率条件是指预先设置好的归属概率阈值,该归属概率阈值可以时该节点可以归属的最大社团数的倒数。服务器判断标签数据中的标签归属概率是否符合预设概率条件,当符合预设概率条件,即小于归属概率阈值时,删除对应的标签数据,当未符合预设概率条件时,即超过归属概率阈值时保留对应的标签数据。其中,当所有标签对用的标签归属概率都小于归属概率阈值是,保留最大标签归属概率对应的标签数据。当有多组标签数据中的标签归属概率相同时,随机保存一组标签数据。
步骤1608,判断是否达到预设终止条件。当未达到预设终止条件时,返回步骤1604继续执行,当达到预设终止条件时,执行步骤1610。
步骤1610,得到各个待定性社团。
具体地,预设终止条件是指预先设置好的划分完成的条件,包括达到最大迭代次数或者两次迭代后节点的社团不再变化。服务器判断未达到预设终止条件时,返回步骤1610继续迭代执行。服务器判断达到预设终止条件时,将具有相同标签的节点作为同一个社团,并将标签归属概率归一化后得到各个待定性社团。该各个待定性社团中的主体节点存在一组标签数据,用户节点可以存在多组标签数据。
在一个实施例中,步骤208,提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团,包括:
获取各个待定性社团中节点的标签数据,根据节点的标签数据中的标签确定各个待定性社团中的异常社团。
具体地,服务器获取到各个待定性社团中节点的标签数据,将标签数据中相同异常标签的节点作为异常社团。比如,将标签数据中具有相同赌博标签的节点作为赌博黑产社团。
在一个具体地实施例中,如图17所示,异常社团识别方法,具体包括以下步骤:
步骤1702,获取各个主体标识对应的属性信息和交互用户信息。
步骤1704,根据交互用户信息确定各个主体标识之间的共同交互用户标识数。获取交互用户信息中的交互数据,当交互数据满足预设过滤条件时,获取对应的待过滤交互用户标识。获取各个主体标识之间的共同交互用户标识,将共同交互用户标识中的待过滤交互用户标识进行过滤,得到目标交互用户标识,统计目标交互用户标识数。
步骤1706,根据交互用户信息确定各个主体标识对应的交互用户标识总数。计算共同交互用户标识数与交互用户标识总数的比值。当比值符合预设阈值条件时,将比值和目标交互用户标识数作为各个主体标识之间的核心关联信息。
步骤1708,根据各个主体标识对应的属性信息确定相同主体属性,将相同主体属性作为各个主体标识之间的辅助关联信息。根据核心关联信息和辅助关联信息确定各个主体标识之间的第一关联关系。根据各个主体标识和各个主体标识之间的第一关联关系建立第一异构信息网络。
步骤1710,初始化第一异构信息网络中节点对应的社团,计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团。
步骤1712,计算更新后异构信息网络中节点的更新模块度,并计算初始模块度与更新模块度的差值。当差值符合预设差值条件时,得到异构信息网络对应的更新社团。
步骤1714,根据异构信息网络对应的更新社团建立更新后的异构信息网络,并返回计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团的步骤执行,当更新后的异构信息网络符合预设划分完成条件时,得到各个待定性社团。
步骤1716,提取各个待定性社团中主体节点对应的主体节点特征,根据主体节点特征确定主体节点对应的主体可信程度。根据主体节点的主体可信程度确定各个待定性社团的社团可信程度,当社团可信程度符合预设可信程度条件时,将社团可信程度未超过预设可信程度阈值的待定性社团作为异常社团。
步骤1718,统计各个待定性社团中主体节点对应的边数和邻居数。根据各个待定性社团中主体节点对应的边数和邻居数计算各个待定性社团对应的社团稠密度,根据社团稠密度确定社团结构特征。根据社团结构特征确定各个待定性社团中的异常社团。
步骤1720,获取历史异常社团,计算历史异常社团与各个待定性社团的相似程度。当相似程度符合预设阈值时,将对应的待定性社团作为异常社团。
其中,在确定异常社团之后,生成异常社团对应的异常社团标识,并获取到已经保存的历史连续时间段发现的异常社团标识序列,将该异常社团对应的异常社团标识拼接到异常社团标识序列中,得到更新后的异常社团标识序列。然后可以提取出更新后的异常社团标识序列对应的各个异常社团中共同交互用户标识和共同主体标识,然后将共同交互用户标识和共同主体标识与经保存的历史连续时间段发现的异常社团标识序列对应的各个异常社团中共同交互用户标识和共同主体标识进行比较,可以得到异常社团的整体变动情况,从而可以持续的对异常社团进行打击。例如,如图18所示,为更新后的异常社团标识序列对应的异常社团示意图,其中,包括周一到周五每天对应的异常社团,图中的每个点标识异常社团中节点。
在一个具体地实施例中,如图19所示,异常社团识别方法,具体包括以下步骤:
步骤1902,获取各个主体标识对应的属性信息和交互用户信息。
步骤1904,获取交互用户信息中的交互数据,根据交互数据确定各个主体标识与交互用户信息中交互用户标识之间的第二关联关系。
步骤1906,根据各个主体标识、交互用户信息中交互用户标识和第二关联关系建立第二异构信息网络。
步骤1908,获取第二异构信息网络中节点对应的标签数据,标签数据包括标签和标签归属概率。
步骤1910,根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据。
步骤1912,当标签数据中的标签归属概率未符合预设概率条件时,删除对应的标签数据;
步骤1914,返回根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据的步骤执行,当达到预设终止条件时,得到各个待定性社团。
步骤1916,获取各个待定性社团中节点的标签数据,根据节点的标签数据中的标签确定各个待定性社团中的异常社团。
通过上述实施例中,不但能够识别异常的主体,还可以识别得到的异常的用户,方便对异常的主体和用户进行监控和打击。
本申请还提供一种应用场景,该应用场景应用上述的异常社团识别方法。具体地,该异常社团识别方法在该应用场景的应用如下:对各个微信应用群进行异常群的识别,具体来说:获取到各个微信应用群名称和对应的微信应用群用户名称,根据各个微信应用群名称和对应的微信应用群用户名称确定第一关联关系,即统计相同的用户名称数量,将相同的用户名称数量作为微信应用群与微信应用群之间的第一关联关系,根据各个微信应用群名称和对应的第一关联关系建立第一异构信息网络,使用分布式fastunfolding算法对第一异构信息网络进行划分,得到各个待定性社团,提取各个待定性社团对应的网络结构特征,根据网络结构特征确定异常社团,比如,得到其中一个待定性社团为星型网络结构,得到该待定性社团为异常社团,该异常社团是微信应用群游戏赌博机器人社团。比如,得到其中一个待定性社团为近似环状的网络结构,得到该待定性社团为异常社团,该异常社团是传销微信应用群社团。然后对识别到的异常社团中的微信应用群进行监控和打击,比如,限制异常微信应用群的用户加入或者限制异常微信应用群聊天或者解散异常微信应用群等等。
应该理解的是,虽然图2、图3、图5-8、图12-14、图16、图17和图19的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图3、图5-8、图12-14、图16、图17和图19中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图20所示,提供了一种异常社团识别装置2000,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块2002、网络建立模块2004、划分模块2006和异常确定模块2008,其中:
获取模块2002,用于获取各个主体标识对应的属性信息和交互用户信息;
网络建立模块2004,用于基于各个主体标识对应的属性信息和交互用户信息确定关联关系,根据关联关系建立异构信息网络,其中,关联关系包括第一关联关系和第二关联关系中的至少一种,第一关联关系是指各个主体标识之间的关联关系,第二关联关系是指各个主体标识与交互用户信息中交互用户标识之间的关联关系;
划分模块2006,用于对异构信息网络进行社团划分,得到各个待定性社团;
异常确定模块2008,用于提取各个待定性社团对应的社团特征,根据社团特征确定各个待定性社团中的异常社团。
在一个实施例中,网络建立模块2004,包括:
核心关联得到单元,用于根据交互用户信息确定各个主体标识之间的共同交互用户标识数,将共同交互用户标识数作为各个主体标识之间的核心关联信息;
辅助关联得到单元,用于根据各个主体标识对应的属性信息确定相同主体属性,将相同主体属性作为各个主体标识之间的辅助关联信息;
第一关系得到单元,用于根据核心关联信息和辅助关联信息确定各个主体标识之间的第一关联关系;
第一网络建立单元,用于根据各个主体标识和各个主体标识之间的第一关联关系建立第一异构信息网络。
在一个实施例中,核心关联得到单元还用于根据交互用户信息确定各个主体标识对应的交互用户标识总数;计算共同交互用户标识数与交互用户标识总数的比值;当比值符合预设阈值条件时,将比值和相同交互用户标识数作为各个主体标识之间的第一核心关联信息。
在一个实施例中,核心关联得到单元还用于获取交互用户信息中的交互数据,当交互数据满足预设过滤条件时,获取对应的待过滤交互用户标识;获取各个主体标识之间的共同交互用户标识,将共同交互用户标识中的待过滤交互用户标识进行过滤,得到目标交互用户标识;统计目标交互用户标识数,将目标交互用户标识数作为各个主体标识之间的第二核心关联信息。
在一个实施例中,划分模块2006还用于初始化异构信息网络中节点对应的社团;计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团;计算更新后异构信息网络中节点的更新模块度,并计算初始模块度与更新模块度的差值;当差值符合预设差值条件时,得到异构信息网络对应的更新社团;根据异构信息网络对应的更新社团建立更新后的异构信息网络,并返回计算异构信息网络中节点的初始模块度,并根据异构信息网络中节点对应的邻居社团更新异构信息网络中节点对应的社团的步骤执行,当更新后的异构信息网络符合预设划分完成条件时,得到各个待定性社团。
在一个实施例中,异常确定模块2008还用于提取各个待定性社团中主体节点对应的主体节点特征,根据主体节点特征确定主体节点对应的主体可信程度;根据主体节点的主体可信程度确定各个待定性社团的社团可信程度,当社团可信程度符合预设可信程度条件时,将社团可信程度未超过预设可信程度阈值的待定性社团作为异常社团。
在一个实施例中,异常确定模块2008还用于统计各个待定性社团中主体节点对应的边数和邻居数;根据各个待定性社团中主体节点对应的边数和邻居数计算各个待定性社团对应的社团稠密度,根据社团稠密度确定社团结构特征;根据社团结构特征确定各个待定性社团中的异常社团。
在一个实施例中,异常社团识别装置2000,还包括:
相似计算模块,用于获取历史异常社团,计算历史异常社团与各个待定性社团的相似程度;
异常社团得到模块,用于当相似程度符合预设阈值时,将对应的待定性社团作为异常社团。
在一个实施例中,异常社团识别装置2000,还包括:
标识序列生成模块,用于获取历史异常社团对应的历史异常社团标识,并生成异常社团对应的异常社团标识;根据历史异常社团标识和异常社团标识生成异常社团标识序列。
在一个实施例中,相似计算模块还用于从各个待定性社团中确定目标待定性社团,将历史异常社团中的历史主体标识与目标待定性社团中的目标主体标识进行匹配,得到匹配一致的主体标识。统计匹配一致的主体标识对应的主体标识数,根据匹配一致的主体标识对应的主体标识数确定历史异常社团与目标待定性社团的相似程度。
在一个实施例中,相似计算模块还用于获取历史异常社团中历史主体标识对应的各个历史交互用户标识;从各个待定性社团中确定目标待定性社团,获取目标待定性社团中目标主体标识对应的各个目标交互用户标识;基于各个历史交互用户标识和各个目标交互用户标识确定共同交互用户标识,统计共同交互用户标识对应的共同交互用户标识数;根据共同交互用户标识对应的共同交互用户标识数确定历史异常社团与目标待定性社团的相似程度。
在一个实施例中,网络建立模块2004,包括:
第二关系确定单元,用于获取交互用户信息中的交互数据,根据交互数据确定各个主体标识与交互用户信息中交互用户标识之间的第二关联关系;
第二网络建立单元,用于根据各个主体标识、交互用户信息中交互用户标识和第二关联关系建立第二异构信息网络。
在一个实施例中,划分模块2006还用于获取第二异构信息网络中节点对应的标签数据,标签数据包括标签和标签归属概率;根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据;当标签数据中的标签归属概率未符合预设概率条件时,删除对应的标签数据;返回根据第二异构信息网络中邻居节点对应的标签数据更新第二异构信息网络中节点的标签数据的步骤执行,当达到预设终止条件时,得到各个待定性社团。
在一个实施例中,异常确定模块2008还用于获取各个待定性社团中节点的标签数据,根据节点的标签数据中的标签确定各个待定性社团中的异常社团。
关于异常社团识别装置的具体限定可以参见上文中对于异常社团识别方法的限定,在此不再赘述。上述异常社团识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图21所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储社团相关数据,比如,各个主体标识对应的属性信息、交互用户信息、异构信息网络和异常社团的信息等等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常社团识别方法。
本领域技术人员可以理解,图21中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种异常社团识别方法,其特征在于,所述方法包括:
获取各个主体标识对应的属性信息和交互用户信息;
基于所述各个主体标识对应的属性信息和所述交互用户信息确定关联关系,根据所述关联关系建立异构信息网络,其中,所述关联关系包括第一关联关系和第二关联关系中的至少一种,所述第一关联关系是指所述各个主体标识之间的关联关系,所述第二关联关系是指所述各个主体标识与所述交互用户信息中交互用户标识之间的关联关系;
对所述异构信息网络进行社团划分,得到各个待定性社团;
提取所述各个待定性社团对应的社团特征,根据所述社团特征确定所述各个待定性社团中的异常社团。
2.根据权利要求1所述的方法,其特征在于,所述关联关系包括第一关联关系;所述基于所述各个主体标识对应的属性信息和所述交互用户信息确定关联关系,根据所述关联关系建立异构信息网络,包括:
根据所述交互用户信息确定所述各个主体标识之间的共同交互用户标识数,将所述共同交互用户标识数作为所述各个主体标识之间的核心关联信息;
根据所述各个主体标识对应的属性信息确定相同主体属性,将所述相同主体属性作为所述各个主体标识之间的辅助关联信息;
根据所述核心关联信息和所述辅助关联信息确定所述各个主体标识之间的第一关联关系;
根据所述各个主体标识和所述各个主体标识之间的第一关联关系建立第一异构信息网络。
3.根据权利要求2所述的方法,其特征在于,根据所述交互用户信息确定所述各个主体标识之间的共同交互用户标识数,将所述共同交互用户标识数作为所述各个主体标识之间的核心关联信息,包括:
根据所述交互用户信息确定所述各个主体标识对应的交互用户标识总数;
计算所述共同交互用户标识数与所述交互用户标识总数的比值;
当所述比值符合预设阈值条件时,将所述比值和所述相同交互用户标识数作为所述各个主体标识之间的第一核心关联信息。
4.根据权利要求2所述的方法,其特征在于,根据所述交互用户信息确定所述各个主体标识之间的共同交互用户标识数,将所述共同交互用户标识数作为所述各个主体标识之间的核心关联信息,包括:
获取交互用户信息中的交互数据,当所述交互数据满足预设过滤条件时,获取对应的待过滤交互用户标识;
获取所述各个主体标识之间的共同交互用户标识,将所述共同交互用户标识中的所述待过滤交互用户标识进行过滤,得到目标交互用户标识;
统计所述目标交互用户标识数,将所述目标交互用户标识数作为所述各个主体标识之间的第二核心关联信息。
5.根据权利要求1至4任意一项所述的方法,其特征在于,对所述异构信息网络进行社团划分,得到各个待定性社团,包括:
初始化所述异构信息网络中节点对应的社团;
计算所述异构信息网络中节点的初始模块度,并根据所述异构信息网络中节点对应的邻居社团更新所述异构信息网络中节点对应的社团;
计算更新后所述异构信息网络中节点的更新模块度,并计算所述初始模块度与所述更新模块度的差值;
当所述差值符合预设差值条件时,得到所述异构信息网络对应的更新社团;
根据所述异构信息网络对应的更新社团建立更新后的异构信息网络,并返回计算所述异构信息网络中节点的初始模块度,并根据所述异构信息网络中节点对应的邻居社团更新所述异构信息网络中节点对应的社团的步骤执行,当所述更新后的异构信息网络符合预设划分完成条件时,得到各个待定性社团。
6.根据权利要求5所述的方法,其特征在于,所述社团特征包括主体节点特征;所述提取所述各个待定性社团对应的社团特征,根据所述社团特征确定所述各个待定性社团中的异常社团,包括:
提取所述各个待定性社团中主体节点对应的主体节点特征,根据所述主体节点特征确定主体节点对应的主体可信程度;
根据所述主体节点的主体可信程度确定所述各个待定性社团的社团可信程度,当所述社团可信程度符合预设可信程度条件时,将所述社团可信程度未超过预设可信程度阈值的待定性社团作为异常社团。
7.根据权利要求5所述的方法,其特征在于,所述社团特征包括社团结构特征;所述提取所述各个待定性社团对应的社团特征,根据所述社团特征确定所述各个待定性社团中的异常社团,包括:
统计所述各个待定性社团中主体节点对应的边数和邻居数;
根据所述各个待定性社团中主体节点对应的边数和邻居数计算所述各个待定性社团对应的社团稠密度,根据所述社团稠密度确定社团结构特征;
根据所述社团结构特征确定所述各个待定性社团中的异常社团。
8.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
获取历史异常社团,计算所述历史异常社团与所述各个待定性社团的相似程度;
当所述相似程度符合预设阈值时,将对应的待定性社团作为异常社团。
9.根据权利要求8所述的方法,其特征在于,所述计算所述历史异常社团与所述各个待定性社团的相似程度,包括:
从所述各个待定性社团中确定目标待定性社团,将所述历史异常社团中的历史主体标识与所述目标待定性社团中的目标主体标识进行匹配,得到匹配一致的主体标识;
统计所述匹配一致的主体标识对应的主体标识数,根据所述匹配一致的主体标识对应的主体标识数确定所述历史异常社团与所述目标待定性社团的相似程度。
10.根据权利要求8所述的方法,其特征在于,所述计算所述历史异常社团与所述各个待定性社团的相似程度,包括:
获取所述历史异常社团中历史主体标识对应的各个历史交互用户标识;
从所述各个待定性社团中确定目标待定性社团,获取所述目标待定性社团中目标主体标识对应的各个目标交互用户标识;
基于所述各个历史交互用户标识和所述各个目标交互用户标识确定共同交互用户标识,统计所述共同交互用户标识对应的共同交互用户标识数;
根据所述共同交互用户标识对应的共同交互用户标识数确定所述历史异常社团与所述目标待定性社团的相似程度。
11.根据权利要求1所述的方法,其特征在于,所述关联关系包括第二关联关系;所述基于所述各个主体标识对应的属性信息和所述交互用户信息确定关联关系,根据所述关联关系建立异构信息网络,包括:
获取交互用户信息中的交互数据,根据所述交互数据确定所述各个主体标识与所述交互用户信息中交互用户标识之间的第二关联关系;
根据所述各个主体标识、所述交互用户信息中交互用户标识和所述第二关联关系建立第二异构信息网络。
12.根据权利要求11所述的方法,其特征在于,所述对所述异构信息网络进行社团划分,得到各个待定性社团,包括:
获取所述第二异构信息网络中节点对应的标签数据,所述标签数据包括标签和标签归属概率;
根据所述第二异构信息网络中邻居节点对应的标签数据更新所述第二异构信息网络中节点的标签数据;
当所述标签数据中的标签归属概率未符合预设概率条件时,删除对应的标签数据;
返回根据所述第二异构信息网络中邻居节点对应的标签数据更新所述第二异构信息网络中节点的标签数据的步骤执行,当达到预设终止条件时,得到各个待定性社团。
13.一种异常社团识别装置,其特征在于,所述装置包括:
获取模块,用于获取各个主体标识对应的属性信息和交互用户信息;
网络建立模块,用于基于所述各个主体标识对应的属性信息和所述交互用户信息确定关联关系,根据所述关联关系建立异构信息网络,其中,所述关联关系包括第一关联关系和第二关联关系中的至少一种,所述第一关联关系是指所述各个主体标识之间的关联关系,所述第二关联关系是指所述各个主体标识与所述交互用户信息中交互用户标识之间的关联关系;
划分模块,用于对所述异构信息网络进行社团划分,得到各个待定性社团;
异常确定模块,用于提取所述各个待定性社团对应的社团特征,根据所述社团特征确定所述各个待定性社团中的异常社团。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010613527.7A CN111666501B (zh) | 2020-06-30 | 2020-06-30 | 异常社团识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010613527.7A CN111666501B (zh) | 2020-06-30 | 2020-06-30 | 异常社团识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666501A true CN111666501A (zh) | 2020-09-15 |
CN111666501B CN111666501B (zh) | 2024-04-12 |
Family
ID=72390662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010613527.7A Active CN111666501B (zh) | 2020-06-30 | 2020-06-30 | 异常社团识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666501B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205129A (zh) * | 2021-04-28 | 2021-08-03 | 五八有限公司 | 一种作弊团伙识别方法、装置、电子设备及存储介质 |
CN113870021A (zh) * | 2021-12-03 | 2021-12-31 | 北京芯盾时代科技有限公司 | 一种数据的分析方法、装置、存储介质和电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199832A (zh) * | 2014-08-01 | 2014-12-10 | 西安理工大学 | 基于信息熵的金融网络异常交易社区发现方法 |
US20160092774A1 (en) * | 2014-09-29 | 2016-03-31 | Pivotal Software, Inc. | Determining and localizing anomalous network behavior |
CN106022938A (zh) * | 2016-06-02 | 2016-10-12 | 北京奇艺世纪科技有限公司 | 社交网络的用户社团划分方法和装置 |
CN106372239A (zh) * | 2016-09-14 | 2017-02-01 | 电子科技大学 | 一种基于异质网络的社交网络事件关联分析方法 |
CN107590504A (zh) * | 2017-07-31 | 2018-01-16 | 阿里巴巴集团控股有限公司 | 异常主体识别方法和装置、服务器 |
WO2018103456A1 (zh) * | 2016-12-06 | 2018-06-14 | 中国银联股份有限公司 | 一种基于特征匹配网络的社团划分方法、装置及电子设备 |
CN110443265A (zh) * | 2018-05-04 | 2019-11-12 | 北京京东尚科信息技术有限公司 | 一种基于社团的行为检测方法和装置 |
-
2020
- 2020-06-30 CN CN202010613527.7A patent/CN111666501B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199832A (zh) * | 2014-08-01 | 2014-12-10 | 西安理工大学 | 基于信息熵的金融网络异常交易社区发现方法 |
US20160092774A1 (en) * | 2014-09-29 | 2016-03-31 | Pivotal Software, Inc. | Determining and localizing anomalous network behavior |
CN106022938A (zh) * | 2016-06-02 | 2016-10-12 | 北京奇艺世纪科技有限公司 | 社交网络的用户社团划分方法和装置 |
CN106372239A (zh) * | 2016-09-14 | 2017-02-01 | 电子科技大学 | 一种基于异质网络的社交网络事件关联分析方法 |
WO2018103456A1 (zh) * | 2016-12-06 | 2018-06-14 | 中国银联股份有限公司 | 一种基于特征匹配网络的社团划分方法、装置及电子设备 |
CN107590504A (zh) * | 2017-07-31 | 2018-01-16 | 阿里巴巴集团控股有限公司 | 异常主体识别方法和装置、服务器 |
CN110443265A (zh) * | 2018-05-04 | 2019-11-12 | 北京京东尚科信息技术有限公司 | 一种基于社团的行为检测方法和装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205129A (zh) * | 2021-04-28 | 2021-08-03 | 五八有限公司 | 一种作弊团伙识别方法、装置、电子设备及存储介质 |
CN113205129B (zh) * | 2021-04-28 | 2023-04-07 | 五八有限公司 | 一种作弊团伙识别方法、装置、电子设备及存储介质 |
CN113870021A (zh) * | 2021-12-03 | 2021-12-31 | 北京芯盾时代科技有限公司 | 一种数据的分析方法、装置、存储介质和电子设备 |
CN113870021B (zh) * | 2021-12-03 | 2022-03-08 | 北京芯盾时代科技有限公司 | 一种数据的分析方法、装置、存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111666501B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Halvaiee et al. | A novel model for credit card fraud detection using Artificial Immune Systems | |
CN112148987B (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
CN112910710B (zh) | 网络流量时空预测方法、装置、计算机设备和存储介质 | |
CN109598563A (zh) | 刷单检测方法、装置、存储介质和电子设备 | |
CN112165462A (zh) | 基于画像的攻击预测方法、装置、电子设备及存储介质 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
CN110166344B (zh) | 一种身份标识识别方法、装置以及相关设备 | |
CN111666501B (zh) | 异常社团识别方法、装置、计算机设备和存储介质 | |
CN111756706A (zh) | 一种异常流量检测方法、装置及存储介质 | |
CN111598711A (zh) | 目标用户账号识别方法、计算机设备及存储介质 | |
CN112214775A (zh) | 对图数据的注入式攻击方法、装置、介质及电子设备 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN114693192A (zh) | 风控决策方法、装置、计算机设备和存储介质 | |
CN112437034B (zh) | 虚假终端检测方法和装置、存储介质及电子装置 | |
CN112508630B (zh) | 异常会话群的检测方法、装置、计算机设备和存储介质 | |
CN111127185A (zh) | 信贷欺诈识别模型构建方法及装置 | |
CN117240572A (zh) | 基于网络威胁知识图谱的意图预测方法、装置及介质 | |
CN113254672B (zh) | 异常账号的识别方法、系统、设备及可读存储介质 | |
CN109063721A (zh) | 一种行为特征数据提取的方法及装置 | |
CN113780318B (zh) | 用于生成提示信息的方法、装置、服务器和介质 | |
CN111723872B (zh) | 行人属性识别方法及装置、存储介质、电子装置 | |
CN110489568B (zh) | 生成事件图的方法、装置、存储介质和电子设备 | |
JP6774917B2 (ja) | 所定行動に対するグループ内の同調圧力を推定するプログラム、装置及び方法 | |
CN112750047A (zh) | 行为关系信息提取方法及装置、存储介质、电子设备 | |
CN111160738A (zh) | 事件处理方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |