CN112232834B - 资源账户确定方法、装置、设备和介质 - Google Patents
资源账户确定方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN112232834B CN112232834B CN202011046324.0A CN202011046324A CN112232834B CN 112232834 B CN112232834 B CN 112232834B CN 202011046324 A CN202011046324 A CN 202011046324A CN 112232834 B CN112232834 B CN 112232834B
- Authority
- CN
- China
- Prior art keywords
- node
- resource account
- account node
- resource
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000005295 random walk Methods 0.000 claims abstract description 49
- 238000010586 diagram Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 9
- 230000005012 migration Effects 0.000 claims description 4
- 238000013508 migration Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000035515 penetration Effects 0.000 claims 1
- 230000003993 interaction Effects 0.000 description 8
- 208000001613 Gambling Diseases 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Mobile Radio Communication Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种资源账户确定方法、装置、设备和介质。该方法包括:以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;目标结构节点为资源账户节点网络中的目标资源账户节点在带权层次图的第M层对应的结构节点;基于至少一个结构节点序列,确定在资源账户节点网络中与目标资源账户节点相似的资源账户节点;将与目标资源账户节点相似的资源账户节点对应的资源账户,确定为与目标资源账户节点对应的目标资源账户相似的资源账户。根据本申请实施例,提高确定与目标资源账户相似的资源账户的准确性。
Description
技术领域
本申请涉及数据业务领域,尤其涉及一种资源账户确定方法、装置、设备和介质。
背景技术
随着经济和科技的快速发展,用户利用资源账户进行资源交互的行为越来越多样化和复杂化。
在一些场景下,存在查询与已知的目标资源账户的资源交互特征相类似的其他资源账户的需求。因此,需要提供一种精度较高的资源账户确定方法,以确定与目标资源账户的资源交互特征相似的资源账户。
发明内容
本申请实施例提供一种在资源账户确定方法、装置、设备及计算机存储介质,能够提高确定与目标资源账户相似的资源账户的准确性。
第一方面,本申请提供一种资源账户确定方法,方法包括:
以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;目标结构节点为资源账户节点网络中的目标资源账户节点在带权层次图的第M层对应的结构节点;
基于至少一个结构节点序列,确定在资源账户节点网络中与目标资源账户节点相似的资源账户节点;
将与目标资源账户节点相似的资源账户节点对应的资源账户,确定为与目标资源账户节点对应的目标资源账户相似的资源账户;
其中,带权层次图具有N层,带权层次图的第k层包括资源账户节点网络中的第一资源账户节点对应的第k结构节点以及与第一资源账户节点空间结构相似的第二资源账户节点对应的第k结构节点;在第一资源账户节点和第二资源账户节点之间的第k阶结构距离大于第一预设距离阈值的情况下,第k层还包括第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边,带权层次图还包括N层中相邻两层中对应同一资源账户节点的两个结构节点之间的有向边,资源账户节点网络中的资源账户节点对应的第k结构节点用于表征资源账户节点的所有k邻接资源账户节点对应的空间结构;0≤k≤N,N为正整数,M为预设整数,0≤M≤N。
第二方面,本申请提供了一种资源账户确定装置,装置包括:
结构节点序列确定模块,用于以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;目标结构节点为资源账户节点网络中的目标资源账户节点在带权层次图的第M层对应的结构节点;
资源账户节点确定模块,用于基于至少一个结构节点序列,确定在资源账户节点网络中与目标资源账户节点相似的资源账户节点;
资源账户确定模块,用于将与目标资源账户节点相似的资源账户节点对应的资源账户,确定为与目标资源账户节点对应的目标资源账户相似的资源账户;
其中,带权层次图具有N层,带权层次图的第k层包括资源账户节点网络中的第一资源账户节点对应的第k结构节点以及与第一资源账户节点空间结构相似的第二资源账户节点对应的第k结构节点;在第一资源账户节点和第二资源账户节点之间的第k阶结构距离大于第一预设距离阈值的情况下,第k层还包括第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边,带权层次图还包括N层中相邻两层中对应同一资源账户节点的两个结构节点之间的有向边,资源账户节点网络中的资源账户节点对应的第k结构节点用于表征资源账户节点的所有k邻接资源账户节点对应的空间结构;0≤k≤N,N为正整数,M为预设整数,0≤M≤N。
第三方面,本申请提供了一种资源账户确定设备,设备包括:包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现上述第一方面或第二方面提供的资源账户确定方法。
第四方面,本申请提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如上述第一方面或第二方面提供的资源账户确定方法。
本申请实施例的资源账户确定方法、装置、设备及计算机存储介质,由于带权层次图可以层次化的衡量空间结构相似的两个资源账户节点的k邻接资源账户节点集合对应的结构的相似度,且第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边代表着这两个资源账户节点具有相似的空间结构,因此,通过以目标资源账户对应的资源账户节点在第M层对应的结构节点为起点,在带权层次图中进行随机游走,得到的结构节点序列能够更加精确地确定与目标资源账户节点具有空间结构相似的资源账户节点,提高确定与目标资源账户相似的资源账户的准确性。并且,由于资源账户之间的资源交互是有流向的,因此通过在带权层次图中进行有偏随机游走,能够提高在广度上对结构特征的挖掘效果,进一步提高确定与目标资源账户相似的资源账户的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请提供的资源账户确定方法的一个实施例的流程示意图;
图2是根据本申请提供的资源账户节点网络的一实施例的示意图;
图3是根据本申请提供的资源账户节点网络的另一实施例的示意图;
图4是根据本申请提供的资源账户节点网络的再一实施例的示意图;
图5是根据本申请提供的带权层次图的一实施例的示意图;
图6是根据本申请提供的带权层次图的另一实施例的示意图;
图7是根据本申请提供的带权层次图的再一实施例的示意图;
图8是根据本申请提供的资源账户确定装置的一个实施例的结构示意图;
图9是根据本申请提供的资源账户确定设备的一个实施例的结构示意图;
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了更好的理解本申请,下面将结合附图,详细描述根据本申请实施例的资源账户确定方法、装置和系统,应注意,这些实施例并不是用来限制本申请公开的范围。
图1是根据本申请提供的资源账户确定方法的一个实施例的流程示意图。如图1所示,本申请提供的资源账户确定方法100包括以下步骤:
步骤110,以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;目标结构节点为资源账户节点网络中的目标资源账户节点在带权层次图的第M层对应的结构节点;
步骤120,基于至少一个结构节点序列,确定在资源账户节点网络中与目标资源账户节点相似的资源账户节点;
步骤130,将与目标资源账户节点相似的资源账户节点对应的资源账户,确定为与目标资源账户节点对应的目标资源账户相似的资源账户;
其中,带权层次图具有N层,带权层次图的第k层包括资源账户节点网络中的第一资源账户节点对应的第k结构节点以及与第一资源账户节点空间结构相似的第二资源账户节点对应的第k结构节点;在第一资源账户节点和第二资源账户节点之间的第k阶结构距离大于第一预设距离阈值的情况下,第k层还包括第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边,带权层次图还包括N层中相邻两层中对应同一资源账户节点的两个结构节点之间的有向边,资源账户节点网络中的资源账户节点对应的第k结构节点用于表征节点的k邻接资源账户节点集合对应的结构;0≤k≤N,N为正整数,M为预设整数,0≤M≤N。
第一资源账户节点和第二资源账户节点之间的第k阶结构距离用于表征第一资源账户节点的所有k邻接资源账户节点对应的空间结构和第二资源账户节点的所有k邻接资源账户节点对应的空间结构的相似度。
在本申请的实施例中,与第一资源账户节点空间结构相似的第二资源账户节点为:在与第一资源账户节点对应的第二资源账户节点中满足预设距离条件的第二资源账户节点。该预设距离条件包括第一资源账户节点与第二资源账户节点的第0阶结构距离至第N阶结构距离中存在至少一个结构距离大于第一预设距离阈值。第一资源账户节点对应的第二资源账户节点可以为资源账户节点网络中除该第一资源账户节点之外的其他资源账户节点。
在本申请的实施例中,第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边,即这两个结构节点的连接,用于表征第一资源账户节点的所有k邻接资源账户节点对应的空间结构和第二资源账户节点的所有k邻接资源账户节点对应的空间结构具有相似性。
在本申请的实施例中,资源账户节点网络中的资源账户节点对应的第k结构节点是定义的抽象节点,该节点用于表征资源账户节点的所有k邻接资源账户节点对应的空间结构。
下面分别对步骤110~步骤130中的每个步骤的具体实现方式进行详细介绍。
首先,涉及步骤110,由于需要利用预先构建的带权层次图,为了便于更详细地理解步骤110的具体实现方式,下面先对带权层次图的构建进行说明。
因此,在步骤110之前,本申请提供的资源账户确定方法还包括:步骤A~步骤C。步骤A,对于资源账户节点网络中的每个第一资源账户节点,基于第一资源账户节点的i邻接资源账户节点集合与第一资源账户节点对应的第二资源账户节点的i邻接资源账户节点集合,以及第一资源账户节点和第二资源账户节点的第i-1阶结构距离,计算第一资源账户节点和第二资源账户节点的第i阶结构距离;其中,i=0,第一资源账户节点和第二资源账户节点的第-1阶结构距离为第一预设值;步骤B,将i加1得到更新后的i,直至得到第一资源账户节点和第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离;步骤C,对于每个第一资源账户节点,基于第一资源账户节点和第一资源账户节点对应的第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离,构建带权层次图。
在步骤A中,资源账户节点网络中的每个资源账户节点均用于表征一个资源账户,即一个资源账户节点对应一个唯一的资源账户。例如,资源账户可以为银行卡号、支付账号等不同的账户。资源账户节点网络中两个资源账户节点的连接,代表这两个资源账户节点分别对应的资源账户之间存在资源交互行为。两个资源账户节点之间的有向边的指向,代表这两个资源账户节点的资源交互方向。
例如,若资源账户节点1和资源账户节点2之间的有向边的方向为由资源账户节点1指向资源账户节点2,则代表资源账户节点1对应的资源账户是资源转出账户,资源账户节点2对应的资源账户是资源转入账户。
在步骤A中,在一些实施例中,第一资源账户节点可以是资源账户节点网络中的任意一个资源账户节点。在一些实施例中,第一资源账户节点对应的第二资源账户节点为资源账户节点网络中除该第一资源账户节点之外的其他任意一个资源账户节点。
图2是根据本申请提供的资源账户节点网络的一个示例性示意图。如图2所示,图2中示出了资源账户节点网络中的两个局部区域。作为一个示例,第一资源账户节点为图2中的资源账户节点1,第二资源账户节点为图2中的资源账户节点1’。
需要说明的是,对于任意第一个资源账户节点,该资源账户节点的0邻接资源账户节点为该资源账户节点自身。该资源账户节点的1邻接资源账户节点为该资源账户节点直接连接的资源账户节点。若i大于或等于2,则资源账户节点的i邻接资源账户节点与该资源账户节点间接连接,且与该资源账户节点之间具有i-1个资源账户节点。
参见图2,资源账户节点1的1邻接资源账户节点集合包括与资源账户节点1直接连接的资源账户节点2、资源账户节点3和资源账户节点4。资源账户节点1的2邻接资源账户节点集合包括与资源账户节点1间接连接的资源账户节点5、资源账户节点6和资源账户节点7。图2中仅示出资源账户节点网络的局部区域用以说明邻接资源账户节点。对于资源账户节点1’的i邻接资源账户节点可以参见图2,不再一一列举。
需要说明的是,在一些实施例中,第一预设值可以为0,即第一资源账户节点和该第一资源账户节点对应的第二资源账户节点的第-1阶结构距离为0。
在本申请的一些实施例中,步骤A包括步骤A1~步骤A3。步骤A1,按照第一资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到第一资源账户节点对应的第i个资源账户节点序列,并按照第二资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到第二资源账户节点对应的第i个资源账户序列,资源账户节点的入度为与资源账户节点直接连接、且指向资源账户节点的边的个数;步骤A2,计算第一资源账户节点对应的第i个资源账户节点序列和第二资源账户节点对应的第i个资源账户节点序列之间的第一距离;步骤A3,将第一资源账户节点和第二资源账户节点的第i-1阶结构距离和第一距离的和值,确定为第一资源账户节点和第二资源账户节点的第i阶结构距离,i为整数。
在步骤A1中,资源账户节点的入度即为与该资源账户节点直接连接的边,且指向该资源账户节点的边的个数。
在本申请的一些实施例中,若资源账户为银行卡号,则资源账户节点的入度用于表征在资源账户节点网络对应的所有资源账户中,向该资源账户节点对应的资源账户转入资源的资源账户的个数。
在本申请的另一些实施例中,若资源账户为社交账户,则资源账户节点的入度用于表征在资源账户节点网络对应的所有资源账户中,关注该资源账户节点对应的资源账户的资源账户的个数。
在本申请的实施例中,在相关技术中,会采用近邻相似模型来确定某个节点的相似节点,但是在一些场景下,资源账户节点与资源账户节点之间不一定有直接关系,而间接关系的相似无法进行有效挖掘。因此需要利用资源账户节点之间的结构相似度对资源账户节点的相似性进行更深层的挖掘,以提高确定与目标资源账户节点的相似资源账户节点的准确性。
例如,参见图3,图3中的资源账户节点u1和资源账户节点v1是非邻接边,也不共享邻居资源账户节点,在基于近邻相似的模型中,这两个资源账户节点是不相似的。但是这两个资源账户节点的入度相似(分别为5和4),临界点组成三角形结构(分别有3个和2个),且通过两个资源账户节点与网络中的其他部分相连。从空间结构的相似性角度来看,资源账户节点u1和资源账户节点v1是相似的,因为两者具有相似的度入和邻接结构。
在本申请的实施例中,通过利用两个资源账户节点分别对应的第i个资源账户节点序列,可以层次化地对这两个资源账户节点的空间结构的相似度进行衡量。
在本申请的实施例中,可以从资源账户节点网络中获取第一资源账户节点的i邻接资源账户节点集合。当获取第一资源账户节点的i邻接资源账户节点集合后,对该集合中的每个资源账户节点的入度进行统计,然后按照入度从低到高或者从高到低的顺序对第一资源账户节点的i邻接资源账户节点集合中的资源账户节点进行排序,得到第一资源账户节点对应的第i个资源账户节点序列。相类似,还可以得到第二资源账户节点对应的第i个资源账户节点序列。
在步骤A2中,可以利用预设的距离函数计算第一资源账户节点对应的第i个资源账户节点序列和第二资源账户节点对应的第i个资源账户节点序列之间的第一距离。对于预设的距离函数的具体形式不做具体限定。
在本申请的一些实施例中,资源账户节点网络的节点数量大,每个资源账户节点对应的资源账户节点序列可能会很长,且存在重复,因此为了提高计算效率,可以第一资源账户节点对应的第i个资源账户节点序列中资源账户节点的入度和第二资源账户节点对应的第i个资源账户节点序列中资源账户节点的入度进行计算第一距离。
在一些实施例中,步骤A2包括基于第一比值与第二预设值之间的差值以及第一参数,计算第一资源账户节点对应的第i个资源账户节点序列和第二资源账户节点对应的第i个资源账户节点序列之间的第一距离。
其中,第一比值为第二参数与第三参数的比值,第一参数为第四参数和第五参数中的最大值,第四参数为第一资源账户节点的i邻接资源账户节点集合中满足第一入度条件的所有资源账户节点的入度中出现次数最多的入度的出现次数,第五参数为第二资源账户节点的i邻接资源账户节点集合中的满足第一入度条件所有资源账户节点的入度中出现次数最多的入度的出现次数,第二参数和第三参数基于第六参数和第七参数确定,第六参数为第一资源账户节点的i邻接资源账户节点集合中的满足第一入度条件的所有资源账户节点的入度中的最大入度,第七参数为第二资源账户节点的i邻接资源账户节点集合中的满足第一入度条件的所有资源账户节点的入度中的最大入度。
作为一个示例,第一资源账户节点u对应的第i个资源账户节点序列s(Ri(u))和第一资源账户节点u对应的第二资源账户节点v所对应的第i个资源账户节点序列s(Ri(v))之间的第一距离g(s(Ri(u)),s(Ri(v)))可以利用下面的表达式进行计算:
其中,第二预设值即为1。第一参数为max(u1i,v1i),第二参数即为max(u0i,v0i),第三参数即为min(u0i,v0i)。第四参数为u1i,第五参数为v1i,第六参数为u0i,第七参数为v0i。
作为一个示例,第一资源账户节点u的2邻接资源账户节点集合中包括5个资源账户节点,这5个资源账户节点的入度分别为1、4、5、4、4在一些实施例中,第一入度条件为入度大于0,由于上述5个资源账户节点的入度中出现次数最多的入度为4,且4的出现次数为3,则u12等于3。在另一些实施例中,第一入度条件包括资源账户节点的入度大于预设入度阈值。例如,预设入度阈值为2,则可以从{4,5,4,4}这4个入度中确定u12。
在本申请的实施例中,由于资源账户节点的第i个资源账户节点序列可能会很长,因此,为了进一步提高计算效率,减小计算压力,可以利用预设入度阈值筛选掉一部分入度,以提高对第一距离计算的速度。
在上述示例中,由于在上述5个入度中的最大入度为5,则u02为5。
需要说明的是,若i=0,则u10和u00均为第一资源账户节点u的入度,v10和v00均为第二资源账户节点v的入度。
在本申请的实施例中,上述表达式(1)在计算第一距离时对第一资源账户节点和第二资源账户节点的度数的绝对大小不敏感,能够惩罚当两个节点的度数较小时的差异。
在步骤A3中,第一资源账户节点u和第二资源账户节点v的第i阶结构距离fi(u,v)可以利用下面的表达式进行计算:
fi(u,v)=fi-1(u,v)+g(s(Ri(u)),s(Ri(v))) (2)
在步骤A中,当i=0时,根据初始化的第一资源账户节点和第二资源账户节点的第-1阶结构距离,以及第一资源账户节点的入度和第二资源账户节点的入度,可以计算出第一资源账户节点和第二资源账户节点的第0阶结构距离。
在步骤B中,当计算出第一资源账户节点和第二资源账户节点的第0阶结构距离之后,可以更新i,即将i加1,得到更新后的i,即更新后的i=1,更新i之后,返回步骤A,计算第一资源账户节点和第二资源账户节点的第1阶结构距离,接着再将i更新为2,依次类推,可以得到得到第一资源账户节点和第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离。其中,N可以为预设正整数。
在本申请的实施例中,通过利用两个资源账户节点的k阶结构距离可以衡量这两个资源账户节点的k邻接结构之间的相似性,实现层次化地对这两个资源账户节点的空间结构的相似度进行衡量,可以更深层地挖掘两者之间的空间结构特征,以捕捉两个节点之间的结构相似性。
对于每个第一资源账户节点,当计算出该第一资源账户节点与该第一资源账户节点对应的每个第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离之后,则可以根据这些结构距离带权层次图。
在本申请的一些实施例中,步骤C包括步骤C1~步骤C3。步骤C1,对于每个第一资源账户节点以及与第一资源账户节点空间结构相似的第二资源账户节点,构建第一资源账户节点对应的第j结构节点和第二资源账户节点对应的第j结构节点,在第一资源账户节点和第二资源账户节点的第j阶结构距离大于第一预设距离阈值的情况下,构建第一资源账户节点对应的第j结构节点与第二资源账户节点对应的第j结构节点之间的第一边,并基于第一资源账户节点和第二资源账户节点的第j阶结构距离,计算第一边对应的权重,形成第j层,j=0;步骤C2,将j加1得到更新后的j,直至构建第0层至第N层中的每一层;步骤C3,对于第k层中的每个目标结构节点,构建由目标结构节点指向目标结构节点在第k层的每个相邻层对应的结构节点的第二边,并根据目标结构节点的每个第一边的权重,计算每个第二边对应的权重,以构成带权层次图;目标结构节点为第k层中的任一结构节点。
其中,与第一资源账户节点空间结构相似的第二资源账户节点为第一资源账户节点对应的第二资源账户节点中满足预设距离条件的第二资源账户节点,预设距离条件包括第一资源账户节点与第二资源账户节点的第0阶结构距离至第N阶结构距离中存在至少一个结构距离大于第一预设距离阈值。
在本申请的一些实施例中,对于每个第一资源账户节点,当计算出该第一资源账户节点与其对应的每个第二资源账户节点的第0阶结构距离至第N阶结构距离之后,需要根据这些结构距离判断该第二资源账户节点是否为与该第一资源账户节点空间结构相似的资源账户节点。
对于第一资源账户节点,若该第一资源账户节点与其对应的第二资源账户节点的第0阶结构距离至第N阶结构距离均小于第一预设距离阈值,则确定第一资源账户节点与该第二资源账户节点的空间结构不相似;若该第一资源账户节点与其对应的第二资源账户节点的第0阶结构距离至第N阶结构距离中存在一个结构距离大于第一预设距离阈值,则确定第一资源账户节点与该第二资源账户节点的空间结构相似。
在构建带权层次图时,对于第一资源账户节点,若该第一资源账户节点不具有与自身空间结构相似的第二资源账户节点,则不会构建该第一资源账户节点对应的结构节点,即在带权层次图中不体现该第一资源账户节点的信息。
需要说明的是,若第一资源账户节点和与第一资源账户节点空间结构相似的第二资源账户节点的第j阶结构距离不大于第一预设距离阈值,则可以只构建第一资源账户节点对应的第j结构节点和第二资源账户节点对应的第j结构节点,而不构建两者之间的无向边。
作为一个示例,参见图4,图4示出了一个资源账户节点网络的示意图。假设第一资源账户节点为资源账户节点u,与该资源账户节点u空间结构相似的第二资源账户节点为资源账户节点v和资源账户节点w。资源账户节点u与资源账户节点v的第0阶结构距离大于第一预设距离阈值,且资源账户节点u与资源账户节点w的第0阶结构距离也大于第一预设距离阈值,则构建资源账户节点u对应的第0结构节点u0、资源账户节点v对应的第0结构节点v0和资源账户节点w对应的第0结构节点w0,以及构建资源账户节点u对应的第0结构节点u0与资源账户节点v对应的第0结构节点v0之间的无向边、资源账户节点u对应的第0结构节点u0与资源账户节点w对应的第0结构节点w0之间的无向边。相类似地,若第一资源账户节点为资源账户节点v,与该资源账户节点v空间结构相似的第二资源账户节点为资源账户节点u和资源账户节点w,若资源账户节点v与资源账户节点w的第0阶结构距离大于第一预设距离阈值,则还需要构建资源账户节点v对应的第0结构节点v0与资源账户节点w对应的第0结构节点w0之间的无向边。并且,还需要计算每一层中两个结构节点之间的边的权重。需要说明的是,位于同一层之间的结构节点之间构建的是无向边。
在本申请的一些实施例中,可以将n个自然常数相乘的乘积确定为第一资源账户节点对应的第j结构节点与第二资源账户节点对应的第j结构节点之间的第一边对应的权重。其中,n由第一资源账户节点和第二资源账户节点的第j阶结构距离确定。
作为一个示例,第一资源账户节点u对应的第j结构节点与第二资源账户节点v对应的第j结构节点之间的第一边对应的权重ω(uj,vj)可以利用下面的表达式进行计算:
ω(uj,vj)=e-fj(u,v) (3)
其中,fj(u,v)为第一资源账户节点和第二资源账户节点的第j阶结构距离。
当构建完第0层之后,可以更新j,即将j加1得到更新后的j,更新后的j为1,然后返回步骤C1,以构建第1层。依次类推,直至j=N,则可以构建第N层,则可以构建第0层至第N层中的每一层。
继续参见图5,假设N=2,则构建与图4对应的最终构建了第0层至第2层这三个层。
在本申请的实施例中,在带权层次图中的同一层中两个结构节点之间的相连,代表这两个结构节点对应的空间结构相似,而结构节点之间的第一边的权重可以衡量空间结构的相似性。
在本申请的实施例中,为了可以更深次地挖掘资源账户节点之间的结构特征,还需要构建跨层结构节点之间的有向边。需要说明的是,相邻两层中对应的两个结构节点为与同一个资源账户节点对应的两个结构节点。
继续参见图4,若k=1,则第1层具有两个相邻层,对于目标结构节点u1,则构建结构节点u1指向结构节点u2的第二边,以及构建结构节点u1指向结构节点u0的第二边。相类似地,对结构节点v1和结构节点w1做相似处理。另k取0,1,2中的每个值,则可以构建所有的第二边,接着在计算每个第二边的权重,则可以得到最后的带权层次图。其中,k取0~N中的每个值。需要说明的是,若第k层只有一个相邻层,例如,k=0,对于目标结构节点u0,则只需构建结构节点u0指向结构节点u1的第二边。
在本申请的实施例中,由于目标结构节点所在层数为第k层,若存在第k+1层,则基于自然常数和第一数量的和值确定目标结构节点指向目标结构节点在第k+1层对应的结构节点的第二边的权重;若存在第k-1层,将目标结构节点指向目标结构节点在第k-1层对应的结构节点的第二边的权重确定为第三预设值。
其中,第一数量为与目标结构节点连接的所有第一边的权重中大于平均权重的个数,平均权重为与目标结构节点连接的所有第一边对应的权重的平均值。
作为一个示例,参见图6,目标结构节点uk指向目标结构节点uk在第k+1层对应的结构节点uk+1的第二边的权重ω(uk,uk+1)可以利用下面的表达式进行计算:
ω(uk,uk+1)=log(Γk+e) (4)
其中,Γk为第一数量。
作为一个示例,第三预设值可以为1,即目标结构节点uk指向目标结构节点uk在第k-1层对应的结构节点uk-1的第二边的权重ω(uk,uk-1)=1。
需要说明的是,跨层结构节点之间的边为双向边,结构几点既可以往上层游走,也可以往下层游走。
在本申请的实施例总,若带权层次图的层数越多,则资源账户节点间相似的条件越严格,可能会导致一些资源账户节点的空间相似性随着层数的增加而降低,最终得到的相似资源账户节点的数量减小,泛化性能弱。因此需要对带权层次图的层数进行合理限制。当带权层次图的层数越高时,邻接资源账户节点的个数越少,则资源账户节点对应的资源账户节点序列越短,因此fi(u,v)和fi-1(u,v)越相近。
因此,在本申请的一些实施例中,第一资源账户节点和第二资源账户节点的第0阶结构距离至第N阶结构距离中每相邻两阶的结构距离差值大于或等于第二预设距离阈值。
也就是说,可以将fi(u,v)-fi-1(u,v)<ε的层去掉,ε为第二预设距离阈值,只分析一些重要的层来评估资源账户节点之间的空间相似度。同时,简化图的层次也有利于降低带权层次图构造的计算和存储开销。
在本申请的一些实施例中,基于目标资源账户节点的空间特性显著,二轮关联即可以抓取到较准确的与目标资源账户较为相似的资源账户,关联次数越多可能会引起准确度降低,因此可以对带权层次图的层数进行限制。
在本申请的一些实施例中,为了进一步减少计算量,在步骤A之前,本申请提供的资源账户确定方法还包括:统计资源账户节点网络中每个资源账户节点的出度和入度;将入度大于出度的资源账户节点确定为第一资源账户节点。
资源账户节点网络中资源账户节点的出度为与资源账户节点直接连接、且背离资源账户节点的边的个数,资源账户节点网络中资源账户节点的入度为与资源账户节点直接连接、且指向资源账户节点的边的个数。
在本申请的一些实施例中,资源账户可以为银行卡号,则资源账户节点的出度用于表征在资源账户节点网络对应的所有资源账户中,该资源账户节点对应的资源账户转出资源的资源账户的个数。
在本申请的另一些实施例中,资源账户可以为社交账号,则资源账户节点的出度用于表征在资源账户节点网络对应的所有资源账户中,该资源账户节点对应的资源账户所关注的资源账户的个数。
在本申请的一些实施例中,目标资源账户可以为集资涉赌银行卡号。由于集资涉赌卡的特点为集资,大量的资金通过小额多笔的方式流入,因此集资涉赌卡的转入笔数远大于转出笔数。对于赌民卡,可能有两种行为,一是在一个平台多次赌博,那么对于同一个平台会有多笔转出,二是在多个平台进行赌博。无论赌民的赌博行为如何,都体现为多笔转出。因此通过转入和转出笔数可以初步的区分出赌民卡和集资涉赌卡,以筛选掉赌民卡。因此,可以将资源账户节点网络中疑似集资涉赌卡号对应的资源账户节点给标记出来,作为第一资源账户节点。
在本申请的另一些实施例中,目标资源账户可以为社交账户。例如,对于已在社交平台认证的知名社交账户,会有大量的其他社交账户关注该知名社交账户。其中,关注知名社交账户的社交账户的数目远大于该知名社交账户所关注的社交账户的数目。对于普通社交账户,一般表现为关注该普通社交账户的社交账户的数目小于该普通社交账户所关注的社交账户。因此,通过关注量和被关注量可以初步的区分出知名社交账户和普通社交账户,以筛选掉普通社交账户。因此,可以将资源账户节点网络中疑似知名社交账户对应的资源账户节点给标记出来,作为第一资源账户节点。
在本申请的实施例中,可以基于需要查询的目标资源账户的资源交互特征预先筛选出第一资源账户节点,可以大大减小计算量。
在本申请的实施例中,计算每个资源账户节点的出度和入度,分别记为Degin和Degout。然后,对每个资源账户节点进行标记:
在本申请的一些实施例中,若资源账户节点的Degout<Degin,则代表该节点对应的资源账户可能为集资涉赌卡号,若资源账户节点的Degout>Degin,则代表该节点对应的资源账户可能为赌民卡号。
在本申请的一些实施例中,若资源账户节点的Degout<Degin,则代表该节点对应的资源账户可能为知名社交账户,若资源账户节点的Degout>Degin,则代表该节点对应的资源账户可能为普通社交账户。
在本申请的实施例中,在进行资源账户节点的空间相似度计算时,只计算标记为1的资源账户节点。也就是说,第一资源账户节点为标记为1的资源账户节点。
在本申请的实施例中,通过对资源账户节点网络中的资源账户节点进行初步筛选,不仅减少了资源账户节点的空间相似度计算过程中的计算资源消耗和时间,而且也可以简化带权层次图,也减少了一些不必要的噪声,提高确定与目标资源账户相似的资源账户的准确性。
在本申请的实施例中,基于资源账户节点网络中资源账户节点的出入度的简化计算的复杂度,对于复杂多资源账户节点的图网络关系简化效果显著。
在本申请的一些实施例中,在将入度大于出度的资源账户节点确定为第一资源账户节之后以及步骤A之前,本申请提供的资源账户确定方法还包括:按照从低到高的顺序对每个第一资源账户节点的入度进行排序,得到每个第一资源账户节点的入度排名;对于每个第一资源账户节点,将所有第三资源账户节点中与第一资源账户节点的入度排名的差值小于预设数量阈值的第三资源账户节点确定为第一资源账户节点对应的第二资源账户节点。第三资源账户节点为所有第一资源账户节点中除第一资源账户节点之外的其他第一资源账户节点。
也就是说,当从资源账户网络节点中筛选出第一资源账户节点集合之后,为了减少计算复杂度,对于一个第一资源账户节点,可以不用将第一资源账户节点集合中除该第一资源账户节点之外的其他每个第一资源账户节点均作为需要计算空间相似度的第二资源账户节点。
在本申请的一些实施例中,将所有flag=1的第一资源账户节点集合V构建二叉搜索树,然后对二叉搜索树进行先序遍历,根据每个第一资源账户节点的入度进行升序排序,得到每个第一资源账户节点的排名。
然后,可以设置一个预设数量阈值δ,将与第一资源账户节点的入度排名的差值小于预设数量阈值的其他第一资源账户节点确定为第一资源账户节点对应的第二资源账户节点。
如此,对于每个第一资源账户节点,最多需要计算与该节点的入度排名相邻的2δ个资源账户节点之间的相似度,可以大大减小计算时间和计算量,提高了数据处理效率。
以上介绍了带权层次图的构建过程,下面接着介绍步骤110~步骤130的具体实现方式。
在本申请的一些实施例中,由于带权层次图是基于具有空间结构相似性的资源账户节点进行构造的,即带权层次图可以层次化的衡量空间结构相似的两个资源账户节点的k邻接资源账户节点集合对应的结构的相似度,且第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边代表着这两个资源账户节点具有相似的空间结构,因此,通过以目标资源账户对应的资源账户节点在第M层对应的结构节点为起点,在带权层次图中进行随机游走,得到的结构节点序列能够更加精确地确定与目标资源账户节点具有空间结构相似的资源账户节点。
作为一个示例,M可以等于1。
在本申请的一些实施例中,步骤110包括:步骤1101和步骤1102。步骤1101,以目标结构节点为起点在带权层次图中进行每次有偏随机游走的过程中,对于每一个游走至的第一结构节点,基于与本次有偏随机游走预先关联的同层游走概率以及与第一结构节点连接的每个第二结构节点之间的边的权重,计算由第一结构节点分别游走至每个第二结构节点的概率;步骤1102,基于每个概率,在与第一结构节点连接的每个第二结构节点中,确定在本次有偏随机游走中下一个游走至的第一结构节点,直至重新游走至目标结构节点,得到本次有偏随机游走对应的结构点序列。
在本申请的实施例中,使用有偏随机游走在构造的带权层次图中进行结构节点序列采样。在进行有偏随机游走时需要确定是在当前层游走还是切换至其它层游走。如图7所示,当随机游走到结构节点uk时,下一步可能游走到uk+1,uk-1和vk。因此,需要计算游走至与结构节点uk连接的每个结构节点的概率,已确定下一步所要游走至的结构节点。
需要说明的是,在进行有偏随机游走的过程中,目标结构节点留在本层的概率,即同层游走概率为q,而跨层游走的概率为1-q。在每次进行随机游走时的同层游走概率可以不同,以得到不同的结构节点序列。
作为一个示例,结构节点uk即为目标结构节点在一次随机游走中所游走至的第一结构节点,则下一步可以游走到uk+1,uk-1和vk。即,uk+1,uk-1和vk均为第二结构节点。
在一些具体示例中,步骤1101包括:对于与第一结构节点位于同一层的每个第二结构节点,基于由第一结构节点指向第二结构节点的边的权重与第一结构节点对应的归一化因子的比值以及同层游走概率,确定由第一结构节点游走至第二结构节点的有偏游走概率;在第一结构节点位于带权层次图的第h层的情况下,对于带权层次图中第h层的一相邻层中与第一结构节点连接的第二结构节点,基于由第一结构节点指向第二结构节点的边的权重与第二权重总和的比值以及同层游走概率,确定由第一结构节点游走至第二结构节点的有偏游走概率。
其中,第二权重总和为由第一结构节点分别指向带权层次图中第h层的两个相邻层中与第一结构节点连接的第二结构节点的边的权重之和,h为小于N的整数。
在本申请的实施例中,在本次有偏随机游走过程中,对于与第一结构节点位于同一层的第二结构节点(例如vk),由第一结构节点分别游走至该第二结构节点的概率p1可以利用下面的表达式进行计算:
p1=p(uk,vk)*q (6)
其中,q为本有偏随机游走的同层游走概率。
其中,p(uk,vk)∈[0,1],Zk(u)为第k层的结构节点uk的归一化因子。
作为一个示例,Zk(u)为第k层中与uk连接的所有边的权重之和。
在本申请的实施例中,在有偏随机游走中的采样更倾向于选择与目标结构节点具有结构相似性的结构节点,因此选取的相似结构节点与其在带权层次图中的位置无关。
在本申请的实施例中,对于第k+1层中与第一结构节点连接的第二结构节点,由第一结构节点分别游走至该第二结构节点的概率p2可以利用下面的表达式进行计算:
p2=pk(uk,uk+1)*(1-q) (7)
其中,ω(uk,uk+1)+ω(uk,uk-1)为第二权重和。
在本申请的实施例中,对于第k-1层中与第一结构节点连接的第二结构节点,由第一结构节点分别游走至该第二结构节点的概率p3可以利用下面的表达式进行计算:
p3=pk(uk,uk-1)*(1-q) (9)
pk(uk,uk-1)=1-pk(uk,uk+1) (10)
在步骤1102中,在本次有偏随机游走中,将与第一结构节点对应的每个p1、p2和p3进行比较,得到最大的概率,则与最大概率对应的第二结构节点即为下一个要游走至的结构节点,即更新了第一结构节点,接着返回步骤1101,直至重新游走至目标结构节点,则可以得到与本次有偏随机游走对应的结构点序列。
作为一个示例,可预先设置有偏随机游走的次数。作为一个示例,参见图5,若目标结构节点为资源账户节点u在第1层对应的结构节点u1,若以结构节点u1为起点进行了三次有偏随机游走,则可以得到三个结构节点序列。例如三个结构节点序列分别为S1={v1,w1,w2,v2,u2},S2={w1,w0,v0,u0},S3={w1,v1,v0,u0}。
接着介绍步骤120的具体实现方式。在一些实施例中,步骤120包括:将至少一个结构节点序列的交集中的每个结构节点与资源账户节点网络中对应的资源账户节点,确定为与目标资源账户节点相似的资源账户节点。
在上述示例中,结构节点序列S1、S2和S3的交集为{w1},其中,w1对应的资源账户节点为w,则资源账户节点w与目标资源账户节点相似的资源账户节点。
在步骤130中,由于每个资源账户节点均具有各自预先对应的资源账户,因此可以将与目标资源账户节点相似的资源账户节点对应的资源账户,确定为与目标资源账户节点对应的目标资源账户相似的资源账户。
在本申请的实施例中,若目标资源账户有多个,则可以对每个目标资源账户对应的目标资源账户节点执行步骤110~步骤130,从而得到与每个目标资源账户相似的资源账户。
在一些实施例中,若给定的每个目标资源账户均为集资涉赌卡号,则最后得到的所有目标资源账户相似的资源账户的并集即为挖掘到的疑似集资涉赌卡号。
在本申请的另一些实施例中,若给定的每个目标资源账户均为已在社交平台认证的知名社交账户,则最后得到的所有目标资源账户相似的资源账户的并集即为挖掘到的疑似知名社交账户。
在本申请的实施例中,由于层数越高,领域越广,对于资源账户节点的空间相似性要求更高,因此资源账户节点间的相似度在不同的层次中是不同的。通过随机游走得到的结构节点序列对应的节点集的交集即为与目标资源账户节点具有空间相似的节点集。
在本申请的实施例中,本申请提供的资源账户确定方法可以进行单机实现,即在一台服务器上进行实现。
在本申请的实施例中,申请提供的资源账户确定方法可以进行分布式实现,对于筛选第一资源账户节点的步骤和计算每个第一资源账户节点和对应的每个第二资源账户节点的k阶结构距离的步骤可以先通过分布式方法划分资源账户节点子网络。然后由不同的服务器分别对不同的资源账户节点子网络中的节点进行第一资源账户节点筛选以及计算结构距离。最后整合分布式系统得出的结构距离,进行构建带权层次图以及进行疑似目标资源账户的搜索。
本申请提供的有偏游走方法,能够提升图在广度上的挖掘效果,根据业务需求对纵向深度进行选择,灵活性强。
本申请基于资源账户节点的结构相似性的相似结点挖掘,能够应用于精准营销、集资卡挖掘等应用场景,具有实用价值。并且本申请挖掘的相似资源账户节点携带结构化信息,具有较强的解释性和较好的拓展性。
图8是根据本申请提供的资源账户确定装置的一个实施例的结构示意图。如图8所示,本申请提供的资源账户确定装置800包括:
结构节点序列确定模块810,用于以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;目标结构节点为资源账户节点网络中的目标资源账户节点在带权层次图的第M层对应的结构节点;
资源账户节点确定模块820,用于基于至少一个结构节点序列,确定在资源账户节点网络中与目标资源账户节点相似的资源账户节点;
资源账户确定模块830,用于将与目标资源账户节点相似的资源账户节点对应的资源账户,确定为与目标资源账户节点对应的目标资源账户相似的资源账户;
其中,带权层次图具有N层,带权层次图的第k层包括资源账户节点网络中的第一资源账户节点对应的第k结构节点以及与第一资源账户节点空间结构相似的第二资源账户节点对应的第k结构节点;在第一资源账户节点和第二资源账户节点之间的第k阶结构距离大于第一预设距离阈值的情况下,第k层还包括第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边,带权层次图还包括N层中相邻两层中对应同一资源账户节点的两个结构节点之间的有向边,资源账户节点网络中的资源账户节点对应的第k结构节点用于表征资源账户节点的所有k邻接资源账户节点对应的空间结构;0≤k≤N,N为正整数,M为预设整数,0≤M≤N。
在本申请的实施例中,由于带权层次图可以层次化的衡量空间结构相似的两个资源账户节点的k邻接资源账户节点集合对应的结构的相似度,且第一资源账户节点对应的第k结构节点与第二资源账户节点对应的第k结构节点之间的无向边代表着这两个资源账户节点具有相似的空间结构,因此,通过以目标资源账户对应的资源账户节点在第M层对应的结构节点为起点,在带权层次图中进行随机游走,得到的结构节点序列能够更加精确地确定与目标资源账户节点具有空间结构相似的资源账户节点,提高确定与目标资源账户相似的资源账户的准确性。并且,由于资源账户之间的资源交互是有流向的,因此通过在带权层次图中进行有偏随机游走,能够提高在广度上对结构特征的挖掘效果,进一步提高确定与目标资源账户相似的资源账户的准确性。
在本申请的一些实施例中,结构节点序列确定模块810用于:
以目标结构节点为起点在带权层次图中进行每次有偏随机游走的过程中,对于每一个游走至的第一结构节点,基于与本次有偏随机游走预先关联的同层游走概率以及与第一结构节点连接的每个第二结构节点之间的边的权重,计算由第一结构节点分别游走至每个第二结构节点的概率;
基于每个概率,在与第一结构节点连接的每个第二结构节点中,确定在本次有偏随机游走中下一个游走至的第一结构节点,直至重新游走至目标结构节点,得到本次有偏随机游走对应的结构点序列。
在本申请的一些实施例中,结构节点序列确定模块810具体用于:
对于与第一结构节点位于同一层的每个第二结构节点,基于由第一结构节点指向第二结构节点的边的权重与第一结构节点对应的归一化因子的比值以及同层游走概率,确定由第一结构节点游走至第二结构节点的有偏游走概率;
在第一结构节点位于带权层次图的第h层的情况下,对于带权层次图中第h层的一相邻层中与第一结构节点连接的第二结构节点,基于由第一结构节点指向第二结构节点的边的权重与第二权重总和的比值以及同层游走概率,确定由第一结构节点游走至第二结构节点的有偏游走概率;
其中,第二权重总和为由第一结构节点分别指向带权层次图中第h层的两个相邻层中与第一结构节点连接的第二结构节点的边的权重之和,h为小于N的整数。
在本申请的一些实施例中,资源账户节点确定模块820:
将至少一个结构节点序列的交集中的每个结构节点与资源账户节点网络中对应的资源账户节点,确定为与目标资源账户节点相似的资源账户节点。
在本申请的一些实施例中,资源账户确定装置800还包括:
结构距离计算模块,用于对于资源账户节点网络中的每个第一资源账户节点,基于第一资源账户节点的i邻接资源账户节点集合与第一资源账户节点对应的第二资源账户节点的i邻接资源账户节点集合,以及第一资源账户节点和第二资源账户节点的第i-1阶结构距离,计算第一资源账户节点和第二资源账户节点的第i阶结构距离;其中,i=0,第一资源账户节点和第二资源账户节点的第-1阶结构距离为第一预设值;将i加1得到更新后的i,直至得到第一资源账户节点和第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离;
带权层次图构建模块,用于对于每个第一资源账户节点,基于第一资源账户节点和第一资源账户节点对应的第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离,构建带权层次图。
在本申请的一些实施例中,结构距离计算模块包括:
资源账户序列确定单元,用于按照第一资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到第一资源账户节点对应的第i个资源账户节点序列,并按照第二资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到第二资源账户节点对应的第i个资源账户序列,资源账户节点的入度为与资源账户节点直接连接、且指向资源账户节点的边的个数;
第一距离计算单元,用于计算第一资源账户节点对应的第i个资源账户节点序列和第二资源账户节点对应的第i个资源账户节点序列之间的第一距离;
结构距离计算单元,用于将第一资源账户节点和第二资源账户节点的第i-1阶结构距离和第一距离的和值,确定为第一资源账户节点和第二资源账户节点的第i阶结构距离,i为整数。
在本申请的一些实施例中,第一距离计算单元,用于:
基于第一比值与第二预设值之间的差值以及第一参数,计算第一资源账户节点对应的第i个资源账户节点序列和第二资源账户节点对应的第i个资源账户节点序列之间的第一距离;
其中,第一比值为第二参数与第三参数的比值,第一参数为第四参数和第五参数中的最大值,第四参数为第一资源账户节点的i邻接资源账户节点集合中满足第一入度条件的所有资源账户节点的入度中出现次数最多的入度的出现次数,第五参数为第二资源账户节点的i邻接资源账户节点集合中的满足第一入度条件所有资源账户节点的入度中出现次数最多的入度的出现次数,第二参数和第三参数基于第六参数和第七参数确定,第六参数为第一资源账户节点的i邻接资源账户节点集合中的满足第一入度条件的所有资源账户节点的入度中的最大入度,第七参数为第二资源账户节点的i邻接资源账户节点集合中的满足第一入度条件的所有资源账户节点的入度中的最大入度。
在本申请的一些实施例中,第一入度条件包括资源账户节点的入度大于预设入度阈值。
在本申请的一些实施例中,带权层次图构建模块包括:
第一构建单元,用于对于每个第一资源账户节点以及与第一资源账户节点空间结构相似的第二资源账户节点,构建第一资源账户节点对应的第j结构节点和第二资源账户节点对应的第j结构节点,在第一资源账户节点和第二资源账户节点的第j阶结构距离大于第一预设距离阈值的情况下,构建第一资源账户节点对应的第j结构节点与第二资源账户节点对应的第j结构节点之间的第一边,并基于第一资源账户节点和第二资源账户节点的第j阶结构距离,计算第一边对应的权重,形成第j层,j=0;将j加1得到更新后的j,直至构建第0层至第N层中的每一层;
第二构建单元,用于对于第k层中的每个目标结构节点,构建由目标结构节点指向目标结构节点在第k层的每个相邻层对应的结构节点的第二边,并根据目标结构节点的每个第一边的权重,计算每个第二边对应的权重,以构成带权层次图;目标结构节点为第k层中的任一结构节点;
其中,与第一资源账户节点空间结构相似的第二资源账户节点为第一资源账户节点对应的第二资源账户节点中满足预设距离条件的第二资源账户节点,预设距离条件包括第一资源账户节点与第二资源账户节点的第0阶结构距离至第N阶结构距离中存在至少一个结构距离大于第一预设距离阈值。
在本申请的一些实施例中,第一构建单元,用于:
将n个自然常数相乘的乘积确定为第一边对应的权重,n由第一资源账户节点和第二资源账户节点的第j阶结构距离确定。
在本申请的一些实施例中,第二构建单元,用于:
若存在第k+1层,则基于自然常数和第一数量的和值确定目标结构节点指向目标结构节点在第k+1层对应的结构节点的第二边的权重;
若存在第k-1层,将目标结构节点指向目标结构节点在第k-1层对应的结构节点的第二边的权重确定为第三预设值;
第一数量为与目标结构节点连接的所有第一边的权重中大于平均权重的个数,平均权重为与目标结构节点连接的所有第一边对应的权重的平均值。
在本申请的一些实施例中,第一资源账户节点和第二资源账户节点的第0阶结构距离至第N阶结构距离中每相邻两阶的结构距离差值大于或等于第二预设距离阈值。
在本申请的一些实施例中,资源账户确定装置800还包括:
统计模块,用于统计资源账户节点网络中每个资源账户节点的出度和入度;
第一确定模块,用于将入度大于出度的资源账户节点确定为第一资源账户节点;
其中,资源账户节点网络中资源账户节点的入度为与资源账户节点直接连接、且背离资源账户节点的边的个数,资源账户节点网络中资源账户节点的入度为与资源账户节点直接连接、且指向资源账户节点的边的个数。
在本申请的一些实施例中,资源账户确定装置800还包括:
排序模块,用于按照从低到高的顺序对每个第一资源账户节点的入度进行排序,得到每个第一资源账户节点的入度排名;
第二确定模块,用于对于每个第一资源账户节点,将所有第三资源账户节点中与第一资源账户节点的入度排名的差值小于预设数量阈值的第三资源账户节点确定为第一资源账户节点对应的第二资源账户节点,第三资源账户节点为所有第一资源账户节点中除第一资源账户节点之外的其他第一资源账户节点。
根据本申请实施例的资源账户确定装置800的其他细节与以上结合图1~图7描述的根据本申请实施例的资源账户确定方法类似,在此不再赘述。
结合图1至图8描述的根据本申请实施例的资源账户确定方法和装置可以由资源账户确定设备来实现。图9是根据本申请提供的资源账户确定设备的一个实施例的结构示意图。
资源账户确定设备900可以包括处理器901以及存储有计算机程序指令的存储器902。
具体地,上述处理器901可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器902可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器902可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器902可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器902可在资源账户确定设备900的内部或外部。在特定实施例中,存储器902是非易失性固态存储器。
在特定实施例中,存储器902包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的资源账户确定的方法所描述的操作。
处理器901通过读取并执行存储器902中存储的计算机程序指令,以实现上述实施例中的任意一种资源账户确定方法。
在一个示例中,资源账户确定设备还可包括通信接口903和总线910。其中,如图9所示,处理器901、存储器902、通信接口903通过总线910连接并完成相互间的通信。
通信接口903,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线910包括硬件、软件或两者,将资源账户确定设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线910可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的资源账户确定方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种资源账户确定方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (13)
1.一种资源账户确定方法,其特征在于,所述方法包括:
以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在所述带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;所述目标结构节点为资源账户节点网络中的目标资源账户节点在所述带权层次图的第M层对应的结构节点;
将所述至少一个结构节点序列的交集中的每个结构节点与所述资源账户节点网络中对应的资源账户节点,确定为与所述目标资源账户节点相似的资源账户节点;
将与所述目标资源账户节点相似的资源账户节点对应的资源账户,确定为与所述目标资源账户节点对应的目标资源账户相似的资源账户;
其中,所述以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在所述带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列,包括:
以目标结构节点为起点在所述带权层次图中进行每次有偏随机游走的过程中,对于每一个游走至的第一结构节点,基于与本次有偏随机游走预先关联的同层游走概率以及与所述第一结构节点连接的每个第二结构节点之间的边的权重,计算由所述第一结构节点分别游走至每个所述第二结构节点的概率;
基于所述由所述第一结构节点分别游走至每个所述第二结构节点的概率,在与所述第一结构节点连接的每个所述第二结构节点中,确定在所述本次有偏随机游走中下一个游走至的第一结构节点,直至重新游走至所述目标结构节点,得到所述本次有偏随机游走对应的结构点序列;
其中,所述以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在所述带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列之前,所述方法还包括:
对于所述资源账户节点网络中的每个第一资源账户节点,按照所述第一资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到所述第一资源账户节点对应的第i个资源账户节点序列,并按照与所述第一资源账户节点对应的第二资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到所述第二资源账户节点对应的第i个资源账户序列,所述资源账户节点的入度为与所述资源账户节点直接连接、且指向所述资源账户节点的边的个数;
计算所述第一资源账户节点对应的第i个资源账户节点序列和所述第二资源账户节点对应的第i个资源账户节点序列之间的第一距离;
将所述第一资源账户节点和所述第二资源账户节点的第i-1阶结构距离和所述第一距离的和值,确定为所述第一资源账户节点和所述第二资源账户节点的第i阶结构距离,i为整数;其中,i=0,所述第一资源账户节点和所述第二资源账户节点的第-1阶结构距离为第一预设值;
将i加1得到更新后的i,直至得到所述第一资源账户节点和所述第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离;
对于每个所述第一资源账户节点,基于所述第一资源账户节点和所述第一资源账户节点对应的第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离,构建所述带权层次图;
其中,所述带权层次图具有N层,所述带权层次图的第k层包括所述资源账户节点网络中的第一资源账户节点对应的第k结构节点以及与所述第一资源账户节点空间结构相似的第二资源账户节点对应的第k结构节点;在所述第一资源账户节点和所述第二资源账户节点之间的第k阶结构距离大于第一预设距离阈值的情况下,所述第k层还包括所述第一资源账户节点对应的第k结构节点与所述第二资源账户节点对应的第k结构节点之间的无向边,所述带权层次图还包括所述N层中相邻两层中对应同一资源账户节点的两个结构节点之间的有向边,所述资源账户节点网络中的资源账户节点对应的第k结构节点用于表征所述资源账户节点的所有k邻接资源账户节点对应的空间结构;0≤k≤N,N为正整数,M为预设整数,0≤M≤N。
2.根据权利要求1所述的方法,其特征在于,所述基于与本次有偏随机游走预先关联的同层游走概率以及与所述第一结构节点连接的每个第二结构节点之间的边的权重,计算由所述第一结构节点分别游走至每个所述第二结构节点的概率,包括:
对于与所述第一结构节点位于同一层的每个第二结构节点,基于由所述第一结构节点指向所述第二结构节点的边的权重与所述第一结构节点对应的归一化因子的比值以及所述同层游走概率,确定由所述第一结构节点游走至所述第二结构节点的有偏游走概率;
在所述第一结构节点位于所述带权层次图的第h层的情况下,对于所述带权层次图中第h层的一相邻层中与所述第一结构节点连接的第二结构节点,基于由所述第一结构节点指向所述第二结构节点的边的权重与第二权重总和的比值以及所述同层游走概率,确定由所述第一结构节点游走至所述第二结构节点的有偏游走概率;
其中,所述第二权重总和为由所述第一结构节点分别指向所述带权层次图中第h层的两个相邻层中与所述第一结构节点连接的第二结构节点的边的权重之和,h为小于N的整数。
3.根据权利要求1所述的方法,其特征在于,所述计算所述第一资源账户节点对应的第i个资源账户节点序列和所述第二资源账户节点对应的第i个资源账户节点序列之间的第一距离,包括:
基于第一比值与第二预设值之间的差值以及第一参数,计算所述第一资源账户节点对应的第i个资源账户节点序列和所述第二资源账户节点对应的第i个资源账户节点序列之间的第一距离;
其中,所述第一比值为第二参数与第三参数的比值,所述第一参数为第四参数和第五参数中的最大值,所述第四参数为所述第一资源账户节点的i邻接资源账户节点集合中满足第一入度条件的所有资源账户节点的入度中出现次数最多的入度的出现次数,所述第五参数为所述第二资源账户节点的i邻接资源账户节点集合中的满足所述第一入度条件所有资源账户节点的入度中出现次数最多的入度的出现次数,所述第二参数和所述第三参数基于第六参数和第七参数确定,所述第六参数为所述第一资源账户节点的i邻接资源账户节点集合中的满足所述第一入度条件的所有资源账户节点的入度中的最大入度,所述第七参数为所述第二资源账户节点的i邻接资源账户节点集合中的满足所述第一入度条件的所有资源账户节点的入度中的最大入度。
4.根据权利要求3所述的方法,其特征在于,所述第一入度条件包括资源账户节点的入度大于预设入度阈值。
5.根据权利要求1所述的方法,其特征在于,所述对于每个所述第一资源账户节点,基于所述第一资源账户节点和所述第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离,构建所述带权层次图,包括:
对于每个所述第一资源账户节点以及与所述第一资源账户节点空间结构相似的第二资源账户节点,构建所述第一资源账户节点对应的第j结构节点和所述第二资源账户节点对应的第j结构节点,在所述第一资源账户节点和所述第二资源账户节点的第j阶结构距离大于所述第一预设距离阈值的情况下,构建所述第一资源账户节点对应的第j结构节点与所述第二资源账户节点对应的第j结构节点之间的第一边,并基于所述第一资源账户节点和所述第二资源账户节点的第j阶结构距离,计算所述第一边对应的权重,形成第j层,j=0;
将j加1得到更新后的j,直至构建第0层至第N层中的每一层;
对于第k层中的每个目标结构节点,构建由所述目标结构节点指向所述目标结构节点在第k层的每个相邻层对应的结构节点的第二边,并根据所述目标结构节点的每个所述第一边的权重,计算每个所述第二边对应的权重,以构成所述带权层次图;所述目标结构节点为所述第k层中的任一结构节点;
其中,与所述第一资源账户节点空间结构相似的第二资源账户节点为所述第一资源账户节点对应的第二资源账户节点中满足预设距离条件的第二资源账户节点,所述预设距离条件包括所述第一资源账户节点与所述第二资源账户节点的第0阶结构距离至第N阶结构距离中存在至少一个结构距离大于所述第一预设距离阈值。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一资源账户节点和所述第二资源账户节点的第j阶结构距离,计算所述第一边对应的权重,包括:
将n个自然常数相乘的乘积确定为所述第一边对应的权重,n由所述第一资源账户节点和所述第二资源账户节点的第j阶结构距离确定。
7.根据权利要求5所述的方法,其特征在于,所述根据所述目标结构节点的每个所述第一边的权重,计算每个所述第二边对应的权重,包括:
若存在第k+1层,则基于自然常数和第一数量的和值确定所述目标结构节点指向所述目标结构节点在第k+1层对应的结构节点的第二边的权重;
若存在第k-1层,将所述目标结构节点指向所述目标结构节点在所述第k-1层对应的结构节点的第二边的权重确定为第三预设值;
所述第一数量为与所述目标结构节点连接的所有第一边的权重中大于平均权重的个数,所述平均权重为与所述目标结构节点连接的所有第一边对应的权重的平均值。
8.根据权利要求5所述的方法,其特征在于,所述第一资源账户节点和所述第二资源账户节点的第0阶结构距离至第N阶结构距离中每相邻两阶的结构距离差值大于或等于第二预设距离阈值。
9.根据权利要求1所述的方法,其特征在于,所述计算所述第一资源账户节点和所述第二资源账户节点的第k阶结构距离值之前,所述方法还包括:
统计所述资源账户节点网络中每个资源账户节点的出度和入度;
将入度大于出度的资源账户节点确定为所述第一资源账户节点;
其中,所述资源账户节点网络中资源账户节点的入度为与所述资源账户节点直接连接、且背离所述资源账户节点的边的个数,所述资源账户节点网络中资源账户节点的入度为与所述资源账户节点直接连接、且指向所述资源账户节点的边的个数。
10.根据权利要求9所述的方法,其特征在于,所述将入度大于出度的资源账户节点确定为所述第一资源账户节之后和所述计算所述第一资源账户节点和所述第二资源账户节点的第k阶结构距离之前,所述方法还包括:
按照从低到高的顺序对每个所述第一资源账户节点的入度进行排序,得到每个所述第一资源账户节点的入度排名;
对于每个所述第一资源账户节点,将所有第三资源账户节点中与所述第一资源账户节点的入度排名的差值小于预设数量阈值的第三资源账户节点确定为所述第一资源账户节点对应的第二资源账户节点,所述第三资源账户节点为所有第一资源账户节点中除所述第一资源账户节点之外的其他第一资源账户节点。
11.一种资源账户确定装置,其特征在于,所述装置包括:
结构节点序列确定模块,用于以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在所述带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列;所述目标结构节点为资源账户节点网络中的目标资源账户节点在所述带权层次图的第M层对应的结构节点;
资源账户节点确定模块,用于将所述至少一个结构节点序列的交集中的每个结构节点与所述资源账户节点网络中对应的资源账户节点,确定为与所述目标资源账户节点相似的资源账户节点;
资源账户确定模块,用于将与所述目标资源账户节点相似的资源账户节点对应的资源账户,确定为与所述目标资源账户节点对应的目标资源账户相似的资源账户;
其中,所述以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在所述带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列,包括:
以目标结构节点为起点在所述带权层次图中进行每次有偏随机游走的过程中,对于每一个游走至的第一结构节点,基于与本次有偏随机游走预先关联的同层游走概率以及与所述第一结构节点连接的每个第二结构节点之间的边的权重,计算由所述第一结构节点分别游走至每个所述第二结构节点的概率;
基于所述由所述第一结构节点分别游走至每个所述第二结构节点的概率,在与所述第一结构节点连接的每个所述第二结构节点中,确定在所述本次有偏随机游走中下一个游走至的第一结构节点,直至重新游走至所述目标结构节点,得到所述本次有偏随机游走对应的结构点序列;
所述装置还包括:
结构距离计算模块,包括:
资源账户序列确定单元,用于在所述以目标结构节点为起点,基于预先构建的带权层次图中结构节点的边的权重,在所述带权层次图中进行至少一次有偏随机游走,得到至少一个结构节点序列之前,对于所述资源账户节点网络中的每个第一资源账户节点,按照所述第一资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到所述第一资源账户节点对应的第i个资源账户节点序列,并按照与所述第一资源账户节点对应的第二资源账户节点的i邻接资源账户节点集合中的每个资源账户节点的入度进行有序排列,得到所述第二资源账户节点对应的第i个资源账户序列,所述资源账户节点的入度为与所述资源账户节点直接连接、且指向所述资源账户节点的边的个数;
第一距离计算单元,用于计算所述第一资源账户节点对应的第i个资源账户节点序列和所述第二资源账户节点对应的第i个资源账户节点序列之间的第一距离,
结构距离计算单元,用于将所述第一资源账户节点和所述第二资源账户节点的第i-1阶结构距离和所述第一距离的和值,确定为所述第一资源账户节点和所述第二资源账户节点的第i阶结构距离,i为整数;其中,i=0,所述第一资源账户节点和所述第二资源账户节点的第-1阶结构距离为第一预设值;将i加1得到更新后的i,直至得到所述第一资源账户节点和所述第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离;
带权层次图构建模块,用于对于每个所述第一资源账户节点,基于所述第一资源账户节点和所述第一资源账户节点对应的第二资源账户节点的第0阶结构距离至第N阶结构距离中的每个结构距离,构建所述带权层次图;
其中,所述带权层次图具有N层,所述带权层次图的第k层包括所述资源账户节点网络中的第一资源账户节点对应的第k结构节点以及与所述第一资源账户节点空间结构相似的第二资源账户节点对应的第k结构节点;在所述第一资源账户节点和所述第二资源账户节点之间的第k阶结构距离大于第一预设距离阈值的情况下,所述第k层还包括所述第一资源账户节点对应的第k结构节点与所述第二资源账户节点对应的第k结构节点之间的无向边,所述带权层次图还包括所述N层中相邻两层中对应同一资源账户节点的两个结构节点之间的有向边,所述资源账户节点网络中的资源账户节点对应的第k结构节点用于表征所述资源账户节点的所有k邻接资源账户节点对应的空间结构;0≤k≤N,N为正整数,M为预设整数,0≤M≤N。
12.一种资源账户确定设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-10任意一项所述的资源账户确定方法。
13.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-10任意一项所述的资源账户确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011046324.0A CN112232834B (zh) | 2020-09-29 | 2020-09-29 | 资源账户确定方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011046324.0A CN112232834B (zh) | 2020-09-29 | 2020-09-29 | 资源账户确定方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112232834A CN112232834A (zh) | 2021-01-15 |
CN112232834B true CN112232834B (zh) | 2024-04-26 |
Family
ID=74120734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011046324.0A Active CN112232834B (zh) | 2020-09-29 | 2020-09-29 | 资源账户确定方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112232834B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105741175A (zh) * | 2016-01-27 | 2016-07-06 | 电子科技大学 | 一种对在线社交网络中账户进行关联的方法 |
CN109034960A (zh) * | 2018-07-12 | 2018-12-18 | 电子科技大学 | 一种基于用户节点嵌入的多属性推断的方法 |
CN109492027A (zh) * | 2018-11-05 | 2019-03-19 | 南京邮电大学 | 一种基于弱可信数据的跨社群潜在人物关系分析方法 |
CN110097125A (zh) * | 2019-05-07 | 2019-08-06 | 郑州轻工业学院 | 一种基于嵌入表示的跨网络账户关联方法 |
CN110166287A (zh) * | 2019-05-05 | 2019-08-23 | 南京邮电大学 | 一种基于带权超图的同一用户识别方法 |
CN110189167A (zh) * | 2019-05-20 | 2019-08-30 | 华南理工大学 | 一种基于异构图嵌入的移动广告欺诈检测方法 |
US10469504B1 (en) * | 2017-09-08 | 2019-11-05 | Stripe, Inc. | Systems and methods for using one or more networks to assess a metric about an entity |
CN110798467A (zh) * | 2019-10-30 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 目标对象识别方法、装置、计算机设备及存储介质 |
CN110807103A (zh) * | 2019-10-18 | 2020-02-18 | 中国银联股份有限公司 | 知识图谱构建方法、装置、电子设备及存储介质 |
US10771572B1 (en) * | 2014-04-30 | 2020-09-08 | Twitter, Inc. | Method and system for implementing circle of trust in a social network |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9129296B2 (en) * | 2012-10-12 | 2015-09-08 | Adobe Systems Incorporated | Augmenting recommendation algorithms based on similarity between electronic content |
US20150188941A1 (en) * | 2013-12-26 | 2015-07-02 | Telefonica Digital Espana, S.L.U. | Method and system for predicting victim users and detecting fake user accounts in online social networks |
CN106469413B (zh) * | 2015-08-20 | 2021-08-03 | 深圳市腾讯计算机系统有限公司 | 一种虚拟资源的数据处理方法及装置 |
-
2020
- 2020-09-29 CN CN202011046324.0A patent/CN112232834B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10771572B1 (en) * | 2014-04-30 | 2020-09-08 | Twitter, Inc. | Method and system for implementing circle of trust in a social network |
CN105741175A (zh) * | 2016-01-27 | 2016-07-06 | 电子科技大学 | 一种对在线社交网络中账户进行关联的方法 |
US10469504B1 (en) * | 2017-09-08 | 2019-11-05 | Stripe, Inc. | Systems and methods for using one or more networks to assess a metric about an entity |
CN109034960A (zh) * | 2018-07-12 | 2018-12-18 | 电子科技大学 | 一种基于用户节点嵌入的多属性推断的方法 |
CN109492027A (zh) * | 2018-11-05 | 2019-03-19 | 南京邮电大学 | 一种基于弱可信数据的跨社群潜在人物关系分析方法 |
CN110166287A (zh) * | 2019-05-05 | 2019-08-23 | 南京邮电大学 | 一种基于带权超图的同一用户识别方法 |
CN110097125A (zh) * | 2019-05-07 | 2019-08-06 | 郑州轻工业学院 | 一种基于嵌入表示的跨网络账户关联方法 |
CN110189167A (zh) * | 2019-05-20 | 2019-08-30 | 华南理工大学 | 一种基于异构图嵌入的移动广告欺诈检测方法 |
CN110807103A (zh) * | 2019-10-18 | 2020-02-18 | 中国银联股份有限公司 | 知识图谱构建方法、装置、电子设备及存储介质 |
CN110798467A (zh) * | 2019-10-30 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 目标对象识别方法、装置、计算机设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
A comprehensive algorithm for evaluating node influences in Social networks based on preference analysis and random walk;chengying Mao;Complexity;第1-16页 * |
跨社交媒体的账户匹配方法;杨立波;中国优秀硕士论文电子期刊;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112232834A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110390396B (zh) | 用于估计观测变量之间的因果关系的方法、装置和系统 | |
CN110009174A (zh) | 风险识别模型训练方法、装置及服务器 | |
WO2021232585A1 (zh) | 基于人工智能的定位数据处理方法及相关设备 | |
CN104679818A (zh) | 一种视频关键帧提取方法及系统 | |
CN103902597A (zh) | 确定目标关键词所对应的搜索相关性类别的方法和设备 | |
CN110706015B (zh) | 一种面向广告点击率预测的特征选取方法 | |
CN106767851A (zh) | 将定位系统采集到的轨迹点匹配到地图的方法及其装置 | |
CN111027743A (zh) | 基于分层路网的od最优路径搜索方法及装置 | |
CN114491529A (zh) | 基于多模态神经网络的安卓恶意应用程序识别方法 | |
CN110968564A (zh) | 一种数据处理方法及数据状态预测模型的训练方法 | |
CN116150125A (zh) | 结构化数据生成模型的训练方法、装置、设备及存储介质 | |
CN112232834B (zh) | 资源账户确定方法、装置、设备和介质 | |
CN117077018B (zh) | 基于机器学习的数据处理方法、装置及存储介质 | |
Shafique et al. | Recommending most popular travel path within a region of interest from historical trajectory data | |
Ahani et al. | A feature weighting and selection method for improving the homogeneity of regions in regionalization of watersheds | |
CN117010373A (zh) | 一种电力设备资产管理数据所属类别和组的推荐方法 | |
CN114003648B (zh) | 风险交易团伙的识别方法、装置、电子设备与存储介质 | |
Sureshkumar et al. | An efficient underground water prediction using optimal deep neural network | |
CN114090643A (zh) | 招聘信息推荐方法、装置、设备及存储介质 | |
CN115935620A (zh) | 仿真测试场景推荐方法、装置、存储介质及计算机设备 | |
CN112015937B (zh) | 一种图片地理定位方法及系统 | |
Wang et al. | FCM algorithm and index CS for the signal sorting of radiant points | |
CN115203552A (zh) | 基于深度学习模型的地图兴趣点推荐方法及系统 | |
CN114647751A (zh) | 图像检索方法、模型训练方法、装置、设备、介质及产品 | |
CN114202418A (zh) | 信息处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |