CN111461346A - 一种网络节点表征方法、装置和设备 - Google Patents
一种网络节点表征方法、装置和设备 Download PDFInfo
- Publication number
- CN111461346A CN111461346A CN202010249020.8A CN202010249020A CN111461346A CN 111461346 A CN111461346 A CN 111461346A CN 202010249020 A CN202010249020 A CN 202010249020A CN 111461346 A CN111461346 A CN 111461346A
- Authority
- CN
- China
- Prior art keywords
- node
- sequences
- nodes
- user
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例公开了一种网络节点表征方法、装置和设备,其中,网络节点表征方法可在获取待表征的目标网络之后,基于目标网络中节点行为的发生时间和方向,构建多个节点序列,然后将所述多个节点序列作为文本输入预设自然语言处理模型,即可得到所述多个节点序列中的节点的表征向量。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种网络节点表征方法、装置和设备。
背景技术
在机器学习任务中,原始数据通常是高维且冗余复杂的,例如图片、视频、语言文字和音频等,如何从原始数据中提取低维特征是机器学习的首要任务。从原始数据中人工手动提取特征是一种比较有效的特征提取方法,却存在工作量大、耗时长、困难多、成本高以及对专业知识的依赖度大等缺陷。为了克服这些缺陷,特征学习被开发出来,表征学习就是其中之一。
表征学习的目标不是通过学习原始数据预测某个观察结果,而是学习数据的底层结构,从而可以分析出原始数据的其他特征。表征学习允许计算机使用特征的同时,学习如何提取特征,学习如何学习。正因为具备这些能力,表征学习日渐成为机器学习行业中的研究热点。
网络是一种图(Graph)结构的数据,相比于图片、视频等数据更复杂,比如社交网络,手动提取特征显然是不切实际的,须通过表征学习得到网络节点在低维空间的向量表示。但是当前的网络表征学习方法对网络节点的表征效果不理想。
发明内容
本说明书实施例提供了一种网络节点表征方法、装置和设备,以提升网络节点的表征效果。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种网络节点表征方法,包括:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
第二方面,提出了一种网络节点表征方法,包括:
获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
第三方面,提出了一种网络节点表征装置,包括:
第一获取模块,用于获取待表征的目标网络;
第一构建模块,用于基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,一个节点序列中至少包含两个节点;
第一表征模块,用于将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
第四方面,提出了一种网络节点表征装置,包括:
第二获取模块,用于获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
第二构建模块,用于基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
第二表征模块,用于将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
第五方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
第六方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
第七方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
第八方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
由以上本说明书实施例提供的技术方案可见,本说明书实施例提供的方案至少具备如下一种技术效果:将网络节点的表征问题抽象为节点序列表征问题,并基于节点行为的发生时间和方向构建节点序列,使得构建出的序列更加符合网络环境中真实的行为序列,此外,将这样的节点序列作为文本输入预设自然语言处理模型,可把节点序列的表征问题又变为文本的表征问题,因此最终得到的节点的表征向量的表征能力更强,从而提升网络节点的表征效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本说明书实施例提供的一种网络节点表征方法的流程示意图。
图2是本说明书实施例提供的一种待表征的目标网络示意图。
图3是本说明书实施例采用的一种自然语言处理模型的原理示意图。
图4是本说明书实施例提供的另一种网络节点表征方法的流程示意图。
图5是本说明书实施例提供的一种电子设备的结构示意图。
图6是本说明书实施例提供的一种网络节点表征装置的结构示意图。
图7是本说明书实施例提供的另一种网络节点表征装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了提升网络节点的表征效果,本说明书实施例提供一种网络节点表征方法和装置。本说明书实施例提供的方法及装置可以由电子设备执行,例如终端设备或服务端设备。换言之,所述方法可以由安装在终端设备或服务端设备的软件或硬件来执行。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述终端设备包括但不限于:智能手机、个人电脑(personal computer,PC)、笔记本电脑、平板电脑、电子阅读器、网络电视、可穿戴设备等智能终端设备中的任一种。
下面先对本说明书实施例提供的一种网络节点表征方法进行说明。
图1是本说明书的一个实施例提供的一种网络节点表征方法的实现流程示意图。如图1所示,该方法可以包括:
步骤102、获取待表征的目标网络。
待表征的目标网络可以是用图(Graph)这种数据结构表示的任意网络,例如,社交网络、互联网等,其中,社交网络可以是社交平台上的用户之间形成的社交网络,也可以是电子支付平台上的用户之间形成的社交网络。图,是一种将数据中的实体以及实体之间的关系,分别抽象成节点和节点间的边的数据结构。在社交网络中,图的一个节点表示一个用户,图的边标识用户之间的互联关系。用向量的数据形式表示网络结构或网络中的节点即为网络表征学习。
作为一个例子,可以从本地或服务端读取已构建好的目标网络。
步骤104、基于目标网络中节点行为的发生时间和方向,构建多个节点序列。其中,所构建的一个节点序列中至少包含两个节点。
在一个真实的网络中,节点行为通常是有时序和方向的,以电子支付平台用户形成社交网络为例,一个用户向另一个用户转账,一个用户点击另一个用户等节点行为,都是有时间戳和方向性的,因此可以按照节点行为的发生时间和方向构建节点序列。利用这种方式构建的节点序列更加符合网络环境中真实的行为序列,因此更能提升网络节点表征的效果。
在一般的网络中,节点行为包括但不限于下述一种或多种:一个节点点击另一个节点的行为,一个节点向另一个节点转移资源的行为,以及一个节点向另一个节点发送信息的行为。当目标网络为社交网络时,节点行为包括但不限于下述一种或多种:一个用户点击另一个用户的行为,一个用户关注另一用户的行为,一个用户对另一用户发布的信息进行点赞的行为、一个用户对另一用户发布的信息进行评论的行为、一个用户向另一个用户转账的行为,以及一个用户向另一个用户发送信息的行为,等等。
基于目标网络中节点行为的发生时间和方向,构建多个节点序列的方式可以有多种,下面列举三种。
第一种方式
一个节点序列中的节点不受节点行为发生时间之间的时间间隔的约束,具体的,上述步骤104可包括:按照目标网络中节点行为发生时间的先后及节点行为的方向,将目标网络中的多个节点按序排列得到一个节点序列,在该节点序列中,第i个节点的节点行为指向第i+1个节点,且第i个节点指向第i+1个节点的节点行为发生时间早于第i+1个节点指向第i+2个节点的节点行为发生时间,i为大于0的整数,i=1,2,...,N-2,N为该节点序列中的节点总数。
图2示出了目标网络的一种结构示意图,假设目标网络为社交网络,其中的节点表示用户。那么,如果用户A在某一天的10:11向用户B转账(用户A发生了指向用户B的行为),用户B在同一天的10:12向用户E转账(用户B发生了指向用户E的行为),以及用户E在同一天的10:13向用户G转账(用户E发生了指向用户G的行为),则可构建出一个包含用户A、用户B、用户E和用户G这四个节点的序列,该序列可以表示为:{A,B,E,G},不难看出,在序列{nA,nB,nE,nG}中,节点是按照节点行为发生时间的先后以及节点行为的方向排列的。
在节点数量众多的目标网络中,步骤104构建得到的节点序列可以表示为:Vi={n1,n2,n3,...},其中,i表示节点序列的编号,其中,n为node(节点)的缩写。
第二种方式
是否将一个节点加入一个节点序列中,除了发生了指向该节点的节点行为外,还受该节点自身在预设时段内的两次相邻节点行为间的指定时间间隔的约束,例如,在社交网络中,是否将一个用户加入一个节点序列中,还受该用户在过去1个月内的两次相邻转账行为间的指定时间间隔的约束,其中,指定时间间隔包括但不限于节点的两次相邻节点行为间的平均时间间隔、最小时间间隔和最大时间间隔中的一种。
一般情况下,由于平均时间间隔更能反映一个节点的节点行为的总体情况,因此,可选地,上述指定时间间隔为平均时间间隔,相应的,上述步骤104可包括:先确定目标网络中各节点的两次时序相邻行为之间的指定时间间隔Ti,其中T表示时间,i表示第i个节点;然后基于目标网络中各节点行为的发生时间和方向,以及各节点的两次时序相邻行为之间的指定时间间隔,构建多个节点序列,也即以Ti为约束,基于目标网络中节点行为的发生时间和方向,构建多个节点序列。
更为具体的,以Ti为约束,基于目标网络中节点行为的发生时间和方向,构建多个节点序列,可包括:按照目标网络中节点行为发生时间的先后及节点行为的方向,将目标网络中满足第一预设条件的多个节点按序排列得到一个节点序列,在该节点序列中,第i个节点的节点行为指向第i+1个节点,且第i个节点指向第i+1个节点的节点行为发生时间早于第i+1个节点指向第i+2个节点的节点行为发生时间,同样的,i为大于0的整数,i=1,2,...,N-2,N为该节点序列中的节点总数。其中,上述第一预设条件可以是同一节点序列中不同节点的Ti(两次时序相邻行为之间的指定时间间隔)在同一预设范围之内,该预设范围可以灵活设置,例如可以设置为在1小时、5小时、1天,等等。
同样以图2为例,假设:目标网络为社交网络,网络中的节点表示用户,用户A、用户B、用户C、用户D、用户E、用户F、用户G和用户H的Ti分别为:1h、1h、2h、2h、1h、12h、1h和2h,上述预设范围设置为1h。那么,如果用户A在某一天的10:11向用户B转账(用户A发生了指向用户B的行为),用户B在同一天的10:12向用户E转账(用户B发生了指向用户E的行为),用户E在同一天的10:13向用户G转账(用户E发生了指向用户G的行为),以及用户G在一周后的同一天的10:14向用户F转账(用户G发生了指向用户F的行为),则由于用户F的Ti=12h,不在预设范围(1h)之内,因此,可构建出序列{nA,nB,nE,nG},但是不能构建出序列{nA,nB,nE,nG,nF}。
可选地,利用第二种方式构建的不同节点序列中节点的两次时序相邻行为之间的平均时间间隔可以在同一预设范围内,也可以在不同预设范围内。也就是说,不同节点序列中节点的Ti(两次时序相邻行为之间的指定时间间隔)需要满足的第一预设条件可以相同,也可以不同。
第三种方式
是否将一个节点加入一个节点序列中,除了发生了指向该节点的节点行为外,还受节点行为发生时间之间的时间间隔的约束,具体的,步骤104可包括:按照目标网络中节点行为发生时间的先后及节点行为的方向,将目标网络中的多个节点按序排列得到一个节点序列,在该节点序列中,第i个节点的节点行为指向第i+1个节点,第i个节点指向第i+1个节点的节点行为发生时间早于第i+1个节点指向第i+2个节点的节点行为发生时间,两个相邻节点的节点行为发生时间之间的间隔满足第二预设条件,同样的,i为大于0的整数,i=1,2,...,N-2,N为该节点序列中的节点总数。其中,第二预设条件可以是两个相邻节点的节点行为发生时间之间的间隔小于预设时间间隔。也即,第i个节点指向第i+1个节点的节点行为发生时间,与第i+1个节点指向第i+2个节点的节点行为发生时间之间的间隔小于或等于预设时间间隔。
同样以图2为例,假设:目标网络为社交网络,网络中的节点表示用户,预设时间间隔为1h。那么,如果用户A在某一天的10:11向用户B转账(用户A发生了指向用户B的行为),用户B在同一天的10:12向用户E转账(用户B发生了指向用户E的行为),用户E在同一天的10:13向用户G转账(用户E发生了指向用户G的行为),以及用户G在一周后的同一天的10:14向用户F转账(用户G发生了指向用户F的行为),则由于用户G指向用户F的转账行为的发生时间与用户E指向用户G的转账行为的发生时间之间的间隔过长(1周多)大于预设时间间隔1h,因此,用户F不能和用户A、用户B、用户E和用户G在同一序列中,可构建出序列{nA,nB,nE,nG},但是不能构建出序列{nA,nB,nE,nG,nF}。
可选地,在上述三种方式中的任一方式中,在一个节点序列中,第i个节点指向第i+1个节点的节点行为类型与第i+1个节点指向第i+2个节点的节点行为类型相同,例如,如果第i个节点指向第i+1个节点的节点行为是转账行为,那么第i+1个节点指向第i+2个节点的节点行为也是转账行为;或者,在一个节点序列中,第i个节点指向第i+1个节点的节点行为类型与第i+1个节点指向第i+2个节点的节点行为类型不同,例如,第i个节点指向第i+1个节点的节点行为可以是转账行为,但第i+1个节点指向第i+2个节点的节点行为可以是点击行为。
步骤106、将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
上述预设自然语言处理模型包括但不限于双向编码器表征模型(BidirectionalEncoder Representations from Transformers,BERT)和Word2vec中的一种。在本说明书实施例中,相比于Word2Vec,BERT具有更强的表征能力。
当上述预设自然语言处理模型为BERT时,步骤106可包括:将步骤104中构建出的多个节点序列作为文本输入BERT,得到所述多个节点序列中的节点的表征向量。更为具体的,将所述多个节点序列作为句子输入BERT,得到所述多个节点序列中节点的单词向量、位置向量和句子向量;将所述多个节点序列中节点的单词向量、位置向量和句子向量拼接在一起,得到所述多个节点序列中节点的表征向量。
如图3所示,BERT的输入包括两个句子,两个句子通过分隔符[SEP]隔开,可以将第一个句子用A表示,将第二个句子用户B表示,在本说明书实施例中,两个句子为两个节点序列,其中,句子A为{n0,n1,n2,n3},句子B为{n4,n5,n6,n7},BERT的输出包括三部分:词向量(Token embeddings)、句子向量(Segment embeddings)和位置向量(PositionEmbeddings),在本说明书实施例中,词向量表示单个节点的表征向量,句子向量表示单个节点所在节点序列的表征向量,位置向量表示单个节点在节点序列中的位置的表征向量,对于一个节点而言,将这三部分向量拼接起来即可得到该节点的最终表征向量。
在实际应用中,将步骤104中构建出的多个节点序列作为多个句子两两输入BERT,并将各节点的三部分输出结果拼接起来,即可得到多个节点序列中各节点的表征向量,从而完成对目标网络中的节点的表征学习。
本说明书实施例提供的一种网络节点表征方法,将网络节点的表征问题抽象为节点序列表征问题,并基于节点行为的发生时间和方向构建节点序列,使得构建出的序列更加符合网络环境中真实的行为序列,此外,将这样的节点序列作为文本输入预设自然语言处理模型,把节点序列的表征问题又变为文本的表征问题,因此最终得到的节点的表征向量的表征能力更强,从而提升网络节点的表征效果。
具体而言,相比于深度游走(DeepWalk)、LINE、图及其表示(Graphs and TheirRepresentation,GraRep)等中采用的深度优先搜索(Depth-First Search,DFS)、广度优先搜索(Breadth-First Search,BFS)、随机游走(Random Walk)、Node2Vec等构建的节点序列,本说明书实施例提供的结合节点行为发生时间和方向等信息,在节点维度对行为序列的时间进行约束,构建出的节点序列更加符合社会环境中真实的行为序列,从而可以提升网络节点的表征能力。
下面对结合社交网络这一实际应用场景提出的一种网络节点表征方法进行介绍。
如图4所示,本说明的一个实施例提供的一种网络节点表征方法,可包括:
步骤402、获取待表征的社交网络,该社交网络中的节点表示用户。
步骤404、基于上述社交网络中用户行为的发生时间和方向,构建多个用户序列。其中,一个用户序列中至少包含两个用户。
步骤406、将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
具体的,步骤404中构建用户序列的具体方式可以参考上一实施例中的步骤104,步骤406中得到用户的表征向量的方式可以参照上一实施例中的步骤106,此处不做重复描述。
可选地,通过本说明书实例提供的网络节点表征方法得到的用户的表征向量,可以用于风险防控,例如,当目标网络为某一电子支付平台的用户形成的社交网络时,通过本说明书实例提供的网络节点表征方法得到的用户的表征向量,可以用于对该平台的用户进行洗钱、欺诈等风险防控。
本说明书实施例提供的一种网络节点表征方法,将社交网络节点的表征问题抽象为用户序列表征问题,并基于用户行为的发生时间和方向构建用户序列,使得构建出的用户序列更加符合社交环境中真实的行为序列,此外,将这样的用户序列作为文本输入预设自然语言处理模型,可把用户序列的表征问题又变为文本的表征问题,因此最终得到的用户的表征向量的表征能力更强,从而可以提升社交网络中用户的表征效果。
以上是对本说明书提供的方法实施例的说明,下面对本说明书提供的电子设备进行介绍。
图5是本说明书的一个实施例提供的电子设备的结构示意图。请参考图5,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成网络节点表征装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
上述如本说明书图1所示实施例揭示的网络节点表征方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1所示的实施例提供的网络节点表征方法,本说明书在此不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
下面对本说明书提供的装置进行说明。
如图6所示,本说明书的一个实施例提供了一种网络节点表征装置600,在一种软件实施方式中,装置600可包括:第一获取模块601、第一构建模块602、第一表征模块603。
第一获取模块601,用于获取待表征的目标网络。
第一构建模块602,用于基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,一个节点序列中至少包含两个节点。
第一表征模块603,用于将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
需要说明的是,网络节点表征装置600能够实现图1的方法,并能取得相同的技术效果,详细内容可参考图1所示的方法,不再赘述。
如图7所示,本说明书的一个实施例提供了一种网络节点表征装置700,在一种软件实施方式中,装置700可包括:第二获取模块701、第二构建模块702、第二表征模块703。
第二获取模块701,用于获取待表征的社交网络,其中,所述社交网络中的节点表示用户。
第二构建模块702,用于基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户。
第二表征模块703,用于将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
需要说明的是,网络节点表征装置700能够实现图4的方法,并能取得相同的技术效果,详细内容可参考图4所示的方法,不再赘述。
上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (17)
1.一种网络节点表征方法,包括:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
2.根据权利要求1所述的方法,其中,基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,包括:
确定所述目标网络中同一节点的两次时序相邻行为之间的指定时间间隔,所述指定时间间隔为平均时间间隔、最小时间间隔和最大时间间隔中的一种;
基于所述目标网络中节点行为的发生时间和方向,以及节点的两次时序相邻行为之间的指定时间间隔,构建多个节点序列。
3.根据权利要求2所述的方法,所述指定时间间隔为平均时间间隔,其中,基于所述目标网络中节点行为的发生时间和方向,以及节点的两次时序相邻行为之间的指定时间间隔,构建多个节点序列,包括:
按照所述目标网络中节点行为发生时间的先后及节点行为的方向,将所述目标网络中两次时序相邻行为之间的平均时间间隔满足第一预设条件的多个节点按序排列得到一个节点序列,其中,在该节点序列中,第i个节点的节点行为指向第i+1个节点,且第i个节点指向第i+1个节点的节点行为发生时间早于第i+1个节点指向第i+2个节点的节点行为发生时间,i=1,2,...,N-2,N为该节点序列中的节点总数。
4.根据权利要求3所述的方法,
所述第一预设条件包括同一节点序列中不同节点的两次时序相邻行为之间的平均时间间隔在同一预设范围之内。
5.根据权利要求4所述的方法,
不同节点序列中节点的两次时序相邻行为之间的平均时间间隔在不同预设范围内;或者,
不同节点序列中节点的两次时序相邻行为之间的平均时间间隔在同一预设范围内。
6.根据权利要求1所述的方法,其中,基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,包括:
按照所述目标网络中节点行为发生时间的先后及节点行为的方向,将所述目标网络中的多个节点按序排列得到一个节点序列,其中,在该节点序列中,第i个节点的节点行为指向第i+1个节点,且第i个节点指向第i+1个节点的节点行为发生时间早于第i+1个节点指向第i+2个节点的节点行为发生时间,i=1,2,...,N-2,N为该节点序列中的节点总数。
7.根据权利要求2-6任一项所述的方法,
在一个节点序列中,第i个节点指向第i+1个节点的节点行为类型与第i+1个节点指向第i+2个节点的节点行为类型相同;或者,
在一个节点序列中,第i个节点指向第i+1个节点的节点行为类型与第i+1个节点指向第i+2个节点的节点行为类型不同。
8.根据权利要求7所述的方法,
所述节点行为包括下述至少一种:
一个节点点击另一个节点的行为;
一个节点向另一个节点转移资源的行为,
一个节点向另一个节点发送信息的行为。
9.根据权利要求1所述的方法,其中,所述预设自然语言处理模型为双向编码器表征模型BERT,所述将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量,包括:
将所述多个节点序列作为文本输入所述BERT,得到所述多个节点序列中的节点的表征向量。
10.根据权利要求9所述的方法,其中,所述将所述多个节点序列作为文本输入所述BERT,训练得到所述多个节点序列中的节点的表征向量,包括:
将所述多个节点序列作为句子输入所述BERT,得到所述多个节点序列中节点的单词向量、位置向量和句子向量;
将所述多个节点序列中节点的单词向量、位置向量和句子向量拼接在一起,得到所述多个节点序列中节点的表征向量。
11.一种网络节点表征方法,包括:
获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
12.一种网络节点表征装置,包括:
第一获取模块,用于获取待表征的目标网络;
第一构建模块,用于基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,一个节点序列中至少包含两个节点;
第一表征模块,用于将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
13.一种网络节点表征装置,包括:
第二获取模块,用于获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
第二构建模块,用于基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
第二表征模块,用于将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
14.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
15.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待表征的目标网络;
基于所述目标网络中节点行为的发生时间和方向,构建多个节点序列,其中,一个节点序列中至少包含两个节点;
将所述多个节点序列作为文本输入预设自然语言处理模型,得到所述多个节点序列中的节点的表征向量。
16.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
17.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待表征的社交网络,其中,所述社交网络中的节点表示用户;
基于所述社交网络中用户行为的发生时间和方向,构建多个用户序列,其中,一个用户序列中至少包含两个用户;
将所述多个用户序列作为文本输入预设自然语言处理模型,得到所述多个用户序列中的用户的表征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010249020.8A CN111461346B (zh) | 2020-03-31 | 2020-03-31 | 一种网络节点表征方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010249020.8A CN111461346B (zh) | 2020-03-31 | 2020-03-31 | 一种网络节点表征方法、装置和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461346A true CN111461346A (zh) | 2020-07-28 |
CN111461346B CN111461346B (zh) | 2022-12-06 |
Family
ID=71681604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010249020.8A Active CN111461346B (zh) | 2020-03-31 | 2020-03-31 | 一种网络节点表征方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461346B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149179A (zh) * | 2020-09-18 | 2020-12-29 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的风险识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108536844A (zh) * | 2018-04-13 | 2018-09-14 | 吉林大学 | 一种文本增强的网络表示学习方法 |
CN109933666A (zh) * | 2019-03-18 | 2019-06-25 | 西安电子科技大学 | 一种好友自动分类方法、装置、计算机设备和存储介质 |
US20190272480A1 (en) * | 2015-10-19 | 2019-09-05 | International Business Machines Corporation | System, method, and recording medium for vector representation of words in a language |
-
2020
- 2020-03-31 CN CN202010249020.8A patent/CN111461346B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190272480A1 (en) * | 2015-10-19 | 2019-09-05 | International Business Machines Corporation | System, method, and recording medium for vector representation of words in a language |
CN108536844A (zh) * | 2018-04-13 | 2018-09-14 | 吉林大学 | 一种文本增强的网络表示学习方法 |
CN109933666A (zh) * | 2019-03-18 | 2019-06-25 | 西安电子科技大学 | 一种好友自动分类方法、装置、计算机设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149179A (zh) * | 2020-09-18 | 2020-12-29 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的风险识别方法及装置 |
CN112149179B (zh) * | 2020-09-18 | 2022-09-02 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的风险识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111461346B (zh) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108845936B (zh) | 一种基于海量用户的ab测试方法及系统 | |
Pandita et al. | {WHYPER}: Towards automating risk assessment of mobile applications | |
CN108537568B (zh) | 一种信息推荐方法和装置 | |
CN109344406B (zh) | 词性标注方法、装置和电子设备 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN113688310B (zh) | 一种内容推荐方法、装置、设备及存储介质 | |
CN110457578A (zh) | 一种客服服务需求识别方法及装置 | |
CN114817538B (zh) | 文本分类模型的训练方法、文本分类方法及相关设备 | |
CN112184143B (zh) | 一种合规审核规则中的模型训练方法、装置和设备 | |
CN115080836A (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN113837638A (zh) | 话术确定方法、装置及设备 | |
CN110191150B (zh) | 一种信息的处理系统、方法、装置及设备 | |
CN111461346B (zh) | 一种网络节点表征方法、装置和设备 | |
CN109345081A (zh) | 一种数据采集方法、装置及电子设备 | |
CN116701570A (zh) | 一种召回结果筛选方法、装置、计算机设备和存储介质 | |
CN113609271B (zh) | 基于知识图谱的业务处理方法、装置、设备及存储介质 | |
CN110443746B (zh) | 基于生成对抗网络的图片处理方法、装置及电子设备 | |
CN109902170B (zh) | 一种文本的分类方法、装置及电子设备 | |
CN114611513A (zh) | 样本生成方法、模型训练方法、实体识别方法及相关装置 | |
CN114117423A (zh) | 仿冒应用信息获取方法、装置和设备 | |
CN109145084B (zh) | 数据处理方法、数据处理装置和服务器 | |
CN111311372A (zh) | 一种用户识别方法和装置 | |
CN112182179A (zh) | 实体问答处理方法、装置、电子设备和存储介质 | |
CN109325239A (zh) | 学生课堂表现管理方法及系统 | |
US20240193365A1 (en) | Method and system for insightful phrase extraction from text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40034046 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |