CN111369258A - 实体对象类型的预测方法、装置及设备 - Google Patents
实体对象类型的预测方法、装置及设备 Download PDFInfo
- Publication number
- CN111369258A CN111369258A CN202010160772.7A CN202010160772A CN111369258A CN 111369258 A CN111369258 A CN 111369258A CN 202010160772 A CN202010160772 A CN 202010160772A CN 111369258 A CN111369258 A CN 111369258A
- Authority
- CN
- China
- Prior art keywords
- graph
- entity
- network
- entity object
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 239000013598 vector Substances 0.000 claims abstract description 46
- 230000003993 interaction Effects 0.000 claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 17
- 230000006399 behavior Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 31
- 230000002452 interceptive effect Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 10
- 238000003062 neural network model Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书一个或多个实施例提供一种账户类型的预测方法、装置及设备,根据具有交互关联关系的不同实体对象的第一历史行为数据构建第一网络图,通过图神经网络对该第一网络图进行学习,获得表征实体对象之间的交互特征的第一节点向量,再通过该第一节点向量以及基于第二历史行为数据构建的第二网络图对实体对象的类型进行预测,从而可在预测未知类型的实体对象的类型时,可基于实体对象之间的交互特征更加准确地对实体对象的类型进行预测。
Description
技术领域
本公开涉及机器学习技术领域,尤其涉及一种实体对象类型的预测方法、装置及设备。
背景技术
近年来,GNN(图神经网络模型,Graph Neural Network)在对图节点之间依赖关系进行建模的强大功能使得与图分析相关的研究领域取得了突破。对于GNN来说,给定一个数据集,可以将其映射为一个图,数据集中的每个样本对应于图中一个节点,若两个样本之间的相似度很高(或相似度很强),则对应的节点之间存在一条边,边的“强度”正比于样本之间的相似度。
发明内容
有鉴于此,本说明书的一个或多个实施例提出一种实体对象类型的预测方法、装置及设备。
本说明书的一个或多个实施例提供了一种实体对象类型的预测方法,包括:获取具有交互关联的不同实体对象在第一时间段内产生的第一历史行为数据;基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图;向无监督图神经网络输入所述第一网络图,得到与各所述实体对象对应的各第一节点向量,所述各第一节点向量至少融合了其对应节点的三阶邻居节点的信息;获取所述各实体对象在所述第一时间段之后产生的标签数据;以所述第一网络图、所述第一节点向量、以及所述标签数据作为训练样本,对监督图网络模型进行训练,得到训练好的监督图网络模型;将所述第一节点向量以及第二网络图输入所述监督图网络模型,得到所述实体对象类型的预测结果,其中,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到。
可选的,所述训练样本还包括:所述第一网络图中的实体对象的特征和/或实体对象之间交互的特征;在向所述监督图网络模型输入所述第一节点向量以及所述第二网络图时,还向所述监督图网络模型输入所述第二网络图中的实体对象的特征和/或实体对象之间交互的特征。
可选的,所述实体对象的特征,包括:所述实体对象对应的用户的个人身份信息;所述实体对象之间的交互的特征,包括:所述实体对象对应的交互发生的时间、交互的类型以及交互所使用的平台。
可选的,所述第二时间段包括在所述第一时间段之后产生的时间增量。
可选的,所述标签数据包括:对实体对象标注的类型。
可选的,基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图,包括:为在所述第一时间段内发生交互的节点之间创建有向边,以实体对象作为节点得到所述第一网络图;所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到,包括:为在所述第二时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第二网络图。
可选的,所述实体对象包括以下至少一种:账户、设备以及用户。
可选的,所述实体对象之间的交互关系包括所述实体对象之间的交易关系。
本说明书的一个或多个实施例还提供了一种实体对象类型的预测装置,包括:第一获取模块,用于获取具有交互关联的不同实体对象在第一时间段内产生的第一历史行为数据;构建模块,用于基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图;输入模块,用于向无监督图神经网络输入所述第一网络图,得到与各所述实体对象对应的第一节点向量,所述各第一节点向量至少融合了其对应节点的三阶邻居节点的信息;第二获取模块,用于获取所述各实体对象在所述第一时间段之后产生的标签数据;训练模块,用于以所述第一网络图、所述第一节点向量、以及所述标签数据作为训练样本,对监督图网络模型进行训练,得到训练好的监督图网络模型;预测模块,用于将所述第一节点向量以及第二网络图输入所述监督图网络模型,得到所述实体对象类型的预测结果,其中,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到。
可选的,所述构建模块用于:为在所述第一时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第一网络图;为在所述第二时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第二网络图。
本说明书的一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一种实体对象类型的预测方法。
从上面所述可以看出,本说明书的一个或多个实施例的实体对象类型的预测方法,根据实体对象的第一历史行为数据构建第一网络图,通过无监督图神经网络对该第一网络图进行学习,获得表征实体对象之间的交互特征的第一节点向量,再通过该第一节点向量以及基于第二历史行为数据构建的第二网络图对实体对象的类型进行预测,从而可在预测未知类型的实体对象的类型时,可基于实体对象之间的交互特征更加准确地对实体对象的类型进行预测。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一个或多个实施例示出的一种实体对象类型的预测方法的流程图;
图2是根据本说明书一个或多个实施例示出的监督图网络模型的训练流程图;
图3是根据本说明书一个或多个实施例示出的通过训练好的监督图网络模型对实体对象类型进行预测的流程图;
图4是根据本说明书一个或多个实施例示出的一种实体对象类型的预测装置的框图;
图5是根据本说明书一个或多个实施例示出的一种电子设备的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
图神经网络模型可包括监督学习以及无监督学习,监督学习可以较好地利用训练数据的标注信息,对数据进行学习,但监督学习不能充分刻画客户之间的高阶关系,举例说明,住户A有一个邻居住户B,住户B有一个邻居住户C,住户C有一个邻居住户D,那么,称住户A的(一阶)邻居是住户B,二阶邻居是住户C,三阶邻居是住户D。一般而言,高阶信息例如指二阶以上的邻居信息。对于监督学习而言,由于网络图数据往往较大,比如好友/交易网络图中的节点数在几十亿量级,因此在监督学习中,拉取子图时,由于内存、磁盘存储以及计算耗时等因素的限制,无法刻画客户之间的高阶信息。无监督学习则可以很好地刻画客户之间的高阶信息,但其无法利用训练数据的标注信息进行学习。
在互联网金融活动中,对金融服务的提供方而言,各客户均具有各种维度的特征信息,而具有类似特征的客户可被划分为一种特定类型的客户,对特定类型客户的发现,可便于针对客户的类型对业务进行批量推荐,或进行风控等操作。本说明书一个或多个实施例的具体描述中,将以基于图神经网络的实体对象类型的预测为例进行说明。
本说明书的一个或多个实施例提出一种基于图神经网络的实体对象类型的预测方法,通过将图结构和实体对象节点信息融合,无监督地学习到各实体对象对应的节点向量,再将该节点向量作为实体对象的特征输入到预先训练好的监督图网络模型,以对各实体对象的类型进行预测,得到预测结果。
下文将基于附图具体描述根据本说明书一个或多个实施例的一种实体对象类型的预测方法、装置及设备。
图1是根据本说明书一个或多个实施例示出的一种实体对象类型的预测方法的流程图,如图1所示,该方法包括:
步骤102:获取具有交互关联的不同实体对象在第一时间段内产生的第一历史行为数据;
可选的,本说明书中的实体对象例如可以是用户、设备或用户的账户(以下也简称账户)中的任意一种,以账户为例,假设,要预测2019年6月3日当日的欺诈账户,则可收集第一时间段,例如,在2019年6月3日之前的一个月内,2019年5月1日至2019年6月1日之间产生的账户之间的交易数据,作为上述第一历史行为数据,故,上述第一历史行为数据可以是在第一时间段内的各账户之间发生交易的历史交易数据,其中,交易数据可包括账户之间转账、支付、发送/接收红包、发送/接收购物券以及分享购物链接等数据。
步骤104:基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图;
例如,可将上述具有交互关联的不同实体对象归为一个数据集,可将该数据集中每个实体对象作为样本对应于第一网络图中的一个节点,对于在第一时间段内发生过交易(为上述交互的一个示例)的两个节点间,存在一条有向边,例如,由交易主动方指向被动方,从而构建出第一网络图。
步骤106:向无监督图神经网络输入所述第一网络图,得到与各所述实体对象对应的第一节点向量,所述各第一节点向量至少融合了其对应节点的三阶邻居节点的信息;
例如,可将第一网络图作为输入,利用无监督图神经网络进行自学习,得到各实体对象对应的第一节点向量,这样可以更好刻画出第一网络图中各节点之间的交易关系。其中,无监督图神经网络的输出包括第一网络图中各节点对应的一个固定维度的向量,该向量表征了节点在整个第一网络图中的拓扑关系信息,在节点为账户、节点间的关系为交易关系的情况下,该向量表征了账户在第一时间段内的交易关系。
其中,此处的图神经网络(Graph Neural Network,GNN),可以指在广义的图结构上,利用一种递归聚合的方式,将图中节点的信息进行传播,最终学习每个图节点的表征向量。在本说明书的一个或多个实施例中,无监督图神经网络模型例如可采用DeepWalk、LINE、metapath2vec、GraRep以及DNGR中的任意一种算法实现。
步骤108:获取所述各实体对象在所述第一时间段之后产生的标签数据;
例如,可获取所述各实体对象在所述第一时间段之后以及在所述第二时间段开始之前产生的标签数据。沿用上述例子,在预测6月3日的账户的类型时,可使用6月3日之前各账户的历史交易数据中,在对账户的分类时,监督图网络模型对各账户类型的历史分类结果,由于距离预测当日时间越近的历史分类结果对预测当日的账户类型的预测结果的影响越大,故,在该例子中可选择6月2日当日的账户分类结果作为训练监督图网络模型的标签数据,从而使得训练得到的监督图网络模型能够基于各账户近期的交易习惯更精准地对账户进行分类,且,还可使得账户分类模型的训练数据与标签数据在时间上不存在重合。举例说明,其中,账户的标签数据例如包括对账户是否为某一类型的账户的标注信息,例如,欺诈账户的标签赋值为1,非欺诈账户的标签赋值为0,为待推荐业务的潜在消费者账户的标签赋值为1,为待推荐业务的非潜在消费者账户的标签赋值为0。
步骤110:以所述第一网络图、所述第一节点向量、以及所述标签数据作为训练样本,对监督图网络模型进行训练,得到训练好的监督图网络模型;
步骤112:将所述第一节点向量以及第二网络图输入所述监督图网络模型,得到所述实体对象的类型的预测结果,其中,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到。
例如,监督图网络模型可以基于GNN、GCN(Graph ConvolutionalNetwork,图卷积神经网络)以及GAN(Generative Adversarial Networks,生成式对抗网络)中任意一种神经网络模型预先训练得到。
其中,第一节点向量中包括第一网络图中的节点之间的拓扑关系,以该第一节点向量以及第一网络图预测实体对象的类型,可实现基于实体对象之间的交互关系对各实体对象的类型进行预测的目的。
可选的,所述第二时间段包括在所述第一时间段之后产生的时间增量。基于此,可使用距离预测当日更近的第二历史行为数据构建上述第二网络图,由于该第二历史行为数据对用户预测当日的行为的影响度更大,故,使用该第二历史行为数据构建用于预测实体对象类型的第二网络图,可进一步提高预测结果的准确度。举例说明,上述第一历史行为数据可以为所述实体对象在2019年5月1日至2019年6月1日(为上述第一时间段的一个示例)之间产生的历史交易数据,第二历史行为数据为所述实体对象在2019年5月2日至2019年6月2日之间(为第二时间段的一个示例)产生的历史交易数据。
本说明书的一个或多个实施例的实体对象类型的预测方法,根据实体对象的第一历史行为数据构建第一网络图,通过无监督图神经网络对该第一网络图进行学习,获得表征实体对象之间的交互特征的第一节点向量,再通过该第一节点向量以及基于第二历史行为数据构建的第二网络图对实体对象的类型进行预测,从而可在预测未知类型的实体对象的类型时,可基于实体对象之间的交互特征更加准确地对实体对象的类型进行预测。
在本说明书的一个或多个实施例中,所述训练样本还可包括:所述第一网络图中的实体对象的特征和/或实体对象之间交互的特征;基于此,使得训练得到的监督图网络模型还可以基于实体对象的特征和/或实体对象之间的交互的特征对实体对象的类型进行预测,即使得训练得到的监督图网络模型可基于更多维度的特征对账户的类型进行预测,提高预测的准确率。故,在向所述监督图网络模型输入所述第一节点向量以及所述第二网络图以得到所述实体对象类型的预测结果时,还可向所述监督图网络模型输入所述第二网络图中的实体对象的特征和/或实体对象之间交互的特征。
在本说明书的一个或多个实施例中,所述实体对象的特征可包括:所述实体对象对应的用户的个人身份信息;所述实体对象之间的交互的特征,可包括:所述实体对象对应的交互发生的时间、交互的类型以及交互所使用的平台。实体对象以账户为例,上述第一网络图中各账户的特征,即第一网络图中节点的特征,该特征例如可以包括预先提取的各账户的属性特征信息,例如,账户对应的用户的姓名、性别、年龄、职业以及所在地等用户的个人身份信息;各交易的特征,即第一网络图中各交易的特征,例如可包括账户对应的交易发生的时间、交易的类型以及交易使用的交易平台等信息。其中,各账户的特征以及各交易的特征还可以是通过特征提取算法基于第一历史行为数据提取得到,或将第一历史行为数据输入训练训练好的有监督神经网络模型,由模型输出,而对于账户固有的一些身份信息,还可以是系统预先存储的。
以下结合图2对训练监督图神经网络类模型的流程进行说明,其中,实体对象以账户为例,实体对象之间的交互以账户之间的交易为例,如图2所示,该流程包括:收集训练数据,其中,收集的训练数据包括用于构建训练网络图(例如上述第一网络图)的账户之间的历史交易数据以及该交易数据的标签数据;利用收集到的训练数据构建训练网络图;将构建的训练网络图输入无监督图神经网络,得到节点向量(例如上述第一节点向量);将训练网络图、节点向量、标签数据以及训练网络图中的节点和/或边的特征输入监督图神经网络模型进行学习,得到预测参数,从而得到训练好的监督图网络模型。
在本说明书的一个或多个实施例中,所述标签数据可包括:对实体对象标注的类型。以实体对象是账户为例,例如,对实体对象标注的类型可包括,账户为欺诈账户、非欺诈账户,或者,为待推荐业务的潜在消费者账户,为待推荐业务的非潜在消费者账户,又或者,为活跃账户或非活跃账户。在训练上述有监督神经网络模型时输入账户的标签数据,可使得训练得到的模型可用于对指定类型的账户进行识别。例如,在训练上述有监督神经网络模型时,使用的标签数据中标注了欺诈账户以及非欺诈账户,则训练得到的模型可用于将预测样本数据中的账户的类型识别为欺诈账户或非欺诈账户;而训练有监督神经网络模型时,使用的标签数据包括待推荐业务的潜在消费者账户,以及非潜在消费者账户,则训练得到的模型可用于将预测样本数据中的账户的类型识别为待推荐业务的潜在消费者账户,或非潜在消费者账户。
在本说明书的一个或多个实施例中,基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图,可包括:为在所述第一时间段内发生交互的节点之间创建有向边,以实体对象作为节点得到所述第一网络图,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到,可包括:为在所述第二时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第二网络图,其中,在实体对象为账户,实体对象之间的交互为交易的情况下,上述有向边例如由交易发起方指向交易接受方。
以下结合图3对通过训练好的监督图网络模型对实体对象类型进行预测的流程进行说明,其中,实体对象以账户为例,实体对象之间的交互以账户之间的交易为例,如图3所示,该流程包括:收集预测数据,该预测数据例如包括预测当日之前一段时间(例如上述第二时间段)内产生的账户之间的历史交易数据,基于收集到的预测数据构建预测网络图(例如上述第二网络图);将预测网络图、基于上述第一网络图得到的第一节点向量、监督图神经网络模型的参数,以及预测网络图中节点的特征和/或边的特征输入训练好的监督图神经网络模型,得到该模型输出的预测结果。
图4是根据本公开一示例性实施例示出的一种账户类型的预测装置的框图,如图4所示,该装置40包括:
第一获取模块42,用于获取具有交互关联的不同实体对象在第一时间段内产生的第一历史行为数据;
构建模块44,用于基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图;
输入模块46,用于向无监督图神经网络输入所述第一网络图,得到与各所述实体对象对应的第一节点向量,所述各第一节点向量至少融合了其对应节点的三阶邻居节点的信息;
第二获取模块48,用于获取所述各实体对象在所述第一时间段之后产生的标签数据;
训练模块410:用于以所述第一网络图、所述第一节点向量、以及所述标签数据作为训练样本,对监督图网络模型进行训练,得到训练好的监督图网络模型;
预测模块412,用于将所述第一节点向量以及第二网络图输入所述监督图网络模型,得到所述实体对象的类型的预测结果,其中,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到。
在本说明书的一个或多个实施例中,所述构建模块可用于:为在所述第一时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第一网络图;为在所述第二时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第二网络图。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
本公开实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一种账户类型的预测方法。
图5是根据本公开一示例性实施例示出的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本公开难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本公开难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本公开的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (11)
1.一种实体对象类型的预测方法,包括:
获取具有交互关联的不同实体对象在第一时间段内产生的第一历史行为数据;
基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图;
向无监督图神经网络输入所述第一网络图,得到与各所述实体对象对应的各第一节点向量,所述各第一节点向量至少融合了其对应节点的三阶邻居节点的信息;
获取所述各实体对象在所述第一时间段之后产生的标签数据;
以所述第一网络图、所述第一节点向量、以及所述标签数据作为训练样本,对监督图网络模型进行训练,得到训练好的监督图网络模型;
将所述第一节点向量以及第二网络图输入所述监督图网络模型,得到所述实体对象类型的预测结果,其中,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到。
2.根据权利要求1所述的方法,其中,所述训练样本还包括:所述第一网络图中的实体对象的特征和/或实体对象之间交互的特征;
在向所述监督图网络模型输入所述第一节点向量以及所述第二网络图时,还向所述监督图网络模型输入所述第二网络图中的实体对象的特征和/或实体对象之间交互的特征。
3.根据权利要求2所述的方法,其中,所述实体对象的特征,包括:
所述实体对象对应的用户的个人身份信息;
所述实体对象之间的交互的特征,包括:所述实体对象对应的交互发生的时间、交互的类型以及交互所使用的平台。
4.根据权利要求1所述的方法,其中,所述第二时间段包括在所述第一时间段之后产生的时间增量。
5.根据权利要求1所述的方法,其中,所述标签数据包括:
对实体对象标注的类型。
6.根据权利要求1所述的方法,其中,基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图,包括:
为在所述第一时间段内发生交互的节点之间创建有向边,以实体对象作为节点得到所述第一网络图;
所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到,包括:为在所述第二时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第二网络图。
7.根据权利要求1所述的方法,其中,所述实体对象包括以下至少一种:
账户、设备以及用户。
8.根据权利要求1至7任一项所述的方法,其中,所述实体对象之间的交互关系包括所述实体对象之间的交易关系。
9.一种实体对象类型的预测装置,包括:
第一获取模块,用于获取具有交互关联的不同实体对象在第一时间段内产生的第一历史行为数据;
构建模块,用于基于所述第一历史行为数据中实体对象之间的交互关系以实体对象作为节点构建第一网络图;
输入模块,用于向无监督图神经网络输入所述第一网络图,得到与各所述实体对象对应的第一节点向量,所述各第一节点向量至少融合了其对应节点的三阶邻居节点的信息;
第二获取模块,用于获取所述各实体对象在所述第一时间段之后产生的标签数据;
训练模块,用于以所述第一网络图、所述第一节点向量、以及所述标签数据作为训练样本,对监督图网络模型进行训练,得到训练好的监督图网络模型;
预测模块,用于将所述第一节点向量以及第二网络图输入所述监督图网络模型,得到所述实体对象类型的预测结果,其中,所述第二网络图基于所述实体对象在第二时间段内产生的第二历史行为数据中实体对象之间的交互关系,以实体对象作为节点构建得到。
10.根据权利要求9所述的装置,其中,所述构建模块用于:
为在所述第一时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第一网络图;
为在所述第二时间段内发生交互的节点之间创建有向边,以所述实体对象作为节点得到所述第二网络图。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至10任一项所述的实体对象类型的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010160772.7A CN111369258A (zh) | 2020-03-10 | 2020-03-10 | 实体对象类型的预测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010160772.7A CN111369258A (zh) | 2020-03-10 | 2020-03-10 | 实体对象类型的预测方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111369258A true CN111369258A (zh) | 2020-07-03 |
Family
ID=71210432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010160772.7A Pending CN111369258A (zh) | 2020-03-10 | 2020-03-10 | 实体对象类型的预测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111369258A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737546A (zh) * | 2020-07-24 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 确定实体业务属性的方法及装置 |
CN112966131A (zh) * | 2021-03-02 | 2021-06-15 | 中华人民共和国成都海关 | 一种海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质 |
CN113807723A (zh) * | 2021-09-24 | 2021-12-17 | 重庆富民银行股份有限公司 | 用于知识图谱的风险识别方法 |
CN113822309A (zh) * | 2020-09-25 | 2021-12-21 | 京东科技控股股份有限公司 | 用户的分类方法、装置和非易失性计算机可读存储介质 |
CN114818973A (zh) * | 2021-07-15 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的图模型训练方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180247224A1 (en) * | 2017-02-28 | 2018-08-30 | Nec Europe Ltd. | System and method for multi-modal graph-based personalization |
CN110119860A (zh) * | 2018-02-05 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 一种垃圾账号检测方法、装置以及设备 |
CN110334130A (zh) * | 2019-07-09 | 2019-10-15 | 北京万维星辰科技有限公司 | 一种交易数据的异常检测方法、介质、装置和计算设备 |
CN110348573A (zh) * | 2019-07-16 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 训练图神经网络的方法、图神经网络设备、装置、介质 |
CN110400220A (zh) * | 2019-07-23 | 2019-11-01 | 上海氪信信息技术有限公司 | 一种基于半监督图神经网络的智能可疑交易监测方法 |
-
2020
- 2020-03-10 CN CN202010160772.7A patent/CN111369258A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180247224A1 (en) * | 2017-02-28 | 2018-08-30 | Nec Europe Ltd. | System and method for multi-modal graph-based personalization |
CN110119860A (zh) * | 2018-02-05 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 一种垃圾账号检测方法、装置以及设备 |
CN110334130A (zh) * | 2019-07-09 | 2019-10-15 | 北京万维星辰科技有限公司 | 一种交易数据的异常检测方法、介质、装置和计算设备 |
CN110348573A (zh) * | 2019-07-16 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 训练图神经网络的方法、图神经网络设备、装置、介质 |
CN110400220A (zh) * | 2019-07-23 | 2019-11-01 | 上海氪信信息技术有限公司 | 一种基于半监督图神经网络的智能可疑交易监测方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737546A (zh) * | 2020-07-24 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 确定实体业务属性的方法及装置 |
US11227217B1 (en) | 2020-07-24 | 2022-01-18 | Alipay (Hangzhou) Information Technology Co., Ltd. | Entity transaction attribute determination method and apparatus |
CN113822309A (zh) * | 2020-09-25 | 2021-12-21 | 京东科技控股股份有限公司 | 用户的分类方法、装置和非易失性计算机可读存储介质 |
CN112966131A (zh) * | 2021-03-02 | 2021-06-15 | 中华人民共和国成都海关 | 一种海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质 |
CN112966131B (zh) * | 2021-03-02 | 2022-09-16 | 中华人民共和国成都海关 | 一种海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质 |
CN114818973A (zh) * | 2021-07-15 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的图模型训练方法、装置及设备 |
CN113807723A (zh) * | 2021-09-24 | 2021-12-17 | 重庆富民银行股份有限公司 | 用于知识图谱的风险识别方法 |
CN113807723B (zh) * | 2021-09-24 | 2023-11-03 | 重庆富民银行股份有限公司 | 用于知识图谱的风险识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363449B (zh) | 一种风险识别方法、装置及系统 | |
CN111369258A (zh) | 实体对象类型的预测方法、装置及设备 | |
CN110278175B (zh) | 图结构模型训练、垃圾账户识别方法、装置以及设备 | |
CN107358247B (zh) | 一种确定流失用户的方法及装置 | |
US11907675B2 (en) | Generating training datasets for training neural networks | |
US20190272553A1 (en) | Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks | |
CN111737546B (zh) | 确定实体业务属性的方法及装置 | |
WO2022152161A1 (zh) | 混合图神经网络模型的训练、预测 | |
CN114580263A (zh) | 基于知识图谱的信息系统故障预测方法及相关设备 | |
KR20200039852A (ko) | 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법 | |
CN111898247A (zh) | 滑坡位移预测方法、设备及存储介质 | |
CN112328869A (zh) | 一种用户贷款意愿的预测方法、装置及计算机系统 | |
CN111026973B (zh) | 一种商品兴趣度预测方法、装置及电子设备 | |
CN108446738A (zh) | 一种聚类方法、装置及电子设备 | |
Jia et al. | The fusion model of multidomain context information for the internet of things | |
CN115660105A (zh) | 一种模型训练的方法、业务风控的方法及装置 | |
CN111159397B (zh) | 文本分类方法和装置、服务器 | |
CN112036418A (zh) | 用于提取用户特征的方法和装置 | |
CN116127204B (zh) | 多视角用户画像方法、多视角用户画像系统、设备和介质 | |
CN114580427B (zh) | 自媒体用户选择方法及相关设备 | |
CN118133168A (zh) | 数据处理方法和装置、电子设备、计算机可读存储介质 | |
CN116049560A (zh) | 信息处理方法以及装置 | |
CN117876021A (zh) | 基于人工智能的数据预测方法、装置、设备及存储介质 | |
CN116522146A (zh) | 客户流失检测模型训练方法、客户流失检测方法及装置 | |
CN117313008A (zh) | 异常节点的确定方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200703 |