CN111210279A - 一种目标用户预测方法、装置和电子设备 - Google Patents

一种目标用户预测方法、装置和电子设备 Download PDF

Info

Publication number
CN111210279A
CN111210279A CN202010021082.3A CN202010021082A CN111210279A CN 111210279 A CN111210279 A CN 111210279A CN 202010021082 A CN202010021082 A CN 202010021082A CN 111210279 A CN111210279 A CN 111210279A
Authority
CN
China
Prior art keywords
user
medium
node
media
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010021082.3A
Other languages
English (en)
Other versions
CN111210279B (zh
Inventor
曹绍升
曾利彬
张志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010021082.3A priority Critical patent/CN111210279B/zh
Publication of CN111210279A publication Critical patent/CN111210279A/zh
Application granted granted Critical
Publication of CN111210279B publication Critical patent/CN111210279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种目标用户预测方法、装置和电子设备;所述方法包括:获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签;将所述用户介质网络图输入图注意力网络模型,得到所述用户节点与所述介质节点间的影响度;根据所述影响度,重构所述用户介质网络图;并迭代训练图注意力网络模型,并在迭代结束时获得待预测用户介质网络图和训练后的图注意力网络模型;根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。

Description

一种目标用户预测方法、装置和电子设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种目标用户预测方法、装置和电子设备。
背景技术
随着互联网技术的发展和普及,各类线上业务平台应运而生,越来越多的用户(例如商家用户、消费用户等)选择利用线上业务平台进行业务活动。与此同时,部分非法用户也可能利用线上业务平台进行违反规定或者违反法律规定的交易。这些非法交易往往具有隐蔽性,对平台的合法、健康运维构成威胁。
那么,将海量的用户中潜在的可能存在非法行为的用户作为目标用户进行准确的预测,便是业务平台的一项亟需的功能。
发明内容
有鉴于此,本发明的目的在于提出一种目标用户预测方法、装置和电子设备。
基于上述目的,本发明提供了一种目标用户预测方法,包括:
获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签;
将所述用户介质网络图输入图注意力网络模型,得到连接有所述边的所述用户节点与所述介质节点间的影响度;
根据所述影响度,重构所述用户介质网络图;
使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型,并在迭代训练结束时获得待预测用户介质网络图和训练后的图注意力网络模型;其中,每次迭代时,图注意力网络模型的输入均包括根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图;
根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。
另一方面,本发明还提供了一种目标用户预测装置,包括:
获取模块,被配置为获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签;
影响度确定模块,被配置为将所述用户介质网络图输入图注意力网络模型,得到所述用户节点与所述介质节点间的影响度;
重构模块,被配置为根据所述影响度,重构所述用户介质网络图;
训练模块,被配置为使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型,并在迭代训练结束时获得待预测用户介质网络图和训练后的图注意力网络模型;其中,每次迭代时,图注意力网络模型的输入均包括根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图;
预测模块,被配置为根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。
再一方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的方法。
从上面所述可以看出,本发明提供的目标用户预测方法、装置和电子设备,通过用户介质网络图来表示用户和介质的对应关系,通过图注意力网络模型来获得用户节点与所述介质节点间的影响度,并根据影响度重构用户介质网络图,进一步通过迭代的方式训练图注意力网络模型,训练后获得用户预测的待预测用户介质网络图和训练后的图注意力网络模型,最终进行目标用户预测。在迭代训练图注意力网络模型的过程中,即考虑到了不同介质的重要性,通过筛选介质节点来重构用户介质网络图,从而去除噪音数据,提高目标用户预测的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为相关技术中用户与业务平台的交互模式示意图;
图2为本发明实施例的目标用户预测方法流程图;
图3为本发明实施例中的用户介质网络图示意图;
图4为本发明实施例中重构后的用户介质网络图示意图;
图5为本发明实施例中迭代训练过程示意图;
图6为本发明实施例中生成用户介质网络图的步骤流程图;
图7为本发明实施例中得到目标用户预测结果的步骤流程图;
图8为本发明实施例的目标用户预测装置结构示意图;
图9为本发明实施例的电子设备结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如背景技术部分所述,用户通过线上的方式利用业务平台进行业务活动的模式已经越来越普遍。参考图1,用户在与业务平台进行在线业务活动时,需要通过介质与业务平台实现数据交互。其中,所述的介质一般分为强介质和弱介质。所述的强介质,对应为用户使用的设备,其具体的表现形式可以为设备唯一对应的编码,例如手机的IMEI码(International Mobile Equipment Identity,移动设备国际识别码)、电脑的MAC地址(物理地址)等。所述的弱介质,对应于用户接入互联网使用的网络媒介,其具体的表现形式可以为IP地址、WIFI名称等;相比于强介质,弱介质具有很强的可变性,举例来说,用户使用同一台设备进行线上业务活动,其对应的强介质是不变的,但对应的弱介质则可能每次不同。
利用业务平台,通过线上方式进行非法行为的用户,如何将这些进行非法行为的用户作为目标用户进行识别和预测,对于网络安全和业务平台的风险管控有着重要的意义。
基于前述的业务活动模式,在相关技术中存在一些通过用户与介质间的关系进行目标用户的预测的技术。然而,这些技术只是简单的考虑了用户与介质间的对应关系,但实际应用中,用户与介质的关系的表现要更加复杂,相关技术并不能与实际应用情况向符合,也就造成了目标用户预测的准确度不足的问题。
针对于上述问题,本说明书一个或多个实施例提供了一种目标用户预测方法、装置和电子设备。在考虑用户与介质间的对应关系的基础上,进一步考虑到了用户与介质间的相互影响度,从而实现不同介质的重要性的区分,进而对介质进行筛选,使得本说明书一个或多个实施例的方案更加的贴合实际应用情况,进而提高目标用户预测的准确度。
以下结合附图,详细说明本说明书实施例提供的技术方案。
参考图2,本实施例的目标用户预测方法,包括以下步骤:
步骤201、获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签。
本实施例中应用了网络图,网络图是一种数据结构,其由节点和连接节点的无向边组成,其用于表示实际应用场景中具有某种关系的若干对象;其中,节点表示为向量,建立网络图时使用的数据相应的通过向量特征的形式包括于节点中。
本实施例中,用户介质网络图即用来表示不同的用户通过不同的介质使用线上业务。具体的,所述的用户介质网络图包括若干表示用户的用户节点,以及若干表示介质的介质节点。对于一些用户节点和介质节点,其间连接有边,该边即表示其连接的用户节点和介质节点间存在对应关系。本实施例中,该对应关系即表示用户通过介质使用过线上业务;其中,使用过线上业务,可以是用户通过介质登录过线上业务平台,或者是用户通过介质购买过线上业务等。
参考图3,为本实施例的用户介质网络图一个示例,其包括:USER_A、USER_B、USER_C三个用户节点,Medium_1、Medium_2两个介质节点,上述节点间连接有边以表示相应节点间的对应关系。以介质节点Medium_1为例,其分别连接用户节点USER_A、用户节点USER_B和用户节点USER_C,这表示介质节点Medium_1表示的介质,曾经被三个用户使用过进行线上业务。本领域技术人员可以理解的是,图3中所示的用户介质网络图仅是为了方便解释而给出的示例,实际实施过程中,用户介质网络图可能会包含更多的节点和边。
此外,用户介质网络图中的一些用户节点关联有用于表示目标用户的标签。对于用户节点的标签,其一般基于现有的数据进行关联。例如,基于业务平台投诉系统,可以确定一些被投诉具有非法行为的用户,相应的将这些用户对应的用户节点关联所述标签。此外,也可以是基于其他相关的目标用户识别技术的结果,来对用户节点进行标签的关联。
具体的,在数据结构上,一个用户节点与其关联的标签即构成了机器学习中的所谓的样例。用户节点通过向量表示,而标签表示为一个标量值。在本实施例中,对应于已知为目标用户的用户节点,其关联的标签赋值为1;其他的用户节点,其关联的标签赋值为0。在训练过程中,网络图中包括的各用户节点的向量作为样本集,以及所有标签的集合共同输入图注意力网络模型进行训练,训练后的图注意力网络模型即能够建立用户节点与标签之间的映射关系,也即对于任一用户节点,均能够得到其在每个标签下的概率值,该概率值的取值范围为[0-1]。可见,由于用户介质网络图中的部分用户节点关联有标签,整体上本实施例的用户介质网络图形成了一种有监督的网络图数据。本实施例中,所述的介质既包括强介质也包括弱介质。其中,用户使用的设备以手机为例,则强介质为手机的IMEI码;弱介质则为IP地址和WIFI名称。在相关技术中,一般仅会考虑强介质,而不考虑弱介质,这是因为弱介质会带来更大的复杂度,例如,虽然每个用户使用一个IP地址,但同属一个公司或组织的多个用户可能也同属于同一个IP网络,范围很大,虽然存在一定的聚集性,但会引入很多噪音,造成数据处理量加大、准确降低。而本实施例中,同时考虑强介质和弱介质,并通过后续的步骤,避免相关技术存在的不足。需要说明的是,在实际实施过程中,介质的类型可以根据具体需要而选择,可以只包括强介质,也可以只包括弱介质;对于某一种介质,其包括的具体类型也可以灵活选择,如弱介质可以只包括IP地址。
本实施例中,用户介质网络图可以是由外部的其他程序或设备生成的,在实施本实施例的方法时,直接获取得到用户介质网络图;也可以是,在实施本实施例的方法时,获取包含用户和介质对应关系的历史使用数据(如业务平台的登录记录、交易记录等),然后根据历史使用数据而生成的。
步骤202、将所述用户介质网络图输入图注意力网络模型,得到连接有所述边的所述用户节点与所述介质节点间的影响度。
本实施例中,利用了图注意力网络模型(Graph Attention Networks,GAN)。图注意力网络模型是一种经典的图神经网络结构,其输入为网络图,输出为网络图中每个节点的向量表达,与传统图神经网络结构不同的地方在于,图注意力网络模型可以通过注意力机制来计算节点之间的影响力,从而反映不同节点间不同程度的相互影响。图注意力网络模型的具体原理和工作方式为现有技术,本实施例中不再详述。
本实施例中,将前述步骤中获得的用户介质网络图输入图注意力网络模型。经过图注意力网络模型的计算处理输出用户介质网络图中每组连接有边的用户节点和介质节点间的影响度。此外,图注意力网络模型除了输出影响度以外,还会输出用户介质网络中各节点的表示向量,以及其他图注意力网络模型的相关模型参数。
参考图3,用户介质网络图中边上标示的数字即图注意力网络模型输出的影响度。例如,对于介质节点Medium_1来说,其与用户节点USER_A间的影响度为0.1,与用户节点USER_B间的影响度为0.2,与用户节点USER_C间的影响度为0.3。
步骤203、根据所述影响度,重构所述用户介质网络图。
本实施例中,根据前述步骤中获得的用户节点与介质节点间的影响度,来对用户介质网络图进行重构,重构用户介质网络图具体包括:
对于每个所述介质节点,将所述介质节点与与其相连的全部所述用户节点间的影响度求和,并除以与其相连的全部所述用户节点的个数,得到所述介质节点的权重值;
将所述介质节点的权重值与预设的节点权重阈值比较,若所述介质节点的权重值大于所述节点权重阈,则删除所述介质节点以及连接至所述介质节点的全部所述边。对于介质节点的权重值小于节点权重阈的介质节点,则不作改变。
参考图3,以图示的用户介质网络图为例,对两个介质节点分别计算权重值。对于介质节点Medium_1,其通过三条边分别连接用户节点USER_A、用户节点USER_B和用户节点USER_C,相应的其与三个用户节点间的影响度分别为0.1、0.2、0.3;所以,介质节点Medium_1的权重值即为:(0.1+0.2+0.3)/3=0.2。对于介质节点Medium_2,其通过三条边分别连接用户节点USER_A、用户节点USER_B和用户节点USER_C,相应的其与三个用户节点间的影响度分别为0.7、0.8、0.9;所以,介质节点Medium_2的权重值即为:(0.7+0.8+0.9)/3=0.8。
本实施例中,预先设定的节点权重阈值为0.7。介质节点Medium_2权重值0.8大于节点权重阈值0.7,则不对介质节点Medium_2做改变。介质节点Medium_1权重值0.2小于节点权重阈值0.7,则将介质节点Medium_1从用户介质网络图中删除,同时与介质节点Medium_1与USER_A、用户节点USER_B和用户节点USER_C之间的边也均相应的被删除。参考图4,即为重构后的用户介质网络图。
本领域技术人员可以理解的是,本实施例中,介质节点的权重值也可以通过其他的方式计算得到,相应的,节点权重阈值也应根据权重值的不同计算方式而调整。
本实施例中,在重构用户介质网络图时,是删除了其中的一些介质节点以及相应的边,这些被删除的介质节点的特点是其对用户的影响度较低,也就是说这些介质节点的存在并不能对于后续的预测起到更多的作用,甚至可以认为是噪音,故将其删除后,整体上提高了用户介质网络图的准确度和数据量,这也能够相应提高后续预测时的准确度和效率。
此外,对于用户介质网络图中的用户节点,为保证预测的完整性,故不对用户节点进行权重值的计算和相应的删除。显然,在一些实施方式中,根据具体的实施需要,也可以对用户节点执行权重值的计算和相应的删除处理,从而将不重要的用户去除,相应的提高预测的准确度和效率。
步骤204、使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型,并在迭代训练结束时获得待预测用户介质网络图和训练后的图注意力网络模型;其中,每次迭代时,图注意力网络模型的输入均包括根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图。
本实施例中,使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型。所谓迭代,是指重复反馈过程的活动,其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值。本实施例中,在进行迭代训练时,是在重复执行前述的步骤202和步骤203;在每一次迭代时,图注意力网络模型的输入就包括了根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图。
本实施例中,迭代训练结束的条件为迭代达到预设的次数。具体的,可以根据用户介质网络图数据量的大小、设备的处理能力等因素来相应的设置迭代次数;例如,在一般正常的用户介质网络图数据量的大小和设备的处理能力的条件下,迭代次数可以设置为2至5次。
在迭代训练结束时,最后一次迭代后图注意力网络模型输出的模型参数,即可以用于后续的预测,也即相应的获得了训练后的图注意力网络模型。此外,根据最后一次迭代后图注意力网络模型输出的影响度,重构后获得的用户介质网络图,将其作为后续预测时的输入数据,即待预测用户介质网络图。本实施例中的迭代训练过程可参考图5所示。
本实施例中,在整个迭代训练的过程中,会不断的有不重要的介质节点被删除掉,每一次用户介质网络图的重构,又会给图注意力网络模型带来新的输入。可以认为是,更好的用户介质网络图,使得图注意力网络模型的学习更加准确,而图注意力网络模型的准确性的提升,又再一次的使得介质节点筛选更加精准,从而实现一种自适应的过程。
此外,对于同时包括强介质节点和弱介质节点的用户介质网络图,在迭代训练的过程中,由于弱介质节点的特性,一般被删除的是弱介质节点。例如,某一些弱介质节点的覆盖面很大,其连接了众多的用户节点,其对于目标用户的预测来说是不重要的,就大概率会被删除,但是某些连接了很多关联有用于表示目标用户的标签的用户节点的弱介质节点,就很可能会被保留。
步骤205、根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。
本实施例中,将待预测用户介质网络图输入训练后的图注意力网络模型,训练后的图注意力网络模型相应的执行预测过程,训练后的图注意力网络模型会输出目标用户预测结果。其中,训练后的图注意力网络模型具体可以通过softmax函数+交叉熵损失函数+梯度下降法实现预测过程,对于每个用户节点能够给出其在每个标签下的概率值。在本实施例中,具体的用于预测目标用户,则目标用户预测结果包括待预测用户介质网络图中,所有用户节点为目标用户的概率值,其取值范围为[0-1]。通过目标用户预测结果即能够进一步判断得到目标用户,进而可以后续对目标用户采取相应的处理措施。
可见,本实施例的目标用户预测方法,通过用户介质网络图来表示用户和介质的对应关系,通过图注意力网络模型来获得用户节点与所述介质节点间的影响度,并根据影响度重构用户介质网络图,进一步通过迭代的方式训练图注意力网络模型,训练后获得用户预测的待预测用户介质网络图和训练后的图注意力网络模型,最终进行目标用户预测。在迭代训练图注意力网络模型的过程中,即考虑到了不同介质的重要性,通过筛选介质节点来重构用户介质网络图,从而去除噪音数据,提高目标用户预测的准确度。
作为一个可选的实施例,参考图6,所述的目标用户预测方法,还包括以下步骤:
步骤601、获取历史使用数据,确定用户、介质、所述用户与所述介质间的对应关系,以及目标用户相关信息。
本实施例中,用户介质网络图是在执行本实施例的方法时生成的。具体的,获取用于生成用户介质网络图的数据,即所述的历史使用数据。该历史使用数据是指用户使用介质在线上业务平台上使用业务时产生的各种相关数据;例如,淘宝的登录数据,该数据可以反映用户使用介质登录淘宝服务器的情况,从而能够确定用户、介质,以及用户与介质间的对应关系,同时,也可以相应获得能够体现用户、介质以及其对应关系特征的数据,来作为用户介质网络图中各节点的特征数据,如用户的个人信息、介质的属性信息、登录行为的时间地点等。
另一方面,历史使用数据还包括用于为用户节点关联标签的数据,即所述的目标用户相关信息。该目标用户相关信息记录用户做出过对应于目标用户的行为,从而能够基于目标用户相关信息来确定一些用户节点表示的用户为目标用户,从而使得生成的用户介质网络图为一种有监督的网络图数据。例如,目标用户相关信息可以是淘宝中的用户非法行为投诉记录;又如,目标用户相关信息也可以是其他相关的目标用户识别技术输出的结果数据。
步骤602、根据所述用户、所述介质和所述对应关系,生成所述用户介质网络图。
根据前述步骤中由历史使用数据确定的用户、介质和用户与介质间对应关系,生成用户介质网络图。
步骤603、根据所述目标用户相关信息,为部分所述用户节点关联所述标签。
根据前述步骤中由目标用户相关信息确定出的目标用户,将这些确定的目标用户对应的用户节点相应的关联用于表示目标用户的标签。
本实施例中生成的用户介质网络图和标签的具体内容可以参见前述实施例,本实施例中不再赘述。
本实施例的目标用户预测方法,进一步包括了生成用户介质网络图的步骤,使得本实施例的方法具备了生成用户介质网络图的功能,能够有效的扩展本实施例的方法的应用范围。
作为一个可选的实施例,参考图7,所述的目标用户预测方法中,所述得到目标用户预测结果的步骤,具体包括:
步骤701、根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到未关联有所述标签的用户节点表示的用户为目标用户的概率值。
本实施例中,将待预测用户介质网络图输入训练后的图注意力网络模型进行预测后,训练后的图注意力网络模型输出的结果为用户介质网络图中,未关联有标签的用户节点表示的用户为目标用户的概率值。基于前述实施例中的示例,当用于表示目标用户的标签的赋值为1时,训练后的图注意力网络模型输出的结果中各用户节点表示的用户为目标用户的概率值的取值范围即为[0-1]。
步骤702、将所述概率值与预设的概率阈值比较,将所述概率值大于所述概率阈值的所述用户节点表示的用户确定为目标用户。
本实施例中,预先设置有一概率阈值,该概率阈值用于对目标用户预测结果中的各概率值进行筛选,以筛选出为目标用户可能性更大的用户。例如,可以将概率阈值设置为0.6,则训练后的图注意力网络模型输出的结果中,概率值大于0.6的用户节点表示的目标用户将会被确定为目标用户。
步骤703、根据确定得到的所述目标用户,生成所述目标用户预测结果。
本实施例中,生成目标用户预测结果中包括的目标用户,其对应的为目标用户的概率值均较大,预测的准确度也相应较高。
本实施例的目标用户预测方法,对于训练后的图注意力网络模型输出的结果进行了进一步的筛选,去除掉了概率值较低的结果,保留概率值较高的结果,从而有效的提升了目标用户预测的准确度。
作为一个可选的实施例,所述的目标用户预测方法,还包括将得到的目标用户预测结果输出的步骤。
根据不同的应用场景和实施需要,具体的对于目标用户预测结果的输出方式可以灵活选择。
例如,对于本实施例的方法在单一设备上执行的应用场景,可以将目标用户预测结果直接在当前设备的显示部件(显示器、投影仪等)上以显示的方式输出,使得当前设备的操作者能够从显示部件上直接看到目标用户预测结果的内容。
又如,对于本实施例的方法在多个设备组成的系统上执行的应用场景,可以将目标用户预测结果通过任意的数据通信方式(有线连接、NFC、蓝牙、wifi、蜂窝移动网络等)发送至系统内的其他作为接收方的预设设备上,以使得接收到目标用户预测结果的预设设备可以对其进行后续处理。可选的,该预设设备可以是预设的服务器,服务器一般设置在云端,作为数据的处理和存储中心,其能够对目标用户预测结果进行存储和分发;其中,分发的接收方是终端设备,该些终端设备的持有者或操作者可以是用户、线上业务平台的管理人员、执法部门人员等。
再如,对于本实施例的方法在多个设备组成的系统上执行的应用场景时,可以将目标用户预测结果通过任意的数据通信方式直接发送至预设的终端设备,终端设备可以是前述段落列举中的一种或多种。
本实施例的目标用户预测方法,进一步包括了将得到的目标用户预测结果输出的步骤,这使得本实施例的方法能够适应于各种不同的设备和应用场景。
基于同一发明构思,参考图8,本说明书实施例还提供了一种目标用户预测装置,包括:
获取模块801,被配置为获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签;
影响度确定模块802,被配置为将所述用户介质网络图输入图注意力网络模型,得到所述用户节点与所述介质节点间的影响度;
重构模块803,被配置为根据所述影响度,重构所述用户介质网络图;
训练模块804,被配置为使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型,并在迭代训练结束时获得待预测用户介质网络图和训练后的图注意力网络模型;其中,每次迭代时,图注意力网络模型的输入均包括根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图;
预测模块805,被配置为根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。
作为一个可选的实施例,所述介质包括IP地址、WIFI名称中的至少一种。
作为一个可选的实施例,所述重构模块803,具体被配置为对于每个所述介质节点,将所述介质节点与与其相连的全部所述用户节点间的影响度求和,并除以与其相连的全部所述用户节点的个数,得到所述介质节点的权重值;将所述介质节点的权重值与预设的节点权重阈值比较,若所述介质节点的权重值大于所述节点权重阈,则删除所述介质节点以及连接至所述介质节点的全部所述边。
作为一个可选的实施例,迭代训练结束的条件为迭代达到预设的次数。
作为一个可选的实施例,所述预测模块805,具体被配置为根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到未关联有所述标签的用户节点的概率值;将所述概率值与预设的概率阈值比较,将所述概率值大于所述概率阈值的所述用户节点表示的用户确定为目标用户;根据确定得到的所述目标用户,生成所述目标用户预测结果。
作为一个可选的实施例,所述装置还包括:输出模块,被配置为对所述目标用户预测结果执行如下操作中的至少一种:显示所述目标用户预测结果;将所述目标用户预测结果发送至预设的服务器;将所述目标用户预测结果发送至预设的终端设备。
作为一个可选的实施例,所述装置还包括:生成模块,被配置为获取历史使用数据,确定用户、介质、所述用户与所述介质间的对应关系,以及目标用户相关信息;根据所述用户、所述介质和所述对应关系,生成所述用户介质网络图;根据所述目标用户相关信息,为部分所述用户节点关联所述标签。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,本说明书实施例还提供了一种电子设备,该包括电子设备存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一实施例所述的方法。
图9示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本发明实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种目标用户预测方法,包括:
获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签;
将所述用户介质网络图输入图注意力网络模型,得到连接有所述边的所述用户节点与所述介质节点间的影响度;
根据所述影响度,重构所述用户介质网络图;
使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型,并在迭代训练结束时获得待预测用户介质网络图和训练后的图注意力网络模型;其中,每次迭代时,图注意力网络模型的输入均包括根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图;
根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。
2.根据权利要求1所述的目标用户预测方法,所述介质包括IP地址、WIFI名称中的至少一种。
3.根据权利要求1所述的目标用户预测方法,所述根据所述影响度,重构所述用户介质网络图,包括:
对于每个所述介质节点,将所述介质节点与与其相连的全部所述用户节点间的影响度求和,并除以与其相连的全部所述用户节点的个数,得到所述介质节点的权重值;
将所述介质节点的权重值与预设的节点权重阈值比较,若所述介质节点的权重值大于所述节点权重阈,则删除所述介质节点以及连接至所述介质节点的全部所述边。
4.根据权利要求1所述的目标用户预测方法,迭代训练结束的条件为迭代达到预设的次数。
5.根据权利要求1所述的目标用户预测方法,所述得到目标用户预测结果,包括:
根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到未关联有所述标签的用户节点表示的用户为目标用户的概率值;
将所述概率值与预设的概率阈值比较,将所述概率值大于所述概率阈值的所述用户节点表示的用户确定为目标用户;
根据确定得到的所述目标用户,生成所述目标用户预测结果。
6.根据权利要求1所述的目标用户预测方法,还包括:
对所述目标用户预测结果执行如下操作中的至少一种:
显示所述目标用户预测结果;
将所述目标用户预测结果发送至预设的服务器;
将所述目标用户预测结果发送至预设的终端设备。
7.根据权利要求1所述的目标用户预测方法,还包括:
获取历史使用数据,确定用户、介质、所述用户与所述介质间的对应关系,以及目标用户相关信息;
根据所述用户、所述介质和所述对应关系,生成所述用户介质网络图;
根据所述目标用户相关信息,为部分所述用户节点关联所述标签。
8.一种目标用户预测装置,包括:
获取模块,被配置为获取用户介质网络图;所述用户介质网络图包括:表示用户的用户节点、表示介质的介质节点,以及连接用户节点和介质节点以表示用户与介质存在对应关系的边;其中,部分所述用户节点关联有用于表示目标用户的标签;
影响度确定模块,被配置为将所述用户介质网络图输入图注意力网络模型,得到所述用户节点与所述介质节点间的影响度;
重构模块,被配置为根据所述影响度,重构所述用户介质网络图;
训练模块,被配置为使用重构后的所述用户介质网络图迭代训练所述图注意力网络模型,并在迭代训练结束时获得待预测用户介质网络图和训练后的图注意力网络模型;其中,每次迭代时,图注意力网络模型的输入均包括根据前次迭代中图注意力网络模型输出的影响度重构后的用户介质网络图;
预测模块,被配置为根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到目标用户预测结果。
9.根据权利要求8所述的装置,所述介质包括IP地址、WIFI名称中的至少一种。
10.根据权利要求8所述的装置,所述重构模块,具体被配置为对于每个所述介质节点,将所述介质节点与与其相连的全部所述用户节点间的影响度求和,并除以与其相连的全部所述用户节点的个数,得到所述介质节点的权重值;将所述介质节点的权重值与预设的节点权重阈值比较,若所述介质节点的权重值大于所述节点权重阈,则删除所述介质节点以及连接至所述介质节点的全部所述边。
11.根据权利要求8所述的装置,迭代训练结束的条件为迭代达到预设的次数。
12.根据权利要求8所述的装置,所述预测模块,具体被配置为根据所述待预测用户介质网络图和所述训练后的图注意力网络模型,得到未关联有所述标签的用户节点的概率值;将所述概率值与预设的概率阈值比较,将所述概率值大于所述概率阈值的所述用户节点表示的用户确定为目标用户;根据确定得到的所述目标用户,生成所述目标用户预测结果。
13.根据权利要求8所述的装置,还包括:
输出模块,被配置为对所述目标用户预测结果执行如下操作中的至少一种:显示所述目标用户预测结果;将所述目标用户预测结果发送至预设的服务器;将所述目标用户预测结果发送至预设的终端设备。
14.根据权利要求8所述的装置,还包括:
生成模块,被配置为获取历史使用数据,确定用户、介质、所述用户与所述介质间的对应关系,以及目标用户相关信息;根据所述用户、所述介质和所述对应关系,生成所述用户介质网络图;根据所述目标用户相关信息,为部分所述用户节点关联所述标签。
15.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
CN202010021082.3A 2020-01-09 2020-01-09 一种目标用户预测方法、装置和电子设备 Active CN111210279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010021082.3A CN111210279B (zh) 2020-01-09 2020-01-09 一种目标用户预测方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010021082.3A CN111210279B (zh) 2020-01-09 2020-01-09 一种目标用户预测方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN111210279A true CN111210279A (zh) 2020-05-29
CN111210279B CN111210279B (zh) 2022-08-16

Family

ID=70789604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010021082.3A Active CN111210279B (zh) 2020-01-09 2020-01-09 一种目标用户预测方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN111210279B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191565A (zh) * 2021-05-18 2021-07-30 同盾科技有限公司 安全性预测方法及装置、介质、设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944915A (zh) * 2017-11-21 2018-04-20 北京深极智能科技有限公司 一种游戏用户行为分析方法及计算机可读存储介质
US20180336502A1 (en) * 2017-05-16 2018-11-22 Facebook, Inc. Systems and methods for analyzing user activity
CN109918454A (zh) * 2019-02-22 2019-06-21 阿里巴巴集团控股有限公司 对关系网络图进行节点嵌入的方法及装置
CN109934706A (zh) * 2017-12-15 2019-06-25 阿里巴巴集团控股有限公司 一种基于图结构模型的交易风险控制方法、装置以及设备
CN110009093A (zh) * 2018-12-07 2019-07-12 阿里巴巴集团控股有限公司 用于分析关系网络图的神经网络系统和方法
CN110278175A (zh) * 2018-03-14 2019-09-24 阿里巴巴集团控股有限公司 图结构模型训练、垃圾账户识别方法、装置以及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180336502A1 (en) * 2017-05-16 2018-11-22 Facebook, Inc. Systems and methods for analyzing user activity
CN107944915A (zh) * 2017-11-21 2018-04-20 北京深极智能科技有限公司 一种游戏用户行为分析方法及计算机可读存储介质
CN109934706A (zh) * 2017-12-15 2019-06-25 阿里巴巴集团控股有限公司 一种基于图结构模型的交易风险控制方法、装置以及设备
CN110278175A (zh) * 2018-03-14 2019-09-24 阿里巴巴集团控股有限公司 图结构模型训练、垃圾账户识别方法、装置以及设备
CN110009093A (zh) * 2018-12-07 2019-07-12 阿里巴巴集团控股有限公司 用于分析关系网络图的神经网络系统和方法
CN109918454A (zh) * 2019-02-22 2019-06-21 阿里巴巴集团控股有限公司 对关系网络图进行节点嵌入的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191565A (zh) * 2021-05-18 2021-07-30 同盾科技有限公司 安全性预测方法及装置、介质、设备

Also Published As

Publication number Publication date
CN111210279B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN108933713B (zh) 基于影子链路实现沙箱调试的方法、装置及业务服务器
US20140081615A1 (en) Virtual systems testing
US11651233B2 (en) Candidate visualization techniques for use with genetic algorithms
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN110826071A (zh) 软件漏洞风险预测方法、装置、设备及存储介质
US20160283848A1 (en) Automated decision support provenance and simulation
CN113268243B (zh) 内存预测方法及装置、存储介质、电子设备
CN107807841B (zh) 服务器模拟方法、装置、设备及可读存储介质
CN111815169A (zh) 业务审批参数配置方法及装置
CN107733710A (zh) 链路调用关系的构建方法、装置、计算机设备及存储介质
CN109543891A (zh) 容量预测模型的建立方法、设备及计算机可读存储介质
US20160092801A1 (en) Using complexity probability to plan a physical data center relocation
CN109635993A (zh) 基于预测模型的操作行为监控方法及装置
CN107622007A (zh) 应用测试方法和装置
CN110334012B (zh) 一种风险评估方法及装置
CN111210279B (zh) 一种目标用户预测方法、装置和电子设备
US20230040564A1 (en) Learning Causal Relationships
CN105512552B (zh) 参数检测方法及装置
CN112965711A (zh) 作业测试方法和装置、电子设备和存储介质
CN111199421B (zh) 一种基于社交关系的用户推荐方法、装置及电子设备
CN112379946A (zh) 基于yaml的模板配置方法、装置及计算机设备
CN108062401A (zh) 应用推荐方法、装置及存储介质
CN112068812A (zh) 一种微服务生成方法、装置、计算机设备和存储介质
CN116541069A (zh) 关键函数评估方法、装置、电子设备、介质和程序产品
KR102351300B1 (ko) 공공기관 인증 플랫폼 제공 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant