CN111459780B - 用户识别方法、装置、可读介质及电子设备 - Google Patents

用户识别方法、装置、可读介质及电子设备 Download PDF

Info

Publication number
CN111459780B
CN111459780B CN202010251427.4A CN202010251427A CN111459780B CN 111459780 B CN111459780 B CN 111459780B CN 202010251427 A CN202010251427 A CN 202010251427A CN 111459780 B CN111459780 B CN 111459780B
Authority
CN
China
Prior art keywords
user
sampling
identified
neighbor
behavior feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010251427.4A
Other languages
English (en)
Other versions
CN111459780A (zh
Inventor
郭琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010251427.4A priority Critical patent/CN111459780B/zh
Publication of CN111459780A publication Critical patent/CN111459780A/zh
Application granted granted Critical
Publication of CN111459780B publication Critical patent/CN111459780B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种用户识别方法、装置、可读介质及电子设备,以准确识别出具有作弊行为的用户。所述方法包括:确定待识别用户的行为特征信息,作为第一行为特征;确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为特征;根据所述第一行为特征和所述第二行为特征,通过用户识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于目标用户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得;根据所述概率,确定所述待识别用户是否属于所述目标用户类别。

Description

用户识别方法、装置、可读介质及电子设备
技术领域
本公开涉及计算机技术领域,具体地,涉及一种用户识别方法、装置、 可读介质及电子设备。
背景技术
目前,应用程序(例如,社交类应用程序、短视频类应用程序等)越来 越多地被使用,在这些应用程序的使用场景中,存在一些作弊行为,因此, 需要一种方法识别出存在作弊行为的账号。
相关技术中,一般利用GCN(Graph Convolutional Network,图卷积神 经网络)实现针对应用程序的反作弊,通过GCN对节点(即,对应于用户 的节点)特征和节点网络拓扑结构进行建模和训练,学习节点的低维表示,以识别节点是否存在作弊行为。然而,由于GCN本身的特点,学习到的节 点的低维表示无法扩展到其他节点,因此,当出现新节点(即,出现新用户) 时,无法得到该新节点的准确的低维表示,导致对新节点的识别存在准确率 不足的问题,另外,GCN自身计算需要多次迭代,面对大量数据,需要极 大的实时计算力,因此还存在计算效率不高的问题。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的 具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技 术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案 的范围。
第一方面,本公开提供一种用户识别方法,所述方法包括:
确定待识别用户的行为特征信息,作为第一行为特征;
确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行 为特征;
根据所述第一行为特征和所述第二行为特征,通过用户识别模型识别得 到识别结果,所述识别结果标识所述待识别用户属于目标用户类别的概率; 其中,所述用户识别模型通过训练图神经网络模型获得;
根据所述概率,确定所述待识别用户是否属于所述目标用户类别。
第二方面,本公开提供一种用户识别装置,所述装置包括:
第一确定模块,用于确定待识别用户的行为特征信息,作为第一行为特 征;
第二确定模块,用于确定所述待识别用户的多阶采样邻居用户的行为特 征信息,作为第二行为特征;
识别模块,用于根据所述第一行为特征和所述第二行为特征,通过用户 识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于目标用 户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得;
第三确定模块,用于根据所述概率,确定所述待识别用户是否属于所述 目标用户类别。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序, 该程序被处理装置执行时实现本公开第一方面所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开 第一方面所述方法的步骤。
通过上述技术方案,确定待识别用户的行为特征信息,作为第一行为特 征,确定待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为特 征,根据第一行为特征和第二行为特征,通过用户识别模型识别得到识别结 果,识别结果标识待识别用户属于目标用户类别的概率,根据概率,确定待 识别用户是否属于目标用户类别。其中,用户识别模型通过训练图神经网络 模型获得。这样,以图神经网络模型为基础,结合用户特征和用户之间的关联关系对用户进行识别,能够提升识别准确性,进而在反作弊场景下能够更 加准确地识别出存在作弊行为的用户。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、 优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同 或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
在附图中:
图1是根据本公开的一种实施方式提供的用户识别方法的流程图;
图2是根据本公开提供的用户识别方法中,用户关系图的一种示例性的 示意图;
图3是根据本公开提供的用户识别方法中,确定待识别用户的多阶采样 邻居用户的行为特征信息的步骤的一种示例性的流程图;
图4是根据本公开的一种实施方式提供的用户识别装置的框图;
图5是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公 开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而 且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加 透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺 序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省 略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。 术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个 实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一 些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中 给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的 装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的 功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限 制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该 理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用 于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
如背景技术中所述,现有技术中,一般将图卷积神经网络GCN应用在 反作弊场景中,该方法同时对节点(即,用户)特征和节点网络拓扑结构进 行建模和训练,学习得到节点的低维表示,识别节点是否存在作弊行为。一 般包括以下步骤:获取节点信息,根据关联关系(反映用户之间的关注关系) 构造图结构;采用全图的拉普拉斯矩阵与节点原始特征矩阵相乘,作为一次卷积操作,得到的输出隐层继续迭代进行卷积操作。在该方法中,需要进行 多次迭代的拉普拉斯矩阵与节点隐层信息相乘,在面对大量数据时,需要耗 费大量时间及资源,效率不高。并且,GCN本身学习到的节点低维表示无 法扩展到本节点之外的其他节点,所以出现新节点(即,出现新用户)时, 无法得到新节点的准确的低维表示,导致对新节点的识别存在准确率不足的问题。
为了解决上述问题,本公开提供一种用户识别方法、装置、可读介质及 电子设备,基于图神经网络模型实现。示例地,图神经网络模型可以为 GraphSAGE模型。本方案以图神经网络模型为基础,结合用户特征和用户 之间的关联关系(反映用户之间的关注关系),以在反作弊场景下对用户进 行准确识别。
下面将以本公开所使用的图神经网络模型为GraphSAGE模型为示例, 对本公开的方案进行详细的说明。GraphSAGE是Graph SAmple and aggreGatE的缩写,它是一种适用于大规模网络的归纳式框架,能够为新增 节点快速生成embedding,而无需额外训练过程。GraphSAGE模型通过获取节点(即,用户)信息,根据关联关系构造图结构,对节点的邻居进行随机 抽样,并进行训练,以学习生成节点低维表示的函数。
在介绍本公开所提供的方法之前,首先对GraphSAGE模型的数据处理 进行简单介绍,GraphSAGE的核心操作是根据待处理节点的邻居节点进行 采样和聚合操作。数据处理过程中,第一步是采样,也就是从待处理节点中 的邻居节点中选取用于模型训练的节点,第二步是聚合邻居节点的信息,第 三步是使用第二步聚合得到的信息,来预测最终需要预测的信息。
GraphSAGE的主要内容如表1中所示。
表1GraphSAGE的主要内容
GraphSAGE的大体思想是,每一次迭代,都会从待处理节点的邻居节 点获取信息。随着迭代次数的增加,待处理节点会基于其在图中的位置,获 取越来越多位于图远端的信息。
表1中示出了GraphSAGE模型内部前向传播的过程,模型的输入为 G={V,E,A},其中,V表示节点(即,用户),E表示该节点的关联关系, A表示该节点的特征向量。GraphSAGE模型包括聚合函数AGGREGATEk, 权值矩阵Wk,k表示当前聚合的邻居信息的深度,hk表示节 点在这一步的低维向量表示。对于每个节点,在邻居节点中进行采样,聚合 采样出来的邻居节点上一次迭代的信息并用表示。
其中,在邻居节点中使用随机采样的采样方式。以及,聚合存在采用多 种方式,示例地,可以采用平均聚合方式,取抽样邻居的隐藏层向量的平均, 定义如下:
之后将聚合后的邻居节点信息和节点当前低维表示进行拼接。最后 将拼接后的向量传入全连接层,经过激活函数和正则化处理之后作为下一次 迭代的节点表示。如此循环往复,就能够聚合出本节点的节点表示,该节点 表示能够反映本节点和本节点的各阶邻居节点的节点信息,从而进行后续的 数据处理。
图1是根据本公开的一种实施方式提供的用户识别方法的流程图。如图 1所示,该方法可以包括以下步骤。
在步骤11中,确定待识别用户的行为特征信息,作为第一行为特征。
用户的行为特征信息用于指示实际发生的用户的行为,用户的行为可以 表示用户在应用程序中所执行的操作,例如投稿行为、关注行为、点赞行为 等。示例地,对于某一固定类型的应用程序,用户的行为通常是可预期的, 此时,可以预设若干种用户行为,并基于用户实际执行了哪些行为确定用户 对应于各种预设的用户行为的值,最终拼接形成特征向量,作为该用户的行为特征信息。
因此,根据待识别用户的行为,可以确定出待识别用户的行为特征信息, 进而,可以将待识别用户的行为特征信息作为第一行为特征。
在步骤12中,确定待识别用户的多阶采样邻居用户的行为特征信息, 作为第二行为特征。
其中,待识别用户的多阶采样邻居用户基于用户关系图获得。用户关系 图存储有包括待识别用户在内的用户之间的关联关系,且用户关系图周期性 更新。
用户关系图基于用户的行为特征信息和用户之间的关注关系构建,以社 交网络为例,处于社交网络中的用户之间通常具有相互之间的关注关系、且 每一用户存在对应的用户行为(例如,点赞、投稿等),基于这些内容,可 以构建出用户关系图。一般来说,在用户关系图中,每一节点代表一个用户, 且每一节点对应有该节点所代表的用户的行为特征信息,同时,具有关注关 系的两个用户之间通过无向线段连接。某节点的第k阶邻居节点定义为该节 点为起点沿图中线段经k跳跃后到达的所有节点,这里的k可以相当于上文 中给出的k,也就是深度。在图2所示的用户关系图中,节点P的1阶邻居 节点为5个,分别为Q1~Q5,节点P的2阶邻居节点为8个,分别为R1~R8。
由于社交网络的实时性,随时随地都会有新用户加入(如,新注册用户), 基于这一特性,用户关系图也不能总是一成不变。而为了尽可能选取到更高 质量的采样邻居用户,需要周期性更新用户关系图,其中,更新周期可以根 据经验值设定。示例地,周期性更新用户关系图的方式可以如下所述:
获取社交网络中新用户的行为特征信息以及新用户与用户关系图中已 有用户之间的关注关系;
根据新用户与已有用户之间的关注关系确定该新用户与用户关系图中 各节点的连接关系;
根据新用户的行为特征信息及新用户的连接关系在用户关系图中添加 与新用户对应的节点。
也就是说,周期性获取社交网络中新用户的相关信息(包括每一新用户 的行为特征信息和新用户与用户关系图中已有用户之间的关注关系),根据这些信息确定新用户在用户关系图中的位置(即,与用户关系图中节点之间 的连接关系),并将新用户相关信息同步到用户关系图中,以完成用户关系 图的更新。在这里,判断是否为新用户,是以用户关系图中是否存在代表该 用户的节点为依据,若在用户关系图中并无对应于某一用户的节点,则该用 户就可以被认为是新用户。相对应地,用户关系图中已有用户就是相关信息 已被记录至用户关系图中的用户。
因此,确定待识别用户的多阶采样邻居用户的行为特征信息,作为第二 行为特征,就是从用户关系图中,在待识别用户的各阶邻居用户中挑选出合 适的邻居用户作为采样邻居用户,并获得这些采样邻居用户的行为特征信息, 作为第二行为特征。示例地,可以从待识别用户的1阶邻居用户和2阶邻居 用户中挑选采样邻居用户,并获得采样邻居用户的行为特征信息并作为第二 行为特征。
在步骤13中,根据第一行为特征和第二行为特征,通过用户识别模型 识别得到识别结果。
其中,识别结果标识待识别用户属于目标用户类别的概率。示例地,用 户属于目标用户类别可以表征用户存在作弊行为。再例如,用户属于目标用 户类别可以表征用户不存在作弊行为。
用户识别模型可以通过训练图神经网络模型获得,例如,GraphSAGE 模型。其中,有关于图神经网络模型特别是GraphSAGE的描述及作用已在 前文中给出,此处不赘述。
在步骤14中,根据概率,确定待识别用户是否属于目标用户类别。
在一种可能的实施方式中,若经步骤13所得的识别结果所标识的概率 大于预设概率阈值,确定待识别用户属于目标用户类别。
在另一种可能的实施方式中,若经步骤13所得的识别结果所标识的概 率小于或等于预设概率阈值,确定待识别用户不属于目标用户类别。
示例地。预设概率阈值可以为0.9。
示例地,若用户属于目标用户类别表征用户存在作弊行为,则步骤14 可以识别出待识别用户是否是存在作弊行为的用户,从而可以找出存在作弊 行为的用户。再例如,若用户属于目标用户类别表征用户不存在作弊行为, 则步骤14可以识别出待识别用户是否是不存在作弊行为的用户,从而依然 可以找出存在作弊行为的用户。
采用上述方式,确定待识别用户的行为特征信息,作为第一行为特征, 确定待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为特征, 根据第一行为特征和第二行为特征,通过用户识别模型识别得到识别结果, 识别结果标识待识别用户属于目标用户类别的概率,根据概率,确定待识别 用户是否属于目标用户类别。其中,用户识别模型通过训练图神经网络模型获得。这样,以图神经网络模型为基础,结合用户特征和用户之间的关联关 系对用户进行识别,能够提升识别准确性,进而在反作弊场景下能够更加准 确地识别出存在作弊行为的用户。
为了使本领域技术人员更加理解本发明实施例提供的技术方案,下面对 上文中的相应步骤及相关概念进行详细的说明。
首先对步骤12中,确定待识别用户的多阶邻居用户的第二行为特征进 行详细说明。
在一种可能的实施方式中,步骤12可以包括以下步骤,如图3所示。
在步骤31中,确定用户识别模型对应的采样阶数以及对应于各阶的用 户采样数量。
用户识别模型在训练过程中使用的训练数据是有固定格式的,因此,在 使用该用户识别模型时就应当遵循训练数据的格式。一般来说,应当遵循用 户识别模型所对应的采样阶数以及对应于各阶的用户采样数量。例如,用户 识别模型对应的采样阶数为2,且对应于1阶的用户采样数量为50,对应于 2阶的用户采样数量为30,则在使用用户识别模型时的第二行为特征就应当 是对应于1阶的50个采样邻居用户的行为特征信息以及对应于2阶的30个 采样邻居用户的行为特征信息,也就是说,待识别用户的多阶邻居用户中包 括取自待识别用户1阶邻居用户的50个采样邻居用户和取自待识别用户2 阶邻居用户的30个采样邻居用户。
在步骤32中,根据采样阶数以及对应于各阶的用户采样数量,确定待 识别用户的采样邻居用户。
如上所述,根据用户识别模型所对应的采样阶数以及对应于各阶的用户 采样数量,就可以从待识别用户的各阶邻居用户中确定出对应数量的采样邻 居用户。例如,若用户识别模型对应的采样阶数为4,且对应于1~4阶的用 户采样数量均为50,则从待识别用户的1~4阶邻居用户中分别各自选取50 个邻居用户作为采样邻居用户,即,待识别用户的多阶采样邻居用户共200 个。
在一种可能的实施例中,对于偶数阶,该阶的采样邻居用户是根据该阶 各邻居用户的行为特征信息与所述第一行为特征之间的相似度确定的。
由于在用户关注场景下,待识别用户的对应于偶数阶的邻居用户才有可 能与待识别用户同属关注者或被关注者,也就更有可能与待识别用户同属一 个黑产团伙,而来自同一黑产团伙的具有作弊行为的多个用户必然具有相似 的行为。基于这一思想,在获取待识别用户的采样邻居用户时,若到达偶数 阶,则对于与待识别用户的行为特征相似的邻居用户,使其被采样的概率相比于与待识别用户的行为特征并不相似的邻居用户更高一些,才能够有更大 几率采集到可能具有作弊行为的用户。
示例地,可以通过如下方式确定对应于待识别用户的目标阶的采样邻居 用户:
分别计算待识别用户的目标阶的所有邻居用户中每一邻居用户的行为 特征信息与第一行为特征之间的相似度;
根据各个相似度确定待识别用户的目标阶的每一邻居用户各自对应的 采样概率;
根据采样概率和预设的概率抽样算法确定对应于目标阶的采样邻居用 户。
首先,对于待识别用户的目标阶的所有邻居用户中的每一邻居用户,计 算该邻居用户的行为特征信息与第一行为特征之间的相似度。示例地,可以 计算邻居用户的行为特征信息与第一行为特征之间的余弦相似度,并将余弦 相似度作为对应于这一邻居用户的相似度。
之后,根据计算所得的各个相似度,确定待识别用户的目标阶的每一邻 居用户各自对应的采样概率。示例地,可以使用归一化方法得到上述每一邻 居用户对应的采样概率,也就是将各个相似度转换为0~1之间的小数,并且,使得这些小数的和为1。举例来说,若待识别用户的2阶邻居用户共有三个, 分别为NE1、NE2、NE3,且计算得到邻居用户NE1~NE3的相似度依次为 0.1、0.15、0.25,则经过归一化后得到邻居用户NE1~NE3的采样概率依次 为0.2、0.3、0.5。此后,根据采样概率和预设的概率抽样算法,就可以确定 对应于目标阶的采样邻居用户。其中,概率抽样算法(即,指定概率取样) 是基于待选对象的概率对待选对象进行采样的方法,属于本领域的常规手段,为本领域技术人员公知,此处不赘述。以python语言为例,可以使用 np.random.choice()实现概率抽样,其实现可以参考如下代码:
np.random.seed(0)
p=np.array([0.1,0.0,0.7,0.2])
index=np.random.choice([0,1,2,3],p=p.ravel())
优选地,目标阶为偶数阶。对于某一偶数阶来说,该偶数阶对应有待识 别用户的的若干邻居用户可供选择(相当于前文所述的采样),在这些可选 择的邻居用户中,若某一邻居用户的行为特征信息与待识别用户的第一行为 特征的相似度较高,则该邻居用户对应的采样概率就较高,也就更有可能被 采样成为采样邻居用户。
采用上述方式,能够更加有针对性地提取待识别用户的邻居用户的信息 用于对待识别用户的识别,从而,能够提升对具有作弊行为的用户的识别准 确性。
另外,针对奇数阶的采样,也可以使用上述方式,也就是基于相似度确 定奇数阶的采样邻居用户。
在另一种可能的实施方式中,对应于待识别用户的奇数阶的采样邻居用 户,还可以使用随机采样的方式,也就是在待识别用户的奇数阶的所有邻居 用户中,随机选取若干个(对应于用户识别模型所要求的用户采样数量)邻居用户作为对应于该奇数阶的采样邻居用户。
在步骤33中,获取每一采样邻居用户的行为特征信息,作为第二行为 特征。
由于用户关系图中的每一用户的行为特征信息均可知,因此,在确定待 识别用户的采样邻居用户后,即可获取每一采样邻居用户的行为特征信息, 作为第二行为特征。
下面,对本公开所使用的用户识别模型进行详细说明。在一种可能的实 施方式中,用户识别模型可以通过以下方式获得:
获取多组训练数据,每组训练数据包括一历史用户的第三行为特征、历 史用户的多阶采样邻居用户的第四行为特征以及用于指示历史用户是否属 于目标用户类别的标记信息;
根据多组训练数据,对图神经网络模型进行训练,以获得用户识别模型。
其中,历史用户的多阶采样邻居用户的选取方式可以参照本公开任意实 施例所提供的对待识别用户的多阶采样邻居用户的选取,此处不做重复说明。 示例地,在获取训练数据时,在对历史用户的邻居用户进行采样时,若采样 到偶数阶,采样所得的与该偶数阶对应的邻居用户的行为特征信息与历史用 户的第三行为特征信息的相似度越高,该邻居用户成为对应于该偶数阶的第二邻居用户的概率越大。
在准备好多组训练数据后,就可以开始进行模型训练。示例地,在每一 次的训练过程中,可以将一历史用户的第三行为特征和第四行为特征作为输 入数据、并将该历史用户对应的标记信息作为真实输出,对图神经网络模型 (例如,GraphSAGE模型)内部的参数进行调整,在满足模型训练结束条 件时,将获得的模型作为用户识别模型。其中,基于已有训练数据对模型进 行训练的过程属于本领域的公知技术,此处不进行过多说明。
在一种可能的实施方式中,获取多组训练数据可以为:
从存储于硬盘的训练数据文件中获取多组训练数据。
其中,训练数据文件中的每一行数据可以对应于一组或多组训练数据, 或者,训练数据中的多行数据可以对应于一组训练数据。
在现有技术中,一般使用固定的训练集进行训练,且训练集存储于内存 中,模型也运行于内存,这就导致模型的训练收到训练集的数据量的影响, 若训练集的数据量过多,不仅会影响模型的训练效率,还会导致训练集无法 全部应用于模型训练。
因此,在上述实施方式中,将训练数据通过训练数据文件存储于内存之 外的硬盘,从而,在训练过程中,可以从只需要训练数据存储文件中取一行 或几行数据进行当前的训练,不仅能减少内存占用,还能保证所有的训练数 据均能成功用于模型训练。实际上,就是使用pipeline方式获取训练数据。
图4是根据本公开的一种实施方式提供的用户识别装置的框图。如图4 所示,该装置40可以包括:
第一确定模块41,用于确定待识别用户的行为特征信息,作为第一行为 特征;
第二确定模块42,用于确定所述待识别用户的多阶采样邻居用户的行为 特征信息,作为第二行为特征;
模型处理模块43,用于根据所述第一行为特征和所述第二行为特征,通 过用户识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于 目标用户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得;
第三确定模块44,用于根据所述概率,确定所述待识别用户是否属于所 述目标用户类别。
可选地,所述第二确定模块42包括:
第一确定子模块,用于确定所述用户识别模型对应的采样阶数以及对应 于各阶的用户采样数量;
第二确定子模块,用于根据所述采样阶数以及所述对应于各阶的用户采 样数量,确定所述待识别用户的所述采样邻居用户;其中,对于偶数阶,该 阶的采样邻居用户是根据该阶各邻居用户的行为特征信息与所述第一行为 特征之间的相似度确定的;
获取子模块,用于获取每一所述采样邻居用户的行为特征信息,作为所 述第二行为特征。
可选地,所述第二确定子模块用于通过如下方式确定对应于待识别用户 的目标阶的采样邻居用户:
分别计算所述待识别用户的所述目标阶的所有邻居用户中每一邻居用 户的行为特征信息与所述第一行为特征之间的相似度;
根据各个所述相似度确定所述待识别用户的所述目标阶的每一所述邻 居用户各自对应的采样概率;
根据所述采样概率和预设的概率抽样算法确定对应于所述目标阶的采 样邻居用户。
可选地,所述用户识别模型通过以下方式获得:
获取多组训练数据,每组训练数据包括一历史用户的第三行为特征、所 述历史用户的多阶采样邻居用户的第四行为特征以及用于指示所述历史用 户是否属于目标用户类别的标记信息;
根据所述多组训练数据,对图神经网络模型进行训练,以获得所述用户 识别模型。
可选地,从存储于硬盘的训练数据文件中获取所述多组训练数据。
可选地,所述第三确定模块44包括:
第二确定子模块,用于若所述概率大于预设概率阈值,确定所述待识别 用户属于所述目标用户类别;
第三确定子模块,用于若所述概率小于或等于所述预设概率阈值,确定 所述待识别用户不属于所述目标用户类别。
可选地,所述待识别用户的多阶采样邻居用户基于用户关系图获得,其 中,所述用户关系图存储有包括所述待识别用户在内的用户之间的关联关系, 且所述用户关系图周期性更新。
可选地,用户属于所述目标用户类别表征所述用户存在作弊行为。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有 关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备600的 结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、 笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、 PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动 终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备 仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备600可以包括处理装置(例如中央处理器、图形 处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者 从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适 当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种 程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相 连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、 键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括 例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、 硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设 备600与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各 种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的 装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现 为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包 括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执 行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通 过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者 从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介 质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介 质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系 统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例 子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、 光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算 机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可 读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承 载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质 还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或 者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当 的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任 意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络 协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网 络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际 网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任 何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存 在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程 序被该电子设备执行时,使得该电子设备:确定待识别用户的行为特征信息, 作为第一行为特征;确定所述待识别用户的多阶采样邻居用户的行为特征信 息,作为第二行为特征;根据所述第一行为特征和所述第二行为特征,通过 用户识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于目标用户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得; 根据所述概率,确定所述待识别用户是否属于所述目标用户类别。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操 作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计 语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—— 诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在 用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上 执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和 计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或 框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、 程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行 指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以 以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可 以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能 而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程 图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可 以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模 块本身的限定,例如,第一确定模块还可以被描述为“确定待识别用户的行 为特征信息作为第一行为特征的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来 执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场 可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、 片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或 存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结 合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介 质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红 外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算 机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编 程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器 (CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,提供了一种用户识别方法,所述方法 包括:
确定待识别用户的行为特征信息,作为第一行为特征;
确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行 为特征;
根据所述第一行为特征和所述第二行为特征,通过用户识别模型识别得 到识别结果,所述识别结果标识所述待识别用户属于目标用户类别的概率; 其中,所述用户识别模型通过训练图神经网络模型获得;
根据所述概率,确定所述待识别用户是否属于所述目标用户类别。
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,所 述确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为 特征,包括:
确定所述用户识别模型对应的采样阶数以及对应于各阶的用户采样数 量;
根据所述采样阶数以及所述对应于各阶的用户采样数量,确定所述待识 别用户的所述采样邻居用户;其中,对于偶数阶,该阶的采样邻居用户是根 据该阶各邻居用户的行为特征信息与所述第一行为特征之间的相似度确定 的;
获取每一所述采样邻居用户的行为特征信息,作为所述第二行为特征。
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,通 过如下方式确定对应于待识别用户的目标阶的采样邻居用户:
分别计算所述待识别用户的所述目标阶的所有邻居用户中每一邻居用 户的行为特征信息与所述第一行为特征之间的相似度;
根据各个所述相似度确定所述待识别用户的所述目标阶的每一所述邻 居用户各自对应的采样概率;
根据所述采样概率和预设的概率抽样算法确定对应于所述目标阶的采 样邻居用户。
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,所 述用户识别模型通过以下方式获得:
获取多组训练数据,每组训练数据包括一历史用户的第三行为特征、所 述历史用户的多阶采样邻居用户的第四行为特征以及用于指示所述历史用 户是否属于目标用户类别的标记信息;
根据所述多组训练数据,对图神经网络模型进行训练,以获得所述用户 识别模型。
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,所 述获取多组训练数据,包括:
从存储于硬盘的训练数据文件中获取所述多组训练数据。。
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,所 述根据所述概率,确定所述待识别用户是否属于所述目标用户类别,包括:
若所述概率大于预设概率阈值,确定所述待识别用户属于所述目标用户 类别;
若所述概率小于或等于所述预设概率阈值,确定所述待识别用户不属于 所述目标用户类别。
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,待 识别用户的多阶采样邻居用户基于用户关系图获得,其中,所述用户关系图 存储有包括所述待识别用户在内的用户之间的关联关系,且所述用户关系图 周期性更新
根据本公开的一个或多个实施例,提供了一种用户识别方法,其中,用 户属于所述目标用户类别表征所述用户存在作弊行为。
根据本公开的一个或多个实施例,提供了一种用户识别装置,所述装置 包括:
第一确定模块,用于确定待识别用户的行为特征信息,作为第一行为特 征;
第二确定模块,用于确定所述待识别用户的多阶采样邻居用户的行为特 征信息,作为第二行为特征;
识别模块,用于根据所述第一行为特征和所述第二行为特征,通过用户 识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于目标用 户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得;
第三确定模块,用于根据所述概率,确定所述待识别用户是否属于所述 目标用户类别。
根据本公开的一个或多个实施例,提供了一种计算机可读介质,其上存 储有计算机程序,该程序被处理装置执行时实现本公开任意实施例所述方法 的步骤。
根据本公开的一个或多个实施例,提供了一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开 任意实施例所述方法的步骤。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领 域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下, 由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上 述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替 换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些 操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务 和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现 细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的 上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合 的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题, 但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定 特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的 示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

Claims (10)

1.一种用户识别方法,其特征在于,所述方法包括:
确定待识别用户的行为特征信息,作为第一行为特征;
确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为特征,其中,所述邻居用户为用户关系图中以所述待识别用户代表的节点为起点,沿所述用户关系图中的线段经跳跃后到达的节点所代表的用户,在所述用户关系图中,每一节点代表一个用户;
根据所述第一行为特征和所述第二行为特征,通过用户识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于目标用户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得;
根据所述概率,确定所述待识别用户是否属于所述目标用户类别;
其中,所述确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为特征,包括:
确定所述用户识别模型对应的采样阶数以及对应于各阶的用户采样数量;
根据所述采样阶数以及所述对应于各阶的用户采样数量,确定所述待识别用户的所述采样邻居用户;其中,对于偶数阶,该阶的采样邻居用户是根据该阶各邻居用户的行为特征信息与所述第一行为特征之间的相似度确定的;
获取每一所述采样邻居用户的行为特征信息,作为所述第二行为特征。
2.根据权利要求1所述的方法,其特征在于,通过如下方式确定对应于待识别用户的目标阶的采样邻居用户:
分别计算所述待识别用户的所述目标阶的所有邻居用户中每一邻居用户的行为特征信息与所述第一行为特征之间的相似度;
根据各个所述相似度确定所述待识别用户的所述目标阶的每一所述邻居用户各自对应的采样概率;
根据所述采样概率和预设的概率抽样算法确定对应于所述目标阶的采样邻居用户。
3.根据权利要求1所述的方法,其特征在于,所述用户识别模型通过以下方式获得:
获取多组训练数据,每组训练数据包括一历史用户的第三行为特征、所述历史用户的多阶采样邻居用户的第四行为特征以及用于指示所述历史用户是否属于目标用户类别的标记信息;
根据所述多组训练数据,对图神经网络模型进行训练,以获得所述用户识别模型。
4.根据权利要求3所述的方法,其特征在于,所述获取多组训练数据,包括:
从存储于硬盘的训练数据文件中获取所述多组训练数据。
5.根据权利要求1所述的方法,其特征在于,所述根据所述概率,确定所述待识别用户是否属于所述目标用户类别,包括:
若所述概率大于预设概率阈值,确定所述待识别用户属于所述目标用户类别;
若所述概率小于或等于所述预设概率阈值,确定所述待识别用户不属于所述目标用户类别。
6.根据权利要求1所述的方法,其特征在于,所述待识别用户的多阶采样邻居用户基于用户关系图获得,其中,所述用户关系图存储有包括所述待识别用户在内的用户之间的关联关系,且所述用户关系图周期性更新。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述目标用户类别表征所述用户存在作弊行为。
8.一种用户识别装置,其特征在于,所述装置包括:
第一确定模块,用于确定待识别用户的行为特征信息,作为第一行为特征;
第二确定模块,用于确定所述待识别用户的多阶采样邻居用户的行为特征信息,作为第二行为特征,其中,所述邻居用户为用户关系图中以所述待识别用户代表的节点为起点,沿所述用户关系图中的线段经跳跃后到达的节点所代表的用户,在所述用户关系图中,每一节点代表一个用户;
识别模块,用于根据所述第一行为特征和所述第二行为特征,通过用户识别模型识别得到识别结果,所述识别结果标识所述待识别用户属于目标用户类别的概率;其中,所述用户识别模型通过训练图神经网络模型获得;
第三确定模块,用于根据所述概率,确定所述待识别用户是否属于所述目标用户类别;
其中,所述第二确定模块包括:
第一确定子模块,用于确定所述用户识别模型对应的采样阶数以及对应于各阶的用户采样数量;
第二确定子模块,用于根据所述采样阶数以及所述对应于各阶的用户采样数量,确定所述待识别用户的所述采样邻居用户;其中,对于偶数阶,该阶的采样邻居用户是根据该阶各邻居用户的行为特征信息与所述第一行为特征之间的相似度确定的;
获取子模块,用于获取每一所述采样邻居用户的行为特征信息,作为所述第二行为特征。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
CN202010251427.4A 2020-04-01 2020-04-01 用户识别方法、装置、可读介质及电子设备 Active CN111459780B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010251427.4A CN111459780B (zh) 2020-04-01 2020-04-01 用户识别方法、装置、可读介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010251427.4A CN111459780B (zh) 2020-04-01 2020-04-01 用户识别方法、装置、可读介质及电子设备

Publications (2)

Publication Number Publication Date
CN111459780A CN111459780A (zh) 2020-07-28
CN111459780B true CN111459780B (zh) 2023-04-07

Family

ID=71685781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010251427.4A Active CN111459780B (zh) 2020-04-01 2020-04-01 用户识别方法、装置、可读介质及电子设备

Country Status (1)

Country Link
CN (1) CN111459780B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035548A (zh) * 2020-08-31 2020-12-04 北京嘀嘀无限科技发展有限公司 识别模型的获取方法、识别方法、装置、设备及介质
CN117033745B (zh) * 2023-10-10 2024-01-09 北京智慧易科技有限公司 一种作弊对象识别方法、系统、设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201515384D0 (en) * 2015-08-28 2015-10-14 Status Today Ltd User and user group network monitoring
CN205665733U (zh) * 2016-04-05 2016-10-26 陈进民 广告传媒投放终端中基于细胞神经网络或卷积神经网络的用户识别系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
US10013694B1 (en) * 2013-12-30 2018-07-03 EMC IP Holding Company LLC Open data collection for threat intelligence posture assessment
CN110135681A (zh) * 2019-04-03 2019-08-16 平安科技(深圳)有限公司 风险用户识别方法、装置、可读存储介质及终端设备
CN110348528A (zh) * 2019-07-16 2019-10-18 成都威嘉软件有限公司 基于多维数据挖掘的用户信用确定方法
CN110516422A (zh) * 2019-08-30 2019-11-29 北京字节跳动网络技术有限公司 用户身份的识别方法、装置、电子设备及存储介质
CN110674414A (zh) * 2019-09-20 2020-01-10 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质
CN110705585A (zh) * 2019-08-22 2020-01-17 深圳壹账通智能科技有限公司 网络欺诈识别方法、装置、计算机装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183282B2 (en) * 2013-03-15 2015-11-10 Facebook, Inc. Methods and systems for inferring user attributes in a social networking system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10013694B1 (en) * 2013-12-30 2018-07-03 EMC IP Holding Company LLC Open data collection for threat intelligence posture assessment
GB201515384D0 (en) * 2015-08-28 2015-10-14 Status Today Ltd User and user group network monitoring
CN205665733U (zh) * 2016-04-05 2016-10-26 陈进民 广告传媒投放终端中基于细胞神经网络或卷积神经网络的用户识别系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN110135681A (zh) * 2019-04-03 2019-08-16 平安科技(深圳)有限公司 风险用户识别方法、装置、可读存储介质及终端设备
CN110348528A (zh) * 2019-07-16 2019-10-18 成都威嘉软件有限公司 基于多维数据挖掘的用户信用确定方法
CN110705585A (zh) * 2019-08-22 2020-01-17 深圳壹账通智能科技有限公司 网络欺诈识别方法、装置、计算机装置及存储介质
CN110516422A (zh) * 2019-08-30 2019-11-29 北京字节跳动网络技术有限公司 用户身份的识别方法、装置、电子设备及存储介质
CN110674414A (zh) * 2019-09-20 2020-01-10 北京字节跳动网络技术有限公司 目标信息识别方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于多信息融合表示学习的关联用户挖掘算法;韩忠明等;《计算机科学》(第04期);全文 *

Also Published As

Publication number Publication date
CN111459780A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN108520470B (zh) 用于生成用户属性信息的方法和装置
CN111708876B (zh) 生成信息的方法和装置
CN112650841A (zh) 信息处理方法、装置和电子设备
CN111459780B (zh) 用户识别方法、装置、可读介质及电子设备
CN110633423A (zh) 目标账号识别方法、装置、设备及存储介质
CN111368973A (zh) 用于训练超网络的方法和装置
CN111915086A (zh) 异常用户预测方法和设备
CN116128055A (zh) 图谱构建方法、装置、电子设备和计算机可读介质
CN114494709A (zh) 特征提取模型的生成方法、图像特征提取方法和装置
WO2022001887A1 (zh) 用于训练物品编码模型的方法和装置
CN115700548A (zh) 用户行为预测的方法、设备和计算机程序产品
CN113256339A (zh) 资源投放的方法、装置、存储介质及电子设备
CN113140012A (zh) 图像处理方法、装置、介质及电子设备
CN111581455B (zh) 文本生成模型的生成方法、装置和电子设备
CN115757933A (zh) 推荐信息生成方法、装置、设备、介质和程序产品
CN111626044B (zh) 文本生成方法、装置、电子设备及计算机可读存储介质
CN111582456B (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN111898658B (zh) 图像分类方法、装置和电子设备
CN111935259B (zh) 目标帐号集合的确定方法和装置、存储介质及电子设备
CN113220922A (zh) 图像搜索方法、装置和电子设备
CN111860518B (zh) 用于分割图像的方法、装置、设备和计算机可读介质
CN117493688B (zh) 基于用户画像的教学信息推荐方法、装置、电子设备
CN111582482B (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN116629984B (zh) 基于嵌入模型的产品信息推荐方法、装置、设备和介质
CN117633747A (zh) 身份映射匹配方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant