CN113946758B - 一种数据识别方法、装置、设备及可读存储介质 - Google Patents

一种数据识别方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113946758B
CN113946758B CN202010610250.2A CN202010610250A CN113946758B CN 113946758 B CN113946758 B CN 113946758B CN 202010610250 A CN202010610250 A CN 202010610250A CN 113946758 B CN113946758 B CN 113946758B
Authority
CN
China
Prior art keywords
user
feature
category
social
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010610250.2A
Other languages
English (en)
Other versions
CN113946758A (zh
Inventor
陈昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010610250.2A priority Critical patent/CN113946758B/zh
Publication of CN113946758A publication Critical patent/CN113946758A/zh
Application granted granted Critical
Publication of CN113946758B publication Critical patent/CN113946758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种数据识别方法、装置、设备以及可读存储介质,本申请属于计算机技术领域,方法包括:获取第一用户社交特征与第二用户社交特征;获取第一用户属于建立因素类别的第一类别概率,获取第二用户属于建立因素类别的第二类别概率;根据第一用户社交特征、第二用户社交特征以及第二类别概率,确定第一用户针对建立因素类别的第一类别表示特征,根据第二用户社交特征、第一用户社交特征以及第一类别概率,确定第二用户的第二类别表示特征;将第二类别表示特征向第一类别表示特征传递,得到第一用户的目标类别表示特征;根据目标类别表示特征识别第一用户的社交异常类别。采用本申请,可以提高识别异常用户的准确率。

Description

一种数据识别方法、装置、设备及可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据识别方法、装置、设备以及可读存储介质。
背景技术
在日常生活中,部分用户存在违法行为,这些存在违法行为的用户可以被认为是异常用户,为减少异常用户的违法行为的发生,如何准确又高效地识别出异常用户以及该异常用户对应的异常类别,显得十分有必要。
在现有技术中,对于异常用户的识别,通常要收集用户的投诉信息,基于用户的投诉信息才可以确定出行为异常的用户。因为存在部分用户会进行恶意投诉,所以投诉信息中可能既含有真实投诉信息也含有虚假投诉信息,则在通过投诉信息来进行异常用户的识别时,可能会将行为合法但被恶意投诉的合法用户,识别为异常用户。也就是说,通过投诉信息来进行异常用户识别,很难保证准确率。
发明内容
本申请实施例提供一种数据识别方法、装置、设备以及可读存储介质,可以提高识别异常用户的准确率。
本申请实施例一方面提供了一种数据识别方法,包括:
获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;第二用户与第一用户具有社交关联关系;
获取第一用户属于建立因素类别的第一类别概率,获取第二用户属于建立因素类别的第二类别概率;建立因素类别是指建立社交关联关系的因素;
根据第一用户社交特征、第二用户社交特征以及第二类别概率,确定第一用户针对于建立因素类别的第一类别表示特征,根据第二用户社交特征、第一用户社交特征以及第一类别概率,确定第二用户针对于建立因素类别的第二类别表示特征;
将第二类别表示特征向第一类别表示特征进行特征传递,得到第一用户针对于建立因素类别的目标类别表示特征;
根据目标类别表示特征,识别第一用户的社交异常类别。
本申请实施例一方面提供了一种数据识别装置,包括:
特征获取模块,用于获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;第二用户与第一用户具有社交关联关系;
第一类别概率获取模块,用于获取第一用户属于建立因素类别的第一类别概率;建立因素类别是指建立社交关联关系的因素;
第二类别概率获取模块,用于获取第二用户属于建立因素类别的第二类别概率;
第一类别特征确定模块,用于根据第一用户社交特征、第二用户社交特征以及第二类别概率,确定第一用户针对于建立因素类别的第一类别表示特征;
第二类别特征确定模块,用于根据第二用户社交特征、第一用户社交特征以及第一类别概率,确定第二用户针对于建立因素类别的第二类别表示特征;
特征传递模块,用于将第二类别表示特征向第一类别表示特征进行特征传递,得到第一用户针对于建立因素类别的目标类别表示特征;
类别识别模块,用于根据目标类别表示特征,识别第一用户的社交异常类别。
其中,特征获取模块包括:
原始特征获取单元,用于获取第一用户的第一原始用户社交特征,以及第二用户的第二原始用户社交特征;
模型参数获取单元,用于获取建立因素类别对应的类别模型参数;
用户特征生成单元,用于根据类别模型参数以及第一原始用户社交特征,生成第一用户社交特征,根据类别模型参数以及第二原始用户社交特征,生成第二用户社交特征。
其中,原始特征获取单元包括:
统计特征子单元,用于获取第一用户的第一用户行为特征、第一用户资产特征以及第一用户标识特征;
特征融合子单元,用于将第一用户行为特征、第一用户资产特征以及第一用户标识特征进行融合,生成第一原始用户社交特征;
统计特征子单元,还用于获取第二用户的第二用户行为特征、第二用户资产特征以及第二用户标识特征;
特征融合子单元,还用于将第二用户行为特征、第二用户资产特征以及第二用户标识特征进行融合,生成第二原始用户社交特征。
其中,第二类别概率获取模块,包括:
初始概率获取单元,用于获取初始类别概率;
初始特征确定单元,用于根据第一用户社交特征、初始类别概率以及第二用户社交特征,确定第一用户针对于建立因素类别的初始类别表示特征;
类别概率生成单元,用于获取指数函数,根据指数函数、第二用户社交特征以及初始类别表示特征,生成第二类别概率。
其中,第一类别特征确定模块,包括:
第一过渡特征单元,用于将第二用户社交特征与第二类别概率进行相乘,得到第一过渡特征;
第一迭代特征确定单元,用于将第一用户社交特征与第一过渡特征进行相加,根据相加后的结果,确定第一用户针对于建立因素类别的第一迭代表示特征;
第一类别特征确定单元,用于根据第一迭代表示特征,确定第一类别表示特征。
其中,第一类别特征确定单元,包括:
传递函数获取子单元,用于获取特征传递函数;
传递特征确定子单元,用于通过特征传递函数,将第二原始用户社交特征向第一原始用户社交特征进行传递,得到用户传递特征;
类别特征确定子单元,用于根据特征传递函数、用户传递特征以及第一迭代表示特征,确定第一类别表示特征。
其中,第二类别特征确定模块,包括:
第二过渡单元,用于将第一用户社交特征与第一类别概率进行相乘,得到第二过渡特征;
第二迭代特征确定单元,用于将第二用户社交与第二过渡特征进行相加,根据相加后的结果确定第二用户针对建立因素类别的第二迭代表示特征;
第二类别特征确定单元,用于根据第二迭代表示特征,确定第二类别表示特征。
其中,特征传递模块,包括:
更新社交特征确定单元,用于根据建立因素类别对应的类别模型参数以及第一类别表示特征,确定第一更新用户社交特征;
更新社交特征确定单元,还用于根据建立因素类别对应的类别模型参数以及第二类别表示特征,确定第二更新用户社交特征;
初始类别概率获取单元,用于获取初始类别概率;
更新表示特征确定单元,用于根据第一更新用户社交特征、初始类别概率以及第二更新用户社交特征,确定第一用户针对于建立因素类别的更新初始类别表示特征;
迭代类别概率生成单元,用于获取指数函数,根据指数函数、更新初始类别表示特征以及第二更新用户社交特征,生成迭代类别概率;
更新类别特征确定单元,用于根据第一更新用户社交特征、第二更新用户社交特征以及迭代类别概率,确定第一用户针对建立因素类别的更新类别表示特征;
类别传递特征确定单元,用于获取图神经网络中的特征传递函数,根据特征传递函数将第二类别表示特征向第一类别表示特征进行特征传递,得到类别传递特征;
目标类别特征生成单元,用于根据特征传递函数、类别传递特征以及更新类别表示特征,生成目标类别表示特征。
其中,图神经网络中包括至少两个用户分别对应的节点;至少两个用户中包括第一用户以及第二用户;
类别传递特征确定单元包括:
节点特征传递子单元,用于获取图神经网络中的特征传递函数,通过特征传递函数,将第二用户的节点中的第二类别表示特征,传递至第一用户的节点;
特征叠加子单元,用于在第一用户的节点中,将第一类别表示特征以及第二类别表示特征进行叠加,得到类别传递特征。
其中,类别识别模块包括:
预测概率输出单元,用于通过图神经网络对目标类别表示特征进行异常识别,输出预测类别概率;
最大预测概率获取单元,用于在预测类别概率中,获取最大预测类别概率;
异常类别确定单元,用于将最大预测类别概率所对应的预测类别,确定为第一用户的社交异常类别。
其中,类别模型参数为图神经网络中的模型参数;
装置还包括:
训练样本获取模块,用于获取用户训练样本;用户训练样本中包括目标用户样本以及关联用户样本;目标用户样本是指具有社交类别标签的用户样本,关联用户样本是指与目标用户样本具有社交关联关系的用户样本;
样本原始特征获取模块,用于获取目标用户样本的第一样本原始社交特征以及关联用户样本的第二样本原始社交特征;
特征输入模块,用于将第一样本原始社交特征以及第二样本原始社交特征输入至图神经网络,根据图神经网络中的初始类别模型参数以及第一样本原始社交特征,确定第一样本原始社交特征对应的第一样本社交特征,根据初始类别模型参数以及第二样本原始社交特征,确定第二样本原始社交特征对应的第二样本社交特征;初始类别模型参数是建立因素类别所对应的类别模型参数的初始值;
样本类别特征确定模块,用于根据第一样本社交特征、第二样本社交特征以及第二类别概率,确定目标用户样本针对于建立因素类别的第一样本类别表示特征,根据第一样本社交特征、第二样本社交特征以及第一类别概率,确定关联用户样本针对于建立因素类别的第二样本类别表示特征;
样本特征传递模块,用于通过图神经网络,在第一样本类别表示特征与第二样本类别表示特征之间进行特征传递,得到目标用户样本针对于建立因素类别的目标样本类别表示特征;
参数调整模块,用于根据目标样本类别表示特征,识别目标用户样本的预测社交异常类别,根据预测社交异常类别以及社交类别标签,对初始类别模型参数进行调整,得到类别模型参数。
其中,参数调整模块包括:
预测误差确定单元,用于确定预测社交异常类别与社交类别标签之间的预测误差;
参数调整单元,用于根据预测误差确定损失函数,若损失函数未满足模型收敛条件,则根据损失函数对初始类别模型参数进行调整,得到类别模型参数。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行本申请实施例中的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行本申请实施例中的方法。
本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例中一方面提供的方法。
在本申请实施例中,通过获取第一用户以及第二用户之间的社交关联关系所对应的建立因素类别,可以获取到第二用户针对该建立因素类别的类别概率,通过该类别概率可以生成第一用户针对建立因素类别的目标类别表示特征,该目标类别表示特征中包括有通过特征传递得到的第二用户针对该建立因素类别的类别表示特征(即第二类别表示特征),也就是说,该第一用户的特征是通过与该第一用户具有社交关联关系的第二用户来进行关联表示。因此,在识别第一用户的社交异常类别的时候,不仅考虑到了第一用户自身的用户社交特征,也考虑到了第二用户的用户社交特征,还考虑到了第一用户与第二用户之间的社交关联关系的建立因素类别,不同的建立因素类别使用不同的类别概率来进行特征传递,通过多方面的因素综合考虑,可以提高识别异常用户的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构图;
图2a是本申请实施例提供的一种场景示意图;
图2b是本申请实施例提供的一种确定目标类别表示特征的示意图;
图3是本申请实施例提供的一种数据识别方法的流程示意图;
图4是本申请实施例提供的一种确定用户的社交异常类别的示意图;
图5是本申请实施例提供的一种训练图神经网络的流程示意图;
图6是本申请实施例提供的一种训练图神经网络的示意图;
图7是本申请实施例提供的一种数据识别装置的结构示意图;
图8是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案属于人工智能领域下属的机器学习((MachineLearning,ML)。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
请参见图1,图1是本申请实施例提供的一种网络架构图。如图1所示,该网络架构可以包括业务服务器1000以及后台服务器集群,其中,上述后台服务器集群可以包括多个每个后台服务器,如图1所示,具体可以包括后台服务器100a、后台服务器100b、后台服务器100c、…、后台服务器100n。如图1所示,后台服务器100a、后台服务器100b、后台服务器100c、…、后台服务器100n可以分别与上述业务服务器1000进行网络连接,以便于每个后台服务器可以通过该网络连接与业务服务器1000进行数据交互,以便于上述业务服务器1000可以接收到来自于每个后台服务器的业务数据。
如图1所示的每个后台服务器均与用户终端相对应,可以用于存储对应的用户终端的业务数据。每个用户终端均可以集成安装有目标应用,当该目标应用运行于各用户终端中时,则每个用户终端对应的后台服务器可以对应用中的业务数据进行存储,并与上述图1所示的业务服务器1000之间进行数据交互。其中,该目标应用可以包括具有显示文字、图像、音频以及视频等数据信息功能的应用。如,应用可以为支付应用,该支付应用可以用于用户之间进行资金转账;也可以为社交类应用,如即时通讯应用,可以用于用户之间进行沟通联系。本申请中的业务服务器1000可以从这些应用的后台(如上述后台服务器集群)收集到数据,如,该数据可以为用于表征用户的用户身份信息(如用户id)、用户之间的转账记录以及用户之间的通信记录等,根据收集的数据,业务服务器1000可以根据这些数据,确定哪些用户之间具有社交关联关系。
本申请实施例可以在多个用户终端中选择一个用户终端作为目标用户终端,该目标用户终端可以包括:智能手机、平板电脑、桌上型电脑等携带显示和播放数据信息功能的智能终端。例如,本申请实施例可以将图1所示的后台服务器100a对应的用户终端作为该目标用户终端,该目标用户终端中可以集成有上述目标应用,此时,该目标用户终端对应的后台服务器100a可以与业务服务器1000之间进行数据交互。如,大量的用户在使用用户终端中的各种应用时,业务服务器1000通过后台服务器可以检测并收集到这些大量用户之间的社交关联关系,如,用户A与用户B具有通信记录,则业务服务器1000可以确定用户A与用户B之间具有社交关联关系。在检测到大量用户且确定出哪些用户之间具有社交关联关系后,业务服务器1000可以将这些大量用户作为用户群,将该用户群中的每个用户均作为一个节点,并将具有社交关联关系的用户所对应的节点之间进行边连接,由此包含用户节点以及边的用户拓扑图。若两个用户节点之间存在边连接(两个用户之间存在社交关联关系),则业务服务器1000可以识别出这两个用户之间的社交关联关系所属的建立因素类别(业务服务器1000虚拟出的两个用户形成社交关联关系的原因);随后,根据该建立因素类别,业务服务器1000可以对这两个用户节点之间的边设置边权重(节点之间的社交关联关系属于任一种建立因素类别的类别概率),也就是说,不同的建立因素类别对应不同的边权重(类别概率),在该用户拓扑图中,可以使用这些不同的边权重来对用户节点的节点特征进行传递,由此可以得到每个用户节点的目标类别表示特征,其中,每个用户节点的目标类别表示特征中均包含有邻居节点所传递过来的节点特征。进一步地,业务服务器1000可以根据每个用户节点的目标类别表示特征,识别出每个用户节点(即每个用户)的社交异常类别。其中,对于业务服务器1000识别出用户的社交异常类别的具体实现方式,可以参见后续图3所对应实施例中步骤S101-步骤S105的描述。
可选的,可以理解的是,后台服务器可以将各自对应的用户终端所对应的大量用户确定为用户群,将该用户群中的每个用户均作为一个节点,并将具有社交关联关系的用户所对应的节点之间进行边连接,由此得到包含用户节点以及边的用户拓扑图,并识别该用户拓扑图中每个用户节点(每个用户)的社交异常类别。
可以理解的是,本申请实施例提供的方法可以由计算机设备执行,计算机设备包括但不限于用户终端或业务服务器。
进一步地,为便于理解,请参见图2a,图2a是本申请实施例提供的一种场景示意图。其中,终端A、终端B以及终端i均可以为前述图1所对应实施例中用户终端集群中的任一用户终端,如终端A可以为用户终端100a、终端B可以为用户终端100b,终端i可以为用户终端i;其中,业务服务器1000可以为前述图1所对应实施例中的业务服务器1000。
如图2a所示,业务服务器1000可以将终端A对应的用户a、终端B对应的用户b、…、终端i对应的用户i,确定为一个用户群{a,b,c,d,e,f,g,h,i},业务服务器1000可以将用户群中的每一个用户都作为一个节点,根据用户之间的社交关联关系,业务服务器1000可以在节点之间进行边连接(即,将具有社交关联关系的两个用户所对应的节点之间进行边连接),由此可以生成用户群{a,b,c,d,e,f,g,h,i}所对应的用户拓扑关系M(即用户拓扑图)。其中,每个节点均具有节点特征(如,每个用户的用户行为特征、用户标识特征以及用户资产特征等)。业务服务器1000可以将该用户拓扑关系M输入至图神经网络中,在该图神经网络中,可以学习到每两个用户社交关联关系的形成原因(如,因为同事而具有社交关联关系、因为互相转移过资产而具有社交关联关系),也就是说,在图神经网络中可以为两个用户之间的社交关联关系分配建立因素类别。在图神经网络中,可以虚拟出K种建立因素类别,针对不同的建立因素类别,图神经网络可以学习到每种建立因素类别分别对应的类别概率(两个用户之间的社交关联关系属于每种建立因素类别的概率)。随后,可以将类别概率作为节点之间的边权重,可以使用这些不同的边权重在节点之间进行节点特征传递,从而可以得到每个节点(即每个用户)所对应的目标类别表示特征。进一步地,根据每个用户的目标类别表示特征,图神经网络可以识别出每个用户的社交异常类别。
比如,如图2a所示,以节点a为例,在图神经网络中,可以学习到用户b与用户a之间是因为第A种建立因素类别形成的社交关联关系,图神经网络学习到的用户b与用户a之间的社交关联关系,属于第A种建立因素类别的类别概率为p1,则可以将类别概率p1作为节点b与节点a之间的边权重,根据类别概率p1来将节点b的节点特征传递至节点a;同理,在图神经网络中,可以学习到用户d与用户a之间是因为第B种建立因素类别形成的社交关联关系,图神经网络学习到的用户d与用户a之间的社交关联关系,属于第B种建立因素类别的类别概率为p2,则可以将类别概率p2作为节点d与节点a之间的边权重,根据类别概率p2来将节点c的节点特征传递至节点a。
应当理解,节点a可以接收到所有邻居节点(与节点a存在边连接的节点,如用户拓扑关系M中的节点b、节点d、节点c等)传递过来的节点特征,由此可以生成节点a的目标类别表示特征。随后,图神经网络可以根据该目标类别表示特征,识别出节点a的社交异常类别为“账号被盗”。
其中,对于图神经网络确定出每个节点的目标类别表示特征的具体方法,可以为,在图神经网络中,可以将用户拓扑关系M中的每个节点分别作为中心节点,并获取到与该中心节点具有边连接的节点,作为该中心节点的邻居节点。例如,以用户拓扑关系M中的节点a(用户a)为例,如图2a所示,业务服务器1000可以将该用户拓扑关系M输入至图神经网络中,因为在用户拓扑关系M中,节点b、节点c、节点d、节点e、节点f、节点g、节点h以及节点i均与节点a具有边连接,则可以说明用户b、用户c、用户d、用户e、用户f、用户g、用户h以及用户i均与用户a具有社交关联关系。可以将节点a作为中心节点,将节点b、节点c、节点d、节点e、节点f、节点g、节点h以及节点i均作为节点a的邻居节点。在图神经网络中,可以根据每个节点(每个用户)的节点特征,以及图神经网络中的类别模型参数,生成每个用户针对每个建立因素类别的用户社交特征。其中,类别模型参数可以包括权重矩阵w以及偏置向量b,每种建立因素类别分别对应一个类别模型参数,如,建立因素类别a对应的类别模型参数为权重矩阵wa与偏置向量ba,建立因素类别k对应的类别模型参数为权重矩阵wk与偏置向量bk;建立因素类别对应的类别模型参数可以为相同的值也可以为不同的值,比如,权重矩阵wa可以与权重矩阵wk相等,也可以不相等。其中,对于每一种建立因素类别的类别模型参数(包括权重矩阵w以及偏置向量b)的确定,可以通过提前对图神经网络进行训练来确定,对于训练图神经网络的具体实现方式,可以参见后续实施例的描述。
其中,对于生成每个用户针对每个建立因素类别的用户社交特征的具体实现方式,可以如公式(1)所示:
其中,Zi,k可以用于表征用户i针对于建立因素类别k的用户社交特征;可以用于表征建立因素类别k对应的权重矩阵wk的转置矩阵;xi可以用于表征用户i的原始用户社交特征(即节点i的节点特征),该原始用户社交特征可以包括用户i的用户行为特征、用户资产特征以及用户标识特征等;bk可以用于表征建立因素类别k对应的偏置向量bk
进一步地,在计算得到每个用户在每一种建立因素类别的用户社交特征后,可以获取到每个邻居节点被分配到第K种建立因素类别的类别概率,并将该类别概率作为这个邻居节点(如,节点b)与中心节点(如,节点a)的边的边权重。可以理解的是,对于不同的建立因素类别,可以对应有不同的类别概率,则对于每个邻居节点与中心节点之间的边,不同的建立因素类别可以具有不同的边权重。
其中,对于确定每个邻居节点被分配到第K种建立因素类别的类别概率的具体实现方式,可以如公式(2)所示:
其中,可以用于表征在第t轮计算时,针对于中心节点u(如,中心节点a),邻居节点v(如,节点b、节点c)被分配到第K种建立因素类别的类别概率;/>可以用于表征邻居节点v针对于第K种建立因素类别的用户社交特征的转置形式;/>可以用于表征在第t轮计算时,中心节点针对于第K种建立因素类别的初始类别表示特征;/>可以用于表征进行e的/>次指数幂得到的结果;/>可以用于表征邻居节点v针对于除第K种建立因素类别以外的,其他建立因素类别的用户社交特征的转置形式;/>可以用于表征在第t轮计算时,中心节点针对除第K种建立因素类别以外的,其他建立因素类别的初始类别表示特征;/>可以用于表征进行e的/>次指数幂得到的结果;可以用于表征将每种建立因素类别(包括第K种建立因素类别以及除第K种建立因素类别以外的其他建立因素类别)进行e的指数幂得到的结果进行相加,得到一个总的值。
其中,对于计算的具体实现方式,可以如公式(3)所示:
其中,G可以用于表征用户拓扑图(如,用户拓扑关系M),u可以用于表征用户拓扑图中的中心节点(如中心节点a),v可以用于表征用户拓扑图中的邻居节点(如邻居节点b);可以用于表征第t轮的上一轮计算时,针对于中心节点u(如,中心节点a),邻居节点v(如,节点b、节点c)被分配到第K种建立因素类别的类别概率。需要说明的是,当t=1(即在第1轮计算时),/>而/>可以为初始类别概率,该初始类别概率可以为针对于中心节点u(如,中心节点a),邻居节点v(如,节点b、节点c)被分配到第K种建立因素类别的类别概率初始值,该初始类别概率可以根据建立因素类别的总数量来确定,比如,建立因素类别共有3种,分别为建立因素类别C1、建立因素类别C2以及建立因素类别C3,则邻居节点被分配到建立因素类别C1、建立因素类别C2以及建立因素类别C3的初始类别概率可以均为1/3(即对建立因素类别总数量3求均值)。
应当理解,用户拓扑图中的每一个节点均可以作为一次中心节点,通过中心节点的邻居节点来得到每个中心节点的初始类别表示特征,如用户拓扑关系M所示,节点a可以作为中心节点,通过邻居节点b、邻居节点c、邻居节点d、邻居节点e、邻居节点f、邻居节点g、邻居节点h以及邻居节点i可以得到节点a针对每个建立因素类别的初始类别表示特征节点b也可以作为中心节点,因为节点a、节点c以及节点d均与节点b存在边连接,则节点a、节点c以及节点d均可以作为节点b的邻居节点,则通过节点a、节点c以及节点d,也可以得到节点b针对每个建立因素类别的初始类别表示特征/>其中,t可以用于表示第t轮,也就是说,可以对/>进行一轮或多轮迭代计算,将最后一轮的/>作为中心节点的初始类别表示特征。这里的t可以为人为规定值,如t可以为2、1、8、10等,这里将不再进行一一进行举例。
进一步地,根据每个节点的初始类别表示特征可以确定出每个节点在经过t轮迭代计算的一个最终的初始类别表示特征y。如,以节点a为例,节点a的最终的初始类别表示特征可以为/>其中,/>为节点a针对建立因素类别1的初始类别表示特征,/>为节点a针对建立因素类别2的初始类别表示特征。也就是说,最终的初始类别表示特征ya是由所有的建立因素类别(包括1--k种建立因素类别)的初始类别表示特征/>所组成。其中,对建立因素类别总类数k,可以为人为规定值,如,3、5、8等大于或等于1的整数值,这里将不再进行一一举例。应当理解,比如,人为规定k为5,则在图神经网络中,会自动虚拟出5种不同的建立因素类别。
进一步地,根据每个节点的初始类别表示特征(如,节点a的初始类别表示特征ya),可以确定出每个节点的目标类别表示特征。
为便于理解,请参见图2b,图2b是本申请实施例提供的一种确定目标类别表示特征的示意图。如图2b所示,以上述图2a所对应的用户拓扑关系M中的节点b为中心节点,且以建立因素类别共有3种为例,这3种建立因素类别分别为建立因素类别1、建立因素类别2以及建立因素类别3,则对于计算节点b针对建立因素类别1的初始类别表示特征的具体方法,可以为,首先获取到节点b的邻居节点a、邻居节点c以及邻居节点d分别对应的节点特征(用户原始特征)xa、xc以及xd,根据节点特征xa、建立因素类别1的类别模型参数w1以及b1,通过公式(1)可以计算得到邻居节点a(用户a)针对建立因素类别1的社交用户特征Za,1;同理,可以计算得到中心节点b、邻居节点c以及邻居节点d分别针对建立因素类别1的社交用户特征为Zb,1、Zc,1以及Zd,1。进一步地,因为有建立因素类别1、建立因素类别2以及建立因素类别3共3种建立因素类别,所以可以将初始类别概率初始化为1/3,则/>则根据公式(3),可以在第1轮迭代计算后得到中心节点b针对建立因素类别1的初始类别表示特征同理,应当理解,可以计算得到中心节点b、邻居节点a、邻居节点c以及邻居节点d分别针对建立因素类别2的社交用户特征分别为Zb,2、Za,2、Zc,2、以及Zd,2,在第1轮迭代计算后得到中心节点b针对建立因素类别2的初始类别表示特征/>同理,应当理解,可以计算得到中心节点b、邻居节点a、邻居节点c以及邻居节点d分别针对建立因素类别3的社交用户特征分别为Zb,3、Za,3、Zc,3、以及Zd,3,在第1轮迭代计算后得到中心节点b针对建立因素类别3的初始类别表示特征/>
那么通过第1轮的初始类别表示特征初始类别表示特征/>初始类别表示特征/>邻居节点a的社交用户特征Za,1以及公式(2),可以计算得到在第1轮计算中,邻居节点a被分配到建立因素类别1的类别概率为/> 同理,也可以得到在第1轮计算后,邻居节点c以及邻居节点d被分配到建立因素类别1的类别概率为/>以及/>/>
则在第2轮迭代计算中,可以根据以及中心节点b、邻居节点a、邻居节点c、邻居节点d分别针对建立因素类别1的用户社交特征以及公式(3),来得到第2轮迭代计算中,中心节点b针对建立因素类别1的迭代表示特征/>若规定计算迭代次数(即计算的轮数t)为2轮,则可以将中心节点b针对建立因素类别1在第2轮后的计算结果/>作为中心节点b针对建立因素类别1的迭代表示特征。同理,可以得到中心节点b针对建立因素类别2的迭代表示特征/>可以得到中心节点b针对建立因素类别2的迭代表示特征/>那么,可以得到中心节点b最终的迭代表示特征/>
进一步地,应当理解,在经过2轮迭代计算(即,完成迭代计算)得到中心节点b最终的迭代表示特征(即,)后,可以进行特征传递,从而得到中心节点b的目标类别表示特征。
其中,进行特征传递得到中心节点的目标类别表示特征的具体实现方式,可以如公式(4)所示:
其中,可以用于表征中心节点u在第L次传递后得到的目标类别表示特征(如中心节点b在第1次特征传递后得到目标类别表示特征/>),应当理解,该L可以用于表征第L次特征传递,该L可以为大于或等于1的整数;fL可以用于表征第1次特征传递之前,经过t轮迭代计算后得到的中心节点的迭代表示特征(如,中心节点b在经过2轮迭代后得到的yb);可以用于表征中心节点u在第L次特征传递的上一次特征传递后,得到的目标类别特征;/>可以用于表征邻居节点v在第L次特征传递的上一次特征传递后,得到的目标类别特征。其中,dropout可以用于表征一种特征传递函数,可以为一种图神经网络中的函数,dropout函数可以用于有效的防止数据过拟合的情况。需要说明的是,当L为1(即,第1次特征传递时)时,/>可以为中心节点u的原始用户社交特征xu,/>可以为邻居节点v的原始用户社交特征xv
比如,针对中心节点b而言,在进行第1次特征传递时,得到中心节点b在第1次特征传递后的目标类别表示特征其中,/>为中心节点b的原始用户社交特征xb,/>以及/>分别为邻居节点a的原始用户社交特征xa、邻居节点c的原始用户社交特征xc以及邻居节点d的原始用户社交特征xd。同理,应当理解,也可以将邻居节点a、邻居节点c以及邻居节点d作为中心节点,从而可以分别计算得到邻居节点a、邻居节点c以及邻居节点d在第1次特征传递后,分别得到的目标类别表示特征/>目标类别表示特征/>以及目标类别表示特征/>这里将不再对计算目标类别表示特征/>目标类别表示特征/>以及目标类别表示特征/>的具体方式进行赘述。/>
应当理解,的意义在于将各个邻居节点的节点特征(原始用户社交特征)传递至中心节点b,则在中心节点b中,可以将自身的节点特征与各个邻居节点传递过来的特征进行特征叠加。为使中心节点b可以获取到更遥远的节点(如节点e)的节点信息,可以进行第2次特征传递。对于第2次特征传递的具体实现方式,可以为,在得到第1次特征传递后的目标类别表示特征/>后,可以将/>代入公式(1)中,将/>对xb进行替换,从而可以得到中心节点b分别针对建立因素类别1、建立因素类别2以及建立因素类别3的更新用户社交特征;同理,也可以计算得到邻居节点a、邻居节点c以及邻居节点d分别针对建立因素类别1、建立因素类别2以及建立因素类别3的更新用户社交特征,这里将不再进行赘述。进一步地,可以根据中心节点b针对每种建立因素类别(比如,建立因素类别1)的更新用户社交特征、邻居节点a针对每种建立因素建立类别(比如,建立因素类别1)的更新用户社交特征、邻居节点c针对每种建立因素类别(比如,建立因素类别1)的更新用户社交特征以及邻居节点d针对每种建立因素类别(比如,建立因素类别1)的更新用户社交特征、初始类别概率1/3以及前述公式(3),来得到中心节点b在第2次特征传递前的第1轮迭代计算中的迭代表示特征/>(针对建立因素类别1)、迭代表示特征/>(针对建立因素类别2)以及迭代表示特征/>(针对建立因素类别3);从而,根据每个邻居节点的更新用户社交特征,可以得到每个邻居节点在第2次特征传递前的第1轮迭代计算中,针对每种建立因素类别的类别概率,将第1轮计算得到的每种建立因素类别的类别概率代入至公式(3)中,可以计算得到中心节点b在第2次特征传递前的第2轮迭代计算中,针对每种建立因素类别的迭代表示特征(针对建立因素类别1)、迭代表示特征/>(针对建立因素类别2)以及迭代表示特征/>(针对建立因素类别3)。则可以得到中心节点b在第2次特征传递前,经过2轮迭代后的最终的类别表示特征为/>同理,也可以将邻居节点a、邻居节点c以及邻居节点d作为中心节点,从而可以分别计算得到邻居节点a、邻居节点c以及邻居节点d在第2次特征传递前,经过2轮迭代后的最终的类别表示特征分别为ya′、yc′以及yd′。这里将不再对计算ya′、yc′以及yd′的具体方式进行赘述。
进一步地,可以在经过2轮迭代计算得到中心节点b最终的类别表示特征(即,)后,进行第2次特征传递,从而得到中心节点b在第2次特征传递后的目标类别表示特征/>其中,yb′为中心节点b在第2次特征传递前,经过2轮迭代计算后的最终的类别表示特征(经过2轮迭代计算后的最终迭代表示特征),/>为中心节点b在第1次特征传递后的目标类别表示特征,/>为邻居节点a在第1次特征传递后的目标类别表示特征,/>为邻居节点c在第1次特征传递后的目标类别表示特征,/>为邻居节点d在第1次特征传递后的目标类别表示特征。
应当理解,的意义在于将各个邻居节点目前的节点特征(如,目前邻居节点a的节点特征为目标类别表示特征/>)传递至中心节点b,则在中心节点b中,可以将自身的节点特征与各个邻居节点传递过来的特征进行特征叠加。因为邻居节点a的目标类别表示特征/>是根据节点a的邻居节点(如用户拓扑关系M中的节点e、节点f等)来计算生成的,则邻居节点a在第2次特征传递时,将目标类别表示特征/>传递至中心节点b时,中心节点b也可以得到相对于遥远的节点e或节点f等的节点特征,由此可见,通过多次的特征传递,可以使得中心节点获取到更遥远节点的节点信息(如当前节点特征)。
应当理解,若规定的特征传递次数为2次,则可以将中心节点b在第2次特征传递后得到的目标类别表示特征确定为中心节点b最终的目标类别表示特征。随后,可以根据该目标类别表示特征/>识别出中心节点b(用户b)的社交异常类别。其中,对于根据目标类别表示特征,识别用户的社交异常类别的具体实现方式,可以如公式(5)所示:
其中,可以用于表征用户u对于第c类的预测值,yu L可以是指经过L次特征传递后,得到的用户u的目标类别表示特征。应当理解,MLP可以为图神经网络中的函数,该MLP可以作为类别预测函数(Muti-Layer Perception,MLP)。应当理解,将中心节点b经过2次特征传递后得到的目标类别表示特征/>代入公式(5)中,可以得到中心节点b对于各个社交异常类别的预测值,根据这些预测值,可以确定出中心节点b的社交异常类别。同理,将节点a、节点c、…、节点i作为中心节点,也可以得到各个节点经过2特征传递后的目标类别表示特征,根据该公式(5),也可以确定每个节点所属的社交异常类别,这里将不再对确定节点a、节点c、…、节点i分别所属的社交异常类别的方法进行赘述。
进一步地,为便于理解,请参见图3,图3是本申请实施例提供的一种数据识别方法的流程示意图。如图3所示,该流程可以包括:
步骤S101,获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;第二用户与第一用户具有社交关联关系。
本申请中,第一用户社交特征可以是指根据第一用户的第一用户原始特征,以及建立因素类别对应的类别模型参数来生成的一种表示特征,也就是说,该第一用户社交特征可以用于表征第一用户针对一种建立因素类别的表示特征。其中,该建立因素类别可以是指建立第一用户与第二用户之间的社交关联关系的因素,在本申请中,若第一用户与第二用户之间存在社交关联关系,可以识别第一用户与第二用户之间形成社交关联关系的原因(如,因作为对方的同事而形成的社交关联关系、因作为师生而形成的社交关联关系等原因);其中,第一用户原始特征可以是指第一用户的第一用户行为特征(比如,第一用户的用户聊天数量、用户聊天频率以及第一用户在社交软件上的互动频率等特征)、第一用户资产特征(比如,通过时间序列方法所提取到的第一用户的转账等特征)、第一用户的用户初始社交特征(比如,通过图网络嵌入第一用户与第二用户所组成的用户社交网络的方法所获取到的用户初始社交特征)以及第一用户的第一用户标识特征(比如,通过卷积网络所获取到的头像特征),可以理解的是,通过将第一用户的第一用户行为特征、第一用户资产特征、第一用户初始社交特征以及第一用户标识特征进行特征融合,可以得到第一用户的第一用户原始特征。同理,第二用户社交特征可以是指根据第二用户的第二用户原始特征,以及建立因素类别对应的类别模型参数来生成的一种表示特征,也就是说,该第二用户社交特征可以用于表征第二用户针对一种建立因素类别的表示特征;第二用户原始特征可以包括第二用户行为特征、第二用户初始社交特征、第二用户资产特征以及第二用户标识特征等。
在本申请中,对于生成第一用户社交特征或第二用户社交特征的具体方法,可以如上述公式(2)所示,这里将不再进行赘述。
步骤S102,获取第一用户属于建立因素类别的第一类别概率,获取第二用户属于建立因素类别的第二类别概率;建立因素类别是指建立社交关联关系的因素。
本申请中,第一类别概率可以是指根据第一用户社交特征、初始类别概率以及第二用户社交特征所生成的迭代类别概率;其中初始类别概率可以是指第一用户属于建立因素类别的类别概率的初始值,该初始值可以为根据建立因素类别的总数量所确定的平均值。比如,建立因素类别共有3种,则平均值可以为1/3,则可以将该平均值1/3作为第一用户属于每一种建立因素类别的类别概率的初始值;对于生成第二类别概率的方式,可以如图2a所对应实施例中的公式(2)所示,也就是说,根据第一用户针对第K种建立因素类别的第一用户社交特征(如,公式(2)中的Zu,k)、初始类别概率1/3以及第二用户针对第K种建立因素类别的第二用户社交特征Zv,k,可以确定出第一用户针对第K种建立因素类别的初始类别表示特征随后,根据该初始类别表示特征/>指数函数(如公式(2)中的指数函数exp)以及第二用户针对第K种建立因素类别的第二用户社交特征Zv,k,可以生成第二类别概率(迭代类别概率)。其中,对于确定第一用户针对第K种建立因素类别的初始类别表示特征的具体方法,可以如图2a所对应实施例中的公式(3)所示,这里将不再进行赘述。
其中,t可以是指进行t轮迭代计算,也就是说,在获取到初始类别概率后,可以根据初始类别概率以及公式(3)进行第1轮计算,得到第1轮的随后,可以根据/>以及公式(2),计算得到第1轮的迭代类别概率(第二类别概率);随后,可以根据第二类别概率以及公式(3)进行第2轮计算,得到第2轮的/>可以根据/>以及公式(2),计算得到第2轮的迭代类别概率;应当理解,重复这个迭代过程,直至迭代轮数达到t时,将第t-1轮的迭代类别概率代入至公式(3)中,也可以得到第t轮的/>可以将迭代t轮后的/>作为第一用户最终针对第K种建立因素类别的初始类别表示特征。其中,t可以为认为规定值,t可以为1、5、9等大于或等于1的整数。
应当理解,将第二用户作为公式(3)中的用户u(即图2a所对应实施例中的中心用户),将第一用户作为公式(3)中的用户v(即图2a所对应实施例中的邻居用户),也可以得到第二用户在迭代t轮后,针对第K种建立因素类别的初始类别表示特征。对于确定第二用户针对第K种建立因素类别的初始类别表示特征的具体方法,这里将不再进行赘述。可以理解的是,这里的第一类别概率与第二类别概率均可以为根据初始类别概率所生成的迭代类别概率。
可选的,应当理解,第一类别概率与第二类别概率也可以作为初始类别概率。也就是说,第一类别概率以及第二类别概率可以作为根据建立因素类别所确定的平均值,来直接获取得到,再根据第一类别概率以及第二类别概率,从第1轮开始,进行t轮迭代计算,生成最终的迭代类别概率。
步骤S103,根据第一用户社交特征、第二用户社交特征以及第二类别概率,确定第一用户针对于建立因素类别的第一类别表示特征,根据第二用户社交特征、第一用户社交特征以及第一类别概率,确定第二用户针对于建立因素类别的第二类别表示特征。
本申请中,对于第一用户的第一类别表示特征的确定,具体方法可以为,将第二用户社交特征与第二类别概率进行相乘,可以得到第一过渡特征;比如,如图2a所对应实施例的公式(3)所示,将第二用户针对第K种建立因素类别的第二用户社交特征Zv,k与第K种建立因素类别所对应的第二类别概率(迭代类别概率)进行相乘,再将所有第二用户的相乘结果进行相加,可以得到第一过渡特征。比如,在第二类别概率为初始类别概率时,可以将图2b所对应实施例中进行第1轮迭代计算时得到的作为第一过渡特征,其中,Za,1为第二用户a针对于建立因素类别1的用户社交特征,1/3为第二类别概率的值。随后,可以将第一用户社交特征与第一过渡特征进行相加,根据相加后的结果来确定第一用户针对于建立因素类别的第一迭代表示特征。比如,在第二类别概率为初始类别概率时,如图2a所对应实施例中描述,根据公式(3)在第1轮迭代计算中所确定的/>可以作为在第1轮迭代计算后,第一用户对于建立因素类别1的第一迭代表示特征,在第1轮迭代计算中所确定的/>作为第一用户对于建立因素类别2的第一迭代表示特征,在第1轮迭代计算中所确定的/>作为第一用户对于建立因素类别3的第一迭代表示特征;将最终的从而可以确定出第一用户在第1轮计算后,所得到的最终的第一迭代表示特征
进一步地,根据该第一用户的第一迭代表示特征,可以确定出第一用户的第一类别表示特征。具体方法可以为,获取特征传递函数,通过该特征传递函数,可以将第二原始用户社交特征向该第一原始用户社交特征进行传递,从而得到用户传递特征;随后,根据该特征传递函数、该用户传递特征以及该第一迭代表示特征,可以确定该第一类别表示特征。应当理解,这里的第一类别表示特征可以为在第1次特征传递后,所得到的第一用户的目标类别表示特征。如图2b所对应实施例所示,在第1次特征传递后,得到中心节点b在第1次特征传递后的目标类别表示特征其中,/>为中心节点b的原始用户社交特征xb,/>以及/>分别为邻居节点a的原始用户社交特征xa、邻居节点c的原始用户社交特征xc以及邻居节点d的原始用户社交特征xd。则这里的中心节点b(用户b)可以为第一用户,邻居节点a、邻居节点c以及邻居节点d均可以为与第一用户具有社交关联关系的第二用户。
同理,应当理解,也可以将第一用户社交特征与第一类别概率进行相乘,可以得到第一过渡特征;随后,可以将第二用户社交特征与第二过渡特征进行相加,根据相加后的结果来确定第二用户针对于建立因素类别的第二迭代表示特征,进一步地,可以根据第二迭代表示特征,确定出第二用户的第二类别表示特征。其中,第二迭代表示特征可以是指将第二用户作为图2a所对应实施例中的公式(3)中的用户u,将第一用户作为图2a所对应实施例中的公式(3)中的用户v,将第一类别概率作为初始类别概率,根据公式(3)所得到的第二用户在第1轮计算后针对建立因素类别的根据每种建立因素类别的/>所确定得到的/>其中,K为建立因素类别的总类数。同理,根据第二迭代表示特征,也可以确定第二用户的第二类别表示特征,这里将不再对确定第二类别表示特征的具体实现方式进行赘述。应当理解,这里的第二类别表示特征可以为在第1次特征传递后,所得到的第二用户的目标类别表示特征。
步骤S104,将第二类别表示特征向第一类别表示特征进行特征传递,得到第一用户针对于建立因素类别的目标类别表示特征。
在本申请中,第一类别表示特征可以为第一用户在第m次进行特征传递后所得到的目标类别表示特征,第二类别表示特征可以为第二用户在第m次进行特征传递后,所得到的目标类别表示特征;而在第m+1次(即,第m次后的下一次)特征传递时,可以将第一用户在第m次特征传递后的目标类别表示特征(即第一类别表示特征)与第二用户在第m次特征传递后的目标类别表示特征(即第二类别表示特征)进行传递,由此可以得到第一用户在第m+1次进行特征传递后的目标类别表示特征。其中,在进行第m次特征传递时,通过将第一用户在第m-1次特征传递后得到的目标类别表示特征,与第二用户在第m-1次特征传递后得到的目标类别表示特征进行传递,可以得到第一用户在第m次特征传递后的第一类别表示特征。
对于确定第m+1次的目标类别表示特征的具体方法可以为,首先根据建立因素类别对应的类别模型参数以及该第一类别表示特征,确定出第一更新用户社交特征;根据该建立因素类别对应的类别模型参数以及该第二类别表示特征,确定第二更新用户社交特征;随后,获取到初始类别概率,根据该第一更新用户社交特征、该第二更新用户社交特征以及该初始类别概率,可以确定该第一用户针对该建立因素类别的更新初始类别表示特征;随后,可以获取指数函数,根据该指数函数、该更新初始类别表示特征以及该第二更新用户社交特征,可以生成迭代类别概率;随后,根据该第一更新用户社交特征、该第二更新用户社交特征以及该迭代类别概率,可以确定该第一用户针对该建立因素类别的更新类别表示特征;随后,可以获取图神经网络中的特征传递函数,根据该特征传递函数可以将该第二类别表示特征向该第一类别表示特征进行特征传递,得到类别传递特征;其中,图神经网络中包括至少两个用户分别对应的节点,该至少两个用户中包括该第一用户以及第二用户。也就是说,可以将包括第一用户以及第二用户的用户群中的每个用户,均作为一个用户节点,根据社交关联关系在用户节点之间进行边连接,由此可以形成一个用户拓扑图。将该用户拓扑图输入至图神经网络中,图神经网络可以通过特征传递函数,将第二用户的节点中的第二类别表示特征,传递至第一用户的节点;在第一用户的节点中,可以将该第一类别表示特征以及该第二类别表示特征进行叠加,由此可以得到类别传递特征,根据该特征传递函数、该类别传递特征以及该更新类别表示特征,可以生成该第m+1次的目标类别表示特征。
可以理解为,比如,如图2b所对应实施例所示,第一用户可以为中心节点b,第二用户可以为邻居节点a、邻居节点c以及邻居节点d。若m为1,在第1次特征传递时,需要将第1次之前(第0次)的得到的第一用户与第二用户的目标类别表示特征进行特征传递,但第1次前还未进行特征传递,则不存在第0次的目标类别表示特征。在本申请中,可以在第1次特征传递时,将第一用户与第二用户的原始用户社交特征进行传递,由此可以得到类别传递特征(将原始用户社交特征进行传递所得到的结果也可以称为用户传递特征)随后,如公式(4)所示,通过特征传递函数dropout可以将中心节点b在经过2轮迭代计算后得到的迭代表示特征/>与用户传递特征进行计算,从而可以得到第一用户(中心节点b)在第1次特征传递后的目标类别表示特征/>同理,应当理解,也可以将邻居节点a、邻居节点c以及邻居节点d作为中心节点,从而可以分别计算得到邻居节点a、邻居节点c以及邻居节点d在第1次特征传递后,分别得到的目标类别表示特征/>目标类别表示特征/>以及目标类别表示特征这里将不再对计算目标类别表示特征/>目标类别表示特征/>以及目标类别表示特征/>的具体方式进行赘述。则可以将这里的目标类别表示特征/>作为第一类别表示特征,将目标类别表示特征/>目标类别表示特征/>以及目标类别表示特征/>均作为第二类别表示特征。则在第2次(m+1次)特征传递时,需要将目标类别表示特征/>(第一类别表示特征)与目标类别表示特征/>目标类别表示特征/>以及目标类别表示特征/>这些第二类别表示特征进行传递。
比如,如图2b所对应实施例所示,在第2次特征传递前,又需要进行2轮(t轮)迭代计算。如图2b所对应实施例所示,可以将目标类别表示特征(第一类别表示特征)代入公式(1)中,将第一类别表示特征/>对中心节点的原始用户社交特征xb进行替换,从而使得建立因素类别对应的类别模型参数(包括权重矩阵w与偏置向量b)对第一类别表示特征/>进行计算,从而可以得到中心节点b(第一用户)分别针对每种建立因素类别的第一更新用户社交特征;同理,也可以将第二用户(包括邻居节点a、邻居节点c以及邻居节点d)的第二类别表示特征代入公式(1)中,使得建立因素类别对应的类别模型参数(包括权重矩阵w与偏置向量b)对第二类别表示特征进行计算,从而可以得到邻居节点a、邻居节点c以及邻居节点d分别针对每种建立因素类别的第二更新用户社交特征;进一步地,将第一更新用户社交特征、第二更新用户社交特征以及初始类别概率(这里的初始类别概率可以与上一次进行t轮迭代计算时的初始类别概率相同,即可以为3种建立因素类别所对应的平均值1/3)代入至公式(3)中,可以得到中心节点b(即第一用户)在第2次特征传递前的第1轮迭代计算中的迭代表示特征/>(针对建立因素类别1)、迭代表示特征/>(针对建立因素类别2)以及迭代表示特征/>(针对建立因素类别3);这里的迭代表示特征/>迭代表示特征/>以及迭代表示特征/>可以为中心节点b(第一用户)根据初始类别概率所确定的更新初始类别表示特征(在第1次特征传递前经过2轮计算后得到的迭代表示特征/>迭代表示特征/>以及迭代表示特征/>可以为初始类别表示特征)。
进一步地,将每个邻居节点的第二更新用户社交特征以及第1轮的迭代表示特征(包括迭代表示特征迭代表示特征/>以及迭代表示特征/>)代入公式(2)中,通过公式(2)中的指数函数exp可以对初始类别表示特征(包括迭代表示特征/>迭代表示特征以及迭代表示特征/>)进行计算,从而可以得到每个邻居节点在第2次特征传递前的第1轮迭代计算中,针对每种建立因素类别的迭代类别概率;将第1轮计算得到的每种建立因素类别的迭代类别概率代入至公式(3)中,可以计算得到中心节点b在第2次特征传递前的第2轮迭代计算中,针对每种建立因素类别的迭代表示特征/>(针对建立因素类别1)、迭代表示特征/>(针对建立因素类别2)以及迭代表示特征/>(针对建立因素类别3)。则可以得到中心节点b在第2次特征传递前,经过2轮迭代后的最终的类别表示特征为这里的类别表示特征/> 可以为更新类别表示特征(在第1次特征传递前经过2轮计算后得到的类别表示特征yb可以为类别表示特征)。
进一步地,根据特征传递函数(如图2b所对应实施例中公式(4)中的dropout函数)可以将该第二类别表示特征(包括目标类别表示特征目标类别表示特征/>以及目标类别表示特征/>)向该第一类别表示特征(目标类别表示特征/>)进行特征传递,得到类别传递特征/>随后,可以通过dropout函数,对更新类别表示特征yb′以及类别传递特征/>进行计算,从而可以得到中心节点b(第一用户)在第2次特征传递后,所得到的目标类别表示特征/>应当理解,若规定的特征传递次数为2次,则可以将该第2次特征传递后得到的目标类别表示特征/>确定为最终的第一用户的目标类别表示特征。
步骤S105,根据目标类别表示特征,识别第一用户的社交异常类别。
本申请中,可以通过图神经网络对第一用户的目标类别表示特征进行异常识别,输出预测类别概率;随后,可以在该预测类别概率中,获取最大预测类别概率;并将该最大预测类别概率所对应的预测类别,确定该第一用户的社交异常类别。为便于理解,请参见图4,图4是本申请实施例提供的一种确定用户的社交异常类别的示意图。如图4所示,将用户群对应的用户拓扑图(如,图2a所对应实施例中的用户拓扑关系M)输入至图神经网络,在图神经网络中,可以确定出用户拓扑关系M中每一个用户节点的目标类别表示特征;其中,对于图神经网络确定每一个用户节点的目标类别表示特征的具体实现方式,可以参见上述图3所对应实施例中步骤S101-步骤S105的描述,这里将不再进行赘述。如图4所示,以图神经网络确定了用户节点b(用户b)的目标类别表示特征为例,通过图神经网络中的MLP函数,可以对目标类别表示特征进行计算,从而可以输出多个预测类别概率。如图4所示,输出的预测类别概率为P1、P2、P3、P4、P5以及P6,其中P1为0.03,P2为0.10,P3为0.07,P4为0.98,P5为0.05,P6为0.07。其中,预测类别概率P1所对应的预测类别为“发布内容不恰当”,预测类别概率P2所对应的预测类别为“存在欺诈行为”,预测类别P3所对应的预测类别为“账号被盗用”,预测类别概率P4所对应的预测类别为“存在侵权行为”,预测类别概率P5所对应的预测类别为“发布仿冒品信息”,预测类别概率P6所对应的预测类别为“冒充他人”。在这些预测类别概率P1、P2、P3、P4、P5以及P6中,最大预测类别概率为P4=0.98,则可以将P4所对应的预测类别“存在侵权行为”确定为该用户b的社交异常类别。
其中,对于这里的预测类别概率P1、P2、P3、P4、P5以及P6所分别对应的预测类别,可以根据在社交软件中用户的投诉记录所统计确定。比如,用户A对用户B进行了投诉,投诉的原因为“用户B的账号可能被盗用了”,则用户A的投诉原因“用户B的账号可能被盗用了”即可作为一种预测类别。
在本申请实施例中,通过获取第一用户以及第二用户之间的社交关联关系所对应的建立因素类别,可以获取到第二用户针对该建立因素类别的类别概率,通过该类别概率可以生成第一用户针对建立因素类别的目标类别表示特征,该目标类别表示特征中包括有通过特征传递得到的第二用户针对该建立因素类别的类别表示特征(即第二类别表示特征),也就是说,该第一用户的特征是通过与该第一用户具有社交关联关系的第二用户来进行关联表示。因此,在识别第一用户的社交异常类别的时候,不仅考虑到了第一用户自身的用户社交特征,也考虑到了第二用户的用户社交特征,还考虑到了第一用户与第二用户之间的社交关联关系的建立因素类别,不同的建立因素类别使用不同的类别概率来进行特征传递,通过多方面的因素综合考虑,可以提高识别异常用户的准确率。
进一步地,请参见图5,图5是本申请实施例提供的一种训练图神经网络的流程示意图。如图5所示,该流程可以包括:
步骤S201,获取用户训练样本;用户训练样本中包括目标用户样本以及关联用户样本;目标用户样本是指具有社交类别标签的用户样本,关联用户样本是指与目标用户样本具有社交关联关系的用户样本。
本申请中,这里的用户训练样本可以包括目标用户样本以及关联用户样本。根据社交软件中用户的投诉记录,可以统计得到一个或多个被投诉的用户,可以将这些被投诉的用户作为异常用户样本,为使图神经网络通过训练可以学习到准确确定出每个用户的目标类别表示特征,可以获取到与每个异常用户样本具有社交关联关系的用户,作为部分用户样本。作为对比,可以将未被投诉的用户作为正常用户样本,并获取到与每个正常用户样本具有社交关联关系的用户,作为部分用户样本。则根据该异常用户样本、正常用户样本以及与它们具有社交关联关系的用户样本,可以形成用户样本群。在该用户样本群中,可以将任一用户样本作为目标用户样本,并将与该目标用户样本具有社交关联关系的用户样本作为关联用户样本。
步骤S202,获取目标用户样本的第一样本原始社交特征以及关联用户样本的第二样本原始社交特征。
步骤S203,将第一样本原始社交特征以及第二样本原始社交特征输入至图神经网络,根据图神经网络中的初始类别模型参数以及第一样本原始社交特征,确定第一样本原始社交特征对应的第一样本社交特征,根据初始类别模型参数以及第二样本原始社交特征,确定第二样本原始社交特征对应的第二样本社交特征;初始类别模型参数是建立因素类别所对应的类别模型参数的初始值。
步骤S204,根据第一样本社交特征、第二样本社交特征以及第二类别概率,确定目标用户样本针对于建立因素类别的第一样本类别表示特征,根据第一样本社交特征、第二样本社交特征以及第一类别概率,确定关联用户样本针对于建立因素类别的第二样本类别表示特征。
步骤S205,通过图神经网络,在第一样本类别表示特征与第二样本类别表示特征之间进行特征传递,得到目标用户样本针对于建立因素类别的目标样本类别表示特征。
本申请中,对于步骤S202-步骤S203的具体实现方式,可以参见上述图3所对应实施例中对步骤S101-步骤S104中确定目标类别表示特征的描述,这里将不再进行赘述。
步骤S206,根据目标样本类别表示特征,识别目标用户样本的预测社交异常类别,根据预测社交异常类别以及社交类别标签,对初始类别模型参数进行调整,得到类别模型参数。
本申请中,根据图神经网络中MLP函数,可以对目标样本类别表示特征进行计算,从而可以输出一个或多个预测类别概率,可以将最大预测类别概率所对应的预测社交异常类别。而在训练图神经网络时,每个用户样本均携带有真实的社交类别标签,根据该预测社交异常类别以及社交类别标签,可以确定一个预测误差,根据该预测误差可以确定损失函数,若该损失函数未满足模型收敛条件,则可以根据该损失函数对该图神经网络中的初始模型参数进行调整,由此可以得到类别模型参数。也就是说,通过预测社交异常类别与社交类别标签之间的预测误差,可以对每种建立因素类别所分别对应的初始类别模型参数进行调整,使得图神经网络通过类别模型参数所确定的目标类别表示特征更为准确,从而可以使得根据目标类别表示特征所得到的预测社交异常类别可以越来越接近真实的社交类别标签。
其中,对于确定损失函数的具体方法可以如公式(6)所示:
其中,y(c)可以用于表征一个用户样本所属的真实社交类别标签;可以用于表征该用户样本所对应的预测社交异常类别。
为便于理解,请一并参见图6,图6是本申请实施例提供的一种训练图神经网络的示意图。如图6所示,根据用户的投诉记录,可以统计到被投诉的异常用户,作为异常用户样本。获取到与每个异常用户样本具有社交关联关系的用户,作为部分用户样本。作为对比,可以将未被投诉的用户作为正常用户样本,并获取到与每个正常用户样本具有社交关联关系的用户,作为部分用户样本。则根据该异常用户样本、正常用户样本以及与它们具有社交关联关系的用户样本,可以形成用户样本群600a。将用户群样本600a输入至图神经网络600b中,通过该图神经网络600b可以识别用户群样本600a中每一个用户样本的预测社交异常类别。误差函数计算器600e根据每个用户样本所属的社交类别标签、预测社交异常类别以及公式(6),可以生成损失函数,根据损失函数可以对图神经网络(图神经网络中的初始类别模型参数)进行调整。初始类别模型参数进行调整后,可以采用上述方法再次确定预测社交异常类别,再计算损失函数,不断循环,直至当损失函数小于目标阈值,或者损失函数满足模型收敛条件,或者循环的次数达到目标次数时,此时图神经网络就训练完毕,后续可以将训练完毕的图神经网络投入应用中。
在本申请实施例中,通过获取第一用户以及第二用户之间的社交关联关系所对应的建立因素类别,可以获取到第二用户针对该建立因素类别的类别概率,通过该类别概率可以生成第一用户针对建立因素类别的目标类别表示特征,该目标类别表示特征中包括有通过特征传递得到的第二用户针对该建立因素类别的类别表示特征(即第二类别表示特征),也就是说,该第一用户的特征是通过与该第一用户具有社交关联关系的第二用户来进行关联表示。因此,在识别第一用户的社交异常类别的时候,不仅考虑到了第一用户自身的用户社交特征,也考虑到了第二用户的用户社交特征,还考虑到了第一用户与第二用户之间的社交关联关系的建立因素类别,不同的建立因素类别使用不同的类别概率来进行特征传递,通过多方面的因素综合考虑,可以提高识别异常用户的准确率。
进一步地,请参见图7,图7是本申请实施例提供的一种数据识别装置的结构示意图。上述数据识别装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据识别装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图7所示,该数据识别装置1可以包括:特征获取模块11、第一类别概率获取模块12、第二类别概率获取模块13、第一类别特征确定模块14、第二类别特征确定模块15、特征传递模块16以及类别识别模块17。
特征获取模块11,用于获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;第二用户与第一用户具有社交关联关系;
第一类别概率获取模块12,用于获取第一用户属于建立因素类别的第一类别概率;建立因素类别是指建立社交关联关系的因素;
第二类别概率获取模块13,用于获取第二用户属于建立因素类别的第二类别概率;
第一类别特征确定模块14,用于根据第一用户社交特征、第二用户社交特征以及第二类别概率,确定第一用户针对于建立因素类别的第一类别表示特征;
第二类别特征确定模块15,用于根据第二用户社交特征、第一用户社交特征以及第一类别概率,确定第二用户针对于建立因素类别的第二类别表示特征;
特征传递模块16,用于将第二类别表示特征向第一类别表示特征进行特征传递,得到第一用户针对于建立因素类别的目标类别表示特征;
类别识别模块17,用于根据目标类别表示特征,识别第一用户的社交异常类别。
其中,特征获取模块11、第一类别概率获取模块12、第二类别概率获取模块13、第一类别特征确定模块14、第二类别特征确定模块15、特征传递模块16以及类别识别模块17的具体实现方式,可以参见上述图3所对应实施例中步骤S101-步骤S105的描述,这里将不再进行赘述。
请参见图7,特征获取模块11可以包括:原始特征获取单元111、模型参数获取单元112以及用户特征生成单元113。
原始特征获取单元111,用于获取第一用户的第一原始用户社交特征,以及第二用户的第二原始用户社交特征;
模型参数获取单元112,用于获取建立因素类别对应的类别模型参数;
用户特征生成单元113,用于根据类别模型参数以及第一原始用户社交特征,生成第一用户社交特征,根据类别模型参数以及第二原始用户社交特征,生成第二用户社交特征。
其中,原始特征获取单元111、模型参数获取单元112以及用户特征生成单元113的具体实现方式,可以参见上述图3所对应实施例中步骤S101的描述,这里将不再进行赘述。
请参见图7,原始特征获取单元111可以包括:统计特征子单元1111、特征融合子单元1112、统计特征子单元1113以及特征融合子单元1114。
统计特征子单元1111,用于获取第一用户的第一用户行为特征、第一用户资产特征以及第一用户标识特征;
特征融合子单元1112,用于将第一用户行为特征、第一用户资产特征以及第一用户标识特征进行融合,生成第一原始用户社交特征;
统计特征子单元1113,还用于获取第二用户的第二用户行为特征、第二用户资产特征以及第二用户标识特征;
特征融合子单元1114,还用于将第二用户行为特征、第二用户资产特征以及第二用户标识特征进行融合,生成第二原始用户社交特征。
其中,统计特征子单元1111、特征融合子单元1112、统计特征子单元1113以及特征融合子单元1114的具体实现方式,可以参见上述图3所对应实施例中步骤S101中的描述,这里将不再进行赘述。
请参见图7,第二类别概率获取模块13,可以包括:初始概率获取单元131、初始特征确定单元132以及类别概率生成单元133。
初始概率获取单元131,用于获取初始类别概率;
初始特征确定单元132,用于根据第一用户社交特征、初始类别概率以及第二用户社交特征,确定第一用户针对于建立因素类别的初始类别表示特征;
类别概率生成单元133,用于获取指数函数,根据指数函数、第二用户社交特征以及初始类别表示特征,生成第二类别概率。
其中,初始概率获取单元131、初始特征确定单元132以及类别概率生成单元133的具体实现方式,可以参见上述图3所对应实施例中步骤S102中获取第二类别概率的描述,这里将不再进行赘述。
请参见图7,第一类别特征确定模块14可以包括:第一过渡特征单元141、第一迭代特征确定单元142以及第一类别特征确定单元143。
第一过渡特征单元141,用于将第二用户社交特征与第二类别概率进行相乘,得到第一过渡特征;
第一迭代特征确定单元142,用于将第一用户社交特征与第一过渡特征进行相加,根据相加后的结果,确定第一用户针对于建立因素类别的第一迭代表示特征;
第一类别特征确定单元143,用于根据第一迭代表示特征,确定第一类别表示特征。
其中,第一过渡特征单元141、第一迭代特征确定单元142以及第一类别特征确定单元143的具体实现方式,可以参见上述图3所对应实施例中步骤S103对确定第一类别表示特征的描述,这里将不再进行赘述。
请参见图7,第一类别特征确定单元143可以包括:传递函数获取子单元1431、传递特征确定子单元1432以及类别特征确定子单元1433。
传递函数获取子单元1431,用于获取特征传递函数;
传递特征确定子单元1432,用于通过特征传递函数,将第二原始用户社交特征向第一原始用户社交特征进行传递,得到用户传递特征;
类别特征确定子单元1433,用于根据特征传递函数、用户传递特征以及第一迭代表示特征,确定第一类别表示特征。
其中,传递函数获取子单元1431、传递特征确定子单元1432以及类别特征确定子单元1433的具体实现方式,可以参见上述图3所对应实施例中步骤S103中对于确定第一类别表示特征的描述,这里将不再进行赘述。
请参见图7,第二类别特征确定模块15可以包括:第二过渡单元151、第二迭代特征确定单元152以及第二类别特征确定单元153。
第二过渡单元151,用于将第一用户社交特征与第一类别概率进行相乘,得到第二过渡特征;
第二迭代特征确定单元152,用于将第二用户社交与第二过渡特征进行相加,根据相加后的结果确定第二用户针对建立因素类别的第二迭代表示特征;
第二类别特征确定单元153,用于根据第二迭代表示特征,确定第二类别表示特征。
其中,第二过渡单元151、第二迭代特征确定单元152以及第二类别特征确定单元153的具体实现方式,可以参见上述图3所对应实施例中步骤S103中对于确定第二类别表示特征的描述,这里将不再进行赘述。
请参见图7,特征传递模块16,可以包括:更新社交特征确定单元161、更新社交特征确定单元162、初始类别概率获取单元163、更新表示特征确定单元164、迭代类别概率生成单元165、更新类别特征确定单元166、类别传递特征确定单元167以及目标类别特征生成单元168。
更新社交特征确定单元161,用于根据建立因素类别对应的类别模型参数以及第一类别表示特征,确定第一更新用户社交特征;
更新社交特征确定单元162,还用于根据建立因素类别对应的类别模型参数以及第二类别表示特征,确定第二更新用户社交特征;
初始类别概率获取单元163,用于获取初始类别概率;
更新表示特征确定单元164,用于根据第一更新用户社交特征、初始类别概率以及第二更新用户社交特征,确定第一用户针对于建立因素类别的更新初始类别表示特征;
迭代类别概率生成单元165,用于获取指数函数,根据指数函数、更新初始类别表示特征以及第二更新用户社交特征,生成迭代类别概率;
更新类别特征确定单元166,用于根据第一更新用户社交特征、第二更新用户社交特征以及迭代类别概率,确定第一用户针对建立因素类别的更新类别表示特征;
类别传递特征确定单元167,用于获取图神经网络中的特征传递函数,根据特征传递函数将第二类别表示特征向第一类别表示特征进行特征传递,得到类别传递特征;
目标类别特征生成单元168,用于根据特征传递函数、类别传递特征以及更新类别表示特征,生成目标类别表示特征。
其中,更新社交特征确定单元161、更新社交特征确定单元162、初始类别概率获取单元163、更新表示特征确定单元164、迭代类别概率生成单元165、更新类别特征确定单元166、类别传递特征确定单元167以及目标类别特征生成单元168的具体实现方式,可以参见上述图3所对应实施例中步骤S104中对于确定目标类别表示特征的描述,这里将不再进行赘述。
其中,图神经网络中包括至少两个用户分别对应的节点;至少两个用户中包括第一用户以及第二用户;
请参见图7,类别传递特征确定单元167可以包括:节点特征传递子单元1671以及特征叠加子单元1672。
节点特征传递子单元1671,用于获取图神经网络中的特征传递函数,通过特征传递函数,将第二用户的节点中的第二类别表示特征,传递至第一用户的节点;
特征叠加子单元1672,用于在第一用户的节点中,将第一类别表示特征以及第二类别表示特征进行叠加,得到类别传递特征。
其中,节点特征传递子单元1671以及特征叠加子单元1672的具体实现方式,可以参见上述图3所对应实施例中步骤S104中,确定类别传递特征的描述,这里将不再进行赘述。
请参见图7,类别识别模块17可以包括:预测概率输出单元171、最大预测概率获取单元172以及异常类别确定单元173。
预测概率输出单元171,用于通过图神经网络对目标类别表示特征进行异常识别,输出预测类别概率;
最大预测概率获取单元172,用于在预测类别概率中,获取最大预测类别概率;
异常类别确定单元173,用于将最大预测类别概率所对应的预测类别,确定为第一用户的社交异常类别。
其中,预测概率输出单元171、最大预测概率获取单元172以及异常类别确定单元173的具体实现方式,可以参见上述图3所对应实施例中确定社交异常类别的描述,这里将不再进行赘述。
其中,类别模型参数为图神经网络中的模型参数;
请参见图7,该数据识别装置1还可以包括:训练样本获取模块18、样本原始特征获取模块19、特征输入模块20、样本类别特征确定模块21、样本特征传递模块22以及参数调整模块23。
训练样本获取模块18,用于获取用户训练样本;用户训练样本中包括目标用户样本以及关联用户样本;目标用户样本是指具有社交类别标签的用户样本,关联用户样本是指与目标用户样本具有社交关联关系的用户样本;
样本原始特征获取模块19,用于获取目标用户样本的第一样本原始社交特征以及关联用户样本的第二样本原始社交特征;
特征输入模块20,用于将第一样本原始社交特征以及第二样本原始社交特征输入至图神经网络,根据图神经网络中的初始类别模型参数以及第一样本原始社交特征,确定第一样本原始社交特征对应的第一样本社交特征,根据初始类别模型参数以及第二样本原始社交特征,确定第二样本原始社交特征对应的第二样本社交特征;初始类别模型参数是建立因素类别所对应的类别模型参数的初始值;
样本类别特征确定模块21,用于根据第一样本社交特征、第二样本社交特征以及第二类别概率,确定目标用户样本针对于建立因素类别的第一样本类别表示特征,根据第一样本社交特征、第二样本社交特征以及第一类别概率,确定关联用户样本针对于建立因素类别的第二样本类别表示特征;
样本特征传递模块22,用于通过图神经网络,在第一样本类别表示特征与第二样本类别表示特征之间进行特征传递,得到目标用户样本针对于建立因素类别的目标样本类别表示特征;
参数调整模块23,用于根据目标样本类别表示特征,识别目标用户样本的预测社交异常类别,根据预测社交异常类别以及社交类别标签,对初始类别模型参数进行调整,得到类别模型参数。
其中,训练样本获取模块18、样本原始特征获取模块19、特征输入模块20、样本类别特征确定模块21、样本特征传递模块22以及参数调整模块23的具体实现方式,可以参见上述图5所对应实施例中步骤S201-步骤S206的描述,这里将不再进行赘述。
请参见图7,参数调整模块23可以包括:预测误差确定单元231以及参数调整单元232。
预测误差确定单元231,用于确定预测社交异常类别与社交类别标签之间的预测误差;
参数调整单元232,用于根据预测误差确定损失函数,若损失函数未满足模型收敛条件,则根据损失函数对初始类别模型参数进行调整,得到类别模型参数。
其中,预测误差确定单元231以及参数调整单元232的具体实现方式,可以参见上述图5所对应实施例中步骤S206中的描述,这里将不再进行赘述。
在本申请实施例中,通过获取第一用户以及第二用户之间的社交关联关系所对应的建立因素类别,可以获取到第二用户针对该建立因素类别的类别概率,通过该类别概率可以生成第一用户针对建立因素类别的目标类别表示特征,该目标类别表示特征中包括有通过特征传递得到的第二用户针对该建立因素类别的类别表示特征(即第二类别表示特征),也就是说,该第一用户的特征是通过与该第一用户具有社交关联关系的第二用户来进行关联表示。因此,在识别第一用户的社交异常类别的时候,不仅考虑到了第一用户自身的用户社交特征,也考虑到了第二用户的用户社交特征,还考虑到了第一用户与第二用户之间的社交关联关系的建立因素类别,不同的建立因素类别使用不同的类别概率来进行特征传递,通过多方面的因素综合考虑,可以提高识别异常用户的准确率。
进一步地,请参见图8,图8是本申请实施例提供的一种计算机设备的结构示意图。如图8所示,上述图7所对应实施例中的装置1可以应用于上述计算机设备1000,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图8所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图8所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;第二用户与第一用户具有社交关联关系;
获取第一用户属于建立因素类别的第一类别概率,获取第二用户属于建立因素类别的第二类别概率;建立因素类别是指建立社交关联关系的因素;
根据第一用户社交特征、第二用户社交特征以及第二类别概率,确定第一用户针对于建立因素类别的第一类别表示特征,根据第二用户社交特征、第一用户社交特征以及第一类别概率,确定第二用户针对于建立因素类别的第二类别表示特征;
将第二类别表示特征向第一类别表示特征进行特征传递,得到第一用户针对于建立因素类别的目标类别表示特征;
根据目标类别表示特征,识别第一用户的社交异常类别。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3到图6所对应实施例中对该数据识别方法的描述,也可执行前文图7所对应实施例中对该数据识别装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的数据处理的计算机设备1000所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文图3到图6所对应实施例中对上述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
上述计算机可读存储介质可以是前述任一实施例提供的数据识别装置或者上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例中一方面提供的方法。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (15)

1.一种数据识别方法,其特征在于,包括:
获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;所述第二用户与所述第一用户具有社交关联关系;
获取所述第一用户属于建立因素类别的第一类别概率,获取所述第二用户属于所述建立因素类别的第二类别概率;所述建立因素类别是指建立所述社交关联关系的因素;
根据所述第一用户社交特征、所述第二用户社交特征以及所述第二类别概率,确定所述第一用户针对于所述建立因素类别的第一类别表示特征,根据所述第二用户社交特征、所述第一用户社交特征以及所述第一类别概率,确定所述第二用户针对于所述建立因素类别的第二类别表示特征;
将所述第二类别表示特征向所述第一类别表示特征进行特征传递,得到所述第一用户针对于所述建立因素类别的目标类别表示特征;
根据所述目标类别表示特征,识别所述第一用户的社交异常类别。
2.根据权利要求1所述的方法,其特征在于,所述获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征,包括:
获取第一用户的第一原始用户社交特征,以及第二用户的第二原始用户社交特征;
获取所述建立因素类别对应的类别模型参数;
根据所述类别模型参数以及所述第一原始用户社交特征,生成第一用户社交特征,根据所述类别模型参数以及所述第二原始用户社交特征,生成第二用户社交特征。
3.根据权利要求2所述的方法,其特征在于,所述获取第一用户的第一原始用户社交特征,以及第二用户的第二原始用户社交特征,包括:
获取所述第一用户的第一用户行为特征、第一用户资产特征以及第一用户标识特征;
将所述第一用户行为特征、所述第一用户资产特征以及所述第一用户标识特征进行融合,生成所述第一原始用户社交特征;
获取所述第二用户的第二用户行为特征、第二用户资产特征以及第二用户标识特征;
将所述第二用户行为特征、所述第二用户资产特征以及所述第二用户标识特征进行融合,生成所述第二原始用户社交特征。
4.根据权利要求1所述的方法,其特征在于,所述获取所述第二用户属于所述建立因素类别的第二类别概率,包括:
获取初始类别概率;
根据所述第一用户社交特征、所述初始类别概率以及所述第二用户社交特征,确定所述第一用户针对于所述建立因素类别的初始类别表示特征;
获取指数函数,根据所述指数函数、所述第二用户社交特征以及所述初始类别表示特征,生成所述第二类别概率。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一用户社交特征、所述第二用户社交特征以及所述第二类别概率,确定所述第一用户针对于所述建立因素类别的第一类别表示特征,包括:
将所述第二用户社交特征与所述第二类别概率进行相乘,得到第一过渡特征;
将所述第一用户社交特征与所述第一过渡特征进行相加,根据相加后的结果,确定所述第一用户针对于所述建立因素类别的第一迭代表示特征;
根据所述第一迭代表示特征,确定所述第一类别表示特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一迭代表示特征,确定所述第一类别表示特征,包括:
获取特征传递函数;
通过所述特征传递函数,将第二原始用户社交特征向第一原始用户社交特征进行传递,得到用户传递特征;
根据所述特征传递函数、所述用户传递特征以及所述第一迭代表示特征,确定所述第一类别表示特征。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第二用户社交特征、所述第一用户社交特征以及所述第一类别概率,确定所述第二用户针对于所述建立因素类别的第二类别表示特征,包括:
将所述第一用户社交特征与所述第一类别概率进行相乘,得到第二过渡特征;
将所述第二用户社交与所述第二过渡特征进行相加,根据相加后的结果确定所述第二用户针对所述建立因素类别的第二迭代表示特征;
根据所述第二迭代表示特征,确定所述第二类别表示特征。
8.根据权利要求2所述的方法,其特征在于,所述将所述第二类别表示特征向所述第一类别表示特征进行特征传递,得到所述第一用户针对于所述建立因素类别的目标类别表示特征,包括:
根据所述建立因素类别对应的类别模型参数以及所述第一类别表示特征,确定第一更新用户社交特征;
根据所述建立因素类别对应的类别模型参数以及所述第二类别表示特征,确定第二更新用户社交特征;
获取初始类别概率;
根据所述第一更新用户社交特征、所述初始类别概率以及所述第二更新用户社交特征,确定所述第一用户针对于所述建立因素类别的更新初始类别表示特征;
获取指数函数,根据所述指数函数、所述更新初始类别表示特征以及所述第二更新用户社交特征,生成迭代类别概率;
根据所述第一更新用户社交特征、所述第二更新用户社交特征以及所述迭代类别概率,确定所述第一用户针对所述建立因素类别的更新类别表示特征;
获取图神经网络中的特征传递函数,根据所述特征传递函数将所述第二类别表示特征向所述第一类别表示特征进行特征传递,得到类别传递特征;
根据所述特征传递函数、所述类别传递特征以及所述更新类别表示特征,生成所述目标类别表示特征。
9.根据权利要求8所述的方法,其特征在于,所述图神经网络中包括至少两个用户分别对应的节点;所述至少两个用户中包括所述第一用户以及所述第二用户;
所述获取图神经网络中的特征传递函数,根据所述特征传递函数将所述第二类别表示特征向所述第一类别表示特征进行特征传递,得到类别传递特征,包括:
获取图神经网络中的特征传递函数,通过所述特征传递函数,将所述第二用户的节点中的所述第二类别表示特征,传递至所述第一用户的节点;
在所述第一用户的节点中,将所述第一类别表示特征以及所述第二类别表示特征进行叠加,得到所述类别传递特征。
10.根据权利要求1所述的方法,其特征在于,所述根据所述目标类别表示特征,识别所述第一用户的社交异常类别,包括:
通过图神经网络对所述目标类别表示特征进行异常识别,输出预测类别概率;
在所述预测类别概率中,获取最大预测类别概率;
将所述最大预测类别概率所对应的预测类别,确定为所述第一用户的社交异常类别。
11.根据权利要求2所述的方法,其特征在于,所述类别模型参数为图神经网络中的模型参数;
所述方法还包括:
获取用户训练样本;所述用户训练样本中包括目标用户样本以及关联用户样本;所述目标用户样本是指具有社交类别标签的用户样本,所述关联用户样本是指与所述目标用户样本具有社交关联关系的用户样本;
获取所述目标用户样本的第一样本原始社交特征以及所述关联用户样本的第二样本原始社交特征;
将所述第一样本原始社交特征以及所述第二样本原始社交特征输入至所述图神经网络,根据所述图神经网络中的初始类别模型参数以及所述第一样本原始社交特征,确定所述第一样本原始社交特征对应的第一样本社交特征,根据所述初始类别模型参数以及所述第二样本原始社交特征,确定所述第二样本原始社交特征对应的第二样本社交特征;所述初始类别模型参数是所述建立因素类别所对应的所述类别模型参数的初始值;
根据所述第一样本社交特征、所述第二样本社交特征以及所述第二类别概率,确定所述目标用户样本针对于所述建立因素类别的第一样本类别表示特征,根据所述第一样本社交特征、所述第二样本社交特征以及所述第一类别概率,确定所述关联用户样本针对于所述建立因素类别的第二样本类别表示特征;
通过所述图神经网络,在所述第一样本类别表示特征与所述第二样本类别表示特征之间进行特征传递,得到所述目标用户样本针对于所述建立因素类别的目标样本类别表示特征;
根据所述目标样本类别表示特征,识别所述目标用户样本的预测社交异常类别,根据所述预测社交异常类别以及所述社交类别标签,对所述初始类别模型参数进行调整,得到所述类别模型参数。
12.根据权利要求11所述的方法,其特征在于,所述根据所述预测社交异常类别以及所述社交类别标签,对所述初始类别模型参数进行调整,得到所述类别模型参数,包括:
确定所述预测社交异常类别与所述社交类别标签之间的预测误差;
根据所述预测误差确定损失函数,若所述损失函数未满足模型收敛条件,则根据所述损失函数对所述初始类别模型参数进行调整,得到所述类别模型参数。
13.一种数据识别装置,其特征在于,包括:
特征获取模块,用于获取第一用户的第一用户社交特征,以及第二用户的第二用户社交特征;所述第二用户与所述第一用户具有社交关联关系;
第一类别概率获取模块,用于获取所述第一用户属于建立因素类别的第一类别概率;所述建立因素类别是指建立所述社交关联关系的因素;
第二类别概率获取模块,用于获取所述第二用户属于所述建立因素类别的第二类别概率;
第一类别特征确定模块,用于根据所述第一用户社交特征、所述第二用户社交特征以及所述第二类别概率,确定所述第一用户针对于所述建立因素类别的第一类别表示特征;
第二类别特征确定模块,用于根据所述第二用户社交特征、所述第一用户社交特征以及所述第一类别概率,确定所述第二用户针对于所述建立因素类别的第二类别表示特征;
特征传递模块,用于将所述第二类别表示特征向所述第一类别表示特征进行特征传递,得到所述第一用户针对于所述建立因素类别的目标类别表示特征;
类别识别模块,用于根据所述目标类别表示特征,识别所述第一用户的社交异常类别。
14.一种计算机设备,其特征在于,包括:处理器和存储器;
所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至12中任一项所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行权利要求1至12中任一项所述的方法。
CN202010610250.2A 2020-06-30 2020-06-30 一种数据识别方法、装置、设备及可读存储介质 Active CN113946758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010610250.2A CN113946758B (zh) 2020-06-30 2020-06-30 一种数据识别方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010610250.2A CN113946758B (zh) 2020-06-30 2020-06-30 一种数据识别方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113946758A CN113946758A (zh) 2022-01-18
CN113946758B true CN113946758B (zh) 2023-09-19

Family

ID=79325787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010610250.2A Active CN113946758B (zh) 2020-06-30 2020-06-30 一种数据识别方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113946758B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778173A (zh) * 2014-01-10 2015-07-15 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
CN105005594A (zh) * 2015-06-29 2015-10-28 嘉兴慧康智能科技有限公司 异常微博用户识别方法
CN105404947A (zh) * 2014-09-02 2016-03-16 阿里巴巴集团控股有限公司 用户质量侦测方法及装置
WO2018205999A1 (zh) * 2017-05-11 2018-11-15 腾讯科技(深圳)有限公司 一种数据处理方法及装置
CN109214944A (zh) * 2018-08-28 2019-01-15 北京费马科技有限公司 基于社交图谱的垃圾用户识别方法和应用
CN110689084A (zh) * 2019-09-30 2020-01-14 北京明略软件系统有限公司 一种异常用户识别方法及装置
CN111049818A (zh) * 2019-12-03 2020-04-21 北京赋乐科技有限公司 一种基于网络流量大数据的异常信息发现方法
CN111339436A (zh) * 2020-02-11 2020-06-26 腾讯科技(深圳)有限公司 一种数据识别方法、装置、设备以及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166344B (zh) * 2018-04-25 2021-08-24 腾讯科技(深圳)有限公司 一种身份标识识别方法、装置以及相关设备
CN108932669A (zh) * 2018-06-27 2018-12-04 北京工业大学 一种基于监督式层次分析法的异常账户检测方法
CN110213788B (zh) * 2019-06-15 2021-07-13 福州大学 基于数据流时空特征的wsn异常检测及类型识别方法
CN110532862B (zh) * 2019-07-19 2022-02-25 青岛科技大学 基于门控融合单元的特征融合组群识别方法
CN110995810B (zh) * 2019-11-25 2021-08-06 腾讯科技(深圳)有限公司 一种基于人工智能的对象识别方法和相关装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778173A (zh) * 2014-01-10 2015-07-15 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
CN105404947A (zh) * 2014-09-02 2016-03-16 阿里巴巴集团控股有限公司 用户质量侦测方法及装置
CN105005594A (zh) * 2015-06-29 2015-10-28 嘉兴慧康智能科技有限公司 异常微博用户识别方法
WO2018205999A1 (zh) * 2017-05-11 2018-11-15 腾讯科技(深圳)有限公司 一种数据处理方法及装置
CN109214944A (zh) * 2018-08-28 2019-01-15 北京费马科技有限公司 基于社交图谱的垃圾用户识别方法和应用
CN110689084A (zh) * 2019-09-30 2020-01-14 北京明略软件系统有限公司 一种异常用户识别方法及装置
CN111049818A (zh) * 2019-12-03 2020-04-21 北京赋乐科技有限公司 一种基于网络流量大数据的异常信息发现方法
CN111339436A (zh) * 2020-02-11 2020-06-26 腾讯科技(深圳)有限公司 一种数据识别方法、装置、设备以及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jian Dong.Online robot identification by differentiating abnormal behaviors of WeChat users.2017 IEEE International Conference on Systems, Man, and Cybernetics (SMC).2017,第450-454页. *
社交网络异常用户识别技术综述;仲丽君等;计算机工程与应用;第54卷(第16期);第13-21页 *

Also Published As

Publication number Publication date
CN113946758A (zh) 2022-01-18

Similar Documents

Publication Publication Date Title
CN109922032B (zh) 用于确定登录账户的风险的方法、装置、设备及存储介质
US20230039182A1 (en) Method, apparatus, computer device, storage medium, and program product for processing data
CN113408743A (zh) 联邦模型的生成方法、装置、电子设备和存储介质
CN106682906B (zh) 一种风险识别、业务处理方法和设备
CN110991905B (zh) 风险模型训练方法以及装置
CN115511501A (zh) 一种数据处理方法、计算机设备以及可读存储介质
CN116647411A (zh) 游戏平台网络安全的监测预警方法
CN110991789B (zh) 置信区间的确定方法和装置、存储介质及电子装置
CN116862012A (zh) 机器学习模型训练方法、业务数据处理方法、装置及系统
CN111818093A (zh) 用于进行风险评估的神经网络系统、方法及装置
CN111159241B (zh) 一种点击转化预估方法及装置
CN112365007A (zh) 模型参数确定方法、装置、设备及存储介质
CN113726545B (zh) 基于知识增强生成对抗网络的网络流量生成方法及装置
CN111062019A (zh) 用户攻击检测方法、装置、电子设备
CN113792892A (zh) 联邦学习建模优化方法、设备、可读存储介质及程序产品
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN112765481B (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN115049397A (zh) 识别社交网络中的风险账户的方法及装置
CN116307078A (zh) 账户标签预测方法、装置、存储介质及电子设备
CN116362894A (zh) 多目标学习方法、装置、电子设备及计算机可读存储介质
CN113946758B (zh) 一种数据识别方法、装置、设备及可读存储介质
CN116827685A (zh) 基于深度强化学习的微服务系统动态防御策略方法
CN117272017A (zh) 异质图数据节点嵌入特征提取模型训练方法、嵌入特征提取方法、节点分类方法及装置
CN114092268A (zh) 用户社群检测方法、装置、计算机设备及存储介质
CN112231571A (zh) 资讯数据的处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40065974

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant