CN112232165B - 一种数据处理方法、装置、计算机及可读存储介质 - Google Patents

一种数据处理方法、装置、计算机及可读存储介质 Download PDF

Info

Publication number
CN112232165B
CN112232165B CN202011077502.6A CN202011077502A CN112232165B CN 112232165 B CN112232165 B CN 112232165B CN 202011077502 A CN202011077502 A CN 202011077502A CN 112232165 B CN112232165 B CN 112232165B
Authority
CN
China
Prior art keywords
matrix
convolution
feature
expansion
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011077502.6A
Other languages
English (en)
Other versions
CN112232165A (zh
Inventor
陈观钦
陈健柯
陈远
王摘星
钟芬芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011077502.6A priority Critical patent/CN112232165B/zh
Publication of CN112232165A publication Critical patent/CN112232165A/zh
Application granted granted Critical
Publication of CN112232165B publication Critical patent/CN112232165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Complex Calculations (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种数据处理方法、装置、计算机及可读存储介质,可以使用人工智能领域的机器学习及云技术领域的云存储等技术,该方法包括:获取用户针对目标业务的行为序列矩阵;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量;将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;根据异常概率确定用户针对目标业务的行为识别结果。采用本申请,可以提高特征提取的全面性,提高数据处理的准确性。

Description

一种数据处理方法、装置、计算机及可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、计算机及可读存储介质。
背景技术
在用户玩游戏的过程中,会产生很多的行为日志,该行为日志中包括许多行为序列数据,例如大型多人在线角色扮演游戏(Massive Multiplayer Online Role-PlayingGame,MMORPG)等大型端游中的行为序列数据。对于不同的用户,其偏好的行为模式有所不同,存在各种各样的行为序列数据,但是异常用户一般偏向于进行能够产生高收益的行为,产生高收益的行为序列数据往往有其特定的行为模式。再者,如果是群体约定操作,其行为序列数据则更加相似。通过玩家的行为序列数据来挖掘出异常用户,有一定的应用价值和可行性。对于不定长的行为序列数据进行异常识别,一般是通过统计等手段找到一些显著的特征,然后结合人工设定的规则来判定异常用户。或者通过特征工程的手段找到一组特征基底,然后把不定长的行为序列数据映射到固定维度的特征向量,最后通过建立机器学习模型的方式判断异常的行为序列数据。其中,把不定长的序列数据映射为定长的特征向量的方法一般有N元-模型(N-Gram)的方法和基于词组向量化(Word2Vec)的方法。
直接基于统计特征的机器学习模型对行为序列数据进行识别,需要较强的业务理解经验和繁杂的特征工程阶段,而且对行为序列数据中的一些特征无法全面获取,使得对行为序列数据的识别准确性较低。
发明内容
本申请实施例提供了一种数据处理方法、装置、计算机及可读存储介质,可以提高特征提取的全面性,提高数据处理的准确性。
本申请实施例一方面提供了一种数据处理方法,该方法包括:
获取用户针对目标业务的行为序列矩阵;
基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;
基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的;
对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量;
将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;
根据异常概率确定用户针对目标业务的行为识别结果。
其中,获取用户针对目标业务的行为序列矩阵,包括:
获取用户的初始行为序列数据及模型序列长度,根据模型序列长度将初始行为序列数据转换为行为序列数据;行为序列数据包括p个行为元素,p为模型序列长度;
将p个行为元素中的各个行为元素映射为初始特征向量,将各个行为元素分别映射得到的初始特征向量进行拼接,得到行为序列矩阵。
其中,连续卷积网络包括N个连续卷积子网络,各个连续卷积子网络对应的连续卷积宽度不同;N为正整数;
基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵,包括:
在异常识别模型中,将行为序列矩阵输入第i个连续卷积子网络中,在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,直至获取到用户的N个连续特征矩阵;i为正整数,i小于或等于N。
其中,第i个连续卷积子网络包括d1个连续卷积核,d1个连续卷积核中的各个连续卷积核的卷积参数不同;
在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,包括:
在第i个连续卷积子网络中,根据第i个连续卷积子网络对应的连续卷积宽度,采用d1个连续卷积核分别对行为序列矩阵进行卷积,提取行为序列矩阵对应的d1个第一特征向量;
对d1个第一特征向量进行特征拼接,得到用户的第i个连续特征矩阵。
其中,扩张卷积网络包括M个扩张卷积子网络,各个扩张卷积子网络对应的扩张卷积宽度不同;M为正整数;
基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵,包括:
在异常识别模型中,将行为序列矩阵输入第j个扩张卷积子网络中,在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,直至获取到用户的M个扩张特征矩阵;j为正整数,j小于或等于M。
其中,第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;第二扩张卷积层为第一扩张卷积层的下一个卷积层;
在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,包括:
在第j个扩张卷积子网络中,获取第一扩张卷积的第一扩张系数,将行为序列矩阵输入第一扩张卷积层,根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第一扩张卷积层的第一卷积采样点;
基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵;若第一扩张卷积层为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为行为序列矩阵;若第一扩张卷积层不为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为第一扩张卷积层的上一个卷积层的输出矩阵;
根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二扩张系数;
将第一扩张卷积层的输出矩阵输入第二扩张卷积层,根据第二扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二卷积采样点;
基于第二卷积采样点,对第一扩张卷积层的输出矩阵进行卷积,得到第二扩张卷积层的输出矩阵;
若第二扩张卷积层不为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为第二扩张卷积层的下一个卷积层的输入矩阵;
若第二扩张卷积层为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。
其中,第一扩张卷积层包括d2个扩张卷积核,d2个扩张卷积核中的各个扩张卷积核的卷积参数不同;
基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵,包括:
基于第一卷积采样点,采用d2个扩张卷积核分别对输入矩阵进行卷积,提取输入矩阵对应的d2个第二特征向量;
对d2个第二特征向量进行特征拼接,得到第一扩张卷积层的输出矩阵。
其中,对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,包括:
获取第一权重向量,基于第一权重向量对连续特征矩阵中的每一列元素分别进行加权求和,得到连续特征矩阵的第一粗粒度向量;
获取第一权重矩阵,将第一权重矩阵与连续特征矩阵进行点乘,得到第一加权细粒度矩阵,对第一加权细粒度矩阵中的每一列元素进行特征融合,得到连续特征矩阵的第一细粒度向量;
获取第二权重向量,基于第二权重向量对扩张特征矩阵中的每一列元素进行加权求和,得到扩张特征矩阵的第二粗粒度向量;
获取第二权重矩阵,对第二权重矩阵与扩张特征矩阵进行点乘,得到第二加权细粒度矩阵,对第二加权细粒度矩阵中的每一列元素进行特征融合,得到扩张特征矩阵的第二细粒度向量;
对第一粗粒度向量、第一细粒度向量、第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量。
其中,异常识别模型还包括粗粒度注意网络;获取第一权重向量,包括:
获取粗粒度注意网络中的第一权重参数,基于第一权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵中每一行元素的权重值;
对连续特征矩阵中每一行元素的权重值进行归一化,生成第一权重向量。
其中,异常识别模型还包括细粒度注意网络;获取第一权重矩阵,包括:
获取细粒度注意网络中的第二权重参数,基于第二权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵的偏置;
对连续特征矩阵的偏置及连续特征矩阵进行特征融合,生成第一权重矩阵。
其中,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率,包括:
将融合特征向量输入到异常识别模型中的全局特征融合模块中,基于全局特征融合模块对融合特征向量进行门控过滤,生成门向量;
对门向量及融合特征向量进行特征融合,生成融合门控向量;
获取二分类矩阵,基于二分类矩阵对融合门控向量进行预测,输出正常概率及异常概率。
本申请实施例一方面提供了一种数据处理方法,该方法包括:
获取用户样本针对目标业务的行为序列矩阵样本,获取行为序列矩阵样本对应的样本标签;
基于初始异常识别模型中的初始连续卷积网络,对行为序列矩阵样本进行连续卷积,获取用户样本的连续特征训练矩阵;
基于初始异常识别模型中的初始扩张卷积网络,对行为序列矩阵样本进行扩张卷积,获取用户样本的扩张特征训练矩阵;
对连续特征训练矩阵及扩张特征训练矩阵进行特征融合,得到融合特征训练向量,对融合特征训练向量进行预测,得到用户样本针对目标业务的行为预测结果;
基于行为预测结果与样本标签对初始异常识别模型进行调整,生成异常识别模型。
其中,用户样本包括异常用户样本及正常用户样本;
获取用户样本针对目标业务的行为序列矩阵样本,获取行为序列矩阵样本对应的样本标签,包括:
获取异常用户样本针对目标业务的行为序列矩阵正样本,确定行为序列矩阵正样本的样本标签为异常标签;
获取正常用户样本针对目标业务的行为序列矩阵负样本,确定行为序列矩阵负样本的样本标签为正常标签。
本申请实施例一方面提供了一种数据处理装置,该装置包括:
矩阵获取模块,用于获取用户针对目标业务的行为序列矩阵;
连续卷积模块,用于基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;
扩张卷积模块,用于基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的;
概率预测模块,用于对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量;
该概率预测模块,还用于将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;
结果确定模块,用于根据异常概率确定用户针对目标业务的行为识别结果。
其中,该矩阵获取模块,包括:
数据转换单元,用于获取用户的初始行为序列数据及模型序列长度,根据模型序列长度将初始行为序列数据转换为行为序列数据;行为序列数据包括p个行为元素,p为模型序列长度;
矩阵生成单元,用于将p个行为元素中的各个行为元素映射为初始特征向量,将各个行为元素分别映射得到的初始特征向量进行拼接,得到行为序列矩阵。
其中,连续卷积网络包括N个连续卷积子网络,各个连续卷积子网络对应的连续卷积宽度不同;N为正整数;
该连续卷积模块,具体用于:
在异常识别模型中,将行为序列矩阵输入第i个连续卷积子网络中,在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,直至获取到用户的N个连续特征矩阵;i为正整数,i小于或等于N。
其中,第i个连续卷积子网络包括d1个连续卷积核,d1个连续卷积核中的各个连续卷积核的卷积参数不同;
在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵方面,该连续卷积模块包括:
特征提取单元,用于在第i个连续卷积子网络中,根据第i个连续卷积子网络对应的连续卷积宽度,采用d1个连续卷积核分别对行为序列矩阵进行卷积,提取行为序列矩阵对应的d1个第一特征向量;
特征拼接单元,用于对d1个第一特征向量进行特征拼接,得到用户的第i个连续特征矩阵。
其中,扩张卷积网络包括M个扩张卷积子网络,各个扩张卷积子网络对应的扩张卷积宽度不同;M为正整数;
该扩张卷积模块,具体用于:
在异常识别模型中,将行为序列矩阵输入第j个扩张卷积子网络中,在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,直至获取到用户的M个扩张特征矩阵;j为正整数,j小于或等于M。
其中,第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;第二扩张卷积层为第一扩张卷积层的下一个卷积层;
在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵方面,该扩张卷积模块包括:
第一采样确定单元,用于在第j个扩张卷积子网络中,获取第一扩张卷积的第一扩张系数,将行为序列矩阵输入第一扩张卷积层,根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第一扩张卷积层的第一卷积采样点;
第一卷积单元,用于基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵;若第一扩张卷积层为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为行为序列矩阵;若第一扩张卷积层不为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为第一扩张卷积层的上一个卷积层的输出矩阵;
系数确定单元,用于根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二扩张系数;
第二采样确定单元,用于将第一扩张卷积层的输出矩阵输入第二扩张卷积层,根据第二扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二卷积采样点;
第二卷积单元,用于基于第二卷积采样点,对第一扩张卷积层的输出矩阵进行卷积,得到第二扩张卷积层的输出矩阵;
层交互单元,用于若第二扩张卷积层不为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为第二扩张卷积层的下一个卷积层的输入矩阵;
矩阵确定单元,用于若第二扩张卷积层为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。
其中,第一扩张卷积层包括d2个扩张卷积核,d2个扩张卷积核中的各个扩张卷积核的卷积参数不同;
该第一卷积单元,包括:
向量提取子单元,用于基于第一卷积采样点,采用d2个扩张卷积核分别对输入矩阵进行卷积,提取输入矩阵对应的d2个第二特征向量;
输出获取子单元,用于对d2个第二特征向量进行特征拼接,得到第一扩张卷积层的输出矩阵。
其中,在对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量方面,该概率预测模块包括:
第一向量获取单元,用于获取第一权重向量,基于第一权重向量对连续特征矩阵中的每一列元素分别进行加权求和,得到连续特征矩阵的第一粗粒度向量;
第二向量获取单元,用于获取第一权重矩阵,将第一权重矩阵与连续特征矩阵进行点乘,得到第一加权细粒度矩阵,对第一加权细粒度矩阵中的每一列元素进行特征融合,得到连续特征矩阵的第一细粒度向量;
第三向量获取单元,用于获取第二权重向量,基于第二权重向量对扩张特征矩阵中的每一列元素进行加权求和,得到扩张特征矩阵的第二粗粒度向量;
第四向量获取单元,用于获取第二权重矩阵,对第二权重矩阵与扩张特征矩阵进行点乘,得到第二加权细粒度矩阵,对第二加权细粒度矩阵中的每一列元素进行特征融合,得到扩张特征矩阵的第二细粒度向量;
向量拼接单元,用于对第一粗粒度向量、第一细粒度向量、第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量。
其中,异常识别模型还包括粗粒度注意网络;在获取第一权重向量方面,该第一向量获取单元包括:
参数获取子单元,用于获取粗粒度注意网络中的第一权重参数,基于第一权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵中每一行元素的权重值;
权重归一子单元,用于对连续特征矩阵中每一行元素的权重值进行归一化,生成第一权重向量。
其中,异常识别模型还包括细粒度注意网络;在获取第一权重矩阵方面,该第二向量获取单元包括:
偏置确定子单元,用于获取细粒度注意网络中的第二权重参数,基于第二权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵的偏置;
权重生成子单元,用于对连续特征矩阵的偏置及连续特征矩阵进行特征融合,生成第一权重矩阵。
其中,在将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率方面,该概率预测模块包括:
门控过滤单元,用于将融合特征向量输入到异常识别模型中的全局特征融合模块中,基于全局特征融合模块对融合特征向量进行门控过滤,生成门向量;
门向量融合单元,用于对门向量及融合特征向量进行特征融合,生成融合门控向量;
概率预测单元,用于获取二分类矩阵,基于二分类矩阵对融合门控向量进行预测,输出正常概率及异常概率。
本申请实施例一方面提供了一种数据处理装置,该装置包括:
样本获取模块,用于获取用户样本针对目标业务的行为序列矩阵样本,获取行为序列矩阵样本对应的样本标签;
连续提取模块,用于基于初始异常识别模型中的初始连续卷积网络,对行为序列矩阵样本进行连续卷积,获取用户样本的连续特征训练矩阵;
扩张提取模块,用于基于初始异常识别模型中的初始扩张卷积网络,对行为序列矩阵样本进行扩张卷积,获取用户样本的扩张特征训练矩阵;
训练预测模块,用于对连续特征训练矩阵及扩张特征训练矩阵进行特征融合,得到融合特征训练向量,对融合特征训练向量进行预测,得到用户样本针对目标业务的行为预测结果;
模型调整模块,用于基于行为预测结果与样本标签对初始异常识别模型进行调整,生成异常识别模型。
其中,用户样本包括异常用户样本及正常用户样本;
该样本获取模块,包括:
正样本获取单元,用于获取异常用户样本针对目标业务的行为序列矩阵正样本,确定行为序列矩阵正样本的样本标签为异常标签;
负样本获取单元,用于获取正常用户样本针对目标业务的行为序列矩阵负样本,确定行为序列矩阵负样本的样本标签为正常标签。
本申请实施例一方面提供了一种计算机设备,包括处理器、存储器、输入输出接口;
处理器分别与存储器和输入输出接口相连,其中,输入输出接口用于接收数据及输出数据,存储器用于存储计算机程序,处理器用于调用计算机程序,以执行本申请实施例一方面中的数据处理方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行本申请实施例一方面中的数据处理方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例一方面中的各种可选方式中提供的方法。
实施本申请实施例,将具有如下有益效果:
本申请实施例通过获取用户针对目标业务的行为序列矩阵;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的;对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;根据异常概率确定用户针对目标业务的行为识别结果。通过连续卷积网络可以识别行为序列矩阵中连续的矩阵元素,即对行为序列矩阵中连续的矩阵元素进行卷积,可以认为对行为序列矩阵中c1个矩阵元素的特征进行卷积后得到连续特征矩阵中的一个矩阵元素,由于连续卷积网络可以识别行为序列矩阵中连续的矩阵元素,因此得到的连续特征矩阵中的一个矩阵元素在融合c1个矩阵元素的特征时,可能会对c1个矩阵元素的特征进行多次重复融合,故而连续特征矩阵中的一个矩阵元素包括的行为序列矩阵中的特征较少,可以表示行为序列矩阵中的中、小片段的特征;而扩张卷积网络可以识别行为序列矩阵中存在元素间隔的矩阵元素,可以认为对行为序列矩阵中c2个矩阵元素的特征进行卷积后得到扩张特征矩阵中的一个矩阵元素,由于扩张卷积网络所识别的行为序列矩阵中的矩阵元素之间存在元素间隔,因此,得到的扩张特征矩阵中的一个矩阵元素在融合c2个矩阵元素的特征时,可以对c2个矩阵元素的特征进行无重复融合,或者存在较少的重复,即c2大于c1,故而扩张特征矩阵中的一个矩阵元素所包括的行为序列矩阵中的特征较多,可以表示行为序列矩阵中的中、长片段(即更大范围)的特征。通过以上过程,在无需对行为序列数据进行统计,减少特征工程阶段所损耗的资源,并且可以更加全面地提取行为序列数据中所包括的特征,避免信息损失,从而提高了数据处理的准确性。
其中,扩张卷积网络得到的行为序列矩阵中的中、长片段的特征是相对于连续卷积网络所得到的行为序列矩阵中的中、小片段的特征而言的,行为序列矩阵中连续的一段矩阵元素可以认为是一个片段,换句话说,片段的中、小或长是指该片段中所包含的行为序列矩阵中的矩阵元素的数量的多少,中片段中所包含的行为序列矩阵中的矩阵元素的数量大于小片段中所包含的行为序列矩阵中的矩阵元素的数量,长片段中所包含的行为序列矩阵中的矩阵元素的数量大于中片段中所包含的行为序列矩阵中的矩阵元素的数量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理的网络架构图;
图2是本申请实施例提供的一种双目数据处理的简易场景示意图;
图3是本申请实施例提供的一种异常识别模型的简易结构示意图;
图4是本申请实施例提供的一种数据处理的方法流程图;
图5是本申请实施例提供了一种多层连续卷积结构示意图;
图6是本申请实施例提供的一个连续卷积子网络的卷积场景示意图;
图7是本申请实施例提供的一种多层扩张卷积结构示意图;
图8是本申请实施例提供的一种异常识别模型的具体结构示意图;
图9是本申请实施例提供的一种单个扩张卷积子网络对行为序列矩阵的卷积流程示意图;
图10是本申请实施例提供的一种数据处理的数据流图;
图11是本申请实施例提供的一种异常识别模型的训练流程图;
图12是本申请实施例提供的一种数据处理装置示意图;
图13是本申请实施例提供的另一种数据处理装置示意图;
图14是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
其中,在本申请实施例中,可以基于人工智能领域中的机器学习等技术,获取行为序列矩阵中的连续特征矩阵(即中、小片段的特征),获取行为序列矩阵中的扩张特征矩阵(即中、长片段的特征),基于连续特征矩阵及扩张特征矩阵融合后的特征,预测得到用户针对目标业务的行为识别结果,从而可以更为全面地提取行为序列矩阵中的特征,提高数据处理的准确性。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,以提取各个行为序列矩阵的特征,根据特征得到用户针对目标业务的行为识别结果,从而减少人工资源的耗费。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
其中,人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。而本申请中主要涉及的是机器学习/深度学习(如对用户针对目标业务的行为序列矩阵的特征提取、特征融合及概率预测等)等方向。通过学习得到异常识别模型,该异常识别模型可以用于对行为序列矩阵进行预测,以得到该行为序列矩阵对应的用户针对目标业务的行为识别结果。
而深度学习(Deep Learning,DL)是机器学习(Machine Learning,ML)领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。其中,深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术,深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。例如,本申请中的异常识别模型,该异常识别模型中包括连续卷积网络及扩张卷积网络等。
进一步地,本申请中的数据可以通过云存储技术进行存储,也可以在服务器中进行存储。其中,由于一般游戏的用户比较多,每个用户也可以产生较多的行为序列数据,因此,可以采用大数据技术,对本申请中的行为序列数据进行处理。
其中,云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。
通过云存储技术,对本申请中的行为序列数据进行存储,提高数据的存储效率,以及数据交互的效率。
具体的,请参见图1,图1是本申请实施例提供的一种数据处理的网络架构图,本申请实施例可以由计算机设备实现,其中,该计算机设备可以是由服务器及终端设备组成;该计算机设备还可以是服务器或终端设备,在此不做限定。其中,本申请实施例中的计算机设备可以获取目标业务所关联的各个用户的数据,例如,该目标业务为游戏业务,该计算机设备可以获取参与游戏的用户的行为序列数据,并对行为序列数据进行识别,以检测该用户在游戏中的行为是否异常。
如图1所示,计算机设备101可以获取与目标业务相关联的各个用户终端(如用户终端102a、用户终端102b及用户终端102c等)所产生的针对目标业务的行为序列数据,对各个用户终端的行为序列数据进行识别,将该行为序列数据转换成异常识别模型可以识别的行为序列矩阵,提取该行为序列矩阵中的较少的矩阵元素组成的片段的特征,提取该行为序列矩阵中较多的矩阵元素组成的片段的特征,对两种片段的特征进行特征融合,以得到该行为序列矩阵中的融合特征,以基于该融合特征对对应的用户进行检测,确定该用户针对目标业务的行为识别结果,其中,较少和较多是相对而言的。通过行为序列矩阵中的较少的矩阵元素组成的片段的特征及行为序列矩阵中的较多的矩阵元素组成的片段的特征进行融合,对行为序列矩阵进行数据处理,可以全面获取到用户针对目标业务的特征,从而提高数据处理的准确性。
可以理解的是,本申请实施例中所提及的计算机设备或用户设备包括但不限于终端设备或服务器。换句话说,计算机设备或用户设备可以是服务器或终端设备,也可以是服务器和终端设备组成的系统。其中,以上所提及的终端设备可以是一种电子设备,包括但不限于手机、平板电脑、台式电脑、笔记本电脑、掌上电脑、增强现实/虚拟现实(AugmentedReality/Virtual Reality,AR/VR)设备、头盔显示器、可穿戴设备、智能音箱、数码相机、摄像头及其他具备网络接入能力的移动互联网设备(mobile internet device,MID)等。其中,以上所提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
进一步地,请参见图2,图2是本申请实施例提供的一种数据处理的简易场景示意图。如图2所示,计算机设备可以获取用户针对目标业务的行为序列矩阵201,其中,该目标业务可以是任意一个应用程序中的业务,如游戏领域中的各个游戏,视频播放领域或教育领域等。计算机设备基于异常识别模型中的连续卷积网络2021,对行为序列矩阵201进行连续卷积,获取该用户的连续特征矩阵,其中,该连续卷积网络2021中的各个卷积核的扩张系数为1,即连续卷积网络2021对行为序列矩阵201进行卷积时,是对行为序列矩阵201中连续的f1个元素进行卷积,f1为正整数,f1是根据该连续卷积网络2021的连续卷积宽度所确定的,如,连续卷积宽度为3,f1就为3。计算机设备基于异常识别模型中的扩张卷积网络2022,对行为序列矩阵201进行扩张卷积,获取该用户的扩张特征矩阵,其中,该扩张卷积网络2022中的各个卷积核的扩张系数大于或等于1,其中,该扩张卷积网络包括多个扩张卷积层,各个扩张卷积层的扩张系数是逐层增加的,例如,在第一个扩张卷积层中的卷积核的扩张系数为1,在除第一扩张卷积层以外的扩张卷积层中的卷积核的扩张系数大于1,即,该扩张卷积网络2022对行为序列矩阵201进行卷积时,是对行为序列矩阵201中间隔的f2个元素进行卷积,f2为正整数,f2是根据该扩张卷积网络2022的扩张卷积宽度所确定的,如扩张卷积宽度为3,f2就为3。计算机设备对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,对该融合特征向量进行预测,得到异常概率,可以根据该异常概率,确定用户针对目标业务的行为识别结果。通过连续卷积网络2021及扩张卷积网络2022的结合,对行为序列矩阵201进行全面的特征提取,以提高数据处理的准确性。
其中,可以参见图3,图3是本申请实施例提供的一种异常识别模型的简易结构示意图。如图3所示,该异常识别模型包括连续卷积网络、扩张卷积网络、粗粒度注意网络、细粒度注意网络及全局特征融合模块。计算机设备可以获取用户针对目标业务的行为序列矩阵,将该行为序列矩阵输入连续卷积网络中,获取该行为序列矩阵的连续特征矩阵;将该行为序列矩阵输入扩张卷积网络中,获取该行为序列矩阵的扩张特征矩阵,连续卷积网络和扩张卷积网络进行结合,可以提取该行为序列矩阵中较少的矩阵元素所组成的中、小片段的特征,以及行为序列矩阵中较多的矩阵元素所组成的更长片段的特征,可以综合得到更加全面的卷积特征信息,提高了对行为序列矩阵的数据处理的准确性。计算机设备将该连续特征矩阵输入粗粒度注意网络,对连续特征矩阵进行粗粒度上的融合,可以融合同种多个卷积核一起通过连续卷积操作提取到的多维特征向量;将连续特征矩阵输入细粒度注意网络,对连续特征矩阵进行细粒度上的融合,可以融合同种每个卷积核单独通过连续卷积操作提取到的特征,将粗粒度注意网络及细粒度注意网络进行结合,以综合提取连续特征矩阵中更为丰富和关键的语义向量。同理,计算机设备将该扩张特征矩阵输入粗粒度注意网络,对扩张特征矩阵进行粗粒度上的融合;将该扩张特征矩阵输入细粒度注意网络,对扩张特征矩阵进行细粒度上的融合。
其中,粗粒度与细粒度是一个相对的概念,简单来说,粗粒度关注于整体,细粒度关注于细节,以一个软件为例,该软件可以认为是粗粒度的,该软件所包括的模块,该软件对应的程序代码实现等可以认为是细粒度的。在本申请中,粗粒度是对连续特征矩阵或扩张特征矩阵中的每一行元素作为一个整体,对连续特征矩阵或扩张特征矩阵进行特征融合;细粒度是对该连续特征矩阵或扩张特征矩阵中的每一个元素作为一个个体,对连续特征矩阵或扩张特征矩阵进行特征融合。
计算机设备对连续特征矩阵进行粗粒度上的融合后得到的特征和进行细粒度上的融合后得到的特征,以及对扩张特征矩阵进行粗粒度上的融合后得到的特征和进行细粒度上的融合后得到的特征,进行特征融合,得到融合特征向量。计算机设备可以将该融合特征向量输入全局特征融合模块,基于该全局特征融合模块对融合特征向量进行预测,输出异常概率,根据该异常概率,确定用户针对目标业务的行为识别结果。简单来说,本申请通过连续卷积网络及扩张卷积网络综合提取行为序列矩阵中更为全面的卷积特征信息,提高对行为序列数据处理的准确性,进一步通过粗粒度注意网络及细粒度注意网络的双注意力机制的结合,突出行为序列矩阵中的重要片段,并得到该行为序列矩阵中的全局特征等,从而可以得到行为序列矩阵中更为关键和丰富的语义向量,进一步提高数据处理的准确性。
进一步地,请参见图4,图4是本申请实施例提供的一种数据处理的方法流程图。如图4所示,本申请实施例的执行主体“计算机设备”可以是模型预测设备,该数据处理过程包括如下步骤:
步骤S401,获取用户针对目标业务的行为序列矩阵。
在本申请实施例中,计算机设备可以获取用户的初始行为序列数据及模型序列长度,根据模型序列长度将初始行为序列数据转换为行为序列数据,其中,该行为序列数据包括p个行为元素,p为模型序列长度;将各个行为元素映射为初始特征向量,其中,该映射过程可以是通过异常识别模型中的嵌入(Embedding)层实现,将各个行为元素分别映射得到的初始特征向量进行拼接,得到行为序列矩阵。其中,计算机设备可以获取目标业务对应的行为日志数据库,从该行为日志数据库中可以获取与该目标业务相关联的各个用户的初始行为序列数据,其中,该行为日志数据库可以存储在服务器中,该服务器可以是目标业务对应的服务器;可选的,计算机设备可以从该用户对应的用户终端中获取该用户针对目标业务的初始行为序列数据,该初始行为序列数据可以存储在该用户的用户终端中;或者,该初始行为序列数据可以存储在单独的数据存储服务器中,计算机设备可以从该数据存储服务器中获取该初始行为序列数据等,即,该初始行为序列数据的存储位置不做限定。其中,计算机设备获取到初始行为序列数据时,会获取到该初始行为序列数据对应的用户。以行为日志数据库存储在服务器中为例,该行为日志数据库中存储有用户标识与初始行为序列数据的关联关系,计算机设备可以获取行为日志数据库中的用户标识与初始行为序列数据的关联关系,对各个初始行为序列数据进行批量识别,得到各个初始行为序列数据的异常概率,基于该关联关系,可以根据异常概率确定对应的用户标识所指示的用户针对目标业务的行为识别结果,其中,本申请是以一个初始行为序列数据为例进行描述的。
其中,该目标业务可以是任意一个应用程序中的业务,该初始行为序列数据可以是用户在执行目标业务时所进行的操作的集合。其中,当用户在针对该目标业务进行操作时,可以获取该操作对应的行为标识,将该用户在预测周期中所产生的行为标识依次组合,得到该用户的初始行为序列数据,存储该用户的用户标识及初始行为序列数据。计算机设备在对目标业务在该预测周期中的数据进行识别时,可以获取该预测周期中的初始行为序列数据,将该初始行为序列数据转换成行为序列矩阵,对该行为序列矩阵进行数据处理。或者,当用户在针对该目标业务进行操作时,可以获取该操作对应的行为标识,将该用户从登录应用程序到登出该应用程序这一时间段所产生的行为标识依次组合,得到该用户的初始行为序列数据,计算机设备可以在获取到初始行为序列数据时,将该初始行为序列数据进行数据处理,可选的,可以存储该初始行为序列数据,在后续可以对该初始行为序列数据进行再次检测,减少异常误判的情况,提高数据处理的准确性,或者,当用户针对该行为识别结果提出异议时,可以基于该初始行为序列数据进行核实。其中,计算机设备可以对初始行为序列数据按周期进行数据处理,也可以对该初始行为序列数据实时进行数据处理等。例如,该预测周期为一天,计算机设备可以获取一天内用户针对该目标业务的初始行为序列数据。其中,组成该初始行为序列数据中的各个行为标识是根据对应操作的执行时间进行依次组合的。
其中,该模型序列长度是根据异常识别模型所确定的,即,该异常识别模型的输入矩阵为5*3的矩阵,则该模型序列长度为5(即p为5),将该初始行为序列数据转换为包括p个行为元素的行为序列数据,以使该异常识别模型可以对行为序列数据进行数据处理,该行为元素即为行为标识。其中,若该初始行为序列数据的长度小于该模型序列长度,则在该初始行为序列数据中添加默认行为数据(如0),生成行为序列数据;若该初始行为序列数据的长度大于或等于该模型序列长度,则获取采样起始位置,从该初始行为序列数据中的采样起始位置开始,依次获取p个行为元素,生成行为序列数据。其中,该采样起始位置是根据异常识别模型的训练阶段所确定的。
例如,该目标业务为游戏业务,获取到用户针对目标业务的初始行为序列数据为(34,23,34,56,1,1,2,34,55,65,34,1,2,123,23,45,34,34,324,42,34,434,43,23,4),假定模型序列长度为24,采样起始位置为第2个元素,则将初始行为序列数据转换为行为序列数据(23,34,56,1,1,2,34,55,65,34,1,2,123,23,45,34,34,324,42,34,434,43,23,4);或者,获取到用户针对目标业务的初始行为序列数据为(1,1,2,34,55,65,34,1,2,123,23,45,34,34,324,42,34,434,43,23,4),假定模型序列长度为24,则将初始行为序列数据转换为行为序列数据(1,1,2,34,55,65,34,1,2,123,23,45,34,34,324,42,34,434,43,23,4,0,0,0)。将该行为序列数据中的各个行为元素分别映射为初始特征向量,将各个行为元素映射得到的初始特征向量进行拼接,得到行为序列矩阵。其中,将行为元素映射为初始特征向量的方式可以是N-Gram或Word2Vec等方式,以一个行为元素基于Word2Vec的映射过程为例,可以对该行为元素进行独热编码,得到该行为元素对应的独热向量,对该行为元素对应的独热向量进行降维处理,得到维度为m的向量,该维度为m的向量即为该行为元素映射得到的初始特征向量。其中,可以认为该初始特征向量的长度为m,得到的行为序列矩阵为p*m的矩阵,m为正整数,该行为序列矩阵中的每一行都对应一个行为元素。可选的,各个行为元素分别映射得到的初始特征向量也可以是列向量,此时,将各个初始特征向量进行拼接,得到的行为序列矩阵为m*p的矩阵,该行为序列矩阵中的每一列都对应一个行为元素。其中,在本申请实施例中,是以该初始特征向量为行向量进行描述的。
步骤S402,基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取该用户的连续特征矩阵。
在本申请实施例中,计算机设备基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取该用户的连续特征矩阵,该连续卷积网络包括N个连续卷积子网络,各个连续卷积子网络对应的连续卷积宽度不同;N为正整数。其中,各个连续卷积子网络对应的连续卷积核为连续卷积宽度*m,即该连续卷积网络是对行为序列矩阵的行进行连续卷积,例如,连续卷积宽度为3的连续卷积子网络对应的连续卷积核为3*m;若初始特征向量为列向量,则各个连续卷积子网络对应的连续卷积核为m*连续卷积宽度,即该连续卷积网络是对行为序列矩阵的列进行连续卷积,例如,连续卷积宽度为3的连续卷积子网络对应的连续卷积核为m*3。换句话说,该连续卷积网络是对行为元素进行连续卷积,初始特征向量为行向量与初始特征向量为列向量分别对应的连续卷积核是互为转置的关系,在本申请的后续描述中,以初始特征向量为行向量进行描述,后续不再进行说明。
其中,每个连续卷积子网络包括d1个连续卷积核,d1个连续卷积核中的各个连续卷积核的卷积参数不同。即,该连续卷积网络是一种多尺度的卷积网络,该尺度是指连续卷积宽度,可以根据通过不同尺度的卷积网络,提取该行为序列矩阵中不同序列长度的特征(如N-Gram特征),不同的连续卷积子网络是单独操作的。
其中,计算机设备在异常识别模型中,将行为序列矩阵输入第i个连续卷积子网络中,在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,直至获取到用户的N个连续特征矩阵;i为正整数,i小于或等于N。具体的,在获取第i个连续特征矩阵时,计算机设备可以在第i个连续卷积子网络中,根据第i个连续卷积子网络对应的连续卷积宽度,采用d1个连续卷积核分别对行为序列矩阵进行卷积,提取行为序列矩阵对应的d1个第一特征向量,该第一特征向量为列向量;对d1个第一特征向量进行特征拼接,得到用户的第i个连续特征矩阵,该连续特征矩阵包括d1列,同理,获取该用户的N个连续特征矩阵。
可选的,该连续卷积网络包括多个连续卷积层,可以认为,该连续卷积网络包括k1个连续卷积层,每个连续卷积层包括N个连续卷积子网络,每个连续卷积子网络包括d1个连续卷积核,即,该连续卷积网络包括k1*N*d1个连续卷积核。计算机设备可以将该行为序列矩阵输入第一个连续卷积层中的各个连续卷积子网络,在第i个连续卷积子网络中,通过第i个连续卷积子网络中的d1个连续卷积核分别对行为序列矩阵进行连续卷积,得到d1个第一特征向量,将d1个第一特征向量进行特征拼接,得到第i个连续卷积子网络中第一个连续卷积层的输出矩阵;将该第i个连续卷积子网络中第一个连续卷积层的输出矩阵,输入第i个连续卷积子网络中第二个连续卷积层,对第i个连续卷积子网络中第一个连续卷积层的输出矩阵进行连续卷积,得到第i个连续卷积子网络中第二个连续卷积层的输出矩阵;…;将第i个连续卷积子网络中第(k1-1)个连续卷积层的输出矩阵,输入第i个连续卷积子网络中第k1个连续卷积层,通过第i个连续卷积子网络中第k1个连续卷积层的d1个连续卷积核,对第(k1-1)个连续卷积层的输出矩阵进行连续卷积,得到第i个连续卷积子网络中第k1个连续卷积层的输出矩阵,将第i个连续卷积子网络中第k1个连续卷积层的输出矩阵确定为第i个连续卷积子网络的连续特征矩阵。通过以上过程,可以获取到该用户的N个连续特征矩阵。
该连续卷积网络为多层多尺度的网络,即,该连续卷积网络包括多种不同连续卷积宽度的连续卷积子网络,每种连续卷积宽度的连续卷积子网络包括多个不同卷积参数的连续卷积核,通过不同的卷积参数提取该行为序列矩阵中的不同方面的特征,通过多层结构,逐层扩大该连续卷积网络的感受野,可以层次化地提取行为序列矩阵中的高层抽象特征。例如,对于步长为1,连续卷积宽度分别为1~7的三层连续卷积网络来说,其对输入层的感受野范围大小分别是1、4、7、10、13、16和19,总结来说,该步长为1的连续卷积网络对输入层的感受野范围大小为{(连续卷积宽度-1)*连续卷积层数+1}。在卷积神经网络中,感受野(Receptive Field)是指卷积神经网络中每一层输出的特征图(featuremap)上的像素点在输入矩阵或输入图片上映射的区域大小,简单来说,感受野是指上述特征图上的一个点对应到输入矩阵或输入图片上的区域。在本申请实施例中,该连续特征矩阵中的一个矩阵元素所融合的行为序列矩阵中的矩阵元素的数量,即为该连续卷积网络对输入层的感受野;扩张特征矩阵中的一个矩阵元素所融合的行为序列矩阵中的矩阵元素的数量,即为该扩张卷积网络对输入层的感受野。
举例来说,请参见图5,图5是本申请实施例提供的一种多层连续卷积结构示意图。如图5所示,以一个连续卷积子网络为例,假定步长为1,k1为3,即该连续卷积子网络包括3个连续卷积层,假定该行为序列矩阵为(x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11),对x1、x2及x3进行卷积,得到第一个连续卷积层中的第一个元素;对x2、x3及x4进行卷积,得到第一个连续卷积层中的第二个元素;对x3、x4及x5进行卷积,得到第一个连续卷积层中的第三个元素;…;对x9、x10及x11进行卷积,得到第一个连续卷积层中的第九个元素。将第一个连续卷积层中的九个元素进行拼接,得到第一个连续卷积层的输出矩阵。对第一个连续卷积层的输出矩阵中的第一个元素、第二个元素及第三个元素进行卷积,得到第二个连续卷积层的第一个元素;对第一个连续卷积层的输出矩阵中的第二个元素、第三个元素及第四个元素进行卷积,得到第二个连续卷积层的第二个元素;…;对第一个连续卷积层的输出矩阵中的第七个元素、第八个元素及第九个元素进行卷积,得到第二个连续卷积层的第七个元素。对第二个连续卷积层的七个元素进行拼接,得到第二个连续卷积层的输出矩阵。对第二个连续卷积层的输出矩阵中的第一个元素、第二个元素及第三个元素进行卷积,得到第三个连续卷积层的第一个元素;对第二个连续卷积层的输出矩阵中的第二个元素、第三个元素及第四个元素进行卷积,得到第三个连续卷积层的第二个元素;…;对第二个连续卷积层的输出矩阵中的第五个元素、第六个元素及第七个元素进行卷积,得到第三个连续卷积层的第五个元素。对第三个连续卷积层的五个元素进行拼接,得到第三个连续卷积层的输出矩阵,将该第三个连续卷积层的输出矩阵,确定为该用户在该连续卷积网络中的连续特征矩阵。可选的,也可以对各个连续卷积层的输出矩阵进行补零,使各个连续卷积层的输入矩阵的维度相同。如图5所示,第三个连续卷积层的输出矩阵中的第一个元素是由x1、x2、x3、x4、x5、x6及x7逐层卷积得到的,第三个连续卷积层的输出矩阵中的第二个元素是由x2至x8逐层卷积得到的,…,可以认为该连续卷积子网络的感受野为7。
其中,以一个连续卷积层为例,参见图6,图6是本申请实施例提供的一个连续卷积子网络的卷积场景示意图。如图6所示,该连续卷积子网络包括d1个连续卷积核,假定k1为1,计算机设备获取行为序列矩阵601,假定该行为序列矩阵601为8*5的矩阵,获取连续卷积核602,假定该连续卷积核602对应的连续卷积宽度为3,即该连续卷积核602为3*5的矩阵。采用连续卷积核602对行为序列矩阵601进行连续卷积,具体来说,将行为序列矩阵601中的第一行至第三行(即标号①所指示的行为元素)与连续卷积核602进行卷积,得到卷积后的第一个元素;将行为序列矩阵601中的第二行至第四行(即标号②所指示的行为元素)与连续卷积核602进行卷积,得到卷积后的第二个元素;将行为序列矩阵601中的第三行至第五行(即标号③所指示的行为元素)与连续卷积核602进行卷积,得到卷积后的第三个元素;将行为序列矩阵601中的第四行至第六行(即标号④所指示的行为元素)与连续卷积核602进行卷积,得到卷积后的第四个元素;将行为序列矩阵601中的第五行至第七行(即标号⑤所指示的行为元素)与连续卷积核602进行卷积,得到卷积后的第五个元素;将行为序列矩阵601中的第六行至第八行(即标号⑥所指示的行为元素)与连续卷积核602进行卷积,得到卷积后的第六个元素;将与连续卷积核602进行卷积后得到的第一个元素至第六个元素进行组合,得到第一特征向量603。同理,计算机设备可以获取通过该d1个连续卷积核分别对行为序列矩阵601进行卷积后得到的第一特征向量,将d1个第一特征向量进行特征拼接,得到该用户在该连续卷积子网络中所获取的连续特征矩阵604,该连续特征矩阵604为6*d1的矩阵。
步骤S403,基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取该用户的扩张特征矩阵。
在本申请实施例中,计算机设备基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;该扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的。其中,扩张特征矩阵中的一个矩阵元素是由行为序列矩阵中的c1个矩阵元素的特征融合所得到的,连续特征矩阵中的一个矩阵元素是由行为序列矩阵中的c2个矩阵元素的特征融合所得到的,c1及c2为正整数,c1大于c2,其中,该c1可以表示该扩张卷积网络的感受野,c2可以表示该连续卷积网络的感受野。其中,该扩张卷积网络包括M个扩张卷积子网络,各个扩张卷积子网络对应的扩张卷积宽度不同;M为正整数。其中,各个扩张卷积子网络对应的扩张卷积核为扩张卷积宽度*m,即该扩张卷积网络是对行为序列矩阵的行进行扩张卷积,例如,扩张卷积宽度为3的扩张卷积子网络对应的扩张卷积核为3*m;若初始特征向量为列向量,则各个扩张卷积子网络对应的扩张卷积核为m*扩张卷积宽度,即该扩张卷积网络是对行为序列矩阵的列进行扩张卷积,例如,扩张卷积宽度为3的扩张卷积子网络对应的扩张卷积核为m*3。换句话说,该扩张卷积网络是对行为元素进行扩张卷积,初始特征向量为行向量与初始特征向量为列向量分别对应的扩张卷积核是互为转置的关系,在本申请的后续描述中,以该初始特征向量为行向量进行描述,后续不再进行说明。
在本申请实施例中,计算机设备在异常识别模型中,将该行为序列矩阵输入第j个扩张卷积子网络中,在该第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对该行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,直至获取到用户的M个扩张特征矩阵;j为正整数,j小于或等于M。
其中,该第j个扩张卷积子网络可以包括k2个扩张卷积层,其中,通过多个卷积层,可以基于多个卷积层中的非线性操作和片段长度的逐层加深,可以更加深入和充分地挖掘行为序列矩阵中各个长、中及小片段的高层特征,因此,k2可以与k1相等,使得连续卷积网络与扩张卷积网络对各个行为序列矩阵所挖掘的高层特征的特征全局复杂度相同,使得在对连续卷积网络的输出矩阵及扩张卷积网络的输出矩阵进行融合处理时,不会在不同的特征全局复杂度下进行融合,提高了数据处理的准确性。
举例来说,该第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;第二扩张卷积层为第一扩张卷积层的下一个卷积层。计算机设备在第j个扩张卷积子网络中,获取第一扩张卷积的第一扩张系数,将行为序列矩阵输入第一扩张卷积层,根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第一扩张卷积层的第一卷积采样点。基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵;若第一扩张卷积层为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为行为序列矩阵;若第一扩张卷积层不为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为第一扩张卷积层的上一个卷积层的输出矩阵。计算机设备可以根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二扩张系数,其中,该第二扩张系数可以小于或等于{第一扩张系数*(扩张卷积宽度-1)},其中,该第二扩张系数为{第一扩张系数*(扩张卷积宽度-1)}时,该扩张卷积网络在最后一层中的元素映射到第一层时,在该第一层中所映射到的各个元素是连续的,从而可以使得该扩张卷积网络可以覆盖该行为序列矩阵中的所有行为元素。可选的,该扩张卷积网络中的各个扩张卷积层的扩张系数也可以根据需要进行修改,在此不做限定。其中,在对矩阵进行卷积时,该矩阵中的两个元素间存在间隔,该间隔是根据扩张系数得到的,如间隔=扩张系数-1,举例来说,扩张系数为3,则对第一个元素、第四个元素及第七个元素进行卷积。可选的,也可以对各个扩张卷积层的输出矩阵进行补零,使各个扩张卷积层的输入矩阵的维度相同,对于扩张卷积网络来说,也可以减少在扩张卷积网络中越高层元素越少,无法进行卷积的情况。
计算机设备将第一扩张卷积层的输出矩阵输入第二扩张卷积层,根据第二扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二卷积采样点。基于第二卷积采样点,对第一扩张卷积层的输出矩阵进行卷积,得到第二扩张卷积层的输出矩阵。若第二扩张卷积层不为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为第二扩张卷积层的下一个卷积层的输入矩阵;若第二扩张卷积层为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。
具体的,该第一扩张卷积层包括d2个扩张卷积核,该d2个扩张卷积核中的各个扩张卷积核的卷积参数不同。在基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵时,计算机设备可以基于第一卷积采样点,采用d2个扩张卷积核分别对输入矩阵进行卷积,提取输入矩阵对应的d2个第二特征向量;对d2个第二特征向量进行特征拼接,得到第一扩张卷积层的输出矩阵。其中,该第二扩张卷积层也可以包括d2个扩张卷积核,该第二扩张卷积层中的d2个扩张卷积核中的各个扩张卷积核的卷积参数不同。在基于第二卷积采样点,对第一扩张卷积层的输出矩阵进行卷积,得到第二扩张卷积层的输出矩阵时,计算机设备可以基于第二卷积采样点,采用第二扩张卷积层中的d2个扩张卷积核分别对第一扩张卷积层的输出矩阵进行卷积,提取第一扩张卷积层的输出矩阵对应的d2个第二特征向量;对第一扩张卷积层的输出矩阵对应的d2个第二特征向量进行特征拼接,得到第二扩张卷积层的输出矩阵。
在本申请实施例中,该扩张卷积网络包括多个扩张卷积层,可以认为,该扩张卷积网络包括k2个扩张卷积层,每个扩张卷积层包括M个扩张卷积子网络,每个扩张卷积子网络包括d2个扩张卷积核,即,该扩张卷积网络包括k2*M*d2个扩张卷积核。
其中,该扩张卷积网络为多层多尺度的网络,即,该扩张卷积网络包括多种不同扩张卷积宽度的扩张卷积子网络,每种扩张卷积宽度的扩张卷积子网络包括多个不同卷积参数的扩张卷积核,通过不同的卷积参数提取该行为序列矩阵中的不同方面的特征,通过多层结构,逐层扩大该扩张卷积网络的感受野,可以层次化地提取行为序列矩阵中的高层抽象特征。
举例来说,请参见图7,图7是本申请实施例提供的一种多层扩张卷积结构示意图。如图7所示,以一个扩张卷积子网络为例,假定步长为1,k2为3,即该扩张卷积子网络包括3个扩张卷积层,假定该行为序列矩阵为(x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11)。获取第一个扩张卷积层的扩张系数,该第一个扩张卷积层的扩张系数为1,则表示第一个扩张卷积层的元素间隔e为0,计算机设备根据该第一扩张卷积层的扩张系数,对x1、x2及x3进行卷积,得到第一个扩张卷积层中的第一个元素;对x2、x3及x4进行卷积,得到第一个扩张卷积层中的第二个元素;对x3、x4及x5进行卷积,得到第一个扩张卷积层中的第三个元素;…;对x9、x10及x11进行卷积,得到第一个扩张卷积层中的第九个元素。将第一个扩张卷积层中的九个元素进行拼接,得到第一个扩张卷积层的输出矩阵。
计算机设备根据第一个扩张卷积层的扩张系数及该扩张卷积子网络的扩张卷积宽度,确定第二个扩张卷积层的扩张系数,得到该第二个扩张卷积层的扩张系数为2。根据该第二个扩张卷积层的扩张系数,确定第二个扩张卷积层的元素间隔e为1,对第一个扩张卷积层的输出矩阵中的第一个元素、第三个元素及第五个元素进行卷积,得到第二个扩张卷积层的第一个元素;对第一个扩张卷积层的输出矩阵中的第二个元素、第四个元素及第六个元素进行卷积,得到第二个扩张卷积层的第二个元素;…;对第一个扩张卷积层的输出矩阵中的第五个元素、第七个元素及第九个元素进行卷积,得到第二个扩张卷积层的第五个元素。对第二个扩张卷积层的五个元素进行拼接,得到第二个扩张卷积层的输出矩阵。根据第二个扩张卷积层的扩张系数“2”及该扩张卷积子网络的扩张卷积宽度“3”,确定第三个扩张卷积层的扩张系数,得到该第三个扩张卷积层的扩张系数为4。根据该第三个扩张卷积层的扩张系数,确定第三个扩张卷积层的元素间隔e为3,对第二个扩张卷积层的输出矩阵中的第一个元素、第五个元素及第九个元素进行卷积,得到第三个扩张卷积层的第一个元素,其中,可以对该第二个扩张卷积层的输出矩阵补零,以在第三个扩张卷积层对第二个扩张卷积层的输出矩阵进行卷积。根据第三个扩张卷积层的第一个元素,得到第三个扩张卷积层的输出矩阵,将该第三个扩张卷积层的输出矩阵,确定为该用户在该扩张卷积网络中的扩张特征矩阵。
例如,对于步长为1,扩张卷积宽度为3的三层扩张卷积网络来说,第一层到第三层的扩张系数分别设置为1、2、4,该三层扩张卷积网络映射到第一层输入后的感受野范围大小的计算公式是“1+4*3+(3-1)=15”。当使用扩张卷积宽度为4的扩张卷积网络时,第一层到第三层的扩张系数分别设置为1、3、9,该三层扩张卷积网络映射到第一层输入后的感受野范围大小是“1+9*4+(4-1)=40”。再者,当使用扩张卷积宽度为5的扩张卷积网络时,第一层到第三层的扩张系数分别设置为1、4、16,该三层扩张卷积网络映射到第一层输入后的感受野范围大小是“1+16*5+(5-1)=85”。再者,当使用扩张卷积宽度为2的三层扩张卷积网络时,第一层到第三层的扩张系数分别设置为1、2、4,该三层扩张卷积网络映射到第一层输入后的感受野感受范围大小的计算公式具体是5+2+1=8,和上述扩张卷积宽度为3,4,5的扩张卷积网络的感受野计算不太相同,是因为其扩展系数的不同。因此,扩张卷积宽度分别为2,3,4,5的三层扩张卷积网络,其感受野的范围大小分别是8,15,40和85。总结来说,该步长为1的扩张卷积网络对输入层的感受野范围大小为{1+最后一层的扩张系数*扩张卷积宽度+扩张卷积宽度-1=扩张卷积宽度*(最后一层的扩张系数+1)}。
步骤S404,对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率。
在本申请实施例中,计算机设备可以获取第一权重向量,基于第一权重向量对连续特征矩阵中的每一列元素分别进行加权求和,得到连续特征矩阵的第一粗粒度向量,其中,将该连续特征矩阵记作H1,该连续特征矩阵H1为L1*d1的矩阵,该第一粗粒度向量的获取公式可以参见公式(1)所示:
pc1=sum1(aH1) (1)
其中,a是第一权重向量,为L1维的一个向量,也可以认为是1*L1的一个矩阵,sum1(aH1)是指对第一权重向量a与连续特征矩阵H1进行矩阵乘法,得到的第一粗粒度向量为1*d1的一个行向量。
其中,计算机设备可以获取粗粒度注意网络中的第一权重参数,将第一权重参数记作W1,基于第一权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵中每一行元素的权重值。对连续特征矩阵中每一行元素的权重值进行归一化,生成第一权重向量。其中,该第一权重向量的生成公式可以参见公式(2)所示:
a=softmax(VTtanh(W1H1 T)) (2)
其中,计算机设备可以将该第一权重参数W1与连续特征矩阵的转置矩阵H1 T进行加权求和,通过tanh函数对加权求和后的结果进行处理,再基于权重参数V的转置向量(相当于是行向量)对处理后的结果tanh(W1H1 T)进行转换,对转换结果进行归一化,该归一化方式可以是公式(2)中的softmax函数。其中,权重参数V与第一权重参数W1是粗粒度注意网络中可以进行学习的参数。其中,tanh是指一种激活函数,可以将输入的变量压缩为-1至1之间的数值;softmax为一种激活函数,可以对输入的变量进行归一化,即将该变量映射到0至1之间的数值。
计算机设备可以获取第一权重矩阵,将第一权重矩阵与连续特征矩阵进行点乘,得到第一加权细粒度矩阵,对第一加权细粒度矩阵中的每一列元素进行特征融合,得到连续特征矩阵的第一细粒度向量,将该第一权重矩阵记作A。其中,该第一细粒度向量的获取公式可以参见公式(3)所示:
Pf1=sum2(A*H1) (3)
其中,A为第一权重矩阵,为L1*d1维的一个矩阵,A*H1是指对第一权重矩阵与连续特征矩阵进行点乘,得到第一加权细粒度矩阵,sum2是指对第一加权细粒度矩阵中的每一列元素进行特征融合,以得到维度为1*d1的第一细粒度向量。
其中,计算机设备可以获取细粒度注意网络中的第二权重参数,将该第二权重参数为W2,基于第二权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵的偏置。对连续特征矩阵的偏置及连续特征矩阵进行特征融合,生成第一权重矩阵。该连续特征矩阵的偏置的生成公式可以参见公式(4)所示:
B=tanh(W2H1 T) (4)
其中,该第一权重矩阵的生成公式可以参见公式(5)所示:
A=softmax(scale*H1+B) (5)
其中,计算机设备在对连续特征矩阵的偏置及连续特征矩阵进行特征融合时,可以获取缩放参数scale,基于缩放参数scale对连续特征矩阵进行缩放,可以提高连续特征矩阵在第一权重矩阵中的占比,由于该连续特征矩阵为本申请中的主要特征,提高该连续特征矩阵在第一权重矩阵中的占比,可以减少信息误差,提高数据处理的准确性。
计算机设备可以获取第二权重向量,基于第二权重向量对扩张特征矩阵中的每一列元素进行加权求和,得到扩张特征矩阵的第二粗粒度向量,其中,将该扩张特征矩阵记作H2,该扩张特征矩阵H2为L2*d2的矩阵。计算机设备可以获取粗粒度注意网络中的第一权重参数,将第一权重参数记作W1,基于第一权重参数对扩张特征矩阵的转置矩阵进行加权求和,确定扩张特征矩阵中每一行元素的权重值。对扩张特征矩阵中每一行元素的权重值进行归一化,生成第二权重向量。该第二粗粒度向量的获取公式与公式(1)相似,即将公式(1)中的H1替换为H2,该第二权重向量的生成公式与公式(2)相似,即将公式(2)中的H1替换为H2
计算机设备获取第二权重矩阵,对第二权重矩阵与扩张特征矩阵进行点乘,得到第二加权细粒度矩阵,对第二加权细粒度矩阵中的每一列元素进行特征融合,得到扩张特征矩阵的第二细粒度向量,该第二细粒度向量的获取公式与公式(3)相似,即将公式(3)中的H1替换为H2。其中,计算机设备可以获取细粒度注意网络中的第二权重参数,将该第二权重参数为W2,基于第二权重参数对扩张特征矩阵的转置矩阵进行加权求和,确定扩张特征矩阵的偏置。对扩张特征矩阵的偏置及扩张特征矩阵进行特征融合,生成第二权重矩阵。其中,该扩张特征矩阵的偏置的生成公式与公式(4)相似,即将公式(4)中的连续特征矩阵H1替换为扩张特征矩阵H2;该第二权重矩阵的生成公式与公式(5)相似,即将公式(5)中的连续特征矩阵H1替换为扩张特征矩阵H2。计算机设备可以对第一粗粒度向量、第一细粒度向量、第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量。
其中,第一粗粒度向量的维度为d1,第一细粒度向量的维度为d1、第二粗粒度向量的维度为d2及第二细粒度向量的维度为d2。其中,连续卷积网络中包括N个连续卷积子网络,扩张卷积网络中包括M个扩张卷积子网络,每个连续卷积子网络通过粗粒度注意网络得到一个第一粗粒度向量,通过细粒度注意网络得到一个第一细粒度向量;每个扩张卷积子网络通过粗粒度注意网络得到一个第二粗粒度向量,通过细粒度注意网络得到一个第二细粒度向量,对第一粗粒度向量、第一细粒度向量、第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量,该融合特征向量的维度为(N*2*d1+M*2*d2)。可选的,一个连续卷积子网络所包括的连续卷积核的数量d1可以与一个扩张卷积子网络所包括的扩张卷积核的数量d2相等,可以记作d,此时,该融合特征向量的维度为(N+M)*2*d,其中,当d1与d2相等时,可以使得连续卷积网络与扩张卷积网络所提取到的特征的种类相同,使得连续卷积网络与扩张卷积网络在异常识别模型中的重要程度相同,从而在连续卷积网络及扩张卷积网络互相补充时,可以使得两者在融合特征向量中的占比相同,可以减少某个卷积网络占比较多,导致的异常概率偏差,提高数据处理的准确性。可选的,d1与d2也可以不相等,这个可以根据异常识别模型的需要进行更改。
其中,该异常识别模型中的粗粒度注意网络及细粒度注意网络可以为一个网络,记作双注意网络,该双注意网络包括粗粒度注意机制与细粒度注意机制两部分。
进一步地,计算机设备可以基于异常识别模型中的全局特征融合模块对融合特征向量进行门控过滤,生成门向量。对门向量及融合特征向量进行特征融合,生成融合门控向量;获取二分类矩阵,基于二分类矩阵对融合门控向量进行预测,输出正常概率及异常概率。可选的,也可以直接获取概率预测矩阵,基于概率预测矩阵对融合门控向量进行预测,输出异常概率。
步骤S405,根据异常概率确定用户针对目标业务的行为识别结果。
在本申请实施例中,若该异常概率大于或等于异常阈值,则确定用户针对目标业务的行为识别结果为行为异常结果;若该异常概率小于该异常阈值,则确定用户针对目标业务的行为识别结果为行为正常结果。可选的,若计算机设备获取到异常概率及正常概率,则可以在异常概率大于或等于正常概率时,确定用户针对目标业务的行为识别结果为行为异常结果,尽可能检测出行为异常的用户;或者,在异常概率大于正常概率时,确定用户针对目标业务的行为识别结果为行为异常结果,减少误判的情况。其中,当用户针对目标业务的行为识别结果为行为异常结果时,可以将该用户与该用户的初始行为序列数据添加至用户黑名单中。
进一步地,可以根据行为识别结果对对应的用户进行异常提醒,例如,获取用户的历史行为异常结果的异常次数及每个历史行为异常结果的异常概率,根据异常次数及每个历史行为异常结果的异常概率,确定用户所属的异常等级,根据该异常等级对用户进行异常提醒。如,假定异常等级越大,表示该用户异常程度越高,当异常等级为1时,可以向用户发送异常提示消息;当异常等级属于较高等级时,可以根据异常等级,限制用户在目标业务所属的应用程序中的部分操作;进一步地,当异常等级大于异常黑名单阈值时,可以直接限制用户对目标业务所属的应用程序的使用。
其中,当获取到异常用户的申诉请求时,可以获取该申诉请求所请求的异常用户的初始行为序列数据,由工作人员对该初始行为序列数据进行核验,若仍确定该初始行为序列数据异常,则向该异常用户发送申诉驳回消息,该申诉驳回消息包括驳回原因等。若确定该初始行为序列数据正常,则向该异常用户发送申诉成功消息,可选的,还可以基于对该异常用户的异常提醒,向该异常用户发放补偿,例如,目标业务为游戏业务时,可以向异常用户发放游戏货币或游戏道具等;其中,可以将该异常用户与初始行为序列数据作为负样本,对异常识别模型进行调整。
举例来说,该目标业务为游戏业务,计算机设备获取到用户的初始行为序列数据,该初始行为序列数据包括该用户操作的任务(如游戏副本、日常任务及剧情任务等)对应的行为标识、游戏货币收益对应的行为标识及物品拾取对应的行为标识等,假定该初始行为序列数据中的游戏货币收益异常增长,通过上述步骤S401至步骤S404,获取该初始行为序列数据的异常概率,可以得到该异常概率大于异常阈值,则确定该用户针对该游戏业务的行为识别结果为行为异常结果。获取该用户的历史行为异常结果,确定该用户的异常等级,假定该异常等级对应的异常提醒为“指定时间段内限制游戏交易”,则在指定时间段内,限制该用户在游戏中的交易。
其中,本申请实施例中的k1及k2可以根据经验设定,如取2或3,当连续卷积子网络包括2层或3层,扩张卷积子网络包括2层或3层时,可以满足本申请实施例的需要,在优化较为简单的情况下,实现对行为序列矩阵的特征提取。其中,若2或3层结构所提取的特征无法满足本申请时,可以增加连续卷积子网络或扩张卷积子网络的层数,换句话说,k1或k2的取值不做限定,可以根据需求进行设置。
进一步地,请参见图8,图8是本申请实施例提供的一种异常识别模型的具体结构示意图。如图8所示,计算机设备获取初始行为序列数据,根据该初始行为序列数据得到行为序列数据,该行为序列数据包括p个行为元素,包括行为标识1、行为标识2、…及行为标识p,将各个行为元素映射为初始特征向量,得到行为标识1对应的初始特征向量1、行为标识2对应的初始特征向量2、…及行为标识p对应的初始特征向量p。计算机设备将初始特征向量1、初始特征向量2、…及初始特征向量p进行特征拼接,得到行为序列矩阵。将该行为序列矩阵分别输入N个连续卷积子网络及M个扩张卷积子网络中,该N个连续卷积子网络包括连续卷积子网络1、连续卷积子网络2、…及连续卷积子网络N,该M个扩张卷积子网络包括扩张卷积子网络1、扩张卷积子网络2、…及扩张卷积子网络M。基于各个连续卷积子网络及各个扩张卷积子网络分别对行为序列矩阵进行卷积,得到N个连续卷积子网络对应的N个连续特征矩阵,以及M个扩张卷积子网络对应的M个扩张特征矩阵。其中,各个连续卷积子网络与各个扩张卷积子网络对行为序列矩阵的卷积过程是相互独立的,换句话说,各个连续卷积子网络与各个扩张卷积子网络对行为序列矩阵的卷积过程可以是并行执行的。
计算机设备将第i个连续特征矩阵输入粗粒度注意网络及细粒度注意网络,分别得到该第i个连续特征矩阵对应的第一粗粒度向量及第一细粒度向量,对该第i个连续特征矩阵对应的第一粗粒度向量及第一细粒度向量进行特征拼接;将第j个扩张特征矩阵输入粗粒度注意网络及细粒度注意网络,分别得到该第j个扩张特征矩阵对应的第二粗粒度向量及第二细粒度向量,对第j个扩张特征矩阵对应的第二粗粒度向量及第二细粒度向量进行特征拼接。具体来说,将连续卷积子网络1输出的连续特征矩阵1输入粗粒度注意网络及细粒度注意网络,得到连续特征矩阵1的第一粗粒度向量1及第一细粒度向量1;将连续卷积子网络2输出的连续特征矩阵2输入粗粒度注意网络及细粒度注意网络,得到连续特征矩阵2的第一粗粒度向量2及第一细粒度向量2;…;将连续卷积子网络N输出的连续特征矩阵N输入粗粒度注意网络及细粒度注意网络,得到连续特征矩阵N的第一粗粒度向量N及第一细粒度向量N。将扩张卷积子网络1输出的扩张特征矩阵1输入粗粒度注意网络及细粒度注意网络,得到扩张特征矩阵1的第二粗粒度向量1及第二细粒度向量1;将扩张卷积子网络2输出的扩张特征矩阵2输入粗粒度注意网络及细粒度注意网络,得到扩张特征矩阵2的第二粗粒度向量2及第二细粒度向量2;…;将扩张卷积子网络M输出的扩张特征矩阵M输入粗粒度注意网络及细粒度注意网络,得到扩张特征矩阵M的第二粗粒度向量M及第二细粒度向量M。
将各个第一粗粒度向量、各个第一细粒度向量、各个第二粗粒度向量及各个第二细粒度向量进行特征拼接,得到融合特征向量。可选的,也可以将第一粗粒度向量及对应的第一细粒度向量进行拼接,将第二粗粒度向量及对应的第二细粒度向量进行拼接,将拼接后的向量再次拼接,得到融合特征向量,如图8中所示。
其中,注意力机制可以全面地对已提取的片段特征(即连续特征矩阵及扩张特征矩阵等)的各个序列点或者向量做自适应的加权融合,可以包括最大池化操作等,其中,最大池化操作是基于连续特征矩阵的每一列单独取最大值,得到d1维度的输出向量,或基于扩张特征矩阵的每一列单独取最大值,得到d2维度的输出向量。其中,粗粒度注意网络及细粒度注意网络组成的双注意力机制可以基于全局和局部考虑对连续特征矩阵或扩张特征矩阵做元素和向量级别的特征提取,从而得到行为序列矩阵中关键和丰富的语义向量。具体来说,该粗粒度注意网络可以将每种尺度(即连续卷积宽度或扩张卷积宽度)的卷积子网络(如连续卷积子网络或扩张卷积子网络)中的多个卷积核的输出值作为一个整体看待,对行为序列矩阵中的各个滑动窗口得到的整体的特征向量做基于参数学习的自适应加权求和,以在前期可以综合单个尺度的卷积核的所有特征信息,从每种尺度的卷积子网络整体的角度突出行为序列矩阵中的重要片段。同理,细粒度注意网络是分别对每种尺度的卷积核的输出矩阵进行特征融合,是对输出矩阵(如连续特征矩阵或扩张特征矩阵)的每一列单独做特征融合,关注到每一行中元素级别的特征,可以对每种尺度的卷积子网络的多个卷积核输出的矩阵分别做基于参数学习的自适应加权求和,类似于最大池化操作(maxpooling)中分别对一个矩阵中的每一列取最大值。该细粒度注意网络可以基于全局特征考虑,对每一列自适应加权,可以保留更多重要的特征值,而不仅仅是最大值(top1的值),或者是人工设定的前q个值(topq的值),可以提高异常识别模型的泛化性。
其中,该全局特征融合模块包括高速(HighWay)模块、全连接模块,该异常识别模型还包括分类模块,多尺度的特征、粗细粒度注意力机制加权的特征以及两者之间可能存在冗余的情况,可以通过HighWay模块做特征转换,得到更纯和关键的全局语义向量。其中,计算机设备通过HighWay模块对融合特征向量进行门控过滤,生成门向量,该门向量包括第一门向量及第二门向量,该门向量的生成公式可以参见公式(6)及公式(7)所示:
gate=sigmoid(InputW3 T) (6)
其中,gate表示生成的第一门向量,Input是指融合特征向量,W3为该HighWay模块中可以进行学习的权重参数,通过sigmoid函数对融合特征向量进行门控过滤,得到第一门向量。
trans=tanh(InputW4 T) (7)
其中,trans表示生成的第二门向量,W4为该HighWay模块中可以进行学习的权重参数,通过tanh函数对融合特征向量进行门控过滤,得到第二门向量。其中,对第一门向量、第二门向量及融合特征向量进行特征融合,生成融合门控向量,该融合门控向量的生成公式可以参见公式(8)所示:
output=trans*gate+Input*(1-gate) (8)
其中,“*”是指对两个矩阵或向量进行点乘,output是指融合门控向量,其中,output的维度与融合特征向量的维度相同。
其中,计算机设备通过公式(6)和公式(7)对该融合特征向量进行元素级别的门控过滤,通过公式(8)做全局的特征融合和转换,自适应地融合多种特征和每一维的特征元素,保留和融合关键的高层特征,使后续的分类结构更为稳健。
其中,通过全连接模块对HighWay模块输出的融合门控向量进行非线性和维度转换,并获取分类模块中的二分类矩阵,对融合门控向量进行预测,输出正常概率及异常概率。
其中,各个连续卷积子网络对行为序列矩阵的连续卷积过程可以参见图4中步骤S402所示的具体描述。其中,各个扩张卷积子网络对行为序列矩阵的扩张卷积过程可以参见图9所示,图9是本申请实施例提供的一种单个扩张卷积子网络对行为序列矩阵的卷积流程示意图。如图9所示,该扩张卷积子网络包括k2个扩张卷积层,以第j个扩张卷积子网络为例,该卷积流程包括如下过程:
步骤S901,获取用户针对目标业务的行为序列矩阵。
在本申请实施例中,计算机设备获取用户针对目标业务的行为序列矩阵,该过程可以参见图4中步骤S401所示。
步骤S902,s=1,将该行为序列矩阵输入第s个扩张卷积层,对行为序列矩阵进行卷积,得到第s个扩张卷积层的输出矩阵。
在本申请实施例中,计算机设备设置一个变量s,用于表示在扩张卷积子网络中的层数,例如,s为1,则第s个扩张卷积层表示该扩张卷积子网络中的第一个扩张卷积层。计算机设备将s置为1,将该行为序列矩阵输入第s个扩张卷积层,对该行为序列矩阵进行卷积,得到第s个扩张卷积层的输出矩阵。其中,该卷积过程可以参见图4中步骤S403所示的具体描述,在此不再进行赘述。
步骤S903,检测s=k2
在本申请实施例中,计算机设备检测s是否等于k2,若s等于k2,则表示第s个扩张卷积层为扩张卷积子网络中的最后一个卷积层,执行步骤S906;若s不等于k2,则计算机设备执行步骤S904。
步骤S904,将第s个扩张卷积层的输出矩阵输入第(s+1)个扩张卷积层,对第s个扩张卷积层的输出矩阵进行卷积,得到第(s+1)个扩张卷积层的输出矩阵。
在本申请实施例中,计算机设备将第s个扩张卷积层的输出矩阵输入第(s+1)个扩张卷积层,对第s个扩张卷积层的输出矩阵进行卷积,得到第(s+1)个扩张卷积层的输出矩阵,该第(s+1)个扩张卷积层为第s个扩张卷积层的下一个卷积层。
步骤S905,s=s+1。
在本申请实施例中,计算机设备将s的值加一,执行步骤S903。
步骤S906,将第s个扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。
在本申请实施例中,计算机设备在s等于k2时,将第s个扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。
同理,通过步骤S901至步骤S906,获取到各个扩张卷积子网络的扩张特征矩阵。
在本申请实施例中,通过获取用户针对目标业务的行为序列矩阵;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张特征矩阵中的一个元素是由行为序列矩阵中的c1个元素的特征融合所得到的,连续特征矩阵中的一个元素是由行为序列矩阵中的c2个元素的特征融合所得到的,c1及c2为正整数,c1大于c2;对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;根据异常概率确定用户针对目标业务的行为识别结果。通过以上过程,可以参见图5及图7,可知,以连续卷积网络获取行为序列矩阵中较少的矩阵元素所组成的中、小片段的特征,以扩张卷积网络获取行为序列矩阵中较多的矩阵元素所组成的中、长片段(即更大范围)的特征,可以更加全面地提取行为序列数据中所包括的特征,避免信息损失,提高了数据处理的准确性。该异常识别模型为卷积神经网络(Convolutional Neural Networks,CNN)结构,该连续卷积网络及扩张卷积网络均为多层多尺度的网络,基于CNN结构的异常识别模型可以中的各个卷积核可以并行运行,可以提高模型的运行效率,可以满足多款游戏业务同时部署的要求。通过连续卷积网络及扩张卷积网络的结合,可以更加全面地获取到行为序列矩阵中的特征,包括多种中、小片段以及多种中、长片段的特征,提高特征提取的全面性,并基于双注意力机制,可以提高行为序列矩阵中语义向量提取的关键和丰富性。近一步通过HighWay模块融合粗、细粒度的特征,生成高层关键的全局语义特征向量,强化了分类模块的分类判别效果。
进一步地,参见图10,图10是本申请实施例提供的一种数据处理的数据流图。如图10所示,计算机设备从行为日志数据库中获取各个用户的初始行为序列数据,其中,该行为日志数据库中可以包括行为序列日志,该行为序列日志可以包括对应的用户所关联的初始行为序列数据;可选的,该行为日志数据库中的行为序列日志包括同一个游戏中的用户的初始行为序列数据。其中,将游戏标识及行为名称(或行为标识等)通过预处理脚本进行转换,具体是将游戏标识、行为名称及需要处理的初始行为序列数据输入预处理脚本中,通过该预处理脚本将初始行为序列数据转换为行为序列数据,在将该行为序列数据中的各个行为元素映射为初始特征向量,将各个初始特征向量拼接为行为序列矩阵,具体可以参见图4中步骤S401所示的具体描述。换句话说,该预处理脚本用于将获取到的初始行为序列数据转换为异常识别模型所能处理的数据。其中,若该初始行为序列数据为样本,则预处理脚本将该初始行为序列数据转换为训练数据,基于训练数据训练模型,得到异常识别模型,生成模型文件,该模型文件中可以包括训练好的异常识别模型。其中,该异常识别模型中的超参数可以存储于配置文件中,超参数是指模型训练开始之前所设置的参数,例如,模型输入数据信息(如模型序列长度等)、黑白样本比以及模型的固定参数(如扩张卷积网络中各个扩张卷积层的扩张系数、扩张卷积网络所包括的扩张卷积宽度及连续卷积网络所包括的连续卷积宽度等)等,即,在异常识别模型中不需要进行学习的参数,均可以存储在配置文件中。
其中,若初始行为序列数据为需要预测的数据,则预处理脚本将该初始行为序列数据转换为预测数据(即行为序列矩阵),从配置文件中获取异常识别模型的超参数等,从模型文件中加载异常识别模型,基于异常识别模型对预测数据进行预测,得到预测概率结果,该预测概率结果包括异常概率,或者包括异常概率及正常概率,对该异常概率进行阈值检测,得到该初始行为序列数据的行为识别结果。具体的,该过程可以参见图4中步骤S401至步骤S405所示,在此不再进行赘述。其中,在执行步骤S401至步骤S405时,可以从配置文件中获取需要的数据。
其中,可以参见图11,图11是本申请实施例提供的一种异常识别模型的训练流程图。如图11所示,本申请实施例中的执行主体为模型训练设备,该异常识别模型的训练过程如下:
步骤S1101,获取用户样本针对目标业务的行为序列矩阵样本,获取行为序列矩阵样本对应的样本标签。
在本申请实施例中,模型训练设备可以获取模型序列长度。获取用户样本针对目标业务的行为序列数据样本,基于模型序列长度获取行为序列数据样本中的训练数据,该训练数据包括p个行为元素样本,p为模型序列长度;将训练数据中的各个行为元素样本映射为初始特征向量样本,将各个行为元素样本分别对应的初始特征向量样本进行特征拼接,得到行为序列矩阵样本。其中,该过程可以参见图4中步骤S401所示描述。
其中,该用户样本可以包括异常用户样本及正常用户样本。可以获取异常用户样本针对目标业务的行为序列矩阵正样本,确定该行为序列矩阵正样本的样本标签为异常标签;获取正常用户样本针对目标业务的行为序列矩阵负样本,确定该行为序列矩阵负样本的样本标签为正常标签。可选的,可以从配置文件中获取黑白样本比,基于该黑白样本比获取异常用户样本及正常用户样本,获取到的异常用户样本与正常用户样本的比例为黑白样本比。具体的,可以获取目标业务所属的应用程序的用户黑名单及用户白名单,从该用户黑名单中获取异常用户样本,从用户白名单中获取正常用户样本。
其中,该行为日志数据库中可以存储所有的初始行为序列数据,可以从行为日志数据库中获取该异常用户样本的行为序列数据正样本,获取该正常用户样本的行为序列数据负样本。可选的,该行为日志数据库中的初始行为序列数据携带数据标签,可以从行为日志数据库中获取与该异常用户样本关联且数据标签为异常数据标签的初始行为序列数据样本,将获取到的该初始行为序列数据样本确定为异常用户样本的行为序列数据正样本;从行为日志数据库中获取与该正常用户样本关联且数据标签为正常数据标签的初始行为序列数据样本,将获取到的初始行为序列数据样本确定为该正常用户样本的行为序列数据负样本。进一步地,获取模型序列长度,基于该模型序列长度获取行为序列数据正样本中的异常训练数据,基于该模型序列长度获取行为序列数据负样本中的正常训练数据。其中,异常训练数据包括p个行为元素样本,正常训练数据包括p个行为元素样本。将该异常训练数据转换为行为序列矩阵正样本,将正常训练数据转换为行为序列矩阵负样本。
其中,由于不同的用户的初始行为序列数据不尽相同,因为有的用户可能对应用程序使用1个小时,也可能使用2个小时,或者10个小时等,因此,行为日志数据库中所存储的初始行为序列数据样本的长度可能不一致,为了减少由于初始行为序列数据样本的长度的差异造成的特征偏差,需要对初始行为序列数据样本进行截取或添加操作。同时,无论取一天中的初始行为序列数据样本的后面片段还是中间片段,差异性不会很大,若该初始行为序列数据样本中存在异常,则该异常不会因为埋点而改变,其中,埋点是一种数据采集方法,在初始行为序列数据样本的长度大于模型序列长度时,基于该埋点(即采样起始位置)对初始行为序列数据样本进行截取,转换成训练数据。其中,用户A的初始行为序列数据样本的起始点,可能是用户B的初始行为序列数据样本的中间点,基于大数定理,可以认为在一定程度上覆盖截取不同起点的行为序列模式。
进一步地,基于运行效率和预测性能的综合考虑,对各个用户的初始行为序列数据样本截取模型序列长度的训练数据,该模型序列长度可以是根据获取到的初始行为序列数据样本的长度分布,取覆盖初始行为序列数据样本的长度中90%的长度所得到的,其中,该90%可以根据需要进行更改。可选的,获取到的该训练数据可以通过“用户标识|训练数据|序列长度|样本标签”的格式进行表示,如(20133245|23,34,56,1,1,2,34,55,65,34,1,2,123,23,45,34,34,324,42,34,434,43,23,4|24|0),其中,该序列长度可以表示该训练数据中有效的行为元素的长度,该有效的行为元素属于初始行为序列数据样本,该序列长度小于或等于模型序列长度。其中,该样本标签包括正常标签及异常标签,假定该正常标签为1,异常标签为0。
步骤S1102,基于初始异常识别模型中的初始连续卷积网络,对行为序列矩阵样本进行连续卷积,获取该用户样本的连续特征训练矩阵。
在本申请实施例中,该过程可以参见图4中步骤S402中连续特征矩阵的获取过程,在此不再进行赘述。
步骤S1103,基于初始异常识别模型中的扩张卷积网络,对行为序列矩阵样本进行扩张卷积,获取该用户样本的扩张特征训练矩阵。
在本申请实施例中,该过程可以参见图4中步骤S403中扩张特征矩阵的获取过程,在此不再进行赘述。
步骤S1104,对连续特征训练矩阵及扩张特征训练矩阵进行特征融合,得到融合特征训练向量,对融合特征训练向量进行预测,得到用户样本针对目标业务的行为预测结果。
在本申请实施例中,该融合特征训练向量的生成过程可以参见图4中步骤S404所示的融合特征向量的生成过程。通过HighWay模块对融合特征训练向量进行门控过滤及全局特征融合,得到融合门控训练向量,对融合门控训练向量进行非线性和维度转换,通过分类模块对转换后的融合特征训练向量进行预测,具体可以获取二分类矩阵,基于二分类矩阵对该融合门控训练向量进行预测,得到预测异常概率,根据该预测异常概率确定用户样本针对目标业务的行为预测结果。其中,该融合门控训练向量的维度为(M+N)*d*2时,该二分类矩阵可以认为是[(M+N)*d*2]*2的一个矩阵,即(M+N)*d*2行2列的矩阵。
步骤S1105,基于行为预测结果与样本标签对初始异常识别模型进行调整,生成异常识别模型。
在本申请实施例中,基于行为预测结果与该行为序列矩阵样本所关联的样本标签对初始异常识别模型中的参数进行调整,生成异常识别模型。可选的,可以基于softmax的二分类交叉熵目标函数对初始异常识别模型进行优化,具体可以采用模型优化算法对该初始异常识别模型的各层参数进行优化,该模型优化算法可以是任意一种能对模型进行优化调整的算法,如Adam算法,Adam算法是一种可替代传统随机梯度下降过程的一阶优化算法,基于训练数据迭代地更新神经网络中的各个权重。可选的,对于初始异常识别模型的学习速率可以根据需要进行调整,如0.0001。进一步地,为了避免过拟合,可以对全局特征融合模块中的权重参数进行L1和L2正则化。
在本申请实施例中,通过步骤S1101至步骤S1105,实现对异常识别模型的学习训练,该异常识别模型的规则和特征设计较为简单,同时兼顾模型的预测性能和模型的通用性能,当该异常识别模型需要应用到新的目标业务的数据处理中时,可以获取新的目标业务的训练样本,基于该训练样本对异常识别模型进行调整,即可以移植到新的目标业务的数据处理中,减少模型的训练成本,提高模型移植的效率。
其中,对本申请实施例的具体实验数据进行如下说明:
具体的,在实验环境中,该实验中所采用的硬件平台是Core(TM)i7-8700CPU@3.6GHz的处理器,16G内存,256G固态硬盘,STRIX-GTX1080TI-11G显卡。在本实验中所采用的软件平台是基于微软10(window10)的64位操作系统,python2.7,Tensorflow1.8。
基于图8中异常识别模型的结构,各模块的参数和输出维度说明如下。对一个行为序列数据进行预处理后得到p长度的序列,下面以序列长度为p的单样本行为编号的行为序列数据作为输入样例,整个模型的结构参数和输出结果如下表1所示,表1是基于连续、扩张卷积网络和双注意力机制的异常识别模型的网络参数表,其中,连续卷积网络是一个包括N个连续卷积宽度的多层连续卷积子网络,每个连续卷积子网络包括d个连续卷积核;扩张卷积网络是一个包括M个扩张卷积宽度的多层扩张卷积子网络,每个扩张卷积子网络包括d个扩张卷积核。其中,一些避免过拟合的输出(Drop Out)和正则化辅助处理不在下表1中体现:
表1
其中,embed_dim是指对获取到的数据进行向量化,例如,embed_dim(行为标识embedding)是指将该行为标识转换为初始特征向量。在Embedding层,是对行为序列数据中的各个行为元素(即行为标识)进行转换,得到每个行为元素对应的初始特征向量,将各个初始特征向量进行拼接,得到p*m的一个矩阵。
其中,在大型多人在线角色扮演游戏(Massive/MassivelyMultiplayer OnlineRole-Playing Game,MMORPG)类某款游戏中的物品行为序列数据和任务行为序列数据两个数据集中,证明了本模型方案的优良性能。在白黑样本比是25457:170292的资金流向(money flow)行为序列数据的测试数据中,各个模型的预测效果如下表2所示,其中common_cnn表示连续卷积网络,dilated_cnn表示扩张卷积网络,max表示最大池化操作,att_1表示细粒度注意网络,att_2表示粗粒度注意网络,att_1_2表示粗、细粒度的双注意网络,common_and_dilated_cnn表示连续和扩张卷积网络结构。multi-head-att表示多头的自注意力结构,这里使用的是3头注意力。transformer_encoder表示使用转换(transformer)架构中编码(encoder)部分的2层自注意力(self-attention)结构。从表2中可以看出,无论是基于连续卷积网络还是结合连续卷积网络和扩张卷积网络的模型中,结合双注意力机制的模型都优于只使用最大池化层的模型,一定程度上说明了粗细粒度双注意力机制的有效性。同样,当同时含有双注意力机制时,结合连续卷积网络和扩张卷积网络的模型优于仅仅只使用连续卷积网络或者扩张卷积网络的模型。再者,本申请中提出的结合连续卷积网络、扩张卷积网络和粗细粒度双注意力机制的模型在下表2中的CNN类模型中达到最好的效果。同时,其效果比长短期记忆人工神经网络-连续卷积网络-最大池化操作(lstm_common_cnn_max)和长短期记忆人工神经网络-多头自注意力结构(lstm_multi-head-att)这两种长短期记忆人工神经网络(Long Short-Term Memory,LSTM)类模型的效果要优秀。在表2中也比完全基于注意力机制的转换编码多头自注意力结构(tranformer_encoder_multi-head-att)模型效果要好。表2是不同模型在money flow行为序列数据的预测效果对比。
表2
其中,精确率(precision)是指在所有预测出来的正例中有多少是预测正确的正例,可以将该精确率记作Pr,例如,有10个正例,5个负例,其中,10个正例中预测正确的正例为8个,5个负例中有2个负例被预测为正,则Pr为{8/(8+2)=0.8};召回率(recall)是指所有正例中预测正确的正例所占比例,记作R。综合值则是根据精确率Pr及召回率R得到的综合值,可以记作F1。例如,该综合值可以是精确率Pr及召回率R的调和均值,如公式(9)所示:
其中,该精确率、召回率或综合率等的值越大,表示对应的模型的效果越好。
同理,使用上述表2中各个模型相同的配置,基于相同的任务行为序列训练数据做训练,并在白黑样本比是153756:22255的任务行为序列测试数据中做效果对比,模型性能表现如下表3所示。从表3中可以得到类似的结论,在CNN类模型中,本文提出的结合连续卷积网络、扩张卷积网络和粗细粒度双注意力机制的模型在下表3中的CNN类模型中达到最好的效果。同时,其效果比lstm_common_cnn_max模型要好,与lstm_multi-head-att模型的效果相当。在表3中其效果比完全基于注意力机制的tranformer_encoder_multi-head-att模型效果要差一些,表3是不同模型在任务行为序列数据的预测效果对比。
表3
最后,综合多个模型在两个数据集的效果表现,说明本申请中的模型效果性能优秀。由于本申请方案的简单易用性,可以在多款游戏的异常行为判别任务中应用起来。只需要提供行为序列数据,就可以低成本和高效地训练模型,然后通过选择加载已训练好模型的方式,就能进行在线预测。对于不同的游戏,只需要通过修改配置脚本的游戏标识就能适配不同的游戏行为异常判别任务。此方案降低游戏行为异常判别任务的建模成本和预测成本。同时,本申请也提高了数据处理的准确性。通过设定阈值的方式,能够找到一定数量的高可疑的异常用户,对其进行一定程度的管制。本申请可以有效地打击异常玩家,净化游戏环境,降低游戏运营的成本。
进一步地,请参见图12,图12是本申请实施例提供的一种数据处理装置示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码等),例如该数据处理装置可以为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤,用于实现异常识别模型的预测过程。如图12所示,该数据处理装置1200可以用于图4所对应实施例中的计算机设备,具体的,该装置可以包括:矩阵获取模块11、连续卷积模块12、扩张卷积模块13、概率预测模块14及结果确定模块15。
矩阵获取模块11,用于获取用户针对目标业务的行为序列矩阵;
连续卷积模块12,用于基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;
扩张卷积模块13,用于基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的;
概率预测模块14,用于对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;
结果确定模块15,用于根据异常概率确定用户针对目标业务的行为识别结果。
其中,该矩阵获取模块11,包括:
数据转换单元111,用于获取用户的初始行为序列数据及模型序列长度,根据模型序列长度将初始行为序列数据转换为行为序列数据;行为序列数据包括p个行为元素,p为模型序列长度;
矩阵生成单元112,用于将各个行为元素映射为初始特征向量,将各个行为元素分别映射得到的初始特征向量进行拼接,得到行为序列矩阵。
其中,连续卷积网络包括N个连续卷积子网络,各个连续卷积子网络对应的连续卷积宽度不同;N为正整数;
该连续卷积模块12,具体用于:
在异常识别模型中,将行为序列矩阵输入第i个连续卷积子网络中,在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,直至获取到用户的N个连续特征矩阵;i为正整数,i小于或等于N。
其中,第i个连续卷积子网络包括d1个连续卷积核,d1个连续卷积核中的各个连续卷积核的卷积参数不同;
在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵方面,该连续卷积模块12包括:
特征提取单元121,用于在第i个连续卷积子网络中,根据第i个连续卷积子网络对应的连续卷积宽度,采用d1个连续卷积核分别对行为序列矩阵进行卷积,提取行为序列矩阵对应的d1个第一特征向量;
特征拼接单元122,用于对d1个第一特征向量进行特征拼接,得到用户的第i个连续特征矩阵。
其中,扩张卷积网络包括M个扩张卷积子网络,各个扩张卷积子网络对应的扩张卷积宽度不同;M为正整数;
该扩张卷积模块13,具体用于:
在异常识别模型中,将行为序列矩阵输入第j个扩张卷积子网络中,在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,直至获取到用户的M个扩张特征矩阵;j为正整数,j小于或等于M。
其中,第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;第二扩张卷积层为第一扩张卷积层的下一个卷积层;
在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵方面,该扩张卷积模块13包括:
第一采样确定单元131,用于在第j个扩张卷积子网络中,获取第一扩张卷积的第一扩张系数,将行为序列矩阵输入第一扩张卷积层,根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第一扩张卷积层的第一卷积采样点;
第一卷积单元132,用于基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵;若第一扩张卷积层为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为行为序列矩阵;若第一扩张卷积层不为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为第一扩张卷积层的上一个卷积层的输出矩阵;
系数确定单元133,用于根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二扩张系数;
第二采样确定单元134,用于将第一扩张卷积层的输出矩阵输入第二扩张卷积层,根据第二扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二卷积采样点;
第二卷积单元135,用于基于第二卷积采样点,对第一扩张卷积层的输出矩阵进行卷积,得到第二扩张卷积层的输出矩阵;
层交互单元136,用于若第二扩张卷积层不为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为第二扩张卷积层的下一个卷积层的输入矩阵;
矩阵确定单元137,用于若第二扩张卷积层为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。
其中,第一扩张卷积层包括d2个扩张卷积核,d2个扩张卷积核中的各个扩张卷积核的卷积参数不同;
该第一卷积单元132,包括:
向量提取子单元1321,用于基于第一卷积采样点,采用d2个扩张卷积核分别对输入矩阵进行卷积,提取输入矩阵对应的d2个第二特征向量;
输出获取子单元1322,用于对d2个第二特征向量进行特征拼接,得到第一扩张卷积层的输出矩阵。
其中,在对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量方面,该概率预测模块14包括:
第一向量获取单元141,用于获取第一权重向量,基于第一权重向量对连续特征矩阵中的每一列元素分别进行加权求和,得到连续特征矩阵的第一粗粒度向量;
第二向量获取单元142,用于获取第一权重矩阵,将第一权重矩阵与连续特征矩阵进行点乘,得到第一加权细粒度矩阵,对第一加权细粒度矩阵中的每一列元素进行特征融合,得到连续特征矩阵的第一细粒度向量;
第三向量获取单元143,用于获取第二权重向量,基于第二权重向量对扩张特征矩阵中的每一列元素进行加权求和,得到扩张特征矩阵的第二粗粒度向量;
第四向量获取单元144,用于获取第二权重矩阵,对第二权重矩阵与扩张特征矩阵进行点乘,得到第二加权细粒度矩阵,对第二加权细粒度矩阵中的每一列元素进行特征融合,得到扩张特征矩阵的第二细粒度向量;
向量拼接单元145,用于对第一粗粒度向量、第一细粒度向量、第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量。
其中,异常识别模型还包括粗粒度注意网络;在获取第一权重向量方面,该第一向量获取单元141包括:
参数获取子单元1411,用于获取粗粒度注意网络中的第一权重参数,基于第一权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵中每一行元素的权重值;
权重归一子单元1412,用于对连续特征矩阵中每一行元素的权重值进行归一化,生成第一权重向量。
其中,异常识别模型还包括细粒度注意网络;在获取第一权重矩阵方面,该第二向量获取单元142包括:
偏置确定子单元1421,用于获取细粒度注意网络中的第二权重参数,基于第二权重参数对连续特征矩阵的转置矩阵进行加权求和,确定连续特征矩阵的偏置;
权重生成子单元1422,用于对连续特征矩阵的偏置及连续特征矩阵进行特征融合,生成第一权重矩阵。
其中,在基于异常识别模型中的全局特征融合模块对融合特征向量进行预测,得到异常概率方面,该概率预测模块14包括:
门控过滤单元146,用于基于异常识别模型中的全局特征融合模块对融合特征向量进行门控过滤,生成门向量;
门向量融合单元147,用于对门向量及融合特征向量进行特征融合,生成融合门控向量;
概率预测单元148,用于获取二分类矩阵,基于二分类矩阵对融合门控向量进行预测,输出正常概率及异常概率。
本申请实施例提供了一种数据处理装置,该装置通过获取用户针对目标业务的行为序列矩阵;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为整数,e是根据扩张卷积网络的扩张系数所确定的,该扩张特征矩阵中的一个元素是由行为序列矩阵中的c1个元素的特征融合所得到的,连续特征矩阵中的一个元素是由行为序列矩阵中的c2个元素的特征融合所得到的,c1及c2为正整数,c1大于c2;对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;根据异常概率确定用户针对目标业务的行为识别结果。通过以上过程,以连续卷积网络提取行为序列矩阵中的中、小片段的特征,以扩张卷积网络提取行为序列矩阵中的中、长片段(即更大范围)的特征,可以更加全面地提取行为序列数据中所包括的特征,避免信息损失,提高了数据处理的准确性。该异常识别模型为卷积神经网络(Convolutional Neural Networks,CNN)结构,该连续卷积网络及扩张卷积网络均为多层多尺度的网络,基于CNN结构的异常识别模型可以中的各个卷积核可以并行运行,可以提高模型的运行效率,可以满足多款游戏业务同时部署的要求。通过连续卷积网络及扩张卷积网络的结合,可以更加全面地获取到行为序列矩阵中的特征,包括多种中、小片段以及多种中、长片段的特征,提高特征提取的全面性,并基于双注意力机制,可以提高行为序列矩阵中语义向量提取的关键和丰富性。近一步通过HighWay模块融合粗、细粒度的特征,生成高层关键的全局语义特征向量,强化了分类模块的分类判别效果。
进一步地,请参见图13,图13是本申请实施例提供的另一种数据处理装置示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤,用于实现异常识别模型的训练过程。如图10所示,该数据处理装置1300可以用于图11所对应实施例中的计算机设备,该计算机设备是模型训练设备,具体的,该装置可以包括:样本获取模块16、连续提取模块17、扩张提取模块18、训练预测模块19及模型调整模块20。
样本获取模块16,用于获取用户样本针对目标业务的行为序列矩阵样本,获取行为序列矩阵样本对应的样本标签;
连续提取模块17,用于基于初始异常识别模型中的初始连续卷积网络,对行为序列矩阵样本进行连续卷积,获取用户样本的连续特征训练矩阵;
扩张提取模块18,用于基于初始异常识别模型中的初始扩张卷积网络,对行为序列矩阵样本进行扩张卷积,获取用户样本的扩张特征训练矩阵;
训练预测模块19,用于对连续特征训练矩阵及扩张特征训练矩阵进行特征融合,得到融合特征训练向量,对融合特征训练向量进行预测,得到用户样本针对目标业务的行为预测结果;
模型调整模块20,用于基于行为预测结果与样本标签对初始异常识别模型进行调整,生成异常识别模型。
其中,用户样本包括异常用户样本及正常用户样本;
该样本获取模块16,包括:
正样本获取单元161,用于获取异常用户样本针对目标业务的行为序列矩阵正样本,确定行为序列矩阵正样本的样本标签为异常标签;
负样本获取单元162,用于获取正常用户样本针对目标业务的行为序列矩阵负样本,确定行为序列矩阵负样本的样本标签为正常标签。
本申请实施例提供了一种数据处理装置,该装置实现了对异常识别模型的学习训练,该异常识别模型的规则和特征设计较为简单,同时兼顾模型的预测性能和模型的通用性能,当该异常识别模型需要应用到新的目标业务的数据处理中时,可以获取新的目标业务的训练样本,基于该训练样本对异常识别模型进行调整,即可以移植到新的目标业务的数据处理中,减少模型的训练成本。提高模型移植的效率。
参见图14,图14是本申请实施例提供的一种计算机设备的结构示意图。如图14所示,本申请实施例中的计算机设备可以包括:一个或多个处理器1401、存储器1402和输入输出接口1403。该处理器1401、存储器1402和输入输出接口1403通过总线1404连接。存储器1402用于存储计算机程序,该计算机程序包括程序指令,输入输出接口1403用于接收数据及输出数据,如用于模型中的各个网络之间进行数据交互,以及模型的输入和输出;处理器1401用于执行存储器1402存储的程序指令。当处理器1401为模型预测设备中的处理器时,执行如下操作:
获取用户针对目标业务的行为序列矩阵;
基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;
基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的;
对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;
根据异常概率确定用户针对目标业务的行为识别结果。
当处理器1401为模型训练设备中的处理器时,执行如下操作:
获取用户样本针对目标业务的行为序列矩阵样本,获取行为序列矩阵样本对应的样本标签;
基于初始异常识别模型中的初始连续卷积网络,对行为序列矩阵样本进行连续卷积,获取用户样本的连续特征训练矩阵;
基于初始异常识别模型中的初始扩张卷积网络,对行为序列矩阵样本进行扩张卷积,获取用户样本的扩张特征训练矩阵;
对连续特征训练矩阵及扩张特征训练矩阵进行特征融合,得到融合特征训练向量,对融合特征训练向量进行预测,得到用户样本针对目标业务的行为预测结果;
基于行为预测结果与样本标签对初始异常识别模型进行调整,生成异常识别模型。
在一些可行的实施方式中,该处理器1401可以是中央处理单元(centralprocessing unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器1402可以包括只读存储器和随机存取存储器,并向处理器1401和输入输出接口1403提供指令和数据。存储器1402的一部分还可以包括非易失性随机存取存储器。例如,存储器1402还可以存储设备类型的信息。
具体实现中,该计算机设备可通过其内置的各个功能模块执行如该图4或图11中各个步骤所提供的实现方式,具体可参见该图4或图11中各个步骤所提供的实现方式,在此不再赘述。
本申请实施例通过提供一种计算机设备,包括:处理器、输入输出接口、存储器,通过处理器获取存储器中的计算机指令,执行该图4中所示方法的各个步骤,进行数据处理操作。本申请实施例以连续卷积网络提取行为序列矩阵中的中、小片段的特征,以扩张卷积网络提取行为序列矩阵中的中、长片段(即更大范围)的特征,可以更加全面地提取行为序列数据中所包括的特征,避免信息损失,提高了数据处理的准确性。该异常识别模型为卷积神经网络(Convolutional Neural Networks,CNN)结构,该连续卷积网络及扩张卷积网络均为多层多尺度的网络,基于CNN结构的异常识别模型可以中的各个卷积核可以并行运行,可以提高模型的运行效率,可以满足多款游戏业务同时部署的要求。通过连续卷积网络及扩张卷积网络的结合,可以更加全面地获取到行为序列矩阵中的特征,包括多种中、小片段以及多种中、长片段的特征,提高特征提取的全面性,并基于双注意力机制,可以提高行为序列矩阵中语义向量提取的关键和丰富性。近一步通过HighWay模块融合粗、细粒度的特征,生成高层关键的全局语义特征向量,强化了分类模块的分类判别效果。
或者,本申请实施例通过提供一种计算机设备,包括:处理器、输入输出接口、存储器,通过处理器获取存储器中的计算机指令,执行该图11中所示方法的各个步骤,进行模型训练操作。本申请实施例实现了对异常识别模型的学习训练,该异常识别模型的规则和特征设计较为简单,同时兼顾模型的预测性能和模型的通用性能,当该异常识别模型需要应用到新的目标业务的数据处理中时,可以获取新的目标业务的训练样本,基于该训练样本对异常识别模型进行调整,即可以移植到新的目标业务的数据处理中,减少模型的训练成本,提高模型移植的效率。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,当该程序指令被该处理器执行时,可以实现图4或图11中各个步骤所提供的数据处理方法,具体可参见该图4或图11中各个步骤所提供的实现方式,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署为在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行。
该计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者该计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图4或图11中的各种可选方式中所提供的方法,实现对行为序列矩阵的异常识别,可以提高对行为序列矩阵的特征提取的全面性,提高数据处理的准确性;或者实现对异常识别模型的训练,减少模型的训练成本,提高模型移植的效率。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在该说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (15)

1.一种数据处理方法,其特征在于,所述方法包括:
获取用户针对目标业务的行为序列矩阵;
将所述行为序列矩阵输入异常识别模型中,通过所述异常识别模型中的连续卷积网络所包括的N个连续卷积子网络,分别对所述行为序列矩阵进行连续卷积,得到所述用户的N个连续特征矩阵;N为正整数;各个连续卷积子网络对应的连续卷积宽度不同;
通过所述异常识别模型中的扩张卷积网络所包括的M个扩张卷积子网络,分别对所述行为序列矩阵进行扩张卷积,得到所述用户的M个扩张特征矩阵;所述扩张卷积是指对所述行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据所述扩张卷积网络的扩张系数所确定的;M为正整数;各个扩张卷积子网络对应的扩张卷积宽度不同;
采用第一权重向量及第一权重矩阵,分别对每个连续特征矩阵进行加权处理,得到每个连续特征矩阵的第一粗粒度向量及第一细粒度向量,采用第二权重向量及第二权重矩阵,分别对每个扩张特征矩阵进行加权处理,得到每个扩张特征矩阵的第二粗粒度向量及第二细粒度向量,对N个连续特征矩阵分别对应的第一粗粒度向量及第一细粒度向量,以及M个扩张特征矩阵分别对应的第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量;
将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中以得到异常概率;
根据所述异常概率确定所述用户针对所述目标业务的行为识别结果。
2.如权利要求1所述的方法,其特征在于,所述获取用户针对目标业务的行为序列矩阵,包括:
获取用户的初始行为序列数据及模型序列长度,根据所述模型序列长度将所述初始行为序列数据转换为行为序列数据;所述行为序列数据包括p个行为元素,p为所述模型序列长度;
将p个行为元素中的各个行为元素映射为初始特征向量,将所述各个行为元素分别映射得到的初始特征向量进行拼接,得到所述行为序列矩阵。
3.如权利要求1所述的方法,其特征在于,所述将所述行为序列矩阵输入异常识别模型中,通过所述异常识别模型中的连续卷积网络所包括的N个连续卷积子网络,分别对所述行为序列矩阵进行连续卷积,得到所述用户的N个连续特征矩阵,包括:
在异常识别模型中,将所述行为序列矩阵输入第i个连续卷积子网络中,在所述第i个连续卷积子网络中,以所述第i个连续卷积子网络对应的连续卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第i个连续特征矩阵,直至获取到所述用户的N个连续特征矩阵;i为正整数,i小于或等于N。
4.如权利要求3所述的方法,其特征在于,所述第i个连续卷积子网络包括d1个连续卷积核,所述d1个连续卷积核中的各个连续卷积核的卷积参数不同;
所述在所述第i个连续卷积子网络中,以所述第i个连续卷积子网络对应的连续卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第i个连续特征矩阵,包括:
在所述第i个连续卷积子网络中,根据所述第i个连续卷积子网络对应的连续卷积宽度,采用所述d1个连续卷积核分别对所述行为序列矩阵进行卷积,提取所述行为序列矩阵对应的d1个第一特征向量;
对所述d1个第一特征向量进行特征拼接,得到所述用户的第i个连续特征矩阵。
5.如权利要求1所述的方法,其特征在于,所述通过所述异常识别模型中的扩张卷积网络所包括的M个扩张卷积子网络,分别对所述行为序列矩阵进行扩张卷积,得到所述用户的M个扩张特征矩阵,包括:
在所述异常识别模型中,将所述行为序列矩阵输入第j个扩张卷积子网络中,在所述第j个扩张卷积子网络中,以所述第j个扩张卷积子网络对应的扩张卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第j个扩张特征矩阵,直至获取到所述用户的M个扩张特征矩阵;j为正整数,j小于或等于M。
6.如权利要求5所述的方法,其特征在于,所述第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;所述第二扩张卷积层为所述第一扩张卷积层的下一个卷积层;
所述在所述第j个扩张卷积子网络中,以所述第j个扩张卷积子网络对应的扩张卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第j个扩张特征矩阵,包括:
在所述第j个扩张卷积子网络中,获取所述第一扩张卷积的第一扩张系数,将所述行为序列矩阵输入所述第一扩张卷积层,根据所述第一扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度,确定所述第一扩张卷积层的第一卷积采样点;
基于所述第一卷积采样点,对输入矩阵进行卷积,得到所述第一扩张卷积层的输出矩阵;若所述第一扩张卷积层为所述第j个扩张卷积子网络中的第一个卷积层,则所述输入矩阵为所述行为序列矩阵;若所述第一扩张卷积层不为所述第j个扩张卷积子网络中的第一个卷积层,则所述输入矩阵为所述第一扩张卷积层的上一个卷积层的输出矩阵;
根据所述第一扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度,确定所述第二扩张卷积层的第二扩张系数;
将所述第一扩张卷积层的输出矩阵输入所述第二扩张卷积层,根据所述第二扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度,确定所述第二扩张卷积层的第二卷积采样点;
基于所述第二卷积采样点,对所述第一扩张卷积层的输出矩阵进行卷积,得到所述第二扩张卷积层的输出矩阵;
若所述第二扩张卷积层不为所述第j个扩张卷积子网络中的最后一个卷积层,则将所述第二扩张卷积层的输出矩阵确定为所述第二扩张卷积层的下一个卷积层的输入矩阵;
若所述第二扩张卷积层为所述第j个扩张卷积子网络中的最后一个卷积层,则将所述第二扩张卷积层的输出矩阵确定为所述用户的第j个扩张特征矩阵。
7.如权利要求6所述的方法,其特征在于,所述第一扩张卷积层包括d2个扩张卷积核,所述d2个扩张卷积核中的各个扩张卷积核的卷积参数不同;
所述基于所述第一卷积采样点,对输入矩阵进行卷积,得到所述第一扩张卷积层的输出矩阵,包括:
基于所述第一卷积采样点,采用所述d2个扩张卷积核分别对所述输入矩阵进行卷积,提取所述输入矩阵对应的d2个第二特征向量;
对所述d2个第二特征向量进行特征拼接,得到所述第一扩张卷积层的输出矩阵。
8.如权利要求1所述的方法,其特征在于,所述采用第一权重向量及第一权重矩阵,分别对每个连续特征矩阵进行加权处理,得到每个连续特征矩阵的第一粗粒度向量及第一细粒度向量,采用第二权重向量及第二权重矩阵,分别对每个扩张特征矩阵进行加权处理,得到每个扩张特征矩阵的第二粗粒度向量及第二细粒度向量,对N个连续特征矩阵分别对应的第一粗粒度向量及第一细粒度向量,以及M个扩张特征矩阵分别对应的第二粗粒度向量及第二细粒度向量进行特征拼接,生成融合特征向量,包括:
获取第一权重向量,基于所述第一权重向量对每个连续特征矩阵中的每一列元素分别进行加权求和,得到所述N个连续特征矩阵分别对应的第一粗粒度向量;
获取第一权重矩阵,将所述第一权重矩阵与每个连续特征矩阵分别进行点乘,得到N个连续特征矩阵分别对应的第一加权细粒度矩阵,对每个第一加权细粒度矩阵中的每一列元素进行特征融合,得到所述N个连续特征矩阵分别对应的第一细粒度向量;
获取第二权重向量,基于所述第二权重向量对每个扩张特征矩阵中的每一列元素进行加权求和,得到所述M个扩张特征矩阵分别对应的第二粗粒度向量;
获取第二权重矩阵,对所述第二权重矩阵与每个扩张特征矩阵分别进行点乘,得到M个扩张特征矩阵分别对应的第二加权细粒度矩阵,对每个第二加权细粒度矩阵中的每一列元素进行特征融合,得到所述M个扩张特征矩阵分别对应的第二细粒度向量;
对所述N个连续特征矩阵分别对应的第一粗粒度向量、所述N个连续特征矩阵分别对应的第一细粒度向量、所述M个扩张特征矩阵分别对应的第二粗粒度向量及所述M个扩张特征矩阵分别对应的第二细粒度向量进行特征拼接,生成融合特征向量。
9.如权利要求8所述的方法,其特征在于,所述异常识别模型还包括粗粒度注意网络;所述获取第一权重向量,包括:
获取所述粗粒度注意网络中的第一权重参数,基于所述第一权重参数对所述连续特征矩阵的转置矩阵进行加权求和,确定所述连续特征矩阵中每一行元素的权重值;
对所述连续特征矩阵中每一行元素的权重值进行归一化,生成第一权重向量。
10.如权利要求8所述的方法,其特征在于,所述异常识别模型还包括细粒度注意网络;所述获取第一权重矩阵,包括:
获取所述细粒度注意网络中的第二权重参数,基于所述第二权重参数对所述连续特征矩阵的转置矩阵进行加权求和,确定所述连续特征矩阵的偏置;
对所述连续特征矩阵的偏置及所述连续特征矩阵进行特征融合,生成第一权重矩阵。
11.如权利要求1所述的方法,其特征在于,所述将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中以得到异常概率,包括:
将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中,基于所述全局特征融合模块对所述融合特征向量进行门控过滤,生成门向量;
对所述门向量及所述融合特征向量进行特征融合,生成融合门控向量;
获取二分类矩阵,基于所述二分类矩阵对所述融合门控向量进行预测,输出正常概率及异常概率。
12.一种数据处理方法,其特征在于,所述方法包括:
获取用户样本针对目标业务的行为序列矩阵样本,获取所述行为序列矩阵样本对应的样本标签;
将所述行为序列矩阵样本输入初始异常模型中,通过所述初始异常识别模型中的初始连续卷积网络所包括的N个初始连续卷积子网络,分别对所述行为序列矩阵样本进行连续卷积,得到所述用户样本的N个连续特征训练矩阵;N为正整数;各个初始连续卷积子网络对应的连续卷积宽度不同;
通过所述初始异常识别模型中的初始扩张卷积网络所包括的M个扩张卷积子网络,分别对所述行为序列矩阵样本进行扩张卷积,得到所述用户样本的M个扩张特征训练矩阵;所述扩张卷积是指对所述行为序列矩阵样本中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据所述初始扩张卷积网络的扩张系数所确定的;M为正整数;各个初始扩张卷积子网络对应的扩张卷积宽度不同;
采用第一初始权重向量及第一初始权重矩阵,分别对每个连续特征训练矩阵进行加权处理,得到每个连续特征训练矩阵的第一粗粒度向量样本及第一细粒度向量样本,采用第二初始权重向量及第二初始权重矩阵,分别对每个扩张特征训练矩阵进行加权处理,得到每个扩张特征训练矩阵的第二粗粒度向量样本及第二细粒度向量样本,对N个连续特征训练矩阵分别对应的第一粗粒度向量样本及第一细粒度向量样本,以及M个扩张特征训练矩阵分别对应的第二粗粒度向量样本及第二细粒度向量样本进行特征拼接,生成融合特征训练向量,对所述融合特征训练向量进行预测,得到所述用户样本针对所述目标业务的行为预测结果;
基于所述行为预测结果与所述样本标签对所述初始异常识别模型进行调整,生成异常识别模型;所述异常识别模型包括训练好的第一权重参数及第二权重参数,所述第一权重参数及所述第二权重参数用于确定第一权重向量、第一权重矩阵、第二权重向量及第二权重矩阵。
13.如权利要求12所述的方法,其特征在于,所述用户样本包括异常用户样本及正常用户样本;
所述获取用户样本针对目标业务的行为序列矩阵样本,获取所述行为序列矩阵样本对应的样本标签,包括:
获取所述异常用户样本针对目标业务的行为序列矩阵正样本,确定所述行为序列矩阵正样本的样本标签为异常标签;
获取所述正常用户样本针对所述目标业务的行为序列矩阵负样本,确定所述行为序列矩阵负样本的所述样本标签为正常标签。
14.一种计算机设备,其特征在于,包括处理器、存储器、输入输出接口;
所述处理器分别与所述存储器和所述输入输出接口相连,其中,所述输入输出接口用于接收数据及输出数据,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求1-11任一项所述的方法,或者执行如权利要求12-13任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-11任一项所述的方法,或者执行如权利要求12-13任一项所述的方法。
CN202011077502.6A 2020-10-10 2020-10-10 一种数据处理方法、装置、计算机及可读存储介质 Active CN112232165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011077502.6A CN112232165B (zh) 2020-10-10 2020-10-10 一种数据处理方法、装置、计算机及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011077502.6A CN112232165B (zh) 2020-10-10 2020-10-10 一种数据处理方法、装置、计算机及可读存储介质

Publications (2)

Publication Number Publication Date
CN112232165A CN112232165A (zh) 2021-01-15
CN112232165B true CN112232165B (zh) 2024-03-01

Family

ID=74111846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011077502.6A Active CN112232165B (zh) 2020-10-10 2020-10-10 一种数据处理方法、装置、计算机及可读存储介质

Country Status (1)

Country Link
CN (1) CN112232165B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113098664B (zh) * 2021-03-31 2022-10-11 中国人民解放军海军航空大学航空作战勤务学院 基于mdmsffn的空时分组码自动识别方法和装置
CN115624755B (zh) * 2022-12-08 2023-03-14 腾讯科技(深圳)有限公司 一种数据处理方法、装置及计算机设备、存储介质
CN117270476B (zh) * 2023-10-24 2024-03-08 清远欧派集成家居有限公司 基于智慧工厂的生产控制方法及系统
CN117217318B (zh) * 2023-11-07 2024-01-26 瀚博半导体(上海)有限公司 基于Transformer网络模型的文本生成方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734211A (zh) * 2018-05-17 2018-11-02 腾讯科技(深圳)有限公司 图像处理的方法和装置
CN111553419A (zh) * 2020-04-28 2020-08-18 腾讯科技(深圳)有限公司 一种图像识别方法、装置、设备以及可读存储介质
CN111639571A (zh) * 2020-05-20 2020-09-08 浙江工商大学 基于轮廓卷积神经网络的视频动作识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11538585B2 (en) * 2018-06-08 2022-12-27 Cambridge Heartwear Limited Detecting abnormalities in ECG signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734211A (zh) * 2018-05-17 2018-11-02 腾讯科技(深圳)有限公司 图像处理的方法和装置
CN111553419A (zh) * 2020-04-28 2020-08-18 腾讯科技(深圳)有限公司 一种图像识别方法、装置、设备以及可读存储介质
CN111639571A (zh) * 2020-05-20 2020-09-08 浙江工商大学 基于轮廓卷积神经网络的视频动作识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多尺度特征融合空洞卷积 ResNet遥感图像建筑物分割;徐胜军 等;光学精密工程;第28卷(第7期);全文 *

Also Published As

Publication number Publication date
CN112232165A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN112232165B (zh) 一种数据处理方法、装置、计算机及可读存储介质
WO2021233199A1 (zh) 搜索推荐模型的训练方法、搜索结果排序的方法及装置
WO2021022521A1 (zh) 数据处理的方法、训练神经网络模型的方法及设备
WO2021057056A1 (zh) 神经网络架构搜索方法、图像处理方法、装置和存储介质
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
JP6908302B2 (ja) 学習装置、識別装置及びプログラム
CN114418030B (zh) 图像分类方法、图像分类模型的训练方法及装置
CN112200041B (zh) 视频动作识别方法、装置、存储介质与电子设备
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
US11321891B2 (en) Method for generating action according to audio signal and electronic device
CN112561028A (zh) 训练神经网络模型的方法、数据处理的方法及装置
CN113095370A (zh) 图像识别方法、装置、电子设备及存储介质
CN114626503A (zh) 模型的训练方法、目标检测方法、装置、电子设备及介质
CN114266897A (zh) 痘痘类别的预测方法、装置、电子设备及存储介质
CN114299304B (zh) 一种图像处理方法及相关设备
Zhao et al. Multi‐mode neural network for human action recognition
CN111783688A (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN117197609A (zh) 一种遥感样本数据集的构建方法、系统、介质及设备
CN113362852A (zh) 一种用户属性识别方法和装置
CN116977668A (zh) 图像识别方法、装置、计算机设备及计算机存储介质
CN115100599A (zh) 基于掩码transformer的半监督人群场景异常检测方法
CN114333069B (zh) 对象的姿态处理方法、装置、设备及存储介质
CN115115835A (zh) 图像的语义分割方法、装置、设备、存储介质及程序产品
CN115115910A (zh) 图像处理模型的训练方法、使用方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40037777

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant