CN116226769A - 一种基于用户行为序列的短视频异常行为识别方法 - Google Patents

一种基于用户行为序列的短视频异常行为识别方法 Download PDF

Info

Publication number
CN116226769A
CN116226769A CN202211682503.2A CN202211682503A CN116226769A CN 116226769 A CN116226769 A CN 116226769A CN 202211682503 A CN202211682503 A CN 202211682503A CN 116226769 A CN116226769 A CN 116226769A
Authority
CN
China
Prior art keywords
behavior
user
behavior sequence
sequence
short video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211682503.2A
Other languages
English (en)
Inventor
易黎
宋南
王涛
苏俊亮
沈梦强
卓奕炜
相若晨
张晓燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Fiberhome Telecommunication Technologies Co ltd
Original Assignee
Nanjing Fiberhome Telecommunication Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Fiberhome Telecommunication Technologies Co ltd filed Critical Nanjing Fiberhome Telecommunication Technologies Co ltd
Priority to CN202211682503.2A priority Critical patent/CN116226769A/zh
Publication of CN116226769A publication Critical patent/CN116226769A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于用户行为序列的短视频异常行为识别方法,涉及风控技术领域,具体包含如下步骤;获得用户全面的行为序列,包含用户在短视频社交平台上的各种属性特征;采用深度兴趣网络DIN作为训练模型,将用户行为序列分为连续值行为特征和离散值行为特征;且连续值行为特征和离散值行为特征以时间顺序进行排序,用户的id和设备作为条件输入,进而使深度兴趣网络DIN根据不同用户在行为序列特征下做出精准分类;获取用户的连续值行为特征和离散值行为特征,基于深度兴趣网络DIN的短视频用户行为序列识别网络结构,经过Attention结构和全连接FC结构进行用户行为序列特征间的关联学习,通过行为相似性和特点来识别水军用户。

Description

一种基于用户行为序列的短视频异常行为识别方法
技术领域
本发明涉及风控技术领域,尤其涉及一种基于用户行为序列的短视频异常行为识别方法。
背景技术
在抖音、微博、快手等短视频社交平台上,黑产通过机器人水军、雇佣水军账号等作弊手段在平台关注、点赞、评论等重要场景进行操作,导致短视频社交平台环境日趋恶劣,造成严重影响。正是由于水军账号的不透明性和独立性,因此平台管理人员很难通过人工方式去判断某账号是否违规。
目前,针对短视频水军(异常行为)账号识别的方法大都集中在数据统计和文本上,数据统计需要大量账号数据来统计相似性,包括时间、地点、工具等,但随着技术进步,水军已经能够将账号信息模拟成正常用户;而基于文本的识别方法主要依靠自然语言处理来获得文本信息,但在短视频中文本内容往往很少,大都以视频形式出现,若对视频中文本进行分析会大大增加识别难度和时间,因此想通过传统的方法来识别短视频平台水军将愈发困难。然而,短视频中水军团伙在点赞、收藏、浏览时间等行为上会随时间产生大量数据,这些数据间是存在关联性的,不同水军账号的行为之间存在团伙相似性、序列周期性/密集性的特点,例如同一水军团伙的关注账号、收藏作品大同小异,且点赞时间差也会相比于正常用户短。
因而通过分析用户的行为序列来进行水军识别是可行的。根据用户的行为序列的特点,发明一种基于用户行为序列的短视频水军识别方法,能够提高对短视频水军用户的有效监控。
发明内容
本发明所要解决的技术问题是对短视频社交平台上的账号进行有效地水军(异常行为)用户识别,及时高效地为平台管理人员提供监控渠道,提升网络社交环境的质量,打击水军团伙违规行为。
本发明为解决上述技术问题采用以下技术方案:
一种基于用户行为序列的短视频异常行为识别方法,具体包含如下步骤;
步骤1,获得用户全面的行为序列,包含用户在短视频社交平台上的各种属性特征;
步骤2,采用深度兴趣网络DIN作为训练模型,将用户行为序列分为连续值行为特征和离散值行为特征;且连续值行为特征和离散值行为特征以时间顺序进行排序,用户的id和设备作为条件输入,进而使深度兴趣网络DIN根据不同用户在行为序列特征下做出精准分类;
步骤3,获取用户的连续值行为特征和离散值行为特征,基于深度兴趣网络DIN的短视频用户行为序列识别网络结构,经过注意力机制Attention结构和全连接FC结构进行用户行为序列特征间的关联学习,通过行为相似性和特点来识别水军用户。
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,在步骤1中,用户在短视频社交平台上的各种属性特征包含用户账号、作品账号、收藏作品账号、是否浏览完作品、是否对作品点赞、登录设备、作品发布时间、作品时长、浏览作品时长。
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,在步骤2中,连续值行为特征在短视频平台中包含作品账号、收藏作品账号、是否浏览完作品、是否对作品点赞、作品发布时间、作品时长、浏览作品时长;
以用户账号为基本,将同一用户下的上述连续值行为进行聚类,再按时间顺序进行排序,从而获得在一段时间内的某用户的连续值行为序列;
Con_act_seq={actions1,actions2,actions3,Lactionst}
actionst=(f1(t),f2(t),f3(t),Lfn(t))
其中,t表示某一时刻,Con_act_seq表示一段时间内的连续值行为序列特征;actionst表示在t时刻下某用户产生的所有行为序列集合;fn(t)表示在t时刻下不同行为的值,n为不同行为序号;
由于上述的连续行为数值大都表示次数、时间点,在构建数据集时需要对上述排序后的数值按顺序映射到连续实数值上,即
Figure BDA0004018077200000021
充分学习不同时间段内的用户连续行为之间的关系,将整个时间段划分为k个子时间段,子时间段间可重叠,d为重叠长度,具体如下:
Figure BDA0004018077200000022
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,在步骤2中,离散值行为序列在短视频平台中为用户账号、登录设备,将离散行为序列构建为条件输入,作为连续值行为特征的辅助条件,具体如下:
Dis_act_seq={h1,h2,Lhn}
其中,Dis_act_seq表示所有离散行为hn(t)值的集合。
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,由连续值行为特征和离散值行为特征分别构建连续值和离散值的用户行为序列特征,按同一用户u_id进行组合,
Figure BDA0004018077200000031
相应的对于数据中所有用户的行为序列为
Figure BDA0004018077200000032
其中,u表示不同u_id的用户,labell表示每个用户对应的标签,其中l=0,1,2…,不同类型的水军团伙标签不同,包含机器人水军、刷点赞量、恶意评论,对水军团伙的类型细分更加细致。
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,深度兴趣网络DIN的网络结构具体如下:
模型输入为连续行为序列特征Con_act_seq和离散行为序列特征Dis_act_seq数据集合,经过特征嵌入层Embedding操作进行嵌入特征提取;分别作为Attention模块的两个输入,Attention模块首先对连续行为序列特征集合actions和离散行为特征集合h相乘,再分别将三者通过连接层拼接为一维向量,后续连接三层全连接层FC,其每层激活函数和神经元个数分别为激活函数PRelu、激活函数PRelu、激活函数Linear和128、64、1;
获得连续行为序列特征在离散行为序列特征条件下的权重参数actionsweights;
经过Attention模块获得的权重参数再分别与对应的输入序列相乘,获得最终的用户行为序列高维特征;SUM Pooling层对高维特征进行降维,并与离散行为序列特征进一步拼接作为三层全连接输出层FC的输入,激活函数均采用PRelu,神经网络分别为512、512、256;输出结果与标签label进行损失计算,其中,损失函数采用交叉熵损失函数。
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,深度兴趣网络DIN的训练参数设置,具体如下:
在训练深度兴趣网络DIN时,调试学习速率、批次大小、迭代次数、行为序列长度、神经元失活率以及损失函数;且学习速率设置为0.0001,批次大小为10000,迭代次数50-100。
作为本发明一种基于用户行为序列的短视频异常行为识别方法的进一步优选方案,在深度兴趣网络DIN的输出端添加了一个随机失活Dropout层,失活率为0.3;同时采用交叉熵损失函数CrossEntropy Loss来计算每次训练的反传误差。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明采用的用户行为序列数据不局限于时间、地点、设备等少数信息,而是将用户的点赞、收藏、关注、停留时间、点赞间隔时间、感兴趣账号类型等多种信息来构建数据,进而获得用户全面的行为序列,为后续模型训练提供更多信息;
2、本发明采用深度兴趣网络(Deep Interest Network,DIN)作为训练模型,将用户行为序列分为连续值行为特征和离散值行为特征,且特征以时间顺序进行排序,用户的id和设备作为条件输入,进而使DIN根据不同用户在一些列行为序列特征下做出精准分类;
3、本发明无需对用户数据进行统计分析以及文本的语义分析,只需获取用户的连续和离散行为序列数据作为输入,整个模型关注行为之间的先后顺序和时长,以此作为不同用户间的判别基础。
附图说明
图1是本发明基于DIN的短视频用户行为序列识别网络图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于用户行为序列的短视频异常行为识别方法,具体包含如下步骤;
步骤1,获得用户全面的行为序列,包含用户在短视频社交平台上的各种属性特征;
步骤2,采用深度兴趣网络DIN作为训练模型,将用户行为序列分为连续值行为特征和离散值行为特征;且连续值行为特征和离散值行为特征以时间顺序进行排序,用户的id和设备作为条件输入,进而使深度兴趣网络DIN根据不同用户在行为序列特征下做出精准分类;
步骤3,获取用户的连续值行为特征和离散值行为特征,基于深度兴趣网络DIN的短视频用户行为序列识别网络结构,经过注意力机制(Attention)结构和全连接(FC)结构进行用户行为序列特征间的关联学习,通过行为相似性和特点来识别水军用户。
1.用户行为序列
用户行为序列数据是包含用户在短视频社交平台上的各种属性特征,由于大多数短视频平台大同小异,都主要包括用户账号(u_id)、作品账号(item_id)、收藏作品账号(collect_id)、是否浏览完作品(finish)、是否对作品点赞(like)、登录设备(device)、作品发布时间(time)、作品时长(dura_time)、浏览作品时长(interval_time)等行为序列。
因此,需要先对用户的各种行为序列数据进行组合和特征提表示,才能在后续模型识别中充分挖掘行为特征彼此间的关联。根据时间可将行为序列分为连续值行为序列和离散值行为序列,连续值行为序列指行为序列的数值会随时间变化,如点赞、收藏、浏览时间等,这些数值反映了用户在连续时间内的行为情况;而离散值行为序列则值不随时间变化的独立特征,如用户账号、登录设备,这些序列不存在相邻变化差异。因此需要分别构建连续值行为特征和离散值行为特征。各分任务的主要工作如下:
(1)连续值行为特征
连续值行为特征在短视频平台中主要为作品账号(item_id)、收藏作品账号(collect_id)、是否浏览完作品(finish)、是否对作品点赞(like)、作品发布时间(time)、作品时长(dura_time)、浏览作品时长(interval_time),这行为值是动态变化的。尤其是相邻行为间的时间差是反映该账号状态的重要信息,也是模型判断是否具有团伙性的关键。首先以用户账号(u_id)为基本,将同一用户下的上述行为进行聚类,再按时间顺序进行排序,从而获得在一段时间内的某用户的连续值行为序列。其中,t表示某一时刻,Con_act_seq表示一段时间内的连续值行为序列特征;actionst表示在t时刻下某用户产生的所有行为序列集合;fn(t)表示在t时刻下不同行为的值,n为不同行为序号。
Con_act_seq={actions1,actions2,actions3,Lactionst}
actionst=(f1(t),f2(t),f3(t),Lfn(t))
其中,t表示某一时刻,Con_act_seq表示一段时间内的连续值行为序列特征;actionst表示在t时刻下某用户产生的所有行为序列集合;fn(t)表示在t时刻下不同行为的值,n为不同行为序号;
此外,由于上述的连续行为数值大都表示次数、时间点等,因此在构建数据集时需要对上述排序后的数值按顺序映射到连续实数值上,即
Figure BDA0004018077200000051
为了充分学习不同时间段内的用户连续行为之间的关系,将整个时间段划分为k个子时间段,子时间段间可以重叠,d为重叠长度,
Figure BDA0004018077200000061
(2)离散值行为特征
离散值行为序列在短视频平台中主要为用户账号(u_id)、登录设备(device)这些相对比较稳定,变化较小的序列。这些离散的数值无法在连续时间上进行排序,进而无法映射在连续数值上,所以通过模型来学习它们之间的关系意义不大,因此将这些离散行为序列构建为条件输入,作为连续值行为特征的辅助条件。其中,Dis_act_seq表示所有离散行为hn(t)值的集合。
Dis_act_seq={h1,h2,Lhn}
其中,Dis_act_seq表示所有离散行为hn(t)值的集合。
(3)用户行为序列数据集
由(1)、(2)分别构建连续值和离散值的用户行为序列特征,按同一用户u_id进行组合,即
Figure BDA0004018077200000062
相应的对于数据中所有用户的行为序列为/>
Figure BDA0004018077200000063
其中,u表示不同u_id的用户,labell表示每个用户对应的标签,其中l=0,1,2…,不同类型的水军团伙标签不同,包含机器人水军、刷点赞量、恶意评论,对水军团伙的类型细分更加细致。
2.DIN水军账号识别模型
DIN网络在兴趣推荐领域具有较好的应用成果,对用户行为序列在连续时间内的关系抽取是显著的。在短视频社交平台上,由于用户账号的行为序列不同于电商平台,且识别目标由推荐可能感兴趣商品变为可能违规的水军账号,因此本发明在输入输出端进行了相应的改进,其具体的模型结构见附图说明图1。
(1)DIN网络结构
模型输入为连续行为序列特征Con_act_seq和离散行为序列特征Dis_act_seq数据集合,经过特征嵌入层Embedding操作进行嵌入特征提取;分别作为Attention模块的两个输入,Attention模块首先对连续行为序列特征集合actions和离散行为特征集合h相乘,再分别将三者通过连接层拼接为一维向量,后续连接三层全连接层FC,其每层激活函数和神经元个数分别为激活函数PRelu、激活函数PRelu、激活函数Linear和128、64、1;
获得连续行为序列特征在离散行为序列特征条件下的权重参数actionsweights;
经过Attention模块获得的权重参数再分别与对应的输入序列相乘,获得最终的用户行为序列高维特征;SUM Pooling层对高维特征进行降维,并与离散行为序列特征进一步拼接作为三层全连接输出层FC的输入,激活函数均采用PRelu,神经网络分别为512、512、256;输出结果与标签label进行损失计算,其中,损失函数采用交叉熵损失函数。
(2)DIN训练参数设置
本发明在训练DIN网络时,主要调试学习速率、批次大小、迭代次数、行为序列长度、神经元失活率以及损失函数。学习速率设置为0.0001,批次大小为10000,迭代次数50-100,为了防止过拟合,在模型的输出端添加了一个Dropout层,失活率为0.3。同时采用交叉熵损失函数(CrossEntropy Loss)来计算每次训练的反传误差。此外,行为序列长度主要根据用户产生的数据量进行设置。
结合抖音平台提供的公开用户行为序列数据(脱密)进行具体实施说明。根据图1的实施流程,对抖音公开数据集进行训练数据构造,并测试识别效果。
1、首先在数据预处理阶段对抖音平台的公开数据进行连续值行为序列和离散值行为序列数据处理,连续行为选择收藏作品账号(collect_id),是否对作品点赞(like),作品时长(dura_time),浏览作品时长(interval_time);离散行为选择用户账号(u_id),登录设备(device),共67893位用户数据。
然后根据预设的标签[正常用户:0,机器人:1,刷赞:2]进行训练数据组合,其中行为序列长度设为150,重叠长度d设为1。
获得的数据按8:2的比例进行训练集和测试集的分割,最终获得5648815条训练样本数据和41775条测试样本数据,部分样例如表1所示。
表1某用户提取的连续值行为序列特征、离散值行为序列特征和标签
Figure BDA0004018077200000071
Figure BDA0004018077200000081
2、再按照图1网络结构和参数通过深度学习框架构建深度兴趣识别网络(DIN),其中输入数据首先通过Embedding操作进行嵌入特征提取,维度大小为32,再经过Attention模块,其由乘积算子和三层全连接层FC构成,其每层激活函数和神经元个数分别为PRelu、PRelu、Linear和128、64、1;再将输出权重分别与输入数据相乘获得加权特征,采用SUMPooling进行降维;降维特征与条件输入拼接后经过三层全连接层FC进行分类识别,其激活函数均采用PRelu,神经网络分别为512、512、256,并在最后添加Dropout层来避免过拟合,失活率为0.3。训练阶段的学习速率设置为0.0001,批次大小为1000,迭代次数50轮,采用Adam优化器来计算损失函数梯度。
将测试集数据送入已训练好的模型进行预测,最终本实施例下的抖音水军账号识别率达到77.48%,能较好地识别不同类型的水军账号。在更庞大的数据集下将进一步提升模型的准确率。

Claims (8)

1.一种基于用户行为序列的短视频异常行为识别方法,其特征在于:具体包含如下步骤;
步骤1,获得用户全面的行为序列,包含用户在短视频社交平台上的各种属性特征;
步骤2,采用深度兴趣网络DIN作为训练模型,将用户行为序列分为连续值行为特征和离散值行为特征;且连续值行为特征和离散值行为特征以时间顺序进行排序,用户的id和设备作为条件输入,进而使深度兴趣网络DIN根据不同用户在行为序列特征下做出精准分类;
步骤3,获取用户的连续值行为特征和离散值行为特征,基于深度兴趣网络DIN的短视频用户行为序列识别网络结构,经过注意力机制Attention结构和全连接FC结构进行用户行为序列特征间的关联学习,通过行为相似性和特点来识别水军用户。
2.根据权利要求1所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:在步骤1中,用户在短视频社交平台上的各种属性特征包含用户账号、作品账号、收藏作品账号、是否浏览完作品、是否对作品点赞、登录设备、作品发布时间、作品时长、浏览作品时长。
3.根据权利要求1所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:在步骤2中,连续值行为特征在短视频平台中包含作品账号、收藏作品账号、是否浏览完作品、是否对作品点赞、作品发布时间、作品时长、浏览作品时长;
以用户账号为基本,将同一用户下的上述连续值行为进行聚类,再按时间顺序进行排序,从而获得在一段时间内的某用户的连续值行为序列;
Con_act_seq={actions1,actions2,actions3,L actionst}
actionst=(f1(t),f2(t),f3(t),L fn(t))
其中,t表示某一时刻,Con_act_seq表示一段时间内的连续值行为序列特征;actionst表示在t时刻下某用户产生的所有行为序列集合;fn(t)表示在t时刻下不同行为的值,n为不同行为序号;
由于上述的连续行为数值大都表示次数、时间点,在构建数据集时需要对上述排序后的数值按顺序映射到连续实数值上,即
Figure FDA0004018077190000011
充分学习不同时间段内的用户连续行为之间的关系,将整个时间段划分为k个子时间段,子时间段间可重叠,d为重叠长度,具体如下:
Figure FDA0004018077190000021
4.根据权利要求1所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:在步骤2中,离散值行为序列在短视频平台中为用户账号、登录设备,将离散行为序列构建为条件输入,作为连续值行为特征的辅助条件,具体如下:
Dis_act_seq={h1,h2,L hn}
其中,Dis_act_seq表示所有离散行为hn(t)值的集合。
5.根据权利要求1所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:由连续值行为特征和离散值行为特征分别构建连续值和离散值的用户行为序列特征,按同一用户u_id进行组合,
Figure FDA0004018077190000022
相应的对于数据中所有用户的行为序列为
Figure FDA0004018077190000023
其中,u表示不同u_id的用户,labell表示每个用户对应的标签,其中l=0,1,2…,不同类型的水军团伙标签不同,包含机器人水军、刷点赞量、恶意评论,对水军团伙的类型细分更加细致。
6.根据权利要求1所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:深度兴趣网络DIN的网络结构具体如下:
模型输入为连续行为序列特征Con_act_seq和离散行为序列特征Dis_act_seq数据集合,经过特征嵌入层Embedding操作进行嵌入特征提取;分别作为Attention模块的两个输入,Attention模块首先对连续行为序列特征集合actions和离散行为特征集合h相乘,再分别将三者通过连接层拼接为一维向量,后续连接三层全连接层FC,其每层激活函数和神经元个数分别为激活函数PRelu、激活函数PRelu、激活函数Linear和128、64、1;
获得连续行为序列特征在离散行为序列特征条件下的权重参数actions weights;
经过Attention模块获得的权重参数再分别与对应的输入序列相乘,获得最终的用户行为序列高维特征;SUM Pooling层对高维特征进行降维,并与离散行为序列特征进一步拼接作为三层全连接输出层FC的输入,激活函数均采用PRelu,神经网络分别为512、512、256;输出结果与标签label进行损失计算,其中,损失函数采用交叉熵损失函数。
7.根据权利要求6所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:深度兴趣网络DIN的训练参数设置,具体如下:
在训练深度兴趣网络DIN时,调试学习速率、批次大小、迭代次数、行为序列长度、神经元失活率以及损失函数;且学习速率设置为0.0001,批次大小为10000,迭代次数50-100。
8.根据权利要求7所述的一种基于用户行为序列的短视频异常行为识别方法,其特征在于:在深度兴趣网络DIN的输出端添加了一个随机失活Dropout层,失活率为0.3;同时采用交叉熵损失函数CrossEntropy Loss来计算每次训练的反传误差。
CN202211682503.2A 2022-12-26 2022-12-26 一种基于用户行为序列的短视频异常行为识别方法 Pending CN116226769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211682503.2A CN116226769A (zh) 2022-12-26 2022-12-26 一种基于用户行为序列的短视频异常行为识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211682503.2A CN116226769A (zh) 2022-12-26 2022-12-26 一种基于用户行为序列的短视频异常行为识别方法

Publications (1)

Publication Number Publication Date
CN116226769A true CN116226769A (zh) 2023-06-06

Family

ID=86573973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211682503.2A Pending CN116226769A (zh) 2022-12-26 2022-12-26 一种基于用户行为序列的短视频异常行为识别方法

Country Status (1)

Country Link
CN (1) CN116226769A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574362A (zh) * 2024-01-15 2024-02-20 广东茉莉数字科技集团股份有限公司 一种达人帐号数据异常分辩方法及系统
CN117574362B (zh) * 2024-01-15 2024-04-30 广东茉莉数字科技集团股份有限公司 一种达人账号数据异常分辨方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574362A (zh) * 2024-01-15 2024-02-20 广东茉莉数字科技集团股份有限公司 一种达人帐号数据异常分辩方法及系统
CN117574362B (zh) * 2024-01-15 2024-04-30 广东茉莉数字科技集团股份有限公司 一种达人账号数据异常分辨方法及系统

Similar Documents

Publication Publication Date Title
CN110351244A (zh) 一种基于多卷积神经网络融合的网络入侵检测方法及系统
CN107729488A (zh) 一种信息推荐方法及装置
CN107273295B (zh) 一种基于文本混乱度的软件问题报告分类方法
CN112087442B (zh) 基于注意力机制的时序相关网络入侵检测方法
CN109241383A (zh) 一种基于深度学习的网页类型智能识别方法及系统
CN110188195A (zh) 一种基于深度学习的文本意图识别方法、装置及设备
CN110636066A (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN110704510A (zh) 一种结合用户画像的题目推荐方法及系统
CN112529638A (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN113495959A (zh) 一种基于文本数据的金融舆情识别方法及系统
CN114357204B (zh) 媒体信息的处理方法及相关设备
CN111488501A (zh) 一种基于云平台的电商统计系统
CN113158075A (zh) 融合评论的多任务联合谣言检测方法
CN116756688A (zh) 一种基于多模态融合算法的舆情风险发现方法
CN116842263A (zh) 一种智能问答式理财顾问模型的训练处理方法及装置
CN111160254A (zh) 一种适用于短视频推荐打散的分类方法及系统
CN110705638A (zh) 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法
CN116226769A (zh) 一种基于用户行为序列的短视频异常行为识别方法
CN116257618A (zh) 一种基于细粒度情感分析的多源智能旅游推荐方法
CN115758218A (zh) 一种基于长短时特征和决策融合的三模态情感分析方法
CN115062615A (zh) 一种金融领域事件抽取方法和装置
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及系统
CN111460160B (zh) 一种基于强化学习的流式文本数据的事件聚类方法
CN113378024A (zh) 一种基于深度学习面向公检法领域的相关事件识别方法
CN113535820A (zh) 一种基于卷积神经网络的电气操作人员属性推测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination