CN116523566A

CN116523566A - 一种基于互联网广告投放的伪热度识别方法及系统

Info

Publication number: CN116523566A
Application number: CN202310786432.9A
Authority: CN
Inventors: 王国章; 黄振琳; 徐育彪
Original assignee: And Yuan Da Mdt Infotech Ltd
Current assignee: And Yuan Da Mdt Infotech Ltd
Priority date: 2023-06-30
Filing date: 2023-06-30
Publication date: 2023-08-01
Anticipated expiration: 2043-06-30
Also published as: CN116523566B

Abstract

本发明公开了一种基于互联网广告投放的伪热度识别方法及系统，包括：获取待训练热搜广告的正样本，并构建第一信息矩阵；将所述第一信息矩阵进行降维，得到第一分解矩阵，并将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果；将第一分解矩阵和所述第一判别结果进行融合，并将得到的第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵；获取所述第一信息矩阵与所述第一分解矩阵的散度，并建立伪热度识别损失函数，对整个网络框架进行同步训练，以使根据训练好的网络框架对实时热搜广告进行真伪判别；能够有效对热搜虚假广告进行判别。

Description

一种基于互联网广告投放的伪热度识别方法及系统

技术领域

本发明涉及网络中虚假广告检测方法，尤其涉及一种基于互联网广告投放的伪热度识别方法及系统。

背景技术

随着互联网的高速发展，人们更加倾向参考互联网上的广告之后购买对应的产品，然而，通过社交媒体发布的虚假广告有故意购买热度从而引导消费者购买的嫌疑，若用户听信伪热度虚假广告的宣传，极大可能会被误导，造成经济损失，严重者造成健康损害；其次，伪热度虚假广告可能会改变人们对真实广告的反应，并且伪热度虚假广告在互联网上广泛传播也会破坏广告系统的可信度。因此，检测社交媒体上的伪热度虚假广告十分有必要。

现有技术采用对广告的图片和文字进行检测，并通过规则匹配和神经网络对广告进行是否违规的判断，但是，在互联网上的热搜广告除了广告本身可能存在违规问题以外，互联网上的用户与广告的发布者的反应也对热搜广告造势，现有技术并未对用户与广告和发布者与广告之间的联系对热搜上的虚假广告进行判别，无法对实时的热搜虚假广告进行精确地判别。

发明内容

本发明的目的是针对上述现有技术的不足，提出一种基于互联网广告投放的伪热度识别方法及系统，能够有效对热搜虚假广告进行判别。

第一方面，本发明提供了一种基于互联网广告投放的伪热度识别方法，包括：

获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵；

将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，并将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果；

将第一分解矩阵和所述第一判别结果进行融合，得到第一融合结果，并将所述第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵；

获取所述第一信息矩阵与所述第一分解矩阵的散度，并根据所述散度和所述第一权重矩阵，对第一非负矩阵分解模型损失函数、所述第一深度强化学习的时间差分误差函数和第一生成判别网络损失函数进行赋权，建立伪热度识别损失函数；

以最小化所述伪热度识别损失函数为训练目标，对所述第一非负矩阵分解模型、所述第一深度强化学习和第一生成判别网络进行同步训练，以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别。

本发明采用构建关联广告内容信息、对应的用户信息和发布者信息的信息矩阵，不仅基于广告本身的信息还基于用户和发布者的信息进行热搜广告的判别，能够对广告、用户和发布者之间的关系进行量化，进而能够有效对热搜广告进行判别，具有较高的可靠性；并且，对构建的信息矩阵通过非负矩阵分解进行降维，能够对实时出现的上万级别的数据进行快速处理，从而提高对实时热广告的判别的效率；通过深度强化学习得到连续的权重矩阵，从而根据权重矩阵对整体的网络框架进行同步更新，能够保证获取到整体网络框架的最优参数，进而能够提高基于非负矩阵分解模型、深度强化学习和生成判别网络的热搜广告判别的准确性。

进一步，所述将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果，还包括：

根据初始的第一生成网络，获取待训练热搜广告的负样本对应的第二分解矩阵，并将所述第二分解矩阵作为所述第二判别网络的输入，得到所述负样本对应的第二判别结果，以使根据所述第二判别结果对所述第一非负矩阵分解模型、所述第一深度强化学习和所述第一生成网络进行同步训练。

本发明采用生成网络生成负样本对整体网络框架进行同步训练，不仅让整体网络框架学习到正样本的特征，也能学习到负样本的特征，并同时优化非负矩阵分解模型、深度强化学习和生成对抗网络的参数，从而增强对热搜广告的判别能力。

进一步，在所述得到所述正样本对应的第一判别结果之后，还包括：根据所述第一权重矩阵和所述第一判别结果，获取所述第一深度强化学习的即时奖励；具体为：

计算本时刻下的第一权重矩阵的第一累和，若所述第一判别结果为真，则将作为所述第一深度强化学习的即时奖励；

否则，则将上一时刻的第二权重矩阵的第二累和作为惩罚因子，并将所述第一累和与所述惩罚因子的差作为所述第一深度强化学习的即时奖励；其中，所述第二权重矩阵是根据待训练热搜广告的负样本与所述正样本交替训练后得到的。

本发明采用正样本与负样本交替训练的方式，将上一时刻样本的训练的权重因子的累和作为本时刻样本训练的惩罚因子，能够校正样本由于上一时刻进行参数更新后得到较大的奖励后，深度强化学习为了获得更多奖励而重复上一时刻的动作的困境，进而能够有效对热搜广告进行判别，具有较高的可靠性。

进一步，所述将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，包括：

依次对第一广告内容矩阵、第一用户矩阵、第一用户与广告矩阵和第一发布者与广告矩阵进行非负矩阵分解，得到对应的降维后的第一分解矩阵；其中，所述第一信息矩阵包括：所述第一广告内容矩阵、所述第一用户矩阵、所述第一用户与广告矩阵和所述第一发布者与广告矩阵。

进一步，所述将第一分解矩阵和所述第一判别结果进行融合，得到第一融合结果，并将所述第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵，包括：

将第一广告内容矩阵、第一用户矩阵、第一用户与广告矩阵和第一发布者与广告矩阵与所述第一判别结果进行融合，得到第一融合结果；

将所述融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵；其中，所述第一权重矩阵包括：所述第一广告内容矩阵、所述第一用户矩阵、所述第一用户与广告矩阵和所述第一发布者与广告矩阵对应的权重以及所述时间差分误差函数和所述第一生成判别网络损失函数对应的权重。

进一步，所述获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵，包括：

获取正样本的第一用户信息对应的粉丝量和历史发表内容，并根据所述粉丝量和历史发表内容，获取粉丝互动系数和历史发表内容之间的相关系数；

根据所述粉丝量、所述相关系数和所述粉丝互动系数，以及用户的关注量、信用系数、IP地址和用户评价信息，构建第一用户矩阵；其中，所述第一用户矩阵中元素的取值范围为[0,1]。

本发明采用构建关联广告内容信息和对应的用户信息的用户矩阵，不仅基于广告本身的信息还基于用户的信息进行热搜广告的判别，对广告与用户之间的关系利用粉丝互动系数、相关系数和用户评价信息等进行具体量化，并将用户矩阵的值限制在[0,1]之间，避免不同的数值之间和不同用户之间差异过大而造成算法不稳定的问题，进而能够有效对热搜广告进行判别，具有较高的可靠性。

进一步，所述获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵，还包括：

根据所述信用系数、所述粉丝互动系数和所述相关系数，获得用户的行为表征系数，并根据所述行为表征系数、用户评价信息和所述广告内容信息，构建第一用户与广告矩阵。

进一步，所述以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别，包括：

获取实时热搜广告的第二广告内容信息、第二用户信息和第二发布者信息，并根据所述第二广告内容信息、所述第二用户信息和所述第二发布者信息，构建第二信息矩阵；

将第二广告内容矩阵、第二用户矩阵、第二用户与广告矩阵和第二发布者与广告矩阵分别作为对应初始的第一非负矩阵分解模型的输入，分别得到对应的降维后的第一分解矩阵，并将各第一分解矩阵同时作为所述第二判别网络的输入，得到所述实时热搜广告对应的第三判别结果。

优选地，所述伪热度识别损失函数可以表示为：

其中，分别为第/>个样本对应的广告内容矩阵、用户矩阵、用户与广告矩阵和发布者与广告矩阵对应的第一权重矩阵，/>分别为第/>个样本对应的第一深度强化学习和第一对抗生成网络对应的第一权重矩阵；/>为广告矩阵/>与对应的两个第一分解矩阵/>和/>的/>散度，/>为用户矩阵/>与对应的两个第一分解矩阵/>和/>的/>散度，为用户与广告矩阵/>与对应两个第一分解矩阵和/>的/>散度，/>为发布者与广告矩阵/>与对应两个第一分解矩阵/>和/>的/>散度；/>、/>和/>分别为第一深度强化学习的即时奖励、下一时刻状态的Q值和本时刻状态的Q值；/>为二进制系数，表示对第一生成网络进行更新，/>表示对第一判别网络进行更新，/>为正样本与负样本的总样本个数，/>为第一判别网络，/>为第一生成网络，/>和/>分别为正样本和带噪声的负样本。

第二方面，本发明提供了一种基于互联网广告投放的伪热度识别系统，包括：

信息矩阵建立模块，用于获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵；

判别模块，用于将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，并将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果；

权重获取模块，用于将第一分解矩阵和所述第一判别结果进行融合，得到第一融合结果，并将所述第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵；

损失函数建立模块，用于获取所述第一信息矩阵与所述第一分解矩阵的散度，并根据所述散度和所述第一权重矩阵，对第一非负矩阵分解模型损失函数、所述第一深度强化学习的时间差分误差函数和第一生成判别网络损失函数进行赋权，建立伪热度识别损失函数；

参数更新模块，用于以最小化所述伪热度识别损失函数为训练目标，对所述第一非负矩阵分解模型、所述第一深度强化学习和第一生成判别网络进行同步训练，以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别。

附图说明

图1是本发明实施例提供的基于互联网广告投放的伪热度识别方法的流程示意图；

图2是本发明实施例提供的基于互联网广告投放的伪热度识别系统的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，是本发明实施例提供的基于互联网广告投放的伪热度识别方法的流程示意图，包括步骤S11~S15，具体为：

步骤S11、获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵。

其中，所述第一信息矩阵包括：所述第一广告内容矩阵、所述第一用户矩阵、所述第一用户与广告矩阵和所述第一发布者与广告矩阵。

具体地，构建第一广告内容矩阵包括：将广告文字信息按照预设的短句长度划分为若干个广告短句，并获取每个广告短句的文字特征值；将广告图片信息进行预处理，得到图片特征值；其中，若为视频信息，则按照预设的帧步长，获取图像信息，对得到的若干图像信息根据卷积神经网络，提取每个图像信息的图片特征值，将文字特征值和图片特征值进行结合，得到第一广告矩阵。

构建第一用户矩阵包括：获取正样本的第一用户信息对应的粉丝量和历史发表内容，并根据所述粉丝量和历史发表内容，获取粉丝互动系数和历史发表内容之间的相关系数；根据所述粉丝量、所述相关系数和所述粉丝互动系数，以及用户的关注量、信用系数、IP地址和用户评价信息，构建第一用户矩阵；其中，所述第一用户矩阵中元素的取值范围为[0,1]。

值得说明的是，对用户的评价行为进行语义分析，评价行为包括：评论和转发后的博文评论，将用户的评价行为划分根据聚类算法进行4分类，得到情感导向，所述情感导向包括：赞同、反对、讨论和不相关，按照每种分类占情感导向的总占比对每个分类赋权重，得到用户评价信息。统计正样本的用户数量，并对每个用户的粉丝数量和关注量分别进行归一化，得到归一化的粉丝量和归一化的关注量，并将IP地址转换为[0,1]之间的小数，示例性的，若用户的IP地址定位为：“四川，成都”，则对字符串的IP地址定位进行预处理，得到[0,1]之间的小数；取用户的信用分与总信用的占比作为信用系数，还需注意的是，获取的相关系数和粉丝互动系数本身就是[0,1]之间的小数，无需再做处理。根据归一化的粉丝量和归一化的关注量、相关系数、粉丝互动系数、归一化后的信用系数、预处理后的IP地址、用户评价信息构建取值范围均为[0,1]之间的第一用户矩阵。

构建第一用户与广告矩阵包括：获取所述信用系数、所述粉丝互动系数和所述相关系数的均值作为行为表征系数；将用户评价信息划分为若干评价短句，并获取评价短句的评价特征向量，根据广告特征向量与评价特征向量，计算广告评价系数，得到每个用户对每个广告短句的广告评价系数；根据行为表征系数和广告评价系数，得到第一用户与广告矩阵。

构建第一发布者与广告矩阵包括：获取发布者的历史发表内容和当前发表内容，根据卷积神经网络获取预设时间段内的历史发表内容的历史特征值和当前特征值，并根据热搜广告的正样本的文字特征值和图片特征值，得到历史特征值和当前特征值与每个广告短句的文字特征值和图片特征值的发表相关系数，并获取发布者信息，根据发布者信息，获取发布者信用系数和发布者粉丝互动系数和发表相关系数建立第一发布者与广告矩阵。

步骤S12、将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，并将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果。

其中，将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，包括：依次对第一广告内容矩阵、第一用户矩阵、第一用户与广告矩阵和第一发布者与广告矩阵进行非负矩阵分解，得到对应的降维后的第一分解矩阵。

将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果，还包括：根据初始的第一生成网络，获取待训练热搜广告的负样本对应的第二分解矩阵，并将所述第二分解矩阵作为所述第二判别网络的输入，得到所述负样本对应的第二判别结果，以使根据所述第二判别结果对所述第一非负矩阵分解模型、所述第一深度强化学习和所述第一生成网络进行同步训练。

值得说明的是，采用正样本与负样本交替训练的模式对生成对抗网络进行训练，包括：预先设定的热搜广告的正样本对生成对抗网络的判别网络进行训练，再通过生成对抗网络的生成网络生成带噪声的热搜广告的负样本，根据负样本对生成网络进行参数更新，负样本的对整体的网络框架的训练过程与正样本对整体的网络框架的训练过程相同，在此不再赘述。再在下一次训练时，先根据正样本进行训练，再根据负样本进行训练，以此对生成对抗网络进行训练，对整体网络框架进行同步更新。

优选地，所述深度强化学习采用行动者-评论家（Actor-Critic, AC）算法。

在所述得到所述正样本对应的第一判别结果之后，还包括：根据所述第一权重矩阵和所述第一判别结果，获取所述第一深度强化学习的即时奖励；具体为：计算本时刻下的第一权重矩阵的第一累和，若所述第一判别结果为真，则将作为所述第一深度强化学习的即时奖励；否则，则将上一时刻的第二权重矩阵的第二累和作为惩罚因子，并将所述第一累和与所述惩罚因子的差作为所述第一深度强化学习的即时奖励；其中，所述第二权重矩阵是根据待训练热搜广告的负样本与所述正样本交替训练后得到的。

优选地，所述即时奖励可以表示为：

，

其中，为本时刻/>的判别结果，/>和/>分别为本时刻/>的权重矩阵和上一时刻/>的权重矩阵。

步骤S13、将第一分解矩阵和所述第一判别结果进行融合，得到第一融合结果，并将所述第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵。

具体地，将第一广告内容矩阵、第一用户矩阵、第一用户与广告矩阵和第一发布者与广告矩阵与所述第一判别结果进行融合，得到第一融合结果；

值得说明的是，由于实时的热搜广告的用户信息动态变化大，为了求解整体网络框架的目标函数，包括非负矩阵分解模型、深度强化学习和生成对抗网络共同组成的伪热度识别损失函数，对于不同的热搜广告，非负矩阵分解模型和生成对抗网络对判别结果影响程度不同，即对不同的热搜广告，非负矩阵分解模型和生成对抗网络对伪热度识别损失函数的权重不同，同时不同热搜广告的用户与广告和发布者与广告之间的联系不同，直接对伪热度识别损失函数求解的计算复杂度高且计算量大，因此，采用深度强化学习对不同的模型赋予不同的权重，以使对整体网络框架进行参数更新。深度强化学习的动作空间为连续的权重矩阵，环境空间为热搜广告对应的融合结果。

步骤S14、获取所述第一信息矩阵与所述第一分解矩阵的散度，并根据所述散度和所述第一权重矩阵，对第一非负矩阵分解模型损失函数、所述第一深度强化学习的时间差分误差函数和第一生成判别网络损失函数进行赋权，建立伪热度识别损失函数。

优选地，所述伪热度识别损失函数可以表示为：

值得说明的是，对第一广告内容矩阵、第一用户矩阵、第一用户与广告矩阵和第一发布者与广告矩阵分别通过对应模型维度的第一对应的非负矩阵分解模型，分别得到对应的两个第一分解矩阵。

步骤S15、以最小化所述伪热度识别损失函数为训练目标，对所述第一非负矩阵分解模型、所述第一深度强化学习和第一生成判别网络进行同步训练，以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别。

其中，以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别，包括：获取实时热搜广告的第二广告内容信息、第二用户信息和第二发布者信息，并根据所述第二广告内容信息、所述第二用户信息和所述第二发布者信息，构建第二信息矩阵；将第二广告内容矩阵、第二用户矩阵、第二用户与广告矩阵和第二发布者与广告矩阵分别作为对应初始的第一非负矩阵分解模型的输入，分别得到对应的降维后的第一分解矩阵，并将各第一分解矩阵同时作为所述第二判别网络的输入，得到所述实时热搜广告对应的第三判别结果。

参见图2，是本发明实施例提供的基于互联网广告投放的伪热度识别系统的流程示意图，包括：信息矩阵建立模块21、判别模块22、权重获取模块23、损失函数建立模块24和参数更新模块25。

值得说明的是，信息矩阵建立模块21根据获取的第一广告内容信息、第一用户信息和第一发布者信息，构建包含第一广告内容矩阵、第一用户矩阵、第一用户与广告矩阵和第一发布者与广告矩阵的第一信息矩阵，并将得到的第一信息矩阵传输给判别模块22；判别模块22接受到第一信息矩阵后，根据第一非负矩阵分解模型对第一信息矩阵进行降维，将得到的第一分解矩阵作为第一判别网络的输入，输出正样本的第一判别结果，并将所述第一判别结果和第一分解矩阵传输给权重获取模块23，将第一非负矩阵分解模型损失函数传输给损失函数建立模块24；权重获取模块23接受到第一判别结果和第一分解矩阵后，根据第一判别结果和第一分解矩阵，通过第一深度强化学习获取第一权重矩阵，并将得到的第一权重矩阵和第一深度强化学习的时间差分误差函数传输给损失函数建立模块24；损失函数建立模块24接收到第一非负矩阵分解模型损失函数、第一权重矩阵和时间差分误差函数后，建立伪热度识别损失函数，并将伪热度识别损失函数传输给参数更新模块25；参数更新模块25接收到伪热度识别损失函数后，进行反向传播对整体的网络框架的参数进行更新，训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成判别网络，以使对实时热搜广告进行真伪判别。

信息矩阵建立模块21，用于获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵。

构建第一用户与广告矩阵包括：获取所述信用系数、所述粉丝互动系数和所述相关系数的均值作为行为表征系数；将用户评价信息划分为若干评价短句，并获取评价短句的评价特征向量，计算广告特征向量与评价特征向量的广告评价系数，得到每个用户对每个广告短句的广告评价系数，根据行为表征系数和广告评价系数，得到第一用户与广告矩阵。

判别模块22，用于将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，并将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果。

权重获取模块23，用于将第一分解矩阵和所述第一判别结果进行融合，得到第一融合结果，并将所述第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵。

损失函数建立模块24，用于获取所述第一信息矩阵与所述第一分解矩阵的散度，并根据所述散度和所述第一权重矩阵，对第一非负矩阵分解模型损失函数、所述第一深度强化学习的时间差分误差函数和第一生成判别网络损失函数进行赋权，建立伪热度识别损失函数。

优选地，所述伪热度识别损失函数可以表示为：

参数更新模块25，用于以最小化所述伪热度识别损失函数为训练目标，对所述第一非负矩阵分解模型、所述第一深度强化学习和第一生成判别网络进行同步训练，以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别。

本领域内的技术人员应明白，本申请的实施例还可提供包括计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于互联网广告投放的伪热度识别方法，其特征在于，包括：

2.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述将所述第一分解矩阵作为第一判别网络的输入，得到所述正样本对应的第一判别结果，还包括：

3.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，在所述得到所述正样本对应的第一判别结果之后，还包括：根据所述第一权重矩阵和所述第一判别结果，获取所述第一深度强化学习的即时奖励；具体为：

4.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述将所述第一信息矩阵作为对应初始的第一非负矩阵分解模型的输入，得到降维后的第一分解矩阵，包括：

5.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述将第一分解矩阵和所述第一判别结果进行融合，得到第一融合结果，并将所述第一融合结果作为初始的第一深度强化学习的输入，得到由连续值表示的第一权重矩阵，包括：

6.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵，包括：

7.如权利要求6所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述获取待训练热搜广告的正样本对应的第一广告内容信息、第一用户信息和第一发布者信息，并根据所述第一广告内容信息、所述第一用户信息和所述第一发布者信息，构建第一信息矩阵，还包括：

8.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述以使根据训练好的第二非负矩阵分解模型、第二深度强化学习和第二生成网络对实时热搜广告进行真伪判别，包括：

9.如权利要求1所述的基于互联网广告投放的伪热度识别方法，其特征在于，所述伪热度识别损失函数可以表示为：

其中，分别为第/>个样本对应的广告内容矩阵、用户矩阵、用户与广告矩阵和发布者与广告矩阵对应的第一权重矩阵，/>分别为第/>个样本对应的第一深度强化学习和第一对抗生成网络对应的第一权重矩阵；/>为广告矩阵与对应的两个第一分解矩阵/>和/>的/>散度，/>为用户矩阵/>与对应的两个第一分解矩阵/>和/>的/>散度，为用户与广告矩阵/>与对应两个第一分解矩阵和/>的/>散度，/>为发布者与广告矩阵/>与对应两个第一分解矩阵/>和/>的/>散度；/>、/>和/>分别为第一深度强化学习的即时奖励、下一时刻状态的Q值和本时刻状态的Q值；/>为二进制系数，表示对第一生成网络进行更新，/>表示对第一判别网络进行更新，/>为正样本与负样本的总样本个数，/>为第一判别网络，/>为第一生成网络，/>和/>分别为正样本和带噪声的负样本。

10.一种基于互联网广告投放的伪热度识别系统，其特征在于，包括：