CN117875501A

CN117875501A - 一种基于大数据的社交媒体用户行为预测系统及方法

Info

Publication number: CN117875501A
Application number: CN202410050579.6A
Authority: CN
Inventors: 任丙权; 王雪峰; 张永
Original assignee: Shenzhen Zhenhua Data Information Technology Co ltd
Current assignee: Shenzhen Zhenhua Data Information Technology Co ltd
Priority date: 2024-01-12
Filing date: 2024-01-12
Publication date: 2024-04-12

Abstract

本发明提出一种基于大数据的社交媒体用户行为预测系统及方法，方法包括：获取多个社交媒体平台的历史数据并据此生成多个社交媒体平台画像和用户行为画像；根据社交媒体平台画像建立社交媒体平台的监测模型和事件模型；根据用户行为画像和事件模型得到用户事件处理模型；根据监测模型对社交媒体平台进行监测；当监测到第一事件时，根据监测模型和事件模型生成事件监测模型；根据事件监测模型对社交媒体平台进行监测，得到对第一事件的第一事件监测数据；根据第一事件监测数据和用户事件处理模型得到对于第一事件的用户行为预测数据。本发明方案可以对于具体的事件/话题/新闻进行智能的用户行为预测，提高了用户行为预测的效率和准确率。

Description

一种基于大数据的社交媒体用户行为预测系统及方法

技术领域

本发明涉及数据分析技术领域，具体涉及一种基于大数据的社交媒体用户行为预测系统及方法。

背景技术

随着计算机技术发展，通过社交平台发布媒体资源已日益普及，用户通过手机等移动设备进行网络社交的过程中，用户的社交媒体行为也通过信息的传播产生相应的数据标签，这些移动数据标签能够真实的反应用户的社交行为以及社交行为的变化规律。然而，目前对于社交媒体用户行为进行预测的方案并不完善，预测结果并不准确。

发明内容

本发明正是基于上述问题，提出了一种基于大数据的社交媒体用户行为预测系统及方法，通过本发明方案可以对于具体的事件/话题/新闻进行智能的用户行为预测，提高了用户行为预测的效率和准确率。

有鉴于此，本发明的一方面提出了一种基于大数据的社交媒体用户行为预测系统，包括：云服务器和社交媒体平台；

所述云服务器被配置为：

获取多个所述社交媒体平台的历史数据；

根据所述历史数据生成多个社交媒体平台画像和用户行为画像；

根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型；

根据所述用户行为画像和所述第一事件模型得到第一用户事件处理模型；

根据所述第一监测模型对所述社交媒体平台进行监测；

当监测到第一事件时，根据所述第一监测模型和所述第一事件模型生成第一事件监测模型；

根据所述第一事件监测模型对所述社交媒体平台进行监测，得到对所述第一事件的第一事件监测数据；

根据所述第一事件监测数据和所述第一用户事件处理模型得到对于所述第一事件的用户行为预测数据。

本发明的另一方面提供一种基于大数据的社交媒体用户行为预测方法，包括：

获取多个社交媒体平台的历史数据；

根据所述第一监测模型对所述社交媒体平台进行监测；

可选地，所述根据所述历史数据生成多个社交媒体平台画像和用户行为画像的步骤，包括：

从所述历史数据中提取平台特征数据；

对所述平台特征数据进行统计分析，建立量化平台画像；

从所述平台特征数据中提取用户群体特征数据，并根据所述用户群体特征数据构建用户群体画像；

从所述平台特征数据中提取内容特征数据，并根据所述内容特征数据构建内容画像；

从所述平台特征数据中提取互动特征数据，并根据所述互动特征数据构建互动画像；

从所述平台特征数据中提取活跃度特征数据，并根据所述活跃度特征数据构建活跃度画像；

将所述量化平台画像、所述用户群体画像、所述内容画像、所述互动画像、所述活跃度画像进行融合，得到所述社交媒体平台画像。

从所述历史数据中提取所述社交媒体平台的用户的历史行为数据；

从所述历史行为数据中挖掘关联规则，确定不同行为之间的第一关联关系；

对所述历史行为数据进行特征工程，提取行为特征；

基于所述第一关联关系和所述行为特征对所述社交媒体平台的用户进行聚类，使得每一类用户形成一个行为画像群体；

结合所述行为特征中对应每个所述行为画像群体对应的数据，对每个所述行为画像群体进行行为分析，得到多个群体行为画像；

根据所述群体行为画像，为所述社交媒体平台的每个用户打上对应的标签以表示用户属于哪类行为画像群体；

将所述群体行为画像作为所述社交媒体平台的用户的所述用户行为画像。

可选地，所述根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型的步骤，包括：

确定所述社交媒体平台的第一监测目标和第一监测指标；

根据所述第一监测目标和所述第一监测指标从所述小组画像数据中提取能代表监测目标的第一关键特征；

根据所述第一监测目标和所述第一监测指标，选择第一基本模型；

根据所述第一基本模型，使用所述第一关键特征进行训练和建模，得到所述第一基本监测模型；

对所述第一基本监测模型进行评估和调优，得到第一监测模型。

根据所述第一监测目标和所述第一监测指标，确定需要监控的关键事件；

从所述社交媒体平台画像数据提取能反映所述关键事件的第二关键特征；

选择与所述关键事件匹配的第二基本模型；

使用所述第二关键特征，对所述第二基本模型进行训练，得到所述第一关键事件模型。

可选地，所述根据所述用户行为画像和所述第一事件模型得到第一用户事件处理模型的步骤，包括：

从所述历史数据中提取历史事件数据；

基于大数据分析技术，对所述历史行为数据和所述历史事件数据进行分析，确定不同类型事件对用户行为的影响因素；

根据所述用户行为画像，计算不同用户对所述影响因素的敏感度，形成用户行为敏感度矩阵；

基于所述第一事件模型，构建事件模拟器以模拟事件在用网络中的传播和影响力变化，获得事件对不同用户群体的影响程度矩阵；

将所用户行为敏感度矩阵和所述影响程度矩阵相结合，建立所述社交媒体平台的每个用户对于给定事件类型的响应模型；

使用所述历史数据验证所述响应模型的效果，得到验证结果；

根据所述验证结果调整所述响应模型的参数得到所述第一用户事件处理模型。

可选地，所述当监测到第一事件时，根据所述第一监测模型和所述第一事件模型生成第一事件监测模型的步骤，包括：

收集与所述第一事件相关的第一实时数据；

从所述第一实时数据中提取所述第一事件的第一事件特征；

将所述第一事件特征与所述第一事件模型进行匹配，识别所述第一事件的第一事件类型和第一事件属性；

根据所述第一事件类型和所述第一事件属性确定第一事件监测目标和第一事件监测指标；

根据所述第一事件监测目标和所述第一事件监测指标对所述第一监测模型进行修改，得到第一事件监测模型。

可选地，所述根据所述第一事件监测模型对所述社交媒体平台进行监测，得到对所述第一事件的第一事件监测数据的步骤，包括：

根据从所述第一事件监测模型中提取的所述第一事件监测目标和所述第一事件监测指标采集所述社交媒体平台的第二实时数据；

从预处理后的所述第二实时数据中提取文本特征数据、图像特征数据、视频特征数据；

将所述文本特征数据、所述图像特征数据、所述视频特征数据作为输入，利用所述第一事件模型进行筛选，删除与所述第一事件无关的数据，得到第一事件监测数据。

可选地，所述根据所述第一事件监测数据和所述第一用户事件处理模型得到对于所述第一事件的用户行为预测数据的步骤，包括：

基于所述第一事件监测数据，利用所述事件模拟器模拟所述第一事件在网络中的传播情况，评估各用户群体受到的第一影响程度；

根据所述第一用户事件处理模型和所述第一影响程度，确定各用户群体的行为倾向，形成各用户群体的行为影响矩阵；

根据所述行为影响矩阵、行为关联规则，对单个用户进行打分，评估事件对其个体行为的影响概率，得到用户行为预测数据。

采用本发明的技术方案，基于大数据的社交媒体用户行为预测方法包括获取多个所述社交媒体平台的历史数据；根据所述历史数据生成多个社交媒体平台画像和用户行为画像；根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型；根据所述用户行为画像和所述第一事件模型得到第一用户事件处理模型；根据所述第一监测模型对所述社交媒体平台进行监测；当监测到第一事件时，根据所述第一监测模型和所述第一事件模型生成第一事件监测模型；根据所述第一事件监测模型对所述社交媒体平台进行监测，得到对所述第一事件的第一事件监测数据；根据所述第一事件监测数据和所述第一用户事件处理模型得到对于所述第一事件的用户行为预测数据。通过本发明方案，可以对于具体的事件/话题/新闻进行智能的用户行为预测，提高了用户行为预测的效率和准确率。

附图说明

图1是本发明一个实施例提供的基于大数据的社交媒体用户行为预测系统的示意框图；

图2是本发明一个实施例提供的基于大数据的社交媒体用户行为预测方法流程图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

下面参照图1至图2来描述根据本发明一些实施方式提供的一种基于大数据的社交媒体用户行为预测系统及方法。

如图1所示，本发明一个实施例提供一种基于大数据的社交媒体用户行为预测系统，包括：云服务器和社交媒体平台；

所述云服务器被配置为：

获取多个所述社交媒体平台的历史数据；

根据所述第一监测模型对所述社交媒体平台进行监测；

应当知道的是，图1所示的基于大数据的社交媒体用户行为预测系统的框图仅作示意，其所示出的各模块的数量并不对本发明的保护范围进行限定。本实施例提供的基于大数据的社交媒体用户行为预测系统可以用于执行对应的基于大数据的社交媒体用户行为预测方法的各实施例方案，具体实现过程中请参见以下各方法实施例的描述，在此不作赘述。

请参见图2，本发明的另一实施例提供一种基于大数据的社交媒体用户行为预测方法，包括：

获取多个社交媒体平台的历史数据；

根据所述第一监测模型对所述社交媒体平台进行监测；

在本实施例中，所述历史数据包括但不限于：用户数据，包括平台的注册用户数量、用户属性(如年龄、性别、地理位置)、用户活跃度(如每月活跃用户数、每日活跃用户数)、用户增长趋势等；内容数据，包括用户发布的帖子、图片、视频、评论等内容的数量和类型，这些数据可以用于分析用户行为、内容趋势和兴趣爱好；互动数据，包括用户之间的互动行为，如点赞、评论、分享、转发等，这些数据可以反映用户对内容的反应和参与程度；广告数据，包括广告投放数量、广告主数量、广告点击率、广告收入等；社交关系数据，包括用户之间的关注关系、好友关系、粉丝关系等社交关系数据，这些数据可以用于分析用户社交网络和影响力；群组数据，即社交平台上的各种群组或社区的数据，包括群成员、群管理、群活动等数据，这些数据可以用来分析群体结构和行为；反馈数据，包括用户对平台的反馈、举报、投诉等数据，这些数据可以帮助平台改进用户体验和解决问题；安全数据，包括平台上的安全事件、违规行为等数据，这些数据可以用于监测和应对违规活动，维护平台的安全和秩序；分析数据，包括对上述各项数据的分析结果和统计数据，这些数据可以用于生成报告、趋势分析和决策支持；等等。获取这些不同维度的历史数据，可以全面地对一个社交平台进行分析和建模。

事件模型包括但不限于：

事件起源：描述事件的起源和触发因素。这可以是一个具体事件、行为、言论、照片、视频或其他引起关注的内容；事件关键参与者：识别和描述事件中的关键参与者，包括个人、组织、社群、媒体等，这些参与者可以是事件的发起者、推动者、支持者、反对者或被影响者；事件时间和地点：记录事件发生的时间和地点，这有助于追踪事件的时间轴和地理范围，以便了解事件的演变和影响范围；事件内容：描述事件的具体内容和细节。这包括相关的帖子、评论、转发、视频、图片等媒体内容，以及与事件相关的标签、关键词等；事件情感和态度：分析事件参与者和社交媒体用户对事件的情感和态度。这可以通过情感分析、评论分析等方法来了解用户对事件的反应和情感倾向；事件传播和影响：描述事件在社交媒体平台上的传播路径、影响范围和传播速度，这包括用户之间的互动、信息传播的路径、关键节点和影响者，以及事件在社交媒体上的流行度和影响力；反馈和回应：记录社交媒体用户对事件的反馈和回应。这可以是评论、回复、点赞、分享等互动行为，有助于了解用户对事件的看法和参与程度；媒体报道和舆论影响：记录媒体对事件的报道和舆论影响。这包括新闻媒体、专栏作家、意见领袖等的观点和评论，以及媒体报道对事件传播和影响的影响程度；事件走向和后续发展：根据事件的演进过程和相关因素，对事件的走向和后续发展进行预测和分析；等等

采用本实施例的技术方案，通过获取多个所述社交媒体平台的历史数据；根据所述历史数据生成多个社交媒体平台画像和用户行为画像；根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型；根据所述用户行为画像和所述第一事件模型得到第一用户事件处理模型；根据所述第一监测模型对所述社交媒体平台进行监测；当监测到第一事件时，根据所述第一监测模型和所述第一事件模型生成第一事件监测模型；根据所述第一事件监测模型对所述社交媒体平台进行监测，得到对所述第一事件的第一事件监测数据；根据所述第一事件监测数据和所述第一用户事件处理模型得到对于所述第一事件的用户行为预测数据。通过本发明方案，可以对于具体的事件/话题/新闻进行智能的用户行为预测，提高了用户行为预测的效率和准确率。

在本发明一些可能的实施方式中，所述根据所述历史数据生成多个社交媒体平台画像和用户行为画像的步骤，包括：

从所述历史数据中提取平台特征数据(如用于构建用户群体画像的年龄分布、性别比例、地域分布等的用户群体特征数据；用于构建内容画像的文本、图像、视频等内容特征数据；用于构建互动画像的评论、转发量等互动特征数据；用于构建活跃度画像的DAU、MAU等活跃度特征数据；等等)；

对所述平台特征数据进行统计分析(如分布、比较、相关性等)，建立量化平台画像；

从所述平台特征数据中提取内容特征数据，并根据所述内容特征数据构建内容画像(分析所述社交媒体平台的内容主题，抽取主要的用户讨论话题)；

在本步骤中，这个过程是指，将从社交平台历史数据中提取出来的各个方面的画像进行综合和融合，最终得到一个整体的、全面的社交媒体平台画像。具体来说：

量化平台画像：通过统计分析，得到表达平台整体属性的量化指标，如DAU，用户增长曲线等。

用户群体画像：对平台用户进行划分和建模，得到表示不同用户群体特征的画像，如年轻用户群体，中老年用户群体等。

内容画像：分析平台上的发帖内容，得到内容类型和主题的画像，如视频分享内容，社会事件讨论内容等。

互动画像：统计用户的点赞、评论、转发等互动行为，得到互动方式和特征的画像。

活跃度画像：通过用户登录、浏览、发帖等行为数据，分析用户的活跃程度画像。

将上述不同角度的画像综合起来，采用数据融合的技术，可以得到一个涵盖用户、内容、互动、活跃多个方面的社交平台整体画像。这可以更全面地反映和表达一个社交平台的特征。

这样得到的社交媒体平台画像，可以作为后续分析tasks的重要信息输入之一，为用户行为预测、内容推荐等提供支持。

在本实施例中，综合运用各种技术可以全面抽取平台特征并构建平台画像。

从所述历史数据中提取所述社交媒体平台的用户的历史行为数据(包括生成内容、互动行为等)；

在本步骤中，从社交平台的用户历史行为数据中，利用关联规则挖掘算法，来发现不同用户行为之间的关联关系。具体来说，历史行为数据包括用户在社交平台上的历史操作行为数据，如浏览、点赞、评论、转发等各类互动行为的记录。关联规则挖掘：通过采用对大规模事务型数据进行关联分析的算法，可以识别变量间的关联关系。不同行为之间的第一关联关系指利用关联规则挖掘，可以发现如“如果用户对A内容点赞，那么他很可能也会对B内容点赞”这样的两个行为之间存在的关联性。通过这种关联规则的挖掘，我们可以分析出社交平台用户不同行为之间的内在联系，比如哪些行为经常一起出现，出现一个行为会引发什么后续行为等。

这些关联关系可以应用到用户画像分析，精准推荐，用户行为预测等场景，为后续建模提供基础信息。

对所述历史行为数据进行特征工程，提取行为特征(如每天发帖量、互动频率、内容类型偏好等)；

在本步骤中，对社交平台用户的历史行为数据进行特征工程，以提取出能够代表用户行为特征的变量。具体来说，历史行为数据包括了用户在社交平台上的历史互动行为，例如浏览记录、点赞、评论、转发记录等；特征工程指从原始数据中抽取有意义的特征变量的过程，特征工程可以包括数据清洗、变量转换、新特征构造等步骤；提取行为特征：基于上一步的特征工程，确定和构造最能代表用户行为特征的变量。这些行为特征可以反映出用户的行为偏好、模式和水平，例如：每天平均发帖数量、常看内容的类别、互动转换率、发帖时间分布、评论词汇多样性等等能够反映用户社交行为的特征。这些行为特征可以作为用户画像的重要组成部分，为预测用户行为、个性化推荐内容等提供关键支撑。通过特征工程，从海量复杂的行为数据中提取出有效的行为特征，为后续的用户画像分析和模型搭建提供结构化的输入。

基于所述第一关联关系和所述行为特征对所述社交媒体平台的用户进行聚类(如使用K-means等算法)，使得每一类用户形成一个行为画像群体；

在本步骤中，根据前面步骤得到的用户行为关联关系和行为特征，采用聚类算法对社交平台用户进行聚类，使得不同类别的用户形成不同的行为画像群体。具体地，第一关联关系指前面通过关联规则挖掘得到的不同用户行为之间的关联关系；行为特征指通过特征工程从用户行为数据中提取出来的能够表示用户行为偏好的特征；用户聚类即基于上述两类信息，采用聚类算法(如K-Means)，根据用户的行为关联模式和行为特征，将用户分割成不同的类，使同一类用户在行为上更加相似。每一类用户形成一个行为画像群体：每一类用户代表了一种行为倾向，比如更喜欢点赞的用户，更喜欢发评论的用户等。每一类用户都构成了一个有共同行为特点的群体。行为画像群体：就是对每一类用户群体根据他们的共同行为进行总结和抽象，得到表示该类用户行为偏好的画像，比如“专注读者”、“活跃讨论者”等画像。通过用户聚类获得行为画像，可以为用户个性化服务提供基础，也为分析用户行为提供典型模式。

结合所述行为特征中对应每个所述行为画像群体对应的数据，对每个所述行为画像群体进行行为分析，得到多个群体行为画像(画像包括互动频次、时间分布、内容倾向等维度)；

在本步骤中，在得到用户聚类和行为画像群体的基础上，进一步对每个群体进行行为分析，生成代表每个群体的行为画像。具体地，行为特征中对应每个行为画像群体的数据：指在进行用户聚类时，同时获得了每个群体中用户的行为特征数据。对每个行为画像群体进行行为分析：基于每个群体内部的用户行为特征数据，可以进行统计分析，找出该群体的行为偏好、模式等。得到多个群体行为画像：通过上面的分析，可以总结出每个群体的行为关键词或行为传记，反映该群体的行为特点。比如，群体A：每天浏览时间长、偏爱看视频、积极点赞；群体B：发帖频率高、偏好评论、夜间活跃等等，形成对每个群体行为进行概括的行为画像。群体行为画像：这些行为画像可以为用户画像提供行为层面的补充，也可以用于分析不同群体的行为偏差，为运营决策提供支持。本步骤是在用户划分群体的基础上，继续深入分析每个群体的行为，以得到反映群体行为特征的画像，这进一步丰富了用户画像的表达。

在步骤中，根据前面生成的每个行为画像群体的特征，然后为社交平台的每个用户添加标签，表示他们分别属于哪一个群体。具体地，群体行为画像：在对社交平台用户进行聚类后，通过分析得到每个类用户(画像群体)的行为特点概况。为每个用户打上标签：根据用户的实际历史行为数据，可以判断这个用户最匹配哪一个群体的特征。对应的标签：则是这个最匹配的群体的行为画像标签，例如“精力旺盛群体”、“洞察力群体”等。表示用户属于哪类行为画像群体：因此给用户添加这个标签，可以直接明确地表示这个用户属于社交平台中哪一类由共同行为特征定义的用户群体。这个为用户添加行为画像标签的过程，使得每个用户可以直接关联到一个行为群体。这为后期根据用户群体的特点来进行用户画像应用、个性化服务等提供了基础，同时也方便直接根据标签查询属于同一群体的用户。

在本实施例中，通过对用户行为特征建模，可以从数据层面生成用户行为画像，为分析和预测提供基础。

在本发明一些可能的实施方式中，所述根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型的步骤，包括：

确定所述社交媒体平台的第一监测目标和第一监测指标；

在本步骤中，确定在对社交媒体平台进行监测时的监测目标和评估指标。具体地，第一监测目标指此次监测要达到的目的或要监控的对象，如监测突发事件、监测异常账号、监测负面情绪传播等；第一监测指标为评价是否达到监测目标而设定的评估指标，如负面信息量、传播范围、影响用户数等。确定监测目标和指标：根据平台运营的需要，确定这次监测要关注的点和衡量指标，为后续监测提供方向。例如，第一监测目标为“监测负面信息传播”，第一监测指标为“负面信息量”、“传播深度”。明确监测目标和指标，有助于从海量信息中提取有效数据，进行有针对性的平台监测，达到监管效果，同时也为监测结果提供评判标准。

在本步骤中，根据确定的监测目标和指标，从已经构建的社交平台小组画像数据中，提取出能代表这个监测目标的关键特征。具体地，第一监测目标可以是“监测负面信息传播”；第一监测指标可以是“负面信息量”。小组画像数据包含小组各种图像的构建结果，比如小组属性、用户构成、影响力等。提取能代表监测目标的第一关键特征即根据前面的第一监测目标和第一监测指标，从小组画像数据中提取与监测负面信息传播相关的特征，比如：小组内负面发帖比例、小组内高影响力用户数、小组受众敏感度分布等；通过这样的特征提取，可以使得后续的监测模型建立在与监测目标和指标高度相关的特征上，提升监测效果。

在本步骤中，根据确定的监测目标和监测指标，从预设的多个可选模型中选择一个最匹配的基本模型。具体地，第一监测目标可以是“监测负面内容”；第一监测指标可以是“传播范围”；预设的多个模型，例如内容识别模型、用户关系模型、传播模拟模型、情感分析模型等；判断传播范围监测与传播模拟模型最匹配，则选择传播模拟模型作为第一基本模型。通过目标指标与模型预设库的匹配，可以高效获得一个合适的基本模型，为后续模型迭代和生成提供依据。

在本步骤中，使用第一基本模型作为模板，利用提取的第一关键特征作为输入数据，在第一基本模型上进行训练和参数调整，以适应第一关键特征的数据分布，得到针对第一监测目标定制的第一基本监测模型，即在选择出匹配监测目标的基本模型后，使用真实的数据去训练和优化这个模型，使其针对目标任务进行建模，最终得到一个可用于该监测目标的定制化的基本监测模型。这一过程通过数据驱动的模型训练，得到一个具备监测能力的学习模型，为后续监测任务提供基础，相比直接使用预设模型，这种定制化模型可以更好地适应实际数据，提升后续监测效果。

在本步骤中，根据确定的第一监测目标和第一监测指标，明确在后续监测中需要关注和监控的关键事件类型。具体地，第一监测目标可以是“监测负面内容”；第一监测指标可以是“传播数量”；根据监测目标和监测指标确定需要监控的关键事件，即根据负面内容监测和传播数量指标，确定需要监控产生大量负面内容的事件，比如重大事故等。需要监控的关键事件即上述确定的与监测目标和指标相关的事件类型。明确需要监测的关键事件类型，可以使得后续监测更加有针对性和高效，而不会花费大量资源去关注无关事件。同时，针对关键事件建立监测可以帮助及时发现可能引发负面影响的事件并采取应对。

在本步骤中，从已经构建好的社交媒体平台画像数据中，提取出能够代表和反映预先确定的关键事件的特征，作为第二关键特征。具体地，社交媒体平台画像数据包含社交平台各方面的画像，如用户画像、内容画像等；关键事件可以为“重大事故事件”；提取能反映关键事件的第二关键特征即从平台画像数据中，提取与重大事故相关的特征，如:平台负面情感索引、高影响力用户数量、新闻敏感用户分布。这种与特定关键事件高度相关的特征提取，可以使后续针对事件建立的监测模型更加准确和有效。

选择与所述关键事件匹配的第二基本模型；

在本步骤中，从现有的多个模型模板中根据前面确定的关键事件的类型和属性选择与这个关键事件最匹配的模型作为第二基本模型例如:关键事件是重大事故类事件，多个模型模板有内容识别模型、情感分析模型、传播模拟模型、根据事件类型判断等；若传播模拟模型最匹配则选择传播模拟模型作为第二基本模型；这样通过在现有模型库中选择最佳匹配模型作为基本模型，可以使后续基于关键事件的监测模型得到最好的初始化，提高监测效果。

在本步骤中，已经提取了代表关键事件的第二关键特征，选择了与关键事件匹配的第二基本模型，使用真实的第二关键特征数据对第二基本模型进行训练，调整模型参数，优化模型与特征的匹配程度，得到针对关键事件进行监测的第一关键事件模型；即，基于事件相关的第二关键特征，通过训练优化使基本模型适应这些特征，从而产生一个针对关键事件进行监测的定制化模型。这利用了真实数据使模型从泛化向专化方向发展，能够更精确地处理与关键事件相关的监测任务。

在本发明一些可能的实施方式中，所述根据所述用户行为画像和所述第一事件模型得到第一用户事件处理模型的步骤，包括：

从所述历史数据中提取历史事件数据；

基于大数据分析技术，对所述历史行为数据和所述历史事件数据进行分析，确定不同类型事件对用户行为的影响因素(如事件情感向度、传播范围、参与程度等)；

在本步骤中，运用大数据分析技术，从历史行为和事件数据中发现不同类型事件会通过哪些因素影响用户行为，为构建事件影响模型提供基础。

在本步骤中，用户行为画像即为通过分析用户历史行为得到的反映用户行为倾向的画像；影响因素即通过前面的分析确定的事件对用户行为产生影响的因素；基于用户行为画像，分析不同类型用户对影响因素中的各因素的响应程度，形成用户行为敏感度矩阵，即构建一个矩阵，行是用户画像，列是影响因素，每个元素代表一个用户画像对一个影响因素的敏感度。即，根据用户行为画像，计算他们对不同事件影响因素的敏感程度，得到一个表示用户行为对事件响应敏感度的矩阵，这可以为评估事件对不同用户的影响提供支持。

在本步骤中，使用第一事件模型，搭建一个可以模拟事件传播的系统，模拟事件在用户网络中的传播(即在模拟器中输入某事件，让它根据模型进行传播演化)和影响力变化(模拟事件传播时，模拟其影响力如何衰减)，获得事件对不同用户群体的影响程度矩阵(模拟结果生成一个矩阵，表示事件对不同用户群体的最终影响程度)，即通过模拟事件传播，评估事件对不同用户群体的影响，得到一个表示事件影响强度的矩阵，这为评估事件对用户行为的实际效果提供了支持。

将所用户行为敏感度矩阵和所述影响程度矩阵相结合，建立所述社交媒体平台的每个用户对于给定事件类型的响应模型(模型可评估事件对用户行为的影响响应程度)；

在本步骤中，将用户行为敏感度矩阵(反映不同用户对事件影响因素的敏感程度)和影响程度矩阵(反映事件对不同用户群体的最终影响程度)逐元素对应相乘两个矩阵，建立每个用户对于给定事件类型的响应模型，即基于上一步得到的矩阵，建立一个模型，可以输入一个用户和事件类型，输出用户对该事件类型的响应程度。将考虑了用户敏感度和事件影响度的两个矩阵结合，构建出一个可以评估单个用户对特定事件响应的模型，这为分析和预测用户行为提供了工具。

根据所述验证结果调整所述响应模型的参数(以提升响应评估的准确性)得到所述第一用户事件处理模型。

在本实施例中，通过对用户行为画像和事件特征建模，可以得到用户对事件响应/处理的评估模型，为社交平台的决策优化提供支持。

在本发明一些可能的实施方式中，所述根据所述第一监测模型对所述社交媒体平台进行监测的步骤，包括：

根据所述第一监测模型确定第一监测目标、第一监测指标、第一监测时间、第一监测频率、第一监测内容等；

根据第一监测目标、第一监测指标、第一监测时间、第一监测频率、第一监测内容，收集所述社交媒体平台中的实时数据流(如新发布内容、用户互动等)；

对采集的数据进行清洗、去噪等预处理；

对处理后的数据提取文本、视觉等特征；

将特征输入第一事件模型，判断内容是否与第一事件相关；

对监测结果进行过滤，移除误报内容，以提高检测准确率

将监测到的与第一事件相关的数据存入数据库；

对第一事件监测结果进行可视化呈现，统计事件相关数据量、走势等；

用新增监测数据进一步优化第一事件监测模型，提升后续监测效果；

设置相关监测阈值，当超过阈值时发出告警

在本实施例中，通过对实时数据的模型监测，可以持续获得第一事件的监测数据，并设置告警。

在本发明一些可能的实施方式中，所述当监测到第一事件时，根据所述第一监测模型和所述第一事件模型生成第一事件监测模型的步骤，包括：

收集与所述第一事件相关的第一实时数据；

从所述第一实时数据中提取所述第一事件的第一事件特征(如反映事件的关键信息的文本、视觉等特征)；

在本步骤中，将从第一实时数据中提取出的代表第一事件的特征与第一事件模型(通过分析历史数据构建的事件属性模型)进行匹配(将第一事件特征与第一事件模型进行比较对应)，识别第一事件的第一事件类型(通过匹配，判断监测到的第一事件属于什么类别事件)和第一事件属性(判断第一事件的具体属性，如影响范围、传播速度等)等，即将实际事件数据与通用事件模型进行匹配，以识别出特定事件的具体类型和属性，这为后续建立针对该事件的监测模型提供信息。

在本步骤中，通过前面的匹配获得第一事件的类型和属性信息，确定第一事件监测目标(确定针对该事件需要监测和分析的关键目标，例如某事件类型的负面影响监测)和第一事件监测指标(为评价监测目标的达成，设定对应的评估指标，例如负面情绪数量)；即根据对具体事件的分析，明确该事件监测的目标和指标，为后续监测提供方向。

在本步骤中，根据第一事件监测目标(通过分析确定的针对具体事件的监测目标)和第一事件监测指标(如对应的评价指标)调整第一监测模型的结构、参数等使其适应指定的第一事件监测目标和第一事件监测指标，得到第一事件监测模型；即基于对事件的理解，调整普适性监测模型以针对该事件监测，得到一个针对该事件优化的定制化监测模型，通过模型调整提高了监测的针对性和有效性。

在本实施例中，第一事件监测模型包括但不限于：

第一事件监测目标和第一事件监测指标；

事件特征提取模块，用于从数据中提取与事件相关的特征，如文本、图像、视频等特征。

事件识别模块，用于使用机器学习算法识别与第一事件相关的内容。如文本分类、图像识别等。

过滤模块，用于对识别结果进行过滤，去除误报，提升准确率。可以使用规则/黑名单等。

模型优化模块，用于使用新增数据不断优化模型，使其适应第一事件的变化。

存储模块，用于将监测结果存储到数据库中，供进一步分析。

告警模块，用于设置关键指标阈值，当监测结果超过阈值时发出告警。

可视化模块，用于将监测结果进行可视化展示，便于监控。

模型评估模块，用于评估模型在新数据上监测效果，如精确率、召回率等。

模型更新模块，用于当指标下降时，重新训练模型以提升监测效果。

综合这些模块，可以构建针对第一事件的可靠、可解释的监测模型，实现对社交平台的智能监测。

在本实施例中，通过事件模型匹配与监测模型定制，可以实现针对特定事件的监测，提高准确率。

在本发明一些可能的实施方式中，所述根据所述第一事件监测模型对所述社交媒体平台进行监测，得到对所述第一事件的第一事件监测数据的步骤，包括：

根据从所述第一事件监测模型中提取的所述第一事件监测目标和所述第一事件监测指标采集所述社交媒体平台的第二实时数据(通过平台提供的API或爬虫收集用户发布的内容、评论、点击等实时数据)；

从预处理后(如清洗、格式化、统计等)的所述第二实时数据中提取文本特征数据、图像特征数据、视频特征数据；

在本步骤中，使用事件模型，对各维度的监测数据进行过滤，删除与特定事件无关内容，得到该事件的精炼监测数据，这通过模型优化了监测数据的质量，提高后续分析的效率。

在本实施例中，通过持续监测，可以实时捕捉第一事件的数据，并智能识别事件相关内容。

在本发明一些可能的实施方式中，所述根据所述第一事件监测数据和所述第一用户事件处理模型得到对于所述第一事件的用户行为预测数据的步骤，包括：

具体地，使用事件模拟器来模拟第一事件在网络中的传播情况。事件模拟器是一个模拟器系统，可以模拟信息在社交网络中的传播过程，它可以基于现有的网络拓扑结构、用户行为模型和传播模型，模拟信息的传播路径、传播速度等。传播评估：在模拟过程中，可以评估不同用户群体受到第一事件影响的程度。这可以通过多种方式进行评估，如计算特定用户群体中收到该事件的人数、分析信息传播路径上的节点数量等。评估的目的是了解第一事件在网络中的传播效果，并确定不同用户群体对该事件的感知程度或曝光程度。通过以上步骤，可以利用第一事件监测数据和事件模拟器来模拟第一事件在网络中的传播情况，并评估不同用户群体受到第一事件影响的程度。这有助于了解事件在社交媒体和网络中的传播效果，并对用户群体的反应和态度进行分析和评估。这样的评估可以为进一步的决策制定、舆情管理或营销策略提供参考。

根据所述第一用户事件处理模型和所述第一影响程度，确定各用户群体的行为倾向(如是否易受事件影响、是否积极参与等)，形成各用户群体的行为影响矩阵；

具体地，在本步骤中，第一用户事件处理模型即根据之前提到的第一用户事件处理模型，该模型可以是基于用户行为模式、心理学理论或其他相关模型，用于描述用户在面对事件时的行为方式和决策过程。

第一影响程度即基于之前提到的评估各用户群体受到第一事件影响的程度，可以确定不同用户群体在事件中所扮演的角色和受到的影响程度。这可以是根据传播评估、用户参与度、社交网络分析等方法得出的结果。

行为倾向确定即根据第一用户事件处理模型和第一影响程度的结果，可以确定不同用户群体在面对第一事件时的行为倾向。例如，某些用户群体可能易受事件影响，更容易受到事件的情绪激发或行为改变；而其他用户群体可能对事件较为冷漠或不易受到影响；还有一些用户群体可能更积极参与，发表评论、分享意见等。

行为影响矩阵即将上述行为倾向整理成一个行为影响矩阵，以便更好地理解和描述不同用户群体的行为特征和影响程度。行为影响矩阵可以以表格或矩阵的形式展示，其中行表示不同用户群体，列表示不同的行为倾向或影响程度，矩阵中的值表示用户群体在某种行为倾向或影响程度上的程度或权重。

通过以上步骤，可以基于第一用户事件处理模型和第一影响程度，确定各用户群体的行为倾向，并形成行为影响矩阵。这有助于更好地理解用户在面对事件时的行为差异，为相关决策和策略制定提供参考依据，例如针对不同用户群体的个性化沟通、社交媒体营销等。

根据所述行为影响矩阵、行为关联规则(预先应用关联规则学习技术，结合历史数据，得到事件与用户行为之间的关联规则，如XXX事件会引起XX用户群体产生XX行为)，对单个用户进行打分，评估事件对其个体行为的影响概率，得到用户行为预测数据。

在本步骤中，行为影响矩阵即根据之前提到的行为影响矩阵，其中包含了不同用户群体的行为倾向和影响程度。

行为关联规则学习即通过预先应用关联规则学习技术并结合历史数据，可以得到事件与用户行为之间的关联规则。这些关联规则描述了某个事件会引起特定用户群体产生哪些行为。例如，根据历史数据分析，可以得出“XXX事件会引起XX用户群体产生XX行为”的关联规则。

单个用户打分即对于单个用户，根据其特征和历史行为，结合行为影响矩阵和行为关联规则，可以进行打分。这个打分可以体现事件对用户个体行为的影响概率。具体的打分方法可以根据实际情况而定，可以基于概率模型、机器学习算法等进行计算。

用户行为预测数据即通过对单个用户的打分，可以评估事件对其个体行为的影响概率，并得到用户行为的预测数据。这些预测数据可以包括用户在面对某个事件时可能产生的具体行为或行为类别。

通过以上步骤，可以根据行为影响矩阵和行为关联规则，对单个用户进行打分，评估事件对其个体行为的影响概率，并得到用户行为的预测数据。这有助于理解和预测用户在面对特定事件时的行为反应，为个性化推荐、精准营销等提供决策依据。

在本实施例中，可以融合多源数据，进行用户行为预测，为平台决策提供支持。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，可轻易想到变化或替换，均可作各种更动与修改，包含上述不同功能、实施步骤的组合，包含软件和硬件的实施方式，均在本发明的保护范围。

Claims

1.一种基于大数据的社交媒体用户行为预测系统，其特征在于，包括：云服务器和社交媒体平台；

所述云服务器被配置为：

获取多个所述社交媒体平台的历史数据；

根据所述第一监测模型对所述社交媒体平台进行监测；

2.一种基于大数据的社交媒体用户行为预测方法，其特征在于，包括：

获取多个社交媒体平台的历史数据；

根据所述第一监测模型对所述社交媒体平台进行监测；

3.根据权利要求2所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述历史数据生成多个社交媒体平台画像和用户行为画像的步骤，包括：

从所述历史数据中提取平台特征数据；

对所述平台特征数据进行统计分析，建立量化平台画像；

4.根据权利要求3所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述历史数据生成多个社交媒体平台画像和用户行为画像的步骤，包括：

对所述历史行为数据进行特征工程，提取行为特征；

5.根据权利要求4所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型的步骤，包括：

确定所述社交媒体平台的第一监测目标和第一监测指标；

6.根据权利要求5所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述社交媒体平台画像建立各个所述社交媒体平台的第一监测模型和第一事件模型的步骤，包括：

选择与所述关键事件匹配的第二基本模型；

7.根据权利要求6所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述用户行为画像和所述第一事件模型得到第一用户事件处理模型的步骤，包括：

从所述历史数据中提取历史事件数据；

8.根据权利要求7所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述当监测到第一事件时，根据所述第一监测模型和所述第一事件模型生成第一事件监测模型的步骤，包括：

收集与所述第一事件相关的第一实时数据；

从所述第一实时数据中提取所述第一事件的第一事件特征；

9.根据权利要求8所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述第一事件监测模型对所述社交媒体平台进行监测，得到对所述第一事件的第一事件监测数据的步骤，包括：

10.根据权利要求9所述的基于大数据的社交媒体用户行为预测方法，其特征在于，所述根据所述第一事件监测数据和所述第一用户事件处理模型得到对于所述第一事件的用户行为预测数据的步骤，包括：