CN115374307A

CN115374307A - 智能舆情分析方法、装置、终端设备及存储介质

Info

Publication number: CN115374307A
Application number: CN202110542942.2A
Authority: CN
Inventors: 何蕊馨
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Group Design Institute Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Group Design Institute Co Ltd
Priority date: 2021-05-18
Filing date: 2021-05-18
Publication date: 2022-11-22

Abstract

本发明公开了一种智能舆情分析方法、装置、终端设备及存储介质，该方法包括：采集用户视频弹幕数据；基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。本发明提出的基于弹幕采集的智能舆情分析方法，相比传统方法成本更低、覆盖面更全、效率更高、准确度更高。

Description

智能舆情分析方法、装置、终端设备及存储介质

技术领域

本发明涉及移动通信技术领域，尤其涉及一种智能舆情分析方法、装置、终端设备及存储介质。

背景技术

目前，对于社会舆情信息的挖掘分析处理，主要依靠用户调研、传统文本分析手段，通过分析问卷、微博、贴吧、知乎等平台浏览评论情况，识别统计评论文本关键词并实现事件标签分类、热词搜索推荐等舆情分析功能。

现有的分析方案存在以下缺点：

对于用户调研方式，其覆盖面有限，维度单一，难以覆盖大量用户，且具有明显滞后性；对于传统文本分析手段方式，微博、论坛等平台用户评论与视频弹幕相比，时间特征不明显，缺乏实时交互性与共享性，且弹幕文本相比传统评论文本具有长度短、网络用语多、信息不完整、与视频当前场景强相关等特点。因此，传统文本分析方法难以准确应对弹幕数据特征；此外，传统手段对于用户特征画像(一般只有性别、大致年龄、省级区域分布等)及分析较为单一，难以精准指导舆情分析。

发明内容

本发明的主要目的在于提供一种智能舆情分析方法、装置、终端设备及存储介质，旨在实现社会舆情信息的精准分析与智能高效处理，提高舆情信息的准确性。

为实现上述目的，本发明实施例提供一种智能舆情分析方法，所述方法包括以下步骤：

采集用户视频弹幕数据；

基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；

基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；

基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。

可选地，所述基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果的步骤包括：

基于所采集的所述用户视频弹幕数据，进行分类别的视频描述模型训练，得到针对不同类别的视频描述模型；

基于所述视频描述模型，建立视频画像模型；

基于所述视频画像模型生成所关注视频画像，基于生成的所关注视频画像，生成智能舆情初步分析结果。

可选地，所述基于所述视频画像模型生成所关注视频画像，基于生成的所关注视频画像，生成智能舆情初步分析结果的步骤包括：

基于所述视频画像模型，获得所关注视频的舆情监控系数；

选取舆情监控系数排名靠前的预设数量的视频作为所关注视频画像并分类生成相应视频描述信息；

基于生成的相应视频描述信息生成舆情监控视频列表，作为智能舆情初步分析结果。

可选地，所述基于生成的相应视频描述信息生成舆情监控视频列表的步骤之后还包括：

对所述舆情监控视频列表对应的各所述所关注视频画像，比较对应的相应视频描述信息，得到各视频的相似关联度；

对相似关联度高于设定门限值的多个视频，保留舆情监控系数最高的视频，删除其余相似视频，并根据所述舆情监控系数从所述预设数量的视频中依序选取递补视频，直至所述舆情监控视频列表不再变化，得到最终的舆情监控视频列表，作为智能舆情初步分析结果。

可选地，所述基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息的步骤包括：

对所述舆情监控视频列表中的视频，读取相应的用户视频弹幕数据；

基于读取的用户视频弹幕数据生成弹幕基本属性分析结果，以及生成弹幕情感分析信息；

基于所述弹幕情感分析信息，选取情感值评分低于预设门限值的弹幕，生成负面弹幕用户画像结果；

将生成的弹幕基本属性分析结果、弹幕情感分析信息、负面弹幕用户画像结果进行整合，生成弹幕分析信息。

可选地，所述基于所述弹幕情感分析信息，选取情感值评分低于预设门限值的弹幕，生成负面弹幕用户画像结果的步骤包括：

基于所述弹幕情感分析信息，读取情感值评分低于预设门限值的负面弹幕用户视频弹幕数据；

将读取的负面弹幕用户视频弹幕数据与预先建立的用户场景信息库进行关联，获得弹幕用户定位数据库；

基于所述弹幕用户定位数据库，对分析定位所关注负面弹幕用户进行精细画像，生成负面弹幕用户画像结果。

可选地，所述基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析的步骤包括：

基于所述舆情监控视频列表及对应视频的舆情监控系数计算得到重点舆情处理优先级；

对舆情处理优先级达到预设门限值的视频，基于所述智能舆情初步分析结果及所述弹幕分析信息，形成综合智能舆情分析方案，并将舆情分析结果对外输出和/或推送。

可选地，所述基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析的步骤进一步还包括：

对舆情处理优先级达到预设门限值的视频，基于预先建立的用户场景信息库，实现舆情场景化地理呈现。

可选地，所述采集用户视频弹幕数据的步骤包括：通过网络爬虫、公共API接口或SDK埋点自动采集用户视频弹幕数据，并分类别保存。

可选地，所述采集用户视频弹幕数据的步骤进一步还包括：通过平台对接采集用户XDR数据、MDT数据、MR数据；采集工参数据；和/或通过爬虫或API公共接口获取场景边框数据。

可选地，所述采集用户视频弹幕数据的步骤之后还包括：

对采集的用户视频弹幕数据进行处理，包括：对所述采集的用户视频弹幕数据进行清洗、融合关联，形成用户用网信息库；

基于所述用户用网信息库及经纬度匹配，并匹配采集的场景边框数据，建立包含用户用网信息和地理信息的用户场景信息库。

此外，本发明实施例还提出一种智能舆情分析装置，所述智能舆情分析装置包括：

采集模块，用于采集用户视频弹幕数据；

列表生成模块，用于基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；

信息生成模块，用于基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；

分析模块，用于基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。

此外，本发明实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的智能舆情分析方法。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的智能舆情分析方法。

此外，本发明实施例还提出一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现如上所述的智能舆情分析方法。

本发明实施例提出的智能舆情分析方法、装置、终端设备及存储介质，通过采集用户视频弹幕数据；基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。由此，可以自动采集海量用户视频弹幕数据，基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并生成智能舆情初步分析结果，可以实现重点用户精细画像、热点关键信息识别、传播及评价趋势预测、突发事件预警等分析功能及结果GIS呈现，以高效准确实现舆情自动监控及精准智能分析，实现社会舆情智能挖掘、分析与定位，提高舆情信息的准确性，为社会热点事件的监测、追踪和预防性维护提供高效准确的舆情解决方案。本发明实施例提出的基于弹幕采集的智能舆情分析方法，相比传统方法成本更低、覆盖面更全、效率更高、准确度更高。

附图说明

图1为本发明智能舆情分析装置所属终端设备的功能模块示意图；

图2为本发明智能舆情分析方法一示例性实施例的流程示意图；

图3为本发明实施例实现智能舆情分析的具体实施流程示意图；

图4为本发明智能舆情分析方法实施例中数据采集的流程示意图；

图5为本发明智能舆情分析方法实施例中数据处理的流程示意图；

图6为本发明智能舆情分析方法实施例中生成所关注视频画像及智能舆情初步分析结果的流程示意图；

图7为本发明智能舆情分析方法实施例中生成弹幕分析信息的流程示意图；

图8为为本发明智能舆情分析方法实施例中重点舆情智能分析定位及呈现的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例的主要解决方案是：通过采集用户视频弹幕数据；基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。由此，可以自动采集海量用户视频弹幕数据，基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并生成智能舆情初步分析结果，可以实现重点用户精细画像、热点关键信息识别、传播及评价趋势预测、突发事件预警等分析功能及结果GIS呈现，以高效准确实现舆情自动监控及精准智能分析，实现社会舆情智能挖掘、分析与定位，提高舆情信息的准确性，为社会热点事件的监测、追踪和预防性维护提供高效准确的舆情解决方案。本发明实施例提出的基于弹幕采集的智能舆情分析方法，相比传统方法成本更低、覆盖面更全、效率更高、准确度更高。

本发明实施例考虑到，现有相关方案中，对于社会舆情信息的挖掘分析处理，主要依靠用户调研、传统文本分析手段，通过分析问卷、微博、贴吧、知乎等平台浏览评论情况，识别统计评论文本关键词并实现事件标签分类、热词搜索推荐等舆情分析功能。其存在的缺点在于：对于用户调研方式，其覆盖面有限，维度单一，难以覆盖大量用户，且具有明显滞后性；对于传统文本分析手段方式，微博、论坛等平台用户评论与视频弹幕相比，时间特征不明显，缺乏实时交互性与共享性，且弹幕文本相比传统评论文本具有长度短、网络用语多、信息不完整、与视频当前场景强相关等特点。因此，传统文本分析方法难以准确应对弹幕数据特征；此外，传统手段对于用户特征画像(一般只有性别、大致年龄、省级区域分布等)及分析较为单一，难以精准指导舆情分析。

因此，本发明实施例提出解决方案，可以实现社会舆情信息的精准分析与智能高效处理，提高舆情信息的准确性。

该解决方案具体提出一种基于弹幕采集的智能舆情分析方法，包括：1)采集弹幕信息以及相关用户信息；生成包含用户用网信息库以及地理信息的用户场景信息库；2)训练不同视频类别的视频描述模型，基于视频描述模型建立视频画像模型，视频画像模型中包括各个画像维度的视频画像标签以及标签权重；基于各个维度的标签权重，计算舆情监控系数；选取舆情监控系数靠前的视频作为舆情监控视频并分类生成相应描述信息，统计每个视频的描述信息的词频次数靠前的词汇作为该视频的关键词，将视频的描述信息以及关键词共同存储至舆情监控视频列表；对选取的视频集合，比较其描述信息，对相似关联度高于设定门限值的多个视频，仅保留舆情监控系数最高的视频，删除其余相似视频，并根据舆情监控系数依序选取递补视频，直至舆情监控视频列表不再变化；3)对舆情监控视频列表中的视频，读取相应用户视频弹幕数据并生成视频的弹幕基本属性分析结果，弹幕基本属性信息包括视频中出现次数排名靠前的弹幕关键词；对视频中的弹幕生成弹幕情感值评分，将同一用户发送的全部弹幕情感值评分进行加权获得该用户综合情感评分；选取弹幕情感值评分低于预设值的弹幕，根据选取的弹幕对应的用户的用户信息，生成负面弹幕用户画像；将生成的弹幕基本属性分析结果、弹幕情感分析信息、负面弹幕用户画像信息进行整合，生成弹幕分析信息并存储；

4)结合舆情监控视频列表及舆情监控系数，确定重点舆情处理优先级；对舆情处理优先级达到预设门限值的视频，基于弹幕分析信息以及舆情监控视频列表进行舆情分析，并生成相应处理方案，推送给待推送对象用于舆情处理。

具体地，参照图1，图1为本发明智能舆情分析装置所属终端设备的功能模块示意图。该智能舆情分析装置可以为独立于终端设备的、能够实现智能舆情分析的装置，其可以通过硬件或软件的形式承载于终端设备上。该终端设备可以为手机、平板电脑等智能移动终端，还可以为服务器等网络设备。

在本实施例中，该智能舆情分析装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。

存储器130中存储有操作系统以及智能舆情分析程序；输出模块110可为显示屏、扬声器等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等，通过通信模块140与外部设备或服务器进行通信。

其中，作为一种实施例方式，存储器130中的智能舆情分析程序被处理器执行时实现以下步骤：

采集用户视频弹幕数据；

进一步地，存储器130中的智能舆情分析程序被处理器执行时还实现以下步骤：

基于所述视频描述模型，建立视频画像模型；

基于所述视频画像模型，获得所关注视频的舆情监控系数；

通过网络爬虫、公共API接口或SDK埋点自动采集用户视频弹幕数据，并分类别保存；

通过平台对接采集用户XDR数据、MDT数据、MR数据；

采集工参数据；

通过爬虫或API公共接口获取场景边框数据。

对采集的视频弹幕数据进行处理，包括：对所述采集的视频弹幕数据进行清洗、融合关联，形成用户用网信息库；

基于所述用户用网信息库及经纬度匹配，并匹配所述场景边框数据，建立包含用户用网信息和地理信息的用户场景信息库。

本实施例通过上述方案，采集用户视频弹幕数据；基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。由此，可以自动采集海量用户视频弹幕数据，基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并生成智能舆情初步分析结果，可以实现重点用户精细画像、热点关键信息识别、传播及评价趋势预测、突发事件预警等分析功能及结果GIS呈现，以高效准确实现舆情自动监控及精准智能分析，实现社会舆情智能挖掘、分析与定位，提高舆情信息的准确性，为社会热点事件的监测、追踪和预防性维护提供高效准确的舆情解决方案。本发明实施例提出的基于弹幕采集的智能舆情分析方法，相比传统方法成本更低、覆盖面更全、效率更高、准确度更高。

基于上述终端设备架构但不限于上述架构，提出本发明方法实施例。

参照图2，图2为本发明智能舆情分析方法一示例性实施例的流程示意图。

如图2所示，本发明实施例提出一种智能舆情分析方法，所述方法包括以下步骤：

步骤S10，采集用户视频弹幕数据；

其中，采集用户视频弹幕数据可以包括：通过网络爬虫、公共API接口或SDK埋点自动采集用户视频弹幕数据，并分类别保存。

其中，用户视频弹幕数据主要包括视频信息、弹幕信息、用户信息。其中，视频信息主要包括：视频类别、视频url、视频ID(所述视频ID为各网站视频编号的统称，例如某网站1该字段为cid、某网站2该字段为video_id等)、视频标题、视频播放数量、视频上传时间、视频上传者信息。

所述弹幕信息主要包括：视频ID、弹幕在视频中出现的时间戳、弹幕模式、弹幕字号、弹幕颜色、弹幕unix时间戳、弹幕发送者信息、弹幕文本、IMEI、设备型号等。

所述用户信息(所述用户包括视频上传者及弹幕发送者)主要包括用户ID、用户昵称、用户等级、用户视频总播放量、用户关注人数、用户关注列表、用户好友列表等信息。

进一步地，采集用户视频弹幕数据还可以关联采集其他相关数据，包括：通过平台对接采集用户XDR数据、MDT数据、MR数据；采集工参数据；通过爬虫或API公共接口获取场景边框数据，以便通过采集的用户视频弹幕数据并结合场景边框数据、用户XDR数据、MDT数据、MR数据、工参数据等进行智能舆情分析。

进一步地，在采集用户视频弹幕数据之后，还可以对采集的用户视频弹幕数据进行处理，具体可以包括：

对所述采集的用户视频弹幕数据进行清洗、存储、融合关联，形成用户用网信息库以备后续分析使用；

基于所述用户用网信息库及经纬度匹配，并进一步匹配所述场景边框数据，建立包含用户用网信息和地理信息的用户场景信息库。

步骤S20，基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果；

具体实现时，作为一种实施方式，可以采用如下方案：

基于所述视频描述模型，建立视频画像模型；

基于所述视频画像模型生成所关注视频画像，基于生成的所关注视频画像，生成智能舆情初步分析结果。具体可以包括：

基于所述视频画像模型，获得所关注视频的舆情监控系数；

进一步地，在基于生成的相应视频描述信息生成舆情监控视频列表之后还可以包括：

步骤S30，基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息；

具体地，作为一种实施方式，可以采用如下方案：

对所述舆情监控视频列表中的所关注的视频，读取相应的用户视频弹幕数据；

基于读取的用户视频弹幕数据生成弹幕基本属性分析结果，并生成弹幕情感分析信息；

基于所述弹幕情感分析信息，选取情感值评分低于预设门限值的弹幕，生成负面弹幕用户画像结果；具体可以包括：

将读取的负面弹幕用户视频弹幕数据与之前建立的用户场景信息库进行关联，获得弹幕用户定位数据库；

最后，将生成的弹幕基本属性分析结果、弹幕情感分析信息、负面弹幕用户画像结果进行整合，生成弹幕分析信息。

步骤S40，基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析。

具体地，作为一种实施方式，可以基于所述舆情监控视频列表及对应视频的舆情监控系数计算得到重点舆情处理优先级；

进一步地，可以对舆情处理优先级达到预设门限值的视频，基于之前建立的用户场景信息库，实现舆情场景化地理呈现。

以下对本实施例方案进行详细阐述：

本发明实施例实现智能舆情分析的原理主要为：自动采集海量用户视频弹幕数据，通过机器学习算法生成视频描述信息，进一步建立多维度视频画像模型并生成舆情监控视频列表；自动采集、关联XDR数据、MDT数据、MR数据、工参数据、地理场景边框数据建立用户场景信息库。对舆情监控视频列表关注的热点视频，进一步通过机器学习算法结合用户场景信息库生成弹幕分析信息，进一步实现重点用户精细画像、热点关键信息识别、传播及评价趋势预测、突发事件预警等分析功能及结果GIS呈现，以高效准确实现舆情自动监控及精准智能分析。

本发明实施例实现智能舆情分析的具体实施流程可以参照图3所示。具体流程包括：

步骤100，数据采集；

步骤200，数据处理；

步骤300，生成所关注视频画像及智能舆情初步分析结果；

步骤400，生成弹幕分析信息；

步骤500，重点舆情智能分析定位及呈现。

具体地，对于上述步骤100，数据采集的方案阐述如下：

随着5G网络建设与互联网技术的发展，视频应用逐渐成为娱乐社交的主要模式，弹幕作为一种新型评论模式具有实时性高、互动性强等特点，已成为绝大多数视频网页/APP均具备的功能。相比传统的一般文本性评论，弹幕更能反应用户实时看法及情感，同时也使得信息传播发酵的速度与范围迅速提升。进一步地，用户使用网络观看视频等应用时，会留下海量痕迹数据，可精准反映用户细化特征。为实现后续分析，需采集海量数据，主要包括用户视频弹幕数据、场景边框数据、用户XDR数据、MDT数据、MR数据、工参数据，数据采集的具体步骤可以如图4所示，具体包括：

步骤101，用户视频弹幕数据采集；

通过网络爬虫、公共API接口或SDK埋点自动采集用户视频弹幕数据，并分类别保存。采集数据主要包括视频信息、弹幕信息、用户信息。其中，所述视频信息主要包括：视频类别、视频url、视频ID(所述视频ID为各网站视频编号的统称，例如某网站1该字段为cid、某网站2该字段为video_id等)、视频标题、视频播放数量、视频上传时间、视频上传者信息。所述弹幕信息主要包括：视频ID、弹幕在视频中出现的时间戳、弹幕模式、弹幕字号、弹幕颜色、弹幕unix时间戳、弹幕发送者信息、弹幕文本、IMEI、设备型号等。所述用户信息(所述用户包括视频上传者及弹幕发送者)主要包括用户ID、用户昵称、用户等级、用户视频总播放量、用户关注人数、用户关注列表、用户好友列表等信息。

步骤102，用户XDR数据采集；

用户XDR数据通过平台对接实现，采集数据主要包括：S1-U/S11、S1-MME原始码流，MME UE S1AP ID、IMSI/IMEI(国际移动用户识别码/国际移动装备辨识码)、LocalProvince(当前所在省份)、Local City(当前所在城市)、longitude(经度)、latitude(纬度)、First-Play-Time(首次播放时间)、Procedure Start Time(程序开始时间)、Procedure End Time(程序结束时间)、URL(统一资源定位符，又叫做网页地址)、AppName(应用名称)等。

步骤103，MDT数据采集；

MDT数据通过平台对接实现自动采集，采集数据主要包括：时间戳、Cell ID(小区标识)、IMSI/IMEI、longitude、latitude、MME UE S1AP ID等。

步骤104，MR数据采集；

MR数据可通过平台对接实现自动采集，采集数据主要包括：时间戳、MME UE S1APID、eNB ID、Cell ID、Location-longitude、Location-latitude等。

步骤105，工参数据采集；

工参数据需采集数据主要包括：省份、地市、区县、网元名称、小区名称、CGI、CellID、覆盖类型、覆盖场景等。

步骤106，场景边框数据采集；

通过爬虫或API公共接口获取场景边框数据，具体包括：获取POI标识uid，进一步根据获取的POI uid，解析出POI名称、POI边界坐标集合、POI行业分类等信息。通过坐标转换，将解析出的POI边界坐标集合转换为经纬度格式，形成场景边框数据。

进一步地，对采集的数据还可以进行数据清洗和存储，如图4所示，还包括：

步骤107，数据清洗；

数据清洗主要是对上述步骤采集的海量数据分类进行解析、格式转化、物理含义相同字段归一化处理、大小写统一、空格等无意义字符删除等数据处理操作。

步骤108，数据存储；

将上述步骤输出的可用于分析应用格式的海量数据，存储到数据单元。

需要说明的是，上述步骤107数据清洗也可以归集到下述数据处理环节，对此不作具体限定。

具体地，对于上述步骤200，数据处理的方案阐述如下：

在进行后续分析之前，需要对采集的海量数据进行融合关联以备后续分析，如图5所示，主要包括如下步骤：

步骤201，数据融合关联；

通过时间戳、IMEI、IMSI、MME UE S1AP ID、Cell ID、eNB ID关联用户XDR数据、MDT数据、MR数据与工参数据，形成包含时间戳、服务小区信息、GPS经纬度信息、用户标识(IMSI/IMEI)、用户网络行为信息(url)的用户用网信息库。

步骤202，建立用户场景信息库；

基于所述用户用网信息库及经纬度匹配，进一步匹配所述场景边框数据，形成包含用户用网信息和POI等地理信息的用户场景信息库。

具体地，对于上述步骤300，生成所关注视频画像及智能舆情初步分析结果的方案阐述如下：

本方案考虑到：上述步骤所采集的视频数据可能存在内容相似、背景相似、因果关联等内在联系，此外，视频类别、发布者影响力等方面的差异也是舆情分析的重要指标。因此，本实施例方案建立了一种基于视频描述信息的视频画像模型，并进一步基于该模型生成智能舆情初步分析结果。如图6所示，具体步骤如下：

步骤301，基于所采集的用户视频弹幕数据进行分类别的视频描述模型训练。

具体的，将前述步骤采集的视频信息，依照不同视频类别划分为多个子集，并进一步对每个子集使用多种机器学习算法进行训练，进一步通过结果评价比较不同算法对应各子集性能，并选择各子集最优描述模型。

可选的，所述视频描述算法可选择OA-BTG、MARN、MLE+HybirdDis等。

步骤302，基于上述步骤获取的针对不同类别的视频描述模型，建立视频画像模型。

具体地，所述视频画像模型如下表1所示：

表1.视频画像模型

其中，所述相似视频关联度可采用PSNR、SSIM等算法计算，各标签权重可采用TF-IDF、相关系数矩阵权重归类、支持向量机等算法获取。

进一步地，基于所述视频画像模型，可以采用如下公式计算所关注视频的舆情监控系数Vy＝L(Vb，Vs，Vc)，其中L(·)可选择线性回归、卷积神经网络等算法。

步骤303，生成智能舆情初步分析结果并存储。具体包括：

步骤3031，基于前述步骤获取的视频描述模型及视频画像模型，选取舆情监控系数排名靠前(例如前50名)的视频作为舆情监控视频(视频标识及其url)并分类生成相应描述信息，对生成的相应描述信息分别通过分词工具(比如jieba工具)分词，进一步进行词频统计、排序后，将词频次数靠前(例如前5名)的词汇作为该视频的关键词，将该视频的关键词与该视频的描述信息共同存储至所述舆情监控视频列表。

步骤3032，对步骤3031选取的视频集合，比较其描述信息，对相似关联度(相似视频关联度)高于设定门限值vt(例如80％)的多个视频，仅保留舆情监控系数最高的视频，删除其余相似视频，并根据舆情监控系数依序选取递补视频，直至舆情监控视频列表不再变化。

步骤3033，将最终生成的舆情监控视频列表(主要包括视频标识、视频url、视频描述信息、视频关键词等信息)作为智能舆情初步分析结果进行保存。

具体地，对于上述步骤400，生成弹幕分析信息的方案阐述如下：

在获取舆情监控视频列表及相应舆情初步分析结果后，进一步结合前述步骤获取的用户视频弹幕数据与用户场景边框数据生成弹幕分析信息，如图7所示，具体步骤如下：

步骤401，对舆情监控视频列表中的视频，读取相应用户视频弹幕数据并生成弹幕基本属性分析结果。其中所述弹幕基本属性分析主要包括：

步骤4011，通过弹幕在视频中出现的时间戳及弹幕unix时间戳，统计发送弹幕随视频播放时间分布情况及自然时间分布情况，识别视频高热度片段及用户上网密集时段并保存结果；

步骤4012，通过弹幕发送者信息，统计各用户发送弹幕数量及内容(即弹幕文本)；

步骤4013，通过对弹幕文本进行分词及词频统计，选取出现次数排名靠前的(例如前5名)作为视频弹幕关键词。

步骤402，生成弹幕情感分析信息。主要包括：

步骤4021，对每一个所关注视频，将采集到的视频弹幕数据进行分词及停用词删除处理，并进行保存。其中可使用的分词工具包括但不限于Pymmseg-cpp、Loso、Jieba。所述停用词可示例性地使用已发布的中文停用词表；

步骤4022，将上一步骤结果进行向量转化，可示例性地使用Word2Vec、Bag ofWords等模型；

步骤4023，设弹幕情感值评分df∈[-10，10]，其中df∈Z。将向量转化后的结果作为输入，将弹幕情感值评分作为输出，使用神经网络、随机森林、支持向量机等机器学习算法输出每条弹幕的情感值评分并保存。

步骤4024，可选的，将视频每条弹幕情感值评分与相应用户等级、用户关注人数进行加权可得出该视频综合情感评分并保存；将同一用户发送的全部弹幕情感值评分进行加权可得出该用户综合情感评分并保存。

步骤403，对上一步骤输出的弹幕情感分析信息，选取情感值评分df低于预设门限值Ne(比如，可设置为-5)的弹幕，生成负面弹幕用户画像结果。具体包括：

步骤4031，读取情感值评分df低于预设门限值Ne的负面弹幕用户视频弹幕数据，通过时间戳、IMEI、url等字段，将读取的用户视频弹幕数据与用户场景信息库进行关联，获得包含时间戳、弹幕信息、视频信息、用户ID、用户昵称、用户等级、用户视频总播放量、用户关注人数、用户关注列表、用户上网行为(url)、占用服务小区信息、GPS经纬度信息、用户标识(IMSI/IMEI)、POI地理信息等的弹幕用户定位数据库。

步骤4032，基于建立的所述弹幕用户定位数据库，可实现相关用户精细画像。

更具体地，可实现分析定位所关注负面弹幕用户的日常上网时段、常驻地点(比如，常驻POI名称、常驻POI行业分类、日常活动轨迹等，且可进一步通过服务小区工参信息定位室内场景楼层范围)、用户历史上传视频信息、用户主要关注者信息(用户ID、用户昵称)、用户好友列表等，同时基于GPS级精准位置信息实现所关注负面弹幕用户分布GIS化呈现。

步骤404，将生成的弹幕基本属性分析结果、弹幕情感分析信息、负面弹幕用户画像信息进行整合，生成弹幕分析信息并存储。

具体地，对于上述步骤500，重点舆情智能分析定位及呈现的方案阐述如下：

在获取所述弹幕分析信息、视频画像及智能舆情初步分析结果后，可实现重点舆情智能分析定位及结果呈现，如图8所示，其实现步骤如下：

步骤501，重点舆情优先级判断；

通过上述步骤获取的舆情监控视频列表及舆情监控系数，进一步结合视频上传时间、地点、类别、弹幕数量与综合情感评分等加权得出重点舆情处理优先级。

步骤502，对优先级达到阈值的舆情，基于所述智能舆情初步分析结果及所述弹幕分析信息，形成包含热点事件识别、重点用户精细化画像、突发事件预警的综合智能舆情分析方案，进一步对优先级达到阈值事件结合GPS级精准位置信息实现舆情场景化地理呈现；

对舆情处理优先级达到预设门限值的视频，基于所述智能舆情初步分析结果及所述弹幕分析信息，实现热点关键词识别、舆情摘要自动生成、过激评论/恶意发布负面用户精细画像、传播路径预测(例如，可通过用户关注列表与好友列表等预测传播路径)、事件趋势分析(例如，可进行情感趋势、时空发展趋势等分析)等综合智能舆情分析并生成相应方案。

进一步地，基于包含GPS级精准位置信息的用户场景信息库，可实现舆情行业分布、关注度、关键词地理化分布、情感地理化分布等舆情GIS化呈现，并实现所关注用户精准定位等功能。

步骤503，结论输出及推送。

通过所述基于弹幕采集的智能舆情分析方法，可实现准确、全面、动态的智能化舆情自动分析，及时监控预警重大热点事件，实现热点视频及重点用户多维度精准画像，提供自动有效舆情分析依据及解决方案并推送政府、企业、媒体等，为政府监管、品牌形象维护、媒体公正监督、社会和谐稳定提供有力支撑。

本发明实施例方案，通过自动采集海量用户视频弹幕数据，并关联场景边框数据、用户XDR数据、MDT数据、MR数据、工参数据，提出了一种基于弹幕采集的智能舆情分析方法，相比传统方法具有以下优势：

成本更低：需采集数据通过平台对接自动完成，且可自动生成智能舆情分析方案，相比传统人工监控分析舆情可节省大量人力物力；

覆盖面更全：本方案包含海量用户行为、场景及位置信息数据，样本丰富，可避免传统方案局限性及偏差性；

效率更高：可实现实时采集分析、挖掘及方案输出，快速识别热点事件、关键词等，及时掌握舆情发展态势及民众情绪，实现舆情智能预警、分析、追踪等；

准确度更高：由于视频应用及弹幕的实时互动性，可快速、广泛、深入、真实地表现网络舆情，本实施例方案中，所提视频画像模型及负面弹幕用户画像模型，相比传统方案，可准确识别热点事件特征，并实现网络舆情(如关注度、情感分布)、负面用户追踪、精准定位及呈现等功能，相比传统方案更加准确，精度显著提高。

采集模块，用于采集用户视频弹幕数据；

本实施例实现智能舆情分析的原理及实施过程，请参照上述各实施例，在此不再赘述。

此外，本发明实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上述实施例所述的智能舆情分析方法。

由于本智能舆情分析程序被处理器执行时，采用了前述所有实施例的全部技术方案，因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果，在此不再一一赘述。

此外，本发明实施例还提出一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例所述的智能舆情分析方法。

此外，本发明实施例还提出一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现如上述实施例所述的智能舆情分析方法。

此外，本发明实施例还提出一种流媒体网关动态组网装置，所述流媒体网关动态组网装置包括：

加入请求接收模块，用于接收客户端发送的加入目标会话的会话加入请求消息；

记录模块，用于根据所述会话加入请求消息选择目标网关加入所述目标会话，记录已加入所述目标会话的当前会话网关列表；

发送模块，用于将所述目标会话已创建的消息通知给所述目标网关，将所述目标网关的地址通知给所述当前会话网关列表中的其他网关，以供所述其他网关与所述目标网关建立传输通道；以及将所述目标网关的地址返回给所述客户端。

本实施例实现流媒体网关动态组网的原理及实施过程，请参照上述各实施例，在此不再赘述。

离开请求接收模块，用于接收客户端发送的离开目标会话的会话离开请求消息；

查找模块，用于根据所述会话离开请求消息查找所述客户端关联的目标网关；

删除模块，用于从所述客户端关联的目标网关已分配的客户端列表中删除所述客户端；

判断通知模块，用于若所述客户端列表为空，则判定所述目标网关离开所述目标会话，并将所述目标网关离开所述目标会话的消息通知所述目标会话所属会话网络的当前会话网关列表中的其他网关，以供所述其他网关断开与所述目标网关的传输通道，使得所述目标网关离开所述会话网络。

此外，本发明实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的流媒体网关动态组网程序，所述流媒体网关动态组网程序被所述处理器执行时实现如上述实施例所述的流媒体网关动态组网方法的步骤。

由于本流媒体网关动态组网程序被处理器执行时，采用了前述所有实施例的全部技术方案，因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果，在此不再一一赘述。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有流媒体网关动态组网程序，所述流媒体网关动态组网程序被处理器执行时实现如上述实施例所述的流媒体网关动态组网方法的步骤。

相比现有技术，本发明实施例提出的流媒体网关动态组网方法、装置、系统、终端设备及介质，通过接收客户端发送的加入目标会话的会话加入请求消息；根据所述会话加入请求消息选择目标网关加入所述目标会话，记录已加入所述目标会话的当前会话网关列表；将所述目标会话已创建的消息通知给所述目标网关，将所述目标网关的地址通知给所述当前会话网关列表中的其他网关，以供所述其他网关与所述目标网关建立传输通道；将所述目标网关的地址返回给所述客户端。本方案可以根据客户端加入或离开会话动态调整流媒体网关(比如WebRTC网关)的组网拓扑，流媒体网关负责将客户端流量转发到与会话相关的会话网络的其他流媒体网关节点，再由其他流媒体网关相关节点将流量推送给会话网络的其他客户端，从而减少网关集群内无效流量的转发。

相比现有技术，本发明方案实现以会话为单位，通过信令服务控制流媒体网关动态加入和/或离开会话网络，可以动态调整流媒体网关的网络拓扑功能，实现对网络流量的精细化调度管理，实现网络资源的有效利用。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，被控终端，或者网络设备等)执行本发明每个实施例的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种智能舆情分析方法，其特征在于，所述方法包括以下步骤：

采集用户视频弹幕数据；

2.根据权利要求1所述的智能舆情分析方法，其特征在于，所述基于所采集的所述用户视频弹幕数据，生成所关注视频画像，并基于生成的所关注视频画像，生成智能舆情初步分析结果的步骤包括：

基于所述视频描述模型，建立视频画像模型；

3.根据权利要求2所述的智能舆情分析方法，其特征在于，所述基于所述视频画像模型生成所关注视频画像，基于生成的所关注视频画像，生成智能舆情初步分析结果的步骤包括：

基于所述视频画像模型，获得所关注视频的舆情监控系数；

4.根据权利要求3所述的智能舆情分析方法，其特征在于，所述基于生成的相应视频描述信息生成舆情监控视频列表的步骤之后还包括：

5.根据权利要求4所述的智能舆情分析方法，其特征在于，所述基于所采集的所述用户视频弹幕数据以及所述智能舆情初步分析结果生成弹幕分析信息的步骤包括：

6.根据权利要求5所述的智能舆情分析方法，其特征在于，所述基于所述弹幕情感分析信息，选取情感值评分低于预设门限值的弹幕，生成负面弹幕用户画像结果的步骤包括：

7.根据权利要求3-6中任一项所述的智能舆情分析方法，其特征在于，所述基于所述智能舆情初步分析结果以及弹幕分析信息进行视频舆情分析的步骤包括：

对舆情处理优先级达到预设门限值的视频，基于所述智能舆情初步分析结果及所述弹幕分析信息，形成综合智能舆情分析方案，并将舆情分析结果对外输出和/或推送；和/或对舆情处理优先级达到预设门限值的视频，基于预先建立的用户场景信息库，实现舆情场景化地理呈现。

8.一种智能舆情分析装置，其特征在于，所述智能舆情分析装置包括：

采集模块，用于采集用户视频弹幕数据；

9.一种终端设备，其特征在于，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的智能舆情分析方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的智能舆情分析方法。