CN113590918A - 基于课程式学习的社交媒体舆情热度监测的框架构建方法 - Google Patents

基于课程式学习的社交媒体舆情热度监测的框架构建方法 Download PDF

Info

Publication number
CN113590918A
CN113590918A CN202110786417.5A CN202110786417A CN113590918A CN 113590918 A CN113590918 A CN 113590918A CN 202110786417 A CN202110786417 A CN 202110786417A CN 113590918 A CN113590918 A CN 113590918A
Authority
CN
China
Prior art keywords
features
learning
label
social media
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110786417.5A
Other languages
English (en)
Inventor
陈维龙
洪峰
王岩
张彦如
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110786417.5A priority Critical patent/CN113590918A/zh
Publication of CN113590918A publication Critical patent/CN113590918A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,包括如下步骤:S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征;S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;S3:进行课程式学习的步骤;S4:使用长短期记忆和最大池化生成最终图像特征,将最终图像和标签特征结合经过全连接层的处理最终得到热度预测结果。本发明提出了一种新的方案CL‑WMTG,通过基于图片和文字的多模态信息以提高社交媒体舆情信息热度的准确度。该框架可以应用在其他用户各类交际信息场景和其他图文发表中进行相关预测。同时的wide transformer模型中的wide可以增加更多的各类信息。

Description

基于课程式学习的社交媒体舆情热度监测的框架构建方法
技术领域
本发明具体涉及一种基于课程式学习的社交媒体舆情热度监测的框架构建方法。
背景技术
目前使用各类社交媒体的用户越来越多,随之产生越来越多的包含图文的博文和访问记录。并且用户的发言行为会引导舆情的走向,从而会在行为上和思想上影响他人。为了控制舆情尤其是敏感舆情的传播,平台需要对大量包含舆情引导的博文数据进行分析,提取热门舆情。然而,传统的卷积神经网络可以提取图片中的目标,并针对图片数据进行分析,不能对图片中表示的含义进行深入理解。基于注意力机制的Transformer将文本信息并行处理,分析词语之间的联系,并决定为某一短语赋予一定的注意力,从而可用于提取文本信息及时间序列数据等特征。这些模型将图片和文字信息分开建模之后进行预测,没有有效利用图片信息和文字信息,也没有对多模态信息由深入的交叉感知,不能很好得提取文本和图像特征。利用简单的信息融合方式混合处理图片和文字信息,会使得模型混淆图片和文本信息,使得模型难以分辨出文字和图片各自的信息,导致预测结果非常差,模型收敛性弱。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,该基于课程式学习的社交媒体舆情热度监测的框架构建方法可以很好地解决上述问题。
为达到上述要求,本发明采取的技术方案是:提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,该基于课程式学习的社交媒体舆情热度监测的框架构建方法包括如下步骤:
S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征;
S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;
S3:进行课程式学习的步骤;
第一步将目标图像特征、标签、用户其他信息输入Transformer中,学习图像特征和标签数据的组合特征;
第二步输出增强后的图像特征到Transformer中,进一步学习图像数据等数据的特征;
S4:使用长短期记忆和最大池化生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果。
该基于课程式学习的社交媒体舆情热度监测的框架构建方法具有的优点如下:
本发明使用更高效的CL-WMTG框架处理包含舆情信息的博文中的文字和图片,框架主体是transformer,输入文本和图片的特征后,该模型可以完全利用图片和文字之间的信息,并对多模态信息进行深入的交叉感知;同时,采用课程式学习方法,从易到难分步学习图片包含的特征,使得模型的收敛速度比原始模型快了数倍,热度预测的准确率也增强了很多。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的结构示意图。
图2示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的图片目标特征聚合示意图。
图3示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的总体模型框架示意图。
图4示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的两阶段课程式学习示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本申请作进一步地详细说明。
在以下描述中,对“一个实施例”、“实施例”、“一个示例”、“示例”等等的引用表明如此描述的实施例或示例可以包括特定特征、结构、特性、性质、元素或限度,但并非每个实施例或示例都必然包括特定特征、结构、特性、性质、元素或限度。另外,重复使用短语“根据本申请的一个实施例”虽然有可能是指代相同实施例,但并非必然指代相同的实施例。
为简单起见,以下描述中省略了本领域技术人员公知的某些技术特征。
根据本申请的一个实施例,提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,包括:
步骤S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入(wordembedding)将单词映射成向量从而获取标签特征;
步骤S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;
步骤S3:使用课程式学习方法,第一步将目标图像特征、标签、用户其他信息输入Transformer中,学习图像特征和标签数据的组合特征;第二步输出增强后的图像特征到Transformer中,进一步学习图像数据等数据的特征;
步骤S4:使用长短期记忆(LSTM)和最大池化(Max-Pooling)生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果。
根据本申请的一个实施例,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S1包括步骤:
通过Faster R-CNN预训练模型获得图像中包含的目标
Figure BDA0003159350730000041
其中K代表图像中有K个检测目标,每个目标所得的特征是d维。将整个图中所有目标整合起来就是:
Figure BDA0003159350730000042
通过word embedding提取标签汇总的文字信息,得到原始文字特征:
Figure BDA0003159350730000043
其中
Figure BDA0003159350730000044
代表标签的特征,kt代表标签的长度。
根据本申请的一个实施例,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S2包括步骤:
建立图
Figure BDA0003159350730000045
代表K个关系之间的关系矩阵,并且图G中每条边的权重定义为G=(F0·Wi+bi)·((F0·Wj+bj),其中
Figure BDA0003159350730000046
这些参数都是预先指定的参数。
根据本申请的一个实施例,如图2所示,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中的聚合图G中的相关特征,图聚合后的特征定义为
Figure BDA0003159350730000047
该特征不仅考虑物体本身的特征,还考虑了周围环境的特征。该特征的基于图的组合可以解释不通图片中对象的差异。
根据本申请的一个实施例,如图3、图4所示,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S3包括步骤:
课程式学习的第1阶段(phase1)输入的图像特征是由图像特征和标签特征组合在一起的特征,表示为:
Figure BDA0003159350730000051
其中fow为目标类别等信息的词嵌入,ft是标签信息的词嵌入。
将这些特征输入到Transformer中,得到经过增强的特征
Figure BDA0003159350730000052
即:
Figure BDA0003159350730000053
课程式学习的第2阶段(phase2)输入的图像特征如下:
Figure BDA0003159350730000054
其中,
Figure BDA0003159350730000055
是经过S2聚合后的图像特征。
将这些特征输入到Transformer中,得到经过增强的特征
Figure BDA0003159350730000056
即:
Figure BDA0003159350730000057
根据本申请的一个实施例,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S4包括步骤:
将经过长短期记忆和最大池化处理后的特征与标签特征拼接成一个向量。
将该向量输入全连接层后,得到最终博文的流行度:
Figure BDA0003159350730000058
其中W和b表示全连接网络的权重。
以上所述实施例仅表示本发明的几种实施方式,其描述较为具体和详细,但并不能理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明保护范围。因此本发明的保护范围应该以所述权利要求为准。

Claims (7)

1.一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于:包括如下步骤:
S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征;
S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;
S3:进行课程式学习的步骤;
第一步将目标图像特征、标签、用户其他信息输入Transformer中,学习图像特征和标签数据的组合特征;
第二步输出增强后的图像特征到Transformer中,进一步学习图像数据等数据的特征;
S4:使用长短期记忆和最大池化生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果。
2.根据权利要求1所述的基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于,S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征包括如下步骤:
通过Faster R-CNN预训练模型获得图像中包含的目标
Figure FDA0003159350720000011
其中K代表图像中有K个检测目标,每个目标所得的特征是d维;
将整个图中所有目标整合起来为:
Figure FDA0003159350720000012
3.根据权利要求1所述的基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于,S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征包括如下步骤:
通过word embedding提取标签汇总的文字信息,得到原始文字特征:
Figure FDA0003159350720000021
其中
Figure FDA0003159350720000022
代表标签的特征,kt代表标签的长度。
4.根据权利要求1所述的基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于:S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征包括如下步骤:
建立图
Figure FDA0003159350720000023
代表K个关系之间的关系矩阵,并且图G中每条边的权重定义为G=(F0·Wi+bi)·((F0·Wj+bj);
其中
Figure FDA0003159350720000024
均为预先指定的参数。
5.根据权利要求4所述的基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于:聚合图G中的相关特征,图聚合后的特征定义为
Figure FDA0003159350720000025
该特征不仅考虑物体本身的特征,还考虑了周围环境的特征;
该特征的基于图的组合可以解释不通图片中对象的差异。
6.根据权利要求1所述的基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于,S3:进行课程式学习的步骤具体包括:
课程式学习的第1阶段输入的图像特征是由图像特征和标签特征组合在一起的特征,表示为:
Figure FDA0003159350720000026
其中fow为目标类别等信息的词嵌入,ft是标签信息的词嵌入;
将这些特征输入到Transformer中,得到经过增强的特征
Figure FDA0003159350720000027
即:
Figure FDA0003159350720000028
课程式学习的第2阶段输入的图像特征如下:
Figure FDA0003159350720000029
其中,
Figure FDA0003159350720000031
是经过S2聚合后的图像特征;
将这些特征输入到Transformer中,得到经过增强的特征
Figure FDA0003159350720000032
即:
Figure FDA0003159350720000033
7.根据权利要求1所述的基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于,S4:使用长短期记忆和最大池化生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果包括如下步骤:
将经过长短期记忆和最大池化处理后的特征与标签特征拼接成一个向量;
将该向量输入全连接层后,得到最终博文的流行度:
Figure FDA0003159350720000034
其中W和b表示全连接网络的权重。
CN202110786417.5A 2021-07-12 2021-07-12 基于课程式学习的社交媒体舆情热度监测的框架构建方法 Pending CN113590918A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110786417.5A CN113590918A (zh) 2021-07-12 2021-07-12 基于课程式学习的社交媒体舆情热度监测的框架构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110786417.5A CN113590918A (zh) 2021-07-12 2021-07-12 基于课程式学习的社交媒体舆情热度监测的框架构建方法

Publications (1)

Publication Number Publication Date
CN113590918A true CN113590918A (zh) 2021-11-02

Family

ID=78247090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110786417.5A Pending CN113590918A (zh) 2021-07-12 2021-07-12 基于课程式学习的社交媒体舆情热度监测的框架构建方法

Country Status (1)

Country Link
CN (1) CN113590918A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782739A (zh) * 2022-03-31 2022-07-22 电子科技大学 基于双向长短期记忆层和全连接层的多模态分类模型

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN110377710A (zh) * 2019-06-17 2019-10-25 杭州电子科技大学 一种基于多模态融合的视觉问答融合增强方法
CN110852368A (zh) * 2019-11-05 2020-02-28 南京邮电大学 全局与局部特征嵌入及图文融合的情感分析方法与系统
CN111209401A (zh) * 2020-01-03 2020-05-29 西安电子科技大学 网络舆情文本信息情感极性分类处理系统及方法
CN111680484A (zh) * 2020-05-29 2020-09-18 北京理工大学 一种视觉常识推理问答题的答题模型生成方法和系统
CN111950296A (zh) * 2020-08-21 2020-11-17 桂林电子科技大学 一种基于bert微调模型的评论目标情感分析
CN112036659A (zh) * 2020-09-09 2020-12-04 中国科学技术大学 基于组合策略的社交网络媒体信息流行度预测方法
CN112819013A (zh) * 2021-01-29 2021-05-18 厦门大学 基于层内层间联合全局表示的图像描述方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN110377710A (zh) * 2019-06-17 2019-10-25 杭州电子科技大学 一种基于多模态融合的视觉问答融合增强方法
CN110852368A (zh) * 2019-11-05 2020-02-28 南京邮电大学 全局与局部特征嵌入及图文融合的情感分析方法与系统
CN111209401A (zh) * 2020-01-03 2020-05-29 西安电子科技大学 网络舆情文本信息情感极性分类处理系统及方法
CN111680484A (zh) * 2020-05-29 2020-09-18 北京理工大学 一种视觉常识推理问答题的答题模型生成方法和系统
CN111950296A (zh) * 2020-08-21 2020-11-17 桂林电子科技大学 一种基于bert微调模型的评论目标情感分析
CN112036659A (zh) * 2020-09-09 2020-12-04 中国科学技术大学 基于组合策略的社交网络媒体信息流行度预测方法
CN112819013A (zh) * 2021-01-29 2021-05-18 厦门大学 基于层内层间联合全局表示的图像描述方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEILONG CHEN等: "Curriculum Learning for Wide Multimedia-Based Transformer with Graph Target Detection" *
李奥;但志平;董方敏;刘龙文;冯阳;: "基于改进生成对抗网络的谣言检测方法" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782739A (zh) * 2022-03-31 2022-07-22 电子科技大学 基于双向长短期记忆层和全连接层的多模态分类模型

Similar Documents

Publication Publication Date Title
KR101865102B1 (ko) 시각 문답을 위한 시스템 및 방법
CN111126069B (zh) 一种基于视觉对象引导的社交媒体短文本命名实体识别方法
CN111488931B (zh) 文章质量评估方法、文章推荐方法及其对应的装置
Baroni Grounding distributional semantics in the visual world
CN112860888B (zh) 一种基于注意力机制的双模态情感分析方法
CN108009293A (zh) 视频标签生成方法、装置、计算机设备和存储介质
CN107391760A (zh) 用户兴趣识别方法、装置及计算机可读存储介质
CN104142995B (zh) 基于视觉属性的社会事件识别方法
CN107391505A (zh) 一种图像处理方法及系统
CN109726718B (zh) 一种基于关系正则化的视觉场景图生成系统及方法
CN108108468A (zh) 一种基于概念和文本情感的短文本情感分析方法和装置
CN111475622A (zh) 一种文本分类方法、装置、终端及存储介质
EP4060548A1 (en) Method and device for presenting prompt information and storage medium
CN112800225B (zh) 一种微博评论情绪分类方法和系统
CN111159409A (zh) 基于人工智能的文本分类方法、装置、设备、介质
CN109815485A (zh) 一种微博短文本情感极性识别的方法、装置及存储介质
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
Pande et al. Development and deployment of a generative model-based framework for text to photorealistic image generation
CN109635303B (zh) 特定领域意义改变词的识别方法
CN114417874A (zh) 一种基于图注意力网络的中文命名实体识别方法和系统
CN113627550A (zh) 一种基于多模态融合的图文情感分析方法
CN113590918A (zh) 基于课程式学习的社交媒体舆情热度监测的框架构建方法
CN111859925B (zh) 一种基于概率情感词典的情感分析系统及方法
CN111445545B (zh) 一种文本转贴图方法、装置、存储介质及电子设备
CN110309355A (zh) 内容标签的生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211102

RJ01 Rejection of invention patent application after publication