CN113590918A - 基于课程式学习的社交媒体舆情热度监测的框架构建方法 - Google Patents
基于课程式学习的社交媒体舆情热度监测的框架构建方法 Download PDFInfo
- Publication number
- CN113590918A CN113590918A CN202110786417.5A CN202110786417A CN113590918A CN 113590918 A CN113590918 A CN 113590918A CN 202110786417 A CN202110786417 A CN 202110786417A CN 113590918 A CN113590918 A CN 113590918A
- Authority
- CN
- China
- Prior art keywords
- features
- learning
- label
- social media
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 24
- 238000012544 monitoring process Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 13
- 239000013598 vector Substances 0.000 claims abstract description 10
- 238000001514 detection method Methods 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims abstract description 7
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 238000011176 pooling Methods 0.000 claims abstract description 6
- 230000015654 memory Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000004220 aggregation Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,包括如下步骤:S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征;S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;S3:进行课程式学习的步骤;S4:使用长短期记忆和最大池化生成最终图像特征,将最终图像和标签特征结合经过全连接层的处理最终得到热度预测结果。本发明提出了一种新的方案CL‑WMTG,通过基于图片和文字的多模态信息以提高社交媒体舆情信息热度的准确度。该框架可以应用在其他用户各类交际信息场景和其他图文发表中进行相关预测。同时的wide transformer模型中的wide可以增加更多的各类信息。
Description
技术领域
本发明具体涉及一种基于课程式学习的社交媒体舆情热度监测的框架构建方法。
背景技术
目前使用各类社交媒体的用户越来越多,随之产生越来越多的包含图文的博文和访问记录。并且用户的发言行为会引导舆情的走向,从而会在行为上和思想上影响他人。为了控制舆情尤其是敏感舆情的传播,平台需要对大量包含舆情引导的博文数据进行分析,提取热门舆情。然而,传统的卷积神经网络可以提取图片中的目标,并针对图片数据进行分析,不能对图片中表示的含义进行深入理解。基于注意力机制的Transformer将文本信息并行处理,分析词语之间的联系,并决定为某一短语赋予一定的注意力,从而可用于提取文本信息及时间序列数据等特征。这些模型将图片和文字信息分开建模之后进行预测,没有有效利用图片信息和文字信息,也没有对多模态信息由深入的交叉感知,不能很好得提取文本和图像特征。利用简单的信息融合方式混合处理图片和文字信息,会使得模型混淆图片和文本信息,使得模型难以分辨出文字和图片各自的信息,导致预测结果非常差,模型收敛性弱。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,该基于课程式学习的社交媒体舆情热度监测的框架构建方法可以很好地解决上述问题。
为达到上述要求,本发明采取的技术方案是:提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,该基于课程式学习的社交媒体舆情热度监测的框架构建方法包括如下步骤:
S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征;
S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;
S3:进行课程式学习的步骤;
第一步将目标图像特征、标签、用户其他信息输入Transformer中,学习图像特征和标签数据的组合特征;
第二步输出增强后的图像特征到Transformer中,进一步学习图像数据等数据的特征;
S4:使用长短期记忆和最大池化生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果。
该基于课程式学习的社交媒体舆情热度监测的框架构建方法具有的优点如下:
本发明使用更高效的CL-WMTG框架处理包含舆情信息的博文中的文字和图片,框架主体是transformer,输入文本和图片的特征后,该模型可以完全利用图片和文字之间的信息,并对多模态信息进行深入的交叉感知;同时,采用课程式学习方法,从易到难分步学习图片包含的特征,使得模型的收敛速度比原始模型快了数倍,热度预测的准确率也增强了很多。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的结构示意图。
图2示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的图片目标特征聚合示意图。
图3示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的总体模型框架示意图。
图4示意性地示出了根据本申请一个实施例的基于课程式学习的社交媒体舆情热度监测的框架构建方法的两阶段课程式学习示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本申请作进一步地详细说明。
在以下描述中,对“一个实施例”、“实施例”、“一个示例”、“示例”等等的引用表明如此描述的实施例或示例可以包括特定特征、结构、特性、性质、元素或限度,但并非每个实施例或示例都必然包括特定特征、结构、特性、性质、元素或限度。另外,重复使用短语“根据本申请的一个实施例”虽然有可能是指代相同实施例,但并非必然指代相同的实施例。
为简单起见,以下描述中省略了本领域技术人员公知的某些技术特征。
根据本申请的一个实施例,提供一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,包括:
步骤S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入(wordembedding)将单词映射成向量从而获取标签特征;
步骤S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;
步骤S3:使用课程式学习方法,第一步将目标图像特征、标签、用户其他信息输入Transformer中,学习图像特征和标签数据的组合特征;第二步输出增强后的图像特征到Transformer中,进一步学习图像数据等数据的特征;
步骤S4:使用长短期记忆(LSTM)和最大池化(Max-Pooling)生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果。
根据本申请的一个实施例,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S1包括步骤:
根据本申请的一个实施例,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S2包括步骤:
根据本申请的一个实施例,如图2所示,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中的聚合图G中的相关特征,图聚合后的特征定义为该特征不仅考虑物体本身的特征,还考虑了周围环境的特征。该特征的基于图的组合可以解释不通图片中对象的差异。
根据本申请的一个实施例,如图3、图4所示,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S3包括步骤:
课程式学习的第1阶段(phase1)输入的图像特征是由图像特征和标签特征组合在一起的特征,表示为:
其中fow为目标类别等信息的词嵌入,ft是标签信息的词嵌入。
课程式学习的第2阶段(phase2)输入的图像特征如下:
根据本申请的一个实施例,该基于课程式学习的社交媒体舆情热度监测的框架构建方法中步骤S4包括步骤:
将经过长短期记忆和最大池化处理后的特征与标签特征拼接成一个向量。
将该向量输入全连接层后,得到最终博文的流行度:
其中W和b表示全连接网络的权重。
以上所述实施例仅表示本发明的几种实施方式,其描述较为具体和详细,但并不能理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明保护范围。因此本发明的保护范围应该以所述权利要求为准。
Claims (7)
1.一种基于课程式学习的社交媒体舆情热度监测的框架构建方法,其特征在于:包括如下步骤:
S1:使用基于目标检测的预训练模型获得图像特征,使用词嵌入将单词映射成向量从而获取标签特征;
S2:构建基于目标和周围环境的全连接图模型,更新训练过程中的图片特征;
S3:进行课程式学习的步骤;
第一步将目标图像特征、标签、用户其他信息输入Transformer中,学习图像特征和标签数据的组合特征;
第二步输出增强后的图像特征到Transformer中,进一步学习图像数据等数据的特征;
S4:使用长短期记忆和最大池化生成最终图像特征,并将最终图像特征和标签特征结合经过全连接层的处理最终得到热度预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110786417.5A CN113590918A (zh) | 2021-07-12 | 2021-07-12 | 基于课程式学习的社交媒体舆情热度监测的框架构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110786417.5A CN113590918A (zh) | 2021-07-12 | 2021-07-12 | 基于课程式学习的社交媒体舆情热度监测的框架构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113590918A true CN113590918A (zh) | 2021-11-02 |
Family
ID=78247090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110786417.5A Pending CN113590918A (zh) | 2021-07-12 | 2021-07-12 | 基于课程式学习的社交媒体舆情热度监测的框架构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113590918A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782739A (zh) * | 2022-03-31 | 2022-07-22 | 电子科技大学 | 基于双向长短期记忆层和全连接层的多模态分类模型 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543084A (zh) * | 2018-11-09 | 2019-03-29 | 西安交通大学 | 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法 |
CN110377710A (zh) * | 2019-06-17 | 2019-10-25 | 杭州电子科技大学 | 一种基于多模态融合的视觉问答融合增强方法 |
CN110852368A (zh) * | 2019-11-05 | 2020-02-28 | 南京邮电大学 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
CN111209401A (zh) * | 2020-01-03 | 2020-05-29 | 西安电子科技大学 | 网络舆情文本信息情感极性分类处理系统及方法 |
CN111680484A (zh) * | 2020-05-29 | 2020-09-18 | 北京理工大学 | 一种视觉常识推理问答题的答题模型生成方法和系统 |
CN111950296A (zh) * | 2020-08-21 | 2020-11-17 | 桂林电子科技大学 | 一种基于bert微调模型的评论目标情感分析 |
CN112036659A (zh) * | 2020-09-09 | 2020-12-04 | 中国科学技术大学 | 基于组合策略的社交网络媒体信息流行度预测方法 |
CN112819013A (zh) * | 2021-01-29 | 2021-05-18 | 厦门大学 | 基于层内层间联合全局表示的图像描述方法 |
-
2021
- 2021-07-12 CN CN202110786417.5A patent/CN113590918A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543084A (zh) * | 2018-11-09 | 2019-03-29 | 西安交通大学 | 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法 |
CN110377710A (zh) * | 2019-06-17 | 2019-10-25 | 杭州电子科技大学 | 一种基于多模态融合的视觉问答融合增强方法 |
CN110852368A (zh) * | 2019-11-05 | 2020-02-28 | 南京邮电大学 | 全局与局部特征嵌入及图文融合的情感分析方法与系统 |
CN111209401A (zh) * | 2020-01-03 | 2020-05-29 | 西安电子科技大学 | 网络舆情文本信息情感极性分类处理系统及方法 |
CN111680484A (zh) * | 2020-05-29 | 2020-09-18 | 北京理工大学 | 一种视觉常识推理问答题的答题模型生成方法和系统 |
CN111950296A (zh) * | 2020-08-21 | 2020-11-17 | 桂林电子科技大学 | 一种基于bert微调模型的评论目标情感分析 |
CN112036659A (zh) * | 2020-09-09 | 2020-12-04 | 中国科学技术大学 | 基于组合策略的社交网络媒体信息流行度预测方法 |
CN112819013A (zh) * | 2021-01-29 | 2021-05-18 | 厦门大学 | 基于层内层间联合全局表示的图像描述方法 |
Non-Patent Citations (2)
Title |
---|
WEILONG CHEN等: "Curriculum Learning for Wide Multimedia-Based Transformer with Graph Target Detection" * |
李奥;但志平;董方敏;刘龙文;冯阳;: "基于改进生成对抗网络的谣言检测方法" * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782739A (zh) * | 2022-03-31 | 2022-07-22 | 电子科技大学 | 基于双向长短期记忆层和全连接层的多模态分类模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101865102B1 (ko) | 시각 문답을 위한 시스템 및 방법 | |
CN111126069B (zh) | 一种基于视觉对象引导的社交媒体短文本命名实体识别方法 | |
CN111488931B (zh) | 文章质量评估方法、文章推荐方法及其对应的装置 | |
Baroni | Grounding distributional semantics in the visual world | |
CN112860888B (zh) | 一种基于注意力机制的双模态情感分析方法 | |
CN108009293A (zh) | 视频标签生成方法、装置、计算机设备和存储介质 | |
CN107391760A (zh) | 用户兴趣识别方法、装置及计算机可读存储介质 | |
CN104142995B (zh) | 基于视觉属性的社会事件识别方法 | |
CN107391505A (zh) | 一种图像处理方法及系统 | |
CN109726718B (zh) | 一种基于关系正则化的视觉场景图生成系统及方法 | |
CN108108468A (zh) | 一种基于概念和文本情感的短文本情感分析方法和装置 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
EP4060548A1 (en) | Method and device for presenting prompt information and storage medium | |
CN112800225B (zh) | 一种微博评论情绪分类方法和系统 | |
CN111159409A (zh) | 基于人工智能的文本分类方法、装置、设备、介质 | |
CN109815485A (zh) | 一种微博短文本情感极性识别的方法、装置及存储介质 | |
CN110111365B (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
Pande et al. | Development and deployment of a generative model-based framework for text to photorealistic image generation | |
CN109635303B (zh) | 特定领域意义改变词的识别方法 | |
CN114417874A (zh) | 一种基于图注意力网络的中文命名实体识别方法和系统 | |
CN113627550A (zh) | 一种基于多模态融合的图文情感分析方法 | |
CN113590918A (zh) | 基于课程式学习的社交媒体舆情热度监测的框架构建方法 | |
CN111859925B (zh) | 一种基于概率情感词典的情感分析系统及方法 | |
CN111445545B (zh) | 一种文本转贴图方法、装置、存储介质及电子设备 | |
CN110309355A (zh) | 内容标签的生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211102 |
|
RJ01 | Rejection of invention patent application after publication |