CN113626672A - 基于rcnn网络的舆情分析方法及系统 - Google Patents

基于rcnn网络的舆情分析方法及系统 Download PDF

Info

Publication number
CN113626672A
CN113626672A CN202110217620.0A CN202110217620A CN113626672A CN 113626672 A CN113626672 A CN 113626672A CN 202110217620 A CN202110217620 A CN 202110217620A CN 113626672 A CN113626672 A CN 113626672A
Authority
CN
China
Prior art keywords
network
rcnn
output
public opinion
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110217620.0A
Other languages
English (en)
Inventor
何学智
王家逸
林林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Newland Digital Technology Co ltd
Original Assignee
Newland Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Newland Digital Technology Co ltd filed Critical Newland Digital Technology Co ltd
Priority to CN202110217620.0A priority Critical patent/CN113626672A/zh
Publication of CN113626672A publication Critical patent/CN113626672A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种对舆情信息分类精准的舆情分析方法及系统,本发明的技术方案为:基于RCNN网络的舆情分析方法,包括以下步骤:S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;S2:构建分类网络模型,包括以下步骤:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft‑max输出分类结果;S3:利用语料集对分类网络模型进行训练与优化;S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。

Description

基于RCNN网络的舆情分析方法及系统
技术领域
本发明涉及人工智能领域,特别涉及一种基于RCNN网络的舆情分析方法及系统。
背景技术
舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕事件的发生、发展和变化,群众对其产生和持有的社会态度。网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。网络舆情主要以网络为载体,事件为核心,是广大网民情感、态度、意见、观点的表达。
随着互联网信息量的不断增大,对网民舆情的提取、归纳也成为了高效处理互联网信息的重要手段。网络传媒作为一种新的信息传播方式,深入人们的日常生活。网民的言论活跃已达到很高的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过网络来表达观点、传播思想,进而形成舆论压力,对任何部门、机构都是无法忽视的。舆情分析系统针对互联网类新兴媒体,通过舆情分析系统,相关部门可以及时了解网络舆情动态,关注网络舆情的状态,从而产生舆情预警,及时纠正或引导网络上的负面舆情影响,或是得到舆情的整体状况,从而根据舆情状况修改决策。
目前,一些舆情分析方案采用了舆情分析中自然语言处理中的深度学习算法,将文本数据通过模型训练,通过模型实现语义分析任务如情感分析、新闻标签分析、态度分析等,因此,对文本分类型任务的网络模型设计在舆情分析的应用中至关重要。
发明内容
本发明要解决的技术问题是提供一种对舆情信息分类精准的舆情分析方法及系统,本发明的技术方案为:
基于RCNN网络的舆情分析方法,包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
其中,所述将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure BDA0002954503080000011
其中,
Figure BDA0002954503080000012
Figure BDA0002954503080000013
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
其中,所述网络模型的优化方法选用Adam算法,采用采用交叉熵损失作为损失函数。
第二方面,本发明提供一种基于RCNN网络的舆情分析系统,包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的情感标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
第三方面,本发明提供一种基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的文本态度标签,包括正面标签和负面标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure BDA0002954503080000021
其中,
Figure BDA0002954503080000022
Figure BDA0002954503080000023
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
第四方面,本发明提供一种基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的新闻类别标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure BDA0002954503080000024
其中,
Figure BDA0002954503080000025
Figure BDA0002954503080000026
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
第五方面,本发明还提供一种基于RCNN网络的舆情分析系统,包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的新闻类别标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
采用上述技术方案,与现有技术相比,本发明具有如下有益效果:
本发明的分类网络模型结构上通过跨层连接,传递了embedding信息,将语音代入更深的模型,从而有效的解决了LSTM在较深的网络中梯度消失的问题;
采用本方案的分类网络模型,舆情数据的分类准确率得到较大的提升。
附图说明
图1为本发明分类网络模型结构图;
图2为本发明实施例1中舆情分析方法流程图;
图3为本发明实施例1中舆情分析系统结构示意图;
图4为本发明实施例3中舆情数据新闻分类数据集的部分数据截图;
图5为图4中的新闻分类数据在经过分类网络模型后输出的新闻类别标签;
图6为本发明实施例3中新闻分类数据经过分类网络模型后的准确率结果图。
其中,附图标记为:
1-数据获取模块、2-分类模块。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例1
参见图1,本发明一种实施例提供一种基于RCNN网络的舆情分析方法,包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,参见图2,包括以下步骤:
词嵌入层embedding layer,将输入的语料信息构建成词向量;
双向LSTM网络bi-LSTM,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接(向量拼接层),在RCNN网络的深层加入单向LSTM网络,再经过最大池化层max-pool后,最终利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
在神经网络中,随着隐藏层数的增加,数据的浅层信息很难向更深层传递,计算机视觉中的ResNet结构实现了神经网络特征信息的跨层传递,从而使得神经网络获得更好的性能,将计算机视觉中的思路应用于自然语言处理中的文本分类模型,得到改进后的RCNN模型,即本实施例中的分类网络模型。
S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
优选的,所述将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure BDA0002954503080000041
其中,
Figure BDA0002954503080000042
Figure BDA0002954503080000043
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
优选的,单个LSTM网络的输出表示为:
Figure BDA0002954503080000044
Figure BDA0002954503080000045
Γu=δ(Wu[a<t-1>,x<t>]+bu),
Γf=δ(Wf[a<t-1>,x<t>]+bf),
Γo=δ(Wo[a<t-1>,x<t>]+bo),
Γu、Γf和Γo分别代表更新门、遗忘门以及输出门,a<t-1>为上个神经元的隐藏状态。
优选的,所述网络模型的优化方法选用Adam算法,采用交叉熵损失作为损失函数。
另一方面,本发明还提供一种基于RCNN网络的舆情分析系统,包括:
数据获取模块1,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块2,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的情感标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
实施例2
本实施例提供一种基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的文本态度标签,包括正面标签和负面标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure BDA0002954503080000051
其中,
Figure BDA0002954503080000052
Figure BDA0002954503080000053
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
实施例3
本发明另一实施例还提供一种基于RCNN网络的舆情分析方法,包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的新闻类别标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure BDA0002954503080000054
其中,
Figure BDA0002954503080000055
Figure BDA0002954503080000056
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
对本实施例中的分类网络在情感分类的具体表现与现有技术中的分类网络进行比对:
现有技术的方案,即RCNN网络:
1.embedding层,输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量;
2.输入为(64,128,128)的向量,双向的LSTM,每个方向神经元为128个,输出为(64,128,128)的向量;
3.向量拼接层,将两个方向LSTM的输出进行拼接,输出为(64,128,256)的向量;
4.输入为(64,128,256)的向量,卷积层,输出为(64,128,128)的向量;
5.输入为(64,128,128)的向量,最大池化层,输出为(64,128)的向量;
6.输入为(64,128)的向量,softmax层,输出为(64,15)的向量。
本发明采用改进后的RCNN结构为:
1.embedding层,输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量;
2.输入为(64,128,128)的向量,双向的LSTM,每个方向神经元为128个,输出为(64,128,128)的向量;
3.向量拼接层,两个方向LSTM的输出,以及在embedding层分词的词向量,输出为(64,128,384)的向量;
4.输入为(64,128,384)的向量,卷积层,输出为(64,128,128)的向量;
5.输入为(64,128,128)的向量,最大池化层,输出为(64,128)的向量;
6.输入为(64,128)的向量,softmax层,输出为(64,15)的向量。
参见图4至图6,本实施例的舆情数据新闻(文本)分类数据集由今日头条客户端提供,共计382688条数据,15个分类。
分类code:民生/文化/娱乐/体育/财经/房产/汽车/教育/科技/军事/旅游/国际/证券/农业/电竞。
分类网络模型优化方法选用可以自动调节学习率的Adam算法,模型在全连接层使用dropout,模型的损失函数使用交叉熵损失,经过10个epoch的训练。
参见图4,图4为舆情数据新闻分类数据集的部分数据截图,图5为图4中的新闻分类数据在经过分类网络模型后输出的新闻类别标签,图6为新闻分类数据经过分类网络模型后的准确率结果图,由图中可知,通过分类网络模型后,loss为1.93969,准确率为0.890879,与改进前的RCNN分类网络模型对比结果如下:
Figure BDA0002954503080000061
改进后的RCNN在新闻文本分类任务上取得了更好的效果,并且改进的RCNN可以更好地拟合训练数据,在训练集上的准确率更高,训练收敛的速度也更快。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。

Claims (9)

1.基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
2.如权利要求1所述的所述的一种基于RCNN网络的舆情分析方法,其特征在于:将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure FDA0002954503070000011
其中,
Figure FDA0002954503070000012
Figure FDA0002954503070000013
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
3.如权利要求1所述的一种基于RCNN网络的舆情分析方法,其特征在于:所述网络模型的优化方法选用Adam算法,采用采用交叉熵损失作为损失函数。
4.基于RCNN网络的舆情分析系统,其特征在于:包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的情感标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
5.基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的文本态度标签,包括正面标签和负面标签。
6.如权利要求5所述的所述的一种基于RCNN网络的舆情分析方法,其特征在于:将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure FDA0002954503070000021
其中,
Figure FDA0002954503070000022
Figure FDA0002954503070000023
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
7.基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的新闻类别标签。
8.如权利要求7所述的所述的一种基于RCNN网络的舆情分析方法,其特征在于:将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
Figure FDA0002954503070000024
其中,
Figure FDA0002954503070000025
Figure FDA0002954503070000026
分别为双向LSTM两个方向的输出,embedding为词嵌入层的输出。
9.基于RCNN网络的舆情分析系统,其特征在于:包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的新闻类别标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
CN202110217620.0A 2021-02-26 2021-02-26 基于rcnn网络的舆情分析方法及系统 Pending CN113626672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110217620.0A CN113626672A (zh) 2021-02-26 2021-02-26 基于rcnn网络的舆情分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110217620.0A CN113626672A (zh) 2021-02-26 2021-02-26 基于rcnn网络的舆情分析方法及系统

Publications (1)

Publication Number Publication Date
CN113626672A true CN113626672A (zh) 2021-11-09

Family

ID=78377856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110217620.0A Pending CN113626672A (zh) 2021-02-26 2021-02-26 基于rcnn网络的舆情分析方法及系统

Country Status (1)

Country Link
CN (1) CN113626672A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330032A (zh) * 2017-06-26 2017-11-07 北京理工大学 一种基于递归神经网络的隐式篇章关系分析方法
CN107609009A (zh) * 2017-07-26 2018-01-19 北京大学深圳研究院 文本情感分析方法、装置、存储介质和计算机设备
CN109743732A (zh) * 2018-12-20 2019-05-10 重庆邮电大学 基于改进的cnn-lstm的垃圾短信判别方法
CN110162626A (zh) * 2019-04-26 2019-08-23 湘潭大学 一种基于双向lstm的舆情情感热度熵的计算方法
CN110347836A (zh) * 2019-07-15 2019-10-18 昆明理工大学 融入观点句特征的汉越双语新闻情感分类方法
CN110427610A (zh) * 2019-06-25 2019-11-08 平安科技(深圳)有限公司 文本分析方法、装置、计算机装置及计算机存储介质
CN112329824A (zh) * 2020-10-23 2021-02-05 北京中科智加科技有限公司 多模型融合训练方法、文本分类方法以及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330032A (zh) * 2017-06-26 2017-11-07 北京理工大学 一种基于递归神经网络的隐式篇章关系分析方法
CN107609009A (zh) * 2017-07-26 2018-01-19 北京大学深圳研究院 文本情感分析方法、装置、存储介质和计算机设备
CN109743732A (zh) * 2018-12-20 2019-05-10 重庆邮电大学 基于改进的cnn-lstm的垃圾短信判别方法
CN110162626A (zh) * 2019-04-26 2019-08-23 湘潭大学 一种基于双向lstm的舆情情感热度熵的计算方法
CN110427610A (zh) * 2019-06-25 2019-11-08 平安科技(深圳)有限公司 文本分析方法、装置、计算机装置及计算机存储介质
CN110347836A (zh) * 2019-07-15 2019-10-18 昆明理工大学 融入观点句特征的汉越双语新闻情感分类方法
CN112329824A (zh) * 2020-10-23 2021-02-05 北京中科智加科技有限公司 多模型融合训练方法、文本分类方法以及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马远浩;曾卫明;石玉虎;徐鹏;: "基于加权词向量和LSTM-CNN的微博文本分类研究", 现代计算机(专业版), no. 25 *

Similar Documents

Publication Publication Date Title
CN110717017B (zh) 一种处理语料的方法
CN110866117B (zh) 一种基于语义增强与多层次标签嵌入的短文本分类方法
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
CN113158665B (zh) 一种基于文本摘要生成与双向语料改善对话文本生成的方法
CN111797898B (zh) 一种基于深度语义匹配的在线评论自动回复方法
CN107729309A (zh) 一种基于深度学习的中文语义分析的方法及装置
Li et al. Improving convolutional neural network for text classification by recursive data pruning
CN111581401A (zh) 一种基于深度相关性匹配的局部引文推荐系统及方法
CN112016002A (zh) 融合评论文本层级注意力和时间因素的混合推荐方法
CN110990670B (zh) 一种成长激励型图书推荐方法及推荐系统
CN109325120A (zh) 一种分离用户和产品注意力机制的文本情感分类方法
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
CN113987187A (zh) 基于多标签嵌入的舆情文本分类方法、系统、终端及介质
CN111651973A (zh) 一种基于句法感知的文本匹配方法
CN113934835B (zh) 结合关键词和语义理解表征的检索式回复对话方法及系统
CN116578705A (zh) 基于预训练语言模型与集成神经网络的微博情感分类方法
Zhou et al. Condensed convolution neural network by attention over self-attention for stance detection in twitter
Zhu et al. Knowledge-based BERT word embedding fine-tuning for emotion recognition
CN113627550A (zh) 一种基于多模态融合的图文情感分析方法
CN112950414A (zh) 一种基于解耦法律要素的法律文本表示方法
CN111859898B (zh) 一种基于隐藏关联网络的多领域文本隐式特征抽取方法及计算机存储介质
CN113626672A (zh) 基于rcnn网络的舆情分析方法及系统
CN110909167B (zh) 一种微博文本分类系统
Phan et al. Little flower at memotion 2.0 2022: Ensemble of multi-modal model using attention mechanism in memotion analysis
Mastronardo et al. Enhancing a text summarization system with elmo

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination