CN113626672A - 基于rcnn网络的舆情分析方法及系统 - Google Patents
基于rcnn网络的舆情分析方法及系统 Download PDFInfo
- Publication number
- CN113626672A CN113626672A CN202110217620.0A CN202110217620A CN113626672A CN 113626672 A CN113626672 A CN 113626672A CN 202110217620 A CN202110217620 A CN 202110217620A CN 113626672 A CN113626672 A CN 113626672A
- Authority
- CN
- China
- Prior art keywords
- network
- rcnn
- output
- public opinion
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 34
- 238000013528 artificial neural network Methods 0.000 title description 7
- 239000013598 vector Substances 0.000 claims abstract description 80
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 16
- 230000009193 crawling Effects 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 230000008451 emotion Effects 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种对舆情信息分类精准的舆情分析方法及系统,本发明的技术方案为:基于RCNN网络的舆情分析方法,包括以下步骤:S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;S2:构建分类网络模型,包括以下步骤:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft‑max输出分类结果;S3:利用语料集对分类网络模型进行训练与优化;S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
Description
技术领域
本发明涉及人工智能领域,特别涉及一种基于RCNN网络的舆情分析方法及系统。
背景技术
舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕事件的发生、发展和变化,群众对其产生和持有的社会态度。网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。网络舆情主要以网络为载体,事件为核心,是广大网民情感、态度、意见、观点的表达。
随着互联网信息量的不断增大,对网民舆情的提取、归纳也成为了高效处理互联网信息的重要手段。网络传媒作为一种新的信息传播方式,深入人们的日常生活。网民的言论活跃已达到很高的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过网络来表达观点、传播思想,进而形成舆论压力,对任何部门、机构都是无法忽视的。舆情分析系统针对互联网类新兴媒体,通过舆情分析系统,相关部门可以及时了解网络舆情动态,关注网络舆情的状态,从而产生舆情预警,及时纠正或引导网络上的负面舆情影响,或是得到舆情的整体状况,从而根据舆情状况修改决策。
目前,一些舆情分析方案采用了舆情分析中自然语言处理中的深度学习算法,将文本数据通过模型训练,通过模型实现语义分析任务如情感分析、新闻标签分析、态度分析等,因此,对文本分类型任务的网络模型设计在舆情分析的应用中至关重要。
发明内容
本发明要解决的技术问题是提供一种对舆情信息分类精准的舆情分析方法及系统,本发明的技术方案为:
基于RCNN网络的舆情分析方法,包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
其中,所述将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
其中,所述网络模型的优化方法选用Adam算法,采用采用交叉熵损失作为损失函数。
第二方面,本发明提供一种基于RCNN网络的舆情分析系统,包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的情感标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
第三方面,本发明提供一种基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的文本态度标签,包括正面标签和负面标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
第四方面,本发明提供一种基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的新闻类别标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
第五方面,本发明还提供一种基于RCNN网络的舆情分析系统,包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的新闻类别标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
采用上述技术方案,与现有技术相比,本发明具有如下有益效果:
本发明的分类网络模型结构上通过跨层连接,传递了embedding信息,将语音代入更深的模型,从而有效的解决了LSTM在较深的网络中梯度消失的问题;
采用本方案的分类网络模型,舆情数据的分类准确率得到较大的提升。
附图说明
图1为本发明分类网络模型结构图;
图2为本发明实施例1中舆情分析方法流程图;
图3为本发明实施例1中舆情分析系统结构示意图;
图4为本发明实施例3中舆情数据新闻分类数据集的部分数据截图;
图5为图4中的新闻分类数据在经过分类网络模型后输出的新闻类别标签;
图6为本发明实施例3中新闻分类数据经过分类网络模型后的准确率结果图。
其中,附图标记为:
1-数据获取模块、2-分类模块。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例1
参见图1,本发明一种实施例提供一种基于RCNN网络的舆情分析方法,包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,参见图2,包括以下步骤:
词嵌入层embedding layer,将输入的语料信息构建成词向量;
双向LSTM网络bi-LSTM,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接(向量拼接层),在RCNN网络的深层加入单向LSTM网络,再经过最大池化层max-pool后,最终利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
在神经网络中,随着隐藏层数的增加,数据的浅层信息很难向更深层传递,计算机视觉中的ResNet结构实现了神经网络特征信息的跨层传递,从而使得神经网络获得更好的性能,将计算机视觉中的思路应用于自然语言处理中的文本分类模型,得到改进后的RCNN模型,即本实施例中的分类网络模型。
S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
优选的,所述将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
优选的,单个LSTM网络的输出表示为:
Γu=δ(Wu[a<t-1>,x<t>]+bu),
Γf=δ(Wf[a<t-1>,x<t>]+bf),
Γo=δ(Wo[a<t-1>,x<t>]+bo),
Γu、Γf和Γo分别代表更新门、遗忘门以及输出门,a<t-1>为上个神经元的隐藏状态。
优选的,所述网络模型的优化方法选用Adam算法,采用交叉熵损失作为损失函数。
另一方面,本发明还提供一种基于RCNN网络的舆情分析系统,包括:
数据获取模块1,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块2,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的情感标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
实施例2
本实施例提供一种基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的文本态度标签,包括正面标签和负面标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
实施例3
本发明另一实施例还提供一种基于RCNN网络的舆情分析方法,包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的新闻类别标签。
其中,将双向LSTM网络的输出以及词向量进行拼接的输出表示为:
对本实施例中的分类网络在情感分类的具体表现与现有技术中的分类网络进行比对:
现有技术的方案,即RCNN网络:
1.embedding层,输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量;
2.输入为(64,128,128)的向量,双向的LSTM,每个方向神经元为128个,输出为(64,128,128)的向量;
3.向量拼接层,将两个方向LSTM的输出进行拼接,输出为(64,128,256)的向量;
4.输入为(64,128,256)的向量,卷积层,输出为(64,128,128)的向量;
5.输入为(64,128,128)的向量,最大池化层,输出为(64,128)的向量;
6.输入为(64,128)的向量,softmax层,输出为(64,15)的向量。
本发明采用改进后的RCNN结构为:
1.embedding层,输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量;
2.输入为(64,128,128)的向量,双向的LSTM,每个方向神经元为128个,输出为(64,128,128)的向量;
3.向量拼接层,两个方向LSTM的输出,以及在embedding层分词的词向量,输出为(64,128,384)的向量;
4.输入为(64,128,384)的向量,卷积层,输出为(64,128,128)的向量;
5.输入为(64,128,128)的向量,最大池化层,输出为(64,128)的向量;
6.输入为(64,128)的向量,softmax层,输出为(64,15)的向量。
参见图4至图6,本实施例的舆情数据新闻(文本)分类数据集由今日头条客户端提供,共计382688条数据,15个分类。
分类code:民生/文化/娱乐/体育/财经/房产/汽车/教育/科技/军事/旅游/国际/证券/农业/电竞。
分类网络模型优化方法选用可以自动调节学习率的Adam算法,模型在全连接层使用dropout,模型的损失函数使用交叉熵损失,经过10个epoch的训练。
参见图4,图4为舆情数据新闻分类数据集的部分数据截图,图5为图4中的新闻分类数据在经过分类网络模型后输出的新闻类别标签,图6为新闻分类数据经过分类网络模型后的准确率结果图,由图中可知,通过分类网络模型后,loss为1.93969,准确率为0.890879,与改进前的RCNN分类网络模型对比结果如下:
改进后的RCNN在新闻文本分类任务上取得了更好的效果,并且改进的RCNN可以更好地拟合训练数据,在训练集上的准确率更高,训练收敛的速度也更快。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。
Claims (9)
1.基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的情感标签。
3.如权利要求1所述的一种基于RCNN网络的舆情分析方法,其特征在于:所述网络模型的优化方法选用Adam算法,采用采用交叉熵损失作为损失函数。
4.基于RCNN网络的舆情分析系统,其特征在于:包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的情感标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
5.基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的文本态度标签,包括正面标签和负面标签。
7.基于RCNN网络的舆情分析方法,其特征在于:包括以下步骤:
S1:通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
S2:构建分类网络模型,包括以下步骤:
词嵌入层,将输入的语料信息构建成词向量;
双向LSTM网络,用于获得词向量的上下文信息并输出;
RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果;
S3:利用语料集对分类网络模型进行训练与优化;
S4:基于训练完成的分类网络模型,输出舆情数据的新闻类别标签。
9.基于RCNN网络的舆情分析系统,其特征在于:包括:
数据获取模块,通过爬虫技术爬取各大门户论坛的文本语料并进行预处理,生成语料集;
分类模块,用于将语料集输入训练完成的分类网络模型中,输出舆情数据的新闻类别标签;所述训练完成的分类网络模型包括:词嵌入层,将输入的语料信息构建成词向量;双向LSTM网络,用于获得词向量的上下文信息并输出;RCNN网络,将双向LSTM网络的输出以及词向量进行拼接,在RCNN网络的深层加入单向LSTM网络,利用soft-max输出分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110217620.0A CN113626672A (zh) | 2021-02-26 | 2021-02-26 | 基于rcnn网络的舆情分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110217620.0A CN113626672A (zh) | 2021-02-26 | 2021-02-26 | 基于rcnn网络的舆情分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113626672A true CN113626672A (zh) | 2021-11-09 |
Family
ID=78377856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110217620.0A Pending CN113626672A (zh) | 2021-02-26 | 2021-02-26 | 基于rcnn网络的舆情分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113626672A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330032A (zh) * | 2017-06-26 | 2017-11-07 | 北京理工大学 | 一种基于递归神经网络的隐式篇章关系分析方法 |
CN107609009A (zh) * | 2017-07-26 | 2018-01-19 | 北京大学深圳研究院 | 文本情感分析方法、装置、存储介质和计算机设备 |
CN109743732A (zh) * | 2018-12-20 | 2019-05-10 | 重庆邮电大学 | 基于改进的cnn-lstm的垃圾短信判别方法 |
CN110162626A (zh) * | 2019-04-26 | 2019-08-23 | 湘潭大学 | 一种基于双向lstm的舆情情感热度熵的计算方法 |
CN110347836A (zh) * | 2019-07-15 | 2019-10-18 | 昆明理工大学 | 融入观点句特征的汉越双语新闻情感分类方法 |
CN110427610A (zh) * | 2019-06-25 | 2019-11-08 | 平安科技(深圳)有限公司 | 文本分析方法、装置、计算机装置及计算机存储介质 |
CN112329824A (zh) * | 2020-10-23 | 2021-02-05 | 北京中科智加科技有限公司 | 多模型融合训练方法、文本分类方法以及装置 |
-
2021
- 2021-02-26 CN CN202110217620.0A patent/CN113626672A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330032A (zh) * | 2017-06-26 | 2017-11-07 | 北京理工大学 | 一种基于递归神经网络的隐式篇章关系分析方法 |
CN107609009A (zh) * | 2017-07-26 | 2018-01-19 | 北京大学深圳研究院 | 文本情感分析方法、装置、存储介质和计算机设备 |
CN109743732A (zh) * | 2018-12-20 | 2019-05-10 | 重庆邮电大学 | 基于改进的cnn-lstm的垃圾短信判别方法 |
CN110162626A (zh) * | 2019-04-26 | 2019-08-23 | 湘潭大学 | 一种基于双向lstm的舆情情感热度熵的计算方法 |
CN110427610A (zh) * | 2019-06-25 | 2019-11-08 | 平安科技(深圳)有限公司 | 文本分析方法、装置、计算机装置及计算机存储介质 |
CN110347836A (zh) * | 2019-07-15 | 2019-10-18 | 昆明理工大学 | 融入观点句特征的汉越双语新闻情感分类方法 |
CN112329824A (zh) * | 2020-10-23 | 2021-02-05 | 北京中科智加科技有限公司 | 多模型融合训练方法、文本分类方法以及装置 |
Non-Patent Citations (1)
Title |
---|
马远浩;曾卫明;石玉虎;徐鹏;: "基于加权词向量和LSTM-CNN的微博文本分类研究", 现代计算机(专业版), no. 25 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717017B (zh) | 一种处理语料的方法 | |
CN110866117B (zh) | 一种基于语义增强与多层次标签嵌入的短文本分类方法 | |
CN109933664B (zh) | 一种基于情感词嵌入的细粒度情绪分析改进方法 | |
CN113158665B (zh) | 一种基于文本摘要生成与双向语料改善对话文本生成的方法 | |
CN111797898B (zh) | 一种基于深度语义匹配的在线评论自动回复方法 | |
CN107729309A (zh) | 一种基于深度学习的中文语义分析的方法及装置 | |
Li et al. | Improving convolutional neural network for text classification by recursive data pruning | |
CN111581401A (zh) | 一种基于深度相关性匹配的局部引文推荐系统及方法 | |
CN112016002A (zh) | 融合评论文本层级注意力和时间因素的混合推荐方法 | |
CN110990670B (zh) | 一种成长激励型图书推荐方法及推荐系统 | |
CN109325120A (zh) | 一种分离用户和产品注意力机制的文本情感分类方法 | |
CN112256866A (zh) | 一种基于深度学习的文本细粒度情感分析方法 | |
CN113987187A (zh) | 基于多标签嵌入的舆情文本分类方法、系统、终端及介质 | |
CN111651973A (zh) | 一种基于句法感知的文本匹配方法 | |
CN113934835B (zh) | 结合关键词和语义理解表征的检索式回复对话方法及系统 | |
CN116578705A (zh) | 基于预训练语言模型与集成神经网络的微博情感分类方法 | |
Zhou et al. | Condensed convolution neural network by attention over self-attention for stance detection in twitter | |
Zhu et al. | Knowledge-based BERT word embedding fine-tuning for emotion recognition | |
CN113627550A (zh) | 一种基于多模态融合的图文情感分析方法 | |
CN112950414A (zh) | 一种基于解耦法律要素的法律文本表示方法 | |
CN111859898B (zh) | 一种基于隐藏关联网络的多领域文本隐式特征抽取方法及计算机存储介质 | |
CN113626672A (zh) | 基于rcnn网络的舆情分析方法及系统 | |
CN110909167B (zh) | 一种微博文本分类系统 | |
Phan et al. | Little flower at memotion 2.0 2022: Ensemble of multi-modal model using attention mechanism in memotion analysis | |
Mastronardo et al. | Enhancing a text summarization system with elmo |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |