CN113901208B - 融入主题特征的中越跨语言评论情感倾向性分析方法 - Google Patents

融入主题特征的中越跨语言评论情感倾向性分析方法 Download PDF

Info

Publication number
CN113901208B
CN113901208B CN202111078630.7A CN202111078630A CN113901208B CN 113901208 B CN113901208 B CN 113901208B CN 202111078630 A CN202111078630 A CN 202111078630A CN 113901208 B CN113901208 B CN 113901208B
Authority
CN
China
Prior art keywords
comments
vietnamese
language
theme
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111078630.7A
Other languages
English (en)
Other versions
CN113901208A (zh
Inventor
余正涛
施忆雪
相艳
黄于欣
线岩团
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202111078630.7A priority Critical patent/CN113901208B/zh
Publication of CN113901208A publication Critical patent/CN113901208A/zh
Application granted granted Critical
Publication of CN113901208B publication Critical patent/CN113901208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及融入主题特征的中越跨语言评论情感倾向性分析方法,属于自然语言处理领域。本发明包括:构建中越跨语言评论数据集;利用特征编码器和主题特征编码器对中文和越南语评论进行特征编码,之后利用选择门控机制获得评论句特征,并使用对抗学习缩小中文和越南语语义差距;最后基于中文的情感标签作为输入训练分类器,最终完成在越南语数据集上的情感分类任务。本发明通过将主题信息作为指导信息融入实现越南语评论句的情感分类,从获取到的越南语网络数据中得到情感倾向性,为把握越南民众对公共事件等对象的观点看法提供支撑。

Description

融入主题特征的中越跨语言评论情感倾向性分析方法
技术领域
本发明涉及融入主题特征的中越跨语言评论情感倾向性分析方法,属于自然语言处理技术领域。
背景技术
互联网的快速发展推动了中越两国交流,对越南语的网络评论进行情感极性分析有助于了解民众对特定事件的态度,是越南语事件观点分析的基础。越南语情感词典、标注数据等资源的稀缺阻碍了其情感分类研究,可通过跨语言情感分类(Cross-LingualSentiment Classification,CLSC)方法,利用中文作为源语言的情感资源,解决越南语作为目标语言的情感分类问题。
目前常用的跨语言情感分类方法有三类。一类是基于双语对齐资源的方法,利用平行语料、情感词典等,将源语言中的情感资源直接迁移到目标语言中,弥补语言之间的语义鸿沟。另一类基于机器翻译技术,将两种语言翻译至同一语言,最终将跨语言情感分类转变为单语任务。还有一类基于特征迁移,将源语言与目标语言的特定语言特征和语言无关特征映射到统一空间中,使得两种语言在语义空间下共享同一表示,以实现情感分类任务。已有方法解决的是两种语言的语义表征对齐问题,而未关注文本所蕴含的主题对于情感分类的作用。实际上,无论是中文还是越南语,用户通常会针对特定主题发表评论,主题信息将有助于推断情感状态
发明内容
本发明提供了融入主题特征的中越跨语言评论情感倾向性分析方法,以用于以利用中文情感标签对越南语评论句进行情感倾向性分析,解决了由于标注数据稀缺以及模型提取的特征不够准确导致情感分析性能较低的问题。
本发明的技术方案是:融入主题特征的中越跨语言评论情感倾向性分析方法,所述方法的具体步骤如下:
Step1、通过爬虫技术爬取新冠疫情期间的中文微博评论和越南语推特评论,通过人工对噪声数据进行筛选和标注得到中越跨语言评论数据集,利用主题模型对数据集进行预训练,得到每条句子的主题词分布;
Step2、利用词嵌入分别对中文评论句和越南语评论句进行编码,利用语义特征编码器对评论句进行编码得到评论句的语义特征向量,在每个句子的主题词分布进行主题特征编码,利用选择门控机制将得到的语义特征向量和主题特征向量进行融合将得到的表征用于训练模型。
作为本发明的优选方案,所述Step1包括:
Step1.1、采用基于Scrapy框架的爬虫从新浪微博上爬取新冠疫情相关的中文热点事件评论,从推特上爬取新冠疫情相关的越南语热点事件评论;
Step1.2、对爬取微博和推特评论进行过滤筛选,过滤筛选的方式如下所示:删除#话题#结构、删除微博评论里“@+用户名+回复”这样的结构,且删除无关超链接广告;
Step1.3、采用人工标注,获得中越跨语言评论数据集:以一条帖子为单位进行标注工作,将微博评论句中包含积极态度的句子标注为1,包含消极态度的标注为0,三人盲判取交集;
作为本发明的优选方案,所述Step2中:
Step2.1、通过语义特征编码器F对评论进行语义表征,其中语义特征编码器是采用三种不同宽度核的CNN,核的窗口大小为lk,通过卷积操作后得到向量
Figure BDA0003263013820000021
并使用最大池化操作获取到每个卷积特征中的最大值,经过拼接核线性转换得到卷积后的语义表征hc∈Rm,其中m为线性变换后的隐层维度;
Step2.2、利用主题特征编码器T进行主题表征,预训练主题模型LDA获取到中文和越南语评论在其最大主题概率下的前K个主题词;将评论的嵌入序列经过平均池化操作,并通过多层感知机进行维度转换,得到其主题向量ht′∈Rm,m是变换后的维度;
ht′=MLP(avg_pooling(ht)) (1)
Step2.3、获取到语义表征hc和主题表征ht′后,由于两种特征的贡献程度并不相同,利用选择门控机制对提取的特征进行统合得到综合表征:
Figure BDA0003263013820000022
Figure BDA0003263013820000023
hf=tanh(hc⊙gc+ht′⊙gt) (4)
其中gt是主题门,gc是语义特征门,
Figure BDA0003263013820000024
是可学习的参数,hc,ht′,hf维度均为Rm。门控机制允许网络自适应地学习语义表征和主题表征的重要性,组成评论的综合表征hf∈Rm
Step2.4、使用对抗学习对两种语言融入主题信息后的特征进行空间下的对齐,对抗学习包括生成器和鉴别器两部分,其中生成器由语义特征编码器F,主题特征编码器T和选择门控机制G融合构成,语言鉴别器Q由多层感知机构成,输出近似为语言分布,获取中文和越南语评论的语义无关信息。其损失函数表示为:
Figure BDA0003263013820000035
其中hf表示源语言的综合表征,hf'表示目标语言的综合表征;
Step2.5、在得到双语对齐特征后,利用源语言情感标签对情感分类器P进行训练。分类器将源语言综合表征hf输入到一个线性层,转换为一个标签向量vs∈Re,其中e表示标签数量。最后将标签向量vs送入softmax层,得到预测类别
Figure BDA0003263013820000031
Figure BDA0003263013820000032
其中W(l)∈Re,b∈Re是最后一个线性层的待训练参数。情感分类器的损失采用交叉熵损失
Figure BDA0003263013820000033
其中ys为源语言的真实标签;
Step2.6、最终模型的整体目标函数由鉴别器损失和情感分类器损失构成
Figure BDA0003263013820000034
通过研究发现,对抗训练时生成器和鉴别器的训练不完全同步,因此在反向传播的过程中利用超参数λ平衡情感分类器P和鉴别器Q对生成器的影响。
本发明的有益效果是:
(1)由于以往的方法解决的是两种语言的语义表征对齐问题,未关注到文本中特定主题与情感的关联性。无论是哪种语言,用户通常会针对特定主题发表评论,评论句中所使用的观点词通常是与特定主题高度关联,情感极性也与主题信息相关联。因此本发明提出将中文和越南语的主题词分布作为外部知识引入模型,利用主题信息更好地构建双语评论在同一特征空间下的对应关系。
(2)根据评论的语义表征和主题表征贡献程度不同的特定,本发明提出选择门控机制将主题表征与语义表征进行融合,并利用对抗学习使模型语言分布差异最小,从而可以利用中文情感极性标签,实现越南语情感极性的判别。
附图说明
图1本发明中识别模型的具体结构示意图。
具体实施方式
实施例1:如图1所示,融入主题特征的中越跨语言评论情感倾向性分析方法,所述方法的具体步骤如下:
Step1、通过爬虫技术爬取新冠疫情期间的中文微博评论和越南语推特评论,通过人工对噪声数据进行筛选和标注得到中越跨语言评论数据集,利用主题模型对数据集进行预训练,得到每条句子的主题词分布;
Step1.1、采用基于Scrapy框架的爬虫从新浪微博上爬取新冠疫情相关的中文热点事件评论,从推特上爬取新冠疫情相关的越南语热点事件评论;
Step1.2、对爬取微博和推特评论进行过滤筛选,过滤筛选的方式如下所示:删除#话题#结构、删除微博评论里“@+用户名+回复”这样的结构,且删除无关超链接广告;
Step1.3、采用人工标注,获得中越跨语言评论数据集:以一条帖子为单位进行标注工作,将微博评论句中包含积极态度的句子标注为1,包含消极态度的标注为0,三人盲判取交集,数据集信息如表1所示:
表1中越评论句数据集统计信息
Figure BDA0003263013820000041
Step2、利用词嵌入分别对中文评论句和越南语评论句进行编码,利用语义特征编码器对评论句进行编码得到评论句的语义特征向量,在每个句子的主题词分布进行主题特征编码,利用选择门控机制将得到的语义特征向量和主题特征向量进行融合将得到的表征用于训练模型。
Step2.1、通过语义特征编码器F对评论进行语义表征,其中语义特征编码器是采用三种不同宽度核的CNN,核的窗口大小为lk,通过卷积操作后得到向量
Figure BDA0003263013820000042
并使用最大池化操作获取到每个卷积特征中的最大值,经过拼接核线性转换得到卷积后的语义表征hc∈Rm,其中m为线性变换后的隐层维度;
Step2.2、利用主题特征编码器T进行主题表征,预训练主题模型LDA获取到中文和越南语评论在其最大主题概率下的前K个主题词;将评论的嵌入序列经过平均池化操作,并通过多层感知机进行维度转换,得到其主题向量ht′∈Rm,m是变换后的维度;
ht′=MLP(avg_pooling(ht)) (1)
Step2.3、获取到语义表征hc和主题表征ht′后,由于两种特征的贡献程度并不相同,利用选择门控机制G对提取的特征进行统合得到综合表征:
Figure BDA0003263013820000051
Figure BDA0003263013820000052
hf=tanh(hc⊙gc+ht′⊙gt) (4)
其中gt是主题门,gc是语义特征门,
Figure BDA0003263013820000053
是可学习的参数,hc,ht′,hf维度均为Rm。门控机制允许网络自适应地学习语义表征和主题表征的重要性,组成评论的综合表征hf∈Rm
Step2.4、使用对抗学习对两种语言融入主题信息后的特征进行空间下的对齐,对抗学习包括生成器和鉴别器两部分,其中生成器由语义特征编码器F,主题特征编码器T和选择门控机制G融合构成,语言鉴别器Q由多层感知机构成,输出近似为语言分布,获取中文和越南语评论的语义无关信息。其损失函数表示为:
Figure BDA0003263013820000054
其中hf表示源语言的综合表征,hf'表示目标语言的综合表征;
Step2.5、在得到双语对齐特征后,利用源语言情感标签对情感分类器P进行训练。分类器将源语言综合表征hf输入到一个线性层,转换为一个标签向量vs∈Re,其中e表示标签数量。最后将标签向量vs送入softmax层,得到预测类别
Figure BDA0003263013820000055
Figure BDA0003263013820000056
其中W(l)∈Re,b∈Re是最后一个线性层的待训练参数。情感分类器的损失采用交叉熵损失
Figure BDA0003263013820000057
其中ys为源语言的真实标签;
Step2.6、最终模型的整体目标函数由鉴别器损失和情感分类器损失构成
Figure BDA0003263013820000058
通过研究发现,对抗训练时生成器和鉴别器的训练不完全同步,因此在反向传播的过程中利用超参数λ平衡情感分类器P和鉴别器Q对生成器的影响;
Step2.7、选择Adam优化器,它收敛速度较快且收敛过程较稳定,能基于训练数据迭代地更新神经网络权重。利用Adam优化器对F,P和T,G进行联合优化,其中F,P使用学习率为0.0005的优化器,用相同学习率的Adam优化器训练Q。T,G使用学习率为0.0001的优化器。
为了说明本发明的效果,实验设置了2组对比实验。第一组实验验证融入主题信息对越南语情感倾向性分析性能的提升,另一组实验验证融入不同的主题信息对模型性能的提升。
(1)融入主题信息在提高越南语情感倾向性分析性的有效性验证
对比在基准模型中使用中文微博评论句和越南语推特评论句进行跨语言情感倾向性。在基准模型中将中越评论句作为模型的输入,然后获取到两种语言包含主题信息的综合表征,利用对抗学习获得语义无关的综合表征,最后进行情感分类。实验结果如表2所示:
表2融入主题信息实验结果对比(%)
Figure BDA0003263013820000061
分析表2可知,本发明的方法的Accuracy,macroP,macroR,macroF值均高于其他所有方法,说明:本发明方法结构中融入主题能更好的将中文评论中所包含的情感知识转移到越南语评论中,利用对抗学习的方式能在不丢失特定语义特征的情况下,实现两种语言特征在同一空间下的对齐;与基准实验中的ADAN相比,在融入主题信息后的macroF值有提升,说明:对于描述同一事件的两种不同语言评论,本发明方法能更好地学习到两者的对应关系,从而在分类性能上得到提升。
(2)不同主题特征的有效性验证
第二部分验证不同主题特征的有效性,即对比以主题概率分布和主题词分布作为特征信息时的模型性能,实验结果如表3所示:
表3不同主题特征的有效性验证(%)
Figure BDA0003263013820000062
Figure BDA0003263013820000071
分析表3可知,利用主题概率分布和主题词分布均可以提升模型性能。当主题数目在5-15中模型性能随主题数目增加而提升,且在主题数为15时达到最优性能,说明不同的主题数对模型的性能有影响。对比相同主题数目下的不同主题表征方式结果,发现主题词分布的性能始终优于主题概率分布,表明主题词分布的表征方式能更好解释不同主题的观点表述差异。
通过以上实验数据证明了融入主题信息能够丰富跨语言表征的学习,以往的跨语言情感分类工作更多关注于解决不同语言语义差异的问题,本发明通过选择门控机制将主题表征与语义表征进行有效融合,有助于推断评论的情感状态。通过对抗学习策略学习到语言分布差异最小的综合表征,根据实验证明主题词作为融入信息能更快拟合语言分布差异,说明融入主题信息后能更好解决不同语言之间语义差异的问题。本发明仅利用中文情感标注数据进行训练学习,解决了语言情感资源匮乏标注困难的问题。本发明针对越南语评论情感分类任务,提出了一种利用主题信息来指导越南语情感分类的方式是有效的。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (2)

1.融入主题特征的中越跨语言评论情感倾向性分析方法,其特征在于:所述方法的具体步骤如下:
Step1、通过爬虫技术爬取中文微博评论和越南语推特评论,通过人工对噪声数据进行筛选和标注得到中越跨语言评论数据集,利用主题模型对数据集进行预训练,得到每条句子的主题词分布;
Step2、利用词嵌入分别对中文评论句和越南语评论句进行编码,利用语义特征编码器对评论句进行编码得到评论句的语义特征向量,在每个句子的主题词分布进行主题特征编码,利用选择门控机制将得到的语义特征向量和主题特征向量进行融合将得到的表征用于训练模型;
所述Step2的具体步骤如下:
Step2.1、通过语义特征编码器F对评论进行语义表征,其中语义特征编码器是采用三种不同宽度核的CNN,核的窗口大小为lk,通过卷积操作后得到向量
Figure FDA0003670735960000011
并使用最大池化操作获取到每个卷积特征中的最大值,经过拼接核线性转换得到卷积后的语义特征向量hc∈Rm,其中m为线性变换后的隐层维度;
Step2.2、利用主题特征编码器T进行主题表征,预训练主题模型LDA获取到中文和越南语评论在其最大主题概率下的前K个主题词;将评论的嵌入序列经过平均池化操作,并通过多层感知机进行维度转换,得到其主题特征向量ht′∈Rm
ht′=MLP(avg_pooling(ht)) (1)
Step2.3、获取到语义特征向量hc和主题特征向量ht′后,由于两种特征的贡献程度并不相同,利用选择门控机制对提取的特征进行统合得到综合表征:
Figure FDA0003670735960000012
Figure FDA0003670735960000013
hf=tanh(hc⊙gc+ht′⊙gt) (4)
其中gt是主题门,gc是语义特征门,
Figure FDA0003670735960000014
是可学习的参数,hc,ht′,hf维度均为Rm;门控机制允许网络自适应地学习语义表征和主题表征的重要性,组成评论的综合表征hf∈Rm
Step2.4、使用对抗学习对两种语言融入主题信息后的特征进行空间下的对齐,对抗学习包括生成器和鉴别器两部分,其中生成器由语义特征编码器F,主题特征编码器T和选择门控机制G融合构成,语言鉴别器Q由多层感知机构成,输出近似为语言分布,获取中文和越南语评论的语义无关信息,其损失函数表示为:
Figure FDA0003670735960000021
其中hf表示源语言的综合表征,hf’表示目标语言的综合表征;
Step2.5、在得到双语对齐特征后,利用源语言情感标签对情感分类器P进行训练;分类器将源语言综合表征hf输入到一个线性层,转换为一个标签向量vs∈Re,其中e表示标签数量,最后将标签向量vs送入softmax层,得到预测类别ys∈{0,1}:
ys=softmax(W(l)vs+b(l)) (6)
其中W(l)∈Re,b(l)∈Re是最后一个线性层的待训练参数,情感分类器的损失采用交叉熵损失
Figure FDA0003670735960000022
其中ys为源语言的真实标签;
Step2.6、最终模型的整体目标函数由鉴别器损失和情感分类器损失构成
Figure FDA0003670735960000023
通过研究发现,对抗训练时生成器和鉴别器的训练不完全同步,因此在反向传播的过程中利用超参数λ平衡情感分类器P和鉴别器Q对生成器的影响。
2.根据权利要求1所述的融入主题特征的中越跨语言评论情感倾向性分析方法,其特征在于:所述Step1包括:
Step1.1、采用基于Scrapy框架的爬虫从新浪微博上爬取中文热点事件评论,从推特上爬取越南语热点事件评论;
Step1.2、对爬取微博和推特评论进行过滤筛选,过滤筛选的方式如下所示:删除#话题#结构、删除微博评论里“@+用户名+回复”这样的结构,且删除无关超链接广告;
Step1.3、采用人工标注,获得中越跨语言评论数据集:以一条帖子为单位进行标注工作,将微博评论句中包含积极态度的句子标注为1,包含消极态度的标注为0,三人盲判取交集。
CN202111078630.7A 2021-09-15 2021-09-15 融入主题特征的中越跨语言评论情感倾向性分析方法 Active CN113901208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111078630.7A CN113901208B (zh) 2021-09-15 2021-09-15 融入主题特征的中越跨语言评论情感倾向性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111078630.7A CN113901208B (zh) 2021-09-15 2021-09-15 融入主题特征的中越跨语言评论情感倾向性分析方法

Publications (2)

Publication Number Publication Date
CN113901208A CN113901208A (zh) 2022-01-07
CN113901208B true CN113901208B (zh) 2022-07-29

Family

ID=79028484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111078630.7A Active CN113901208B (zh) 2021-09-15 2021-09-15 融入主题特征的中越跨语言评论情感倾向性分析方法

Country Status (1)

Country Link
CN (1) CN113901208B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742071B (zh) * 2022-05-12 2024-04-23 昆明理工大学 基于图神经网络的汉越跨语言观点对象识别分析方法
CN116561325B (zh) * 2023-07-07 2023-10-13 中国传媒大学 一种多语言融媒体文本情感分析方法
CN117648921B (zh) * 2024-01-29 2024-05-03 山东财经大学 基于成对双层对抗对齐的跨主题作文自动测评方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10037491B1 (en) * 2014-07-18 2018-07-31 Medallia, Inc. Context-based sentiment analysis
CN108536870A (zh) * 2018-04-26 2018-09-14 南京大学 一种融合情感特征和语义特征的文本情感分类方法
CN110334187A (zh) * 2019-07-09 2019-10-15 昆明理工大学 基于迁移学习的缅语情感分析方法及装置
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10037491B1 (en) * 2014-07-18 2018-07-31 Medallia, Inc. Context-based sentiment analysis
CN108536870A (zh) * 2018-04-26 2018-09-14 南京大学 一种融合情感特征和语义特征的文本情感分类方法
CN110334187A (zh) * 2019-07-09 2019-10-15 昆明理工大学 基于迁移学习的缅语情感分析方法及装置
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于共享空间的跨语言情感分类;张萌萌;《信息技术与信息化》;20200528(第05期);全文 *

Also Published As

Publication number Publication date
CN113901208A (zh) 2022-01-07

Similar Documents

Publication Publication Date Title
CN113901208B (zh) 融入主题特征的中越跨语言评论情感倾向性分析方法
CN106776581B (zh) 基于深度学习的主观性文本情感分析方法
Cai et al. Intelligent question answering in restricted domains using deep learning and question pair matching
US20240119716A1 (en) Method for multimodal emotion classification based on modal space assimilation and contrastive learning
WO2024036840A1 (zh) 基于主题增强的开放域对话回复方法及系统
CN109101490B (zh) 一种基于融合特征表示的事实型隐式情感识别方法和系统
CN112395417A (zh) 基于深度学习的网络舆情演化仿真方法及系统
Li et al. Chinese grammatical error correction based on convolutional sequence to sequence model
CN114417851B (zh) 一种基于关键词加权信息的情感分析方法
Wei et al. Target-guided emotion-aware chat machine
CN110297986A (zh) 一种微博热点话题的情感倾向分析方法
CN114742071B (zh) 基于图神经网络的汉越跨语言观点对象识别分析方法
Tang et al. Research on automatic labeling of imbalanced texts of customer complaints based on text enhancement and layer-by-layer semantic matching
CN112507717A (zh) 融合实体关键字特征的医疗领域实体分类方法
CN118013045B (zh) 基于人工智能的语句情感检测方法及装置
CN116561592A (zh) 文本情感识别模型的训练方法和文本情感识别方法及装置
Da et al. Deep learning based dual encoder retrieval model for citation recommendation
CN114238636A (zh) 一种基于翻译匹配的跨语言属性级情感分类方法
EP2605150A1 (en) Method for identifying the named entity that corresponds to an owner of a web page
CN116644757A (zh) 一种融合句法和语义表示的属性抽取方法
CN113901172B (zh) 基于关键词结构编码的涉案微博评价对象抽取方法
CN114943216A (zh) 基于图注意力网络的案件微博属性级观点挖掘方法
Wu et al. A Text Emotion Analysis Method Using the Dual‐Channel Convolution Neural Network in Social Networks
Li et al. Emotion analysis for the upcoming response in open-domain human-computer conversation
Li et al. Augmenting the global semantic information between words to heterogeneous graph for deception detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant