CN108694165B - 面向产品评论的跨领域对偶情感分析方法 - Google Patents

面向产品评论的跨领域对偶情感分析方法 Download PDF

Info

Publication number
CN108694165B
CN108694165B CN201710229726.6A CN201710229726A CN108694165B CN 108694165 B CN108694165 B CN 108694165B CN 201710229726 A CN201710229726 A CN 201710229726A CN 108694165 B CN108694165 B CN 108694165B
Authority
CN
China
Prior art keywords
words
sample
field
word
antisense
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710229726.6A
Other languages
English (en)
Other versions
CN108694165A (zh
Inventor
夏睿
王乐义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201710229726.6A priority Critical patent/CN108694165B/zh
Publication of CN108694165A publication Critical patent/CN108694165A/zh
Application granted granted Critical
Publication of CN108694165B publication Critical patent/CN108694165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种面向产品评论的跨领域对偶情感分析方法,该方法包括:对于给定目标领域的产品评论数据,获取源领域标注语料资源,随后对源领域和目标领域的样本数据预处理;借助英文本体库为语料中的特征词构建具有一对多关系的带权反义词典;结合改进的知识规则和带权反义词典为源领域和目标领域的样本构造翻转数据集,扩充语料;采用“词袋”模型对数据集中的原样本及翻转样本进行文本表示,并对翻转样本中引入的带权情感词进行加权表示;采用对偶学习方法训练基分类器,并使用基于置信度的集成策略进行基分类器集成。本发明能较好地解决情感分析任务中产品评论等短文本的数据稀疏问题、极性转移问题,并在领域适应问题上表现良好。

Description

面向产品评论的跨领域对偶情感分析方法
技术领域
本发明涉及人工智能、自然语言处理领域,具体涉及一种面向产品评论的跨领域情感分析方法。
背景技术
随着计算机与网络技术的不断发展,当今互联网已进入社交媒体时代。越来越多的用户乐于在网络上分享自己对产品或事物观点和体验。微博、在线产品评论等带有主观倾向性的文本资源急剧膨胀。对于海量的主观文本信息,仅依靠人工进行跟踪、组织和管理已难以实现,如何利用计算机技术对互联网上的主观文本信息进行自动分析、挖掘用户的观点倾向,已逐渐成为当下最迫切的需求。
文本主观倾向性分析,又称文本情感分析,是自然语言处理领域研究的热点问题之一。由于情感分析任务是一个领域相关的课题,即不同领域间数据分布的差异,往往导致特征词在不同领域表现不同的情感极性。传统的基于监督学习的机器学习方法需要大量的有标注样本构建模型,而对于标注语料匮乏的领域,采用人工标注的方式,不仅需要昂贵的人力成本,效率也很低;另一方面,随着情感分析任务的研究,部分领域已积累了充足的有情感标注信息的语料。如何利用情感标注语料丰富的领域对标注语料匮乏的目标领域的样本进行跨领域情感分析已逐渐成为情感分析领域研究的热点。
虽然随着研究的深入,情感分析技术已取得了很大的进展,但仍存在一些问题有待进一步研究。如情感分类任务中的否定转移问题、领域适应问题、短文本数据稀疏问题等等。
发明内容
本发明的目的在于提供一种面向产品评论的跨领域对偶情感分析方法,解决产品评论、微博等短文本的数据稀疏性、否定情感转移问题及情感分类任务的领域适应问题。
实现本发明目的的技术方案为:一种面向产品评论的跨领域对偶情感分析方法,包括以下步骤:
步骤1,对于给定目标领域的产品评论数据,首先为其选定情感标注语料规模不低于目标领域四倍的领域作为源领域,获取源领域标注语料资源;随后对源领域和目标领域的样本数据预处理,包括分词、词性标注和停用词过滤;
步骤2,借助英文本体库通过迭代查询的方式遍历源领域及目标领域语料中所有特征词的反义词,并根据反义词在数据集中的词频信息,为每个特征词的多个反义词分别设置权重,构建具备一对多关系的带权反义词典;
步骤3,使用步骤2构建的带权反义词典,结合跨领域翻转样本构造规则构造翻转样本,从而扩充源领域和目标领域的样本数据;
步骤4,采用“词袋”模型对数据集中的原样本及翻转样本进行文本表示,并对翻转样本中引入的带权情感词进行加权表示;
步骤5,采用对偶学习方法训练基分类器,并使用基于置信度的集成策略进行基分类器集成。
与现有技术相比,本发明的有益效果为:
(1)否定词、转折词的出现往往伴随情感极性的转移,本发明通过设计跨领域翻转样本构造规则扩充样本集的同时,有效的解决了否定、转折语言结构中的情感极性转移问题;
(2)借助英文本体库查询源领域和目标领域语料中每个特征词的反义词,并根据每个特征词的多个反义词在数据集中的频率信息分别为其设置权重;这种带权反义词典体现了特征词在源领域和目标领域的综合分布。
(3)通过移除原样本中的特征词,并采用加权的方式为移除的特征词引入多个情感反义词,有效的改善了短文本的数据稀疏性。
(4)在构建翻转样本时,对原样本中的情感词采用一对多的替换方法,引入丰富的先验知识的同时,为样本引入了来自全局情感特征词,从而削弱样本中情感词的领域依赖性,使得翻转样本更具有领域适应性,为跨领域情感分析提供了新的思路。
附图说明
图1为本发明面向产品评论的跨领域对偶情感分析方法的流程图。
具体实施方式
结合图1,本发明的一种面向产品评论的跨领域对偶情感分析方法,包括以下步骤:
步骤1,对于给定目标领域的产品评论数据,首先为其选定情感标注语料规模不低于目标领域四倍的领域作为源领域,获取源领域标注语料资源;随后对源领域和目标领域的样本数据预处理,包括分词、词性标注和停用词过滤;
步骤2,借助英文本体库通过迭代查询的方式遍历源领域及目标领域语料中所有特征词的反义词,并根据反义词在数据集中的词频信息,为每个特征词的多个反义词分别设置权重,构建具备一对多关系的带权反义词典;
步骤3,使用步骤2构建的带权反义词典,结合跨领域翻转样本构造规则构造翻转样本,从而扩充源领域和目标领域的样本数据;
步骤4,采用“词袋”模型对数据集中的原样本及翻转样本进行文本表示,并对翻转样本中引入的带权情感词进行加权表示;
步骤5,采用对偶学习方法训练基分类器,并使用基于置信度的集成策略进行基分类器集成。
进一步的,所述步骤1具体为:
A)对于给定目标领域的产品评论数据,首先为其选定情感标注语料规模不低于目标领域四倍的领域作为源领域,获取源领域标注语料资源;
B)使用现有的开源分词和词性标注工具对源领域及目标领域的语料进行分词、词性标注,并过滤语料中的停用词。
进一步的,使用的分词和词性标注工具包括NLTK,Stanford-PosTagger。
进一步的,步骤2所述具有一对多关系的带权反义词典的构建方法具体为:
借助英文本体库通过迭代查询的方式遍历源领域和目标领域中所有形容词、动词、副词的反义词,并根据各反义词在数据集的词频信息,为每个特征择的多个反义词分别设置权重,构建具备一对多关系的带权反义词典;
特征词的反义词权重计算策略如下:
A)BOOL权重策略,即将每个特征词的多个反义词的权重均设置为1;
B)词频权重策略,采用一种基于词频与权重映射关系的表示方法;
首先,定义一种词频和权重信息的映射关系,
Figure BDA0001266287600000031
表示为:
Figure BDA0001266287600000032
其中
Figure BDA0001266287600000033
为权重向量,维度为词表大小,
Figure BDA0001266287600000034
为词频权重,
Figure BDA0001266287600000035
为词表,#V为词表大小。
进一步的,使用的英文本体库为WordNet。
进一步的,步骤3中跨领域翻转样本构造规则具体为:
A)对样本按标点切分子句;若子句中不存在否定词或转折词,则将子句中的情感词移除,并将被移除情感词的所有反义词加入该样本的“词袋”;
若子句中存在否定或转折词,则移除否定词和转折词,否定域和转折域中的情感词保持不变,否定域外的情感词仍按子句中不存在否定词或转折词的规则构造翻转样本;
B)翻转训练集中样本的情感标签。
进一步的,步骤4具体为:
文本特征采用BOOL权重表示方法,对于样本中未翻转词语仍使用BOOL权重表示,对于翻转后添加的词语,使用步骤3所述带权反义词典进行加权表示。
进一步的,所述步骤5中,采用Logistic模型或Navie Bayes算法学习基分类器,具体为:
A)对偶学习阶段:使用源领域的原样本和翻转样本作为训练集训练基分类器clsa;仅使用源领域的原样本训练基分类器clsb
B)对偶预测阶段:使用基分类器clsa分别预测目标领域原样本和翻转样本;使用基分类器clsb预测目标领域原样本;
C)分类器集成阶段:
(1)基于权重的集成:如式(2)中所示,其中权重参数α,0≤α≤1,po(+|x)为基分类器clsa预测目标领域原样本为正类的概率,
Figure BDA0001266287600000041
为基分类器clsa预测目标领域翻转样本预测为负类的概率;
Figure BDA0001266287600000042
为采用(2)中加权的方式集成目标领域原样本、翻转样本关于类别y的预测概率;
Figure BDA0001266287600000043
(2)基于置信度的集成:采用置信度平滑概率,如式(3)所示,其中
Figure BDA0001266287600000044
为样本最终预测的标签,p(y|x)为基分类器clsb预测目标领域原样本的概率,Δp为
Figure BDA0001266287600000045
c为置信度,取[-0.3,0.3],其中,当c<0时,系统更信任基于权重的集成
Figure BDA0001266287600000051
Figure BDA0001266287600000052
下面结合实施例对本发明作进一步说明。
实施例
一种面向产品评论的跨领域对偶情感分析方法,用于对产品评论或微博等短文本语料进行跨领域预测,如图1所示,包括以下步骤:
1)对于给定的目标领域的产品评论数据,首先为其选定情感标注语料规模不低于目标领域四倍的领域作为源领域,获取源领域标注语料资源;使用现有的开源分词和词性标注工具,例如NLTK,Stanford-PosTagger,对源领域及目标领域的语料进行分词、词性标注,并过滤语料中的停用词。以表1为例;
表1样本实例预处理
Figure BDA0001266287600000053
2)使用英文本体库WordNet根据词性标注信息,为源领域及目标领域语料中所有的形容词、动词、副词查询反义词,并根据各反义词在数据集的词频信息,为每个特征择的多个反义词分别设置权重,构建具备一对多关系的带权反义词典。以表2为例;
表2构建带权反义词典
Figure BDA0001266287600000054
3)使用第二步所述具备一对多关系的带权反义词典,结合改进的知识规则构造翻转样本,扩充源领域和目标领域的样本数据。根据改进的知识规则:
A)首先对样本按标点切分子句;若子句中不存在否定词或转折词,则将子句中的情感词移除,并将被移除特征词的所有反义词加入该样本的“词袋”;
B)若子句中存在否定或转折词,则移除否定词和转折词,否定域和转折域中的情感词保持不变,否定域外的情感词仍按A)中规则构造翻转样本;
C)翻转训练集中样本的情感标签。
示例样本翻转后结果如表3所示。
表3构建翻转样本
Figure BDA0001266287600000061
对于表3中给定的原样本来自“movie”,在样本翻转过程中移除情感词“funny”,“expensive”的同时,引入其带权的反义词,其中情感词“broken”,“beautiful”本身并非movie领域的情感词,通过这种翻转样本构造方式,再引入本领域特征情感词的同时,引入多个来自其他领域的特征情感词,在一定程度上削弱了样本的领域依赖性。
4)采用“词袋”模型对数据集中的原样本及翻转样本进行文本表示,并对翻转样本中加入的带权情感词进行加权表示。若文本特征采用BOOL权重表示方法,则对于样本中未翻转词语仍使用BOOL权重表示,对于翻转后添加的词语,使用3)中构造的一对多反义词典进行加权表示。采用稀疏的文本表示方式,原样本和翻转样本的文本表示如表4所示:
表4样本的文本表示
Figure BDA0001266287600000062
5)采用Logistic模型或Navie Bayes算法学习基分类器。主要分为一下几个阶段:
A)对偶学习阶段:使用源领域的原样本和翻转样本作为训练集训练基分类器clsa;仅使用源领域的原样本训练基分类器clsb
B)对偶预测阶段:使用基分类器clsa分别预测目标领域原样本和翻转样本;使用基分类器clsb预测目标领域原样本;
C)分类器集成阶段:
(1)基于权重的集成:如式(4)所示,其中权重参数α取0.5,po(+|x)为基分类器clsa预测目标领域原样本为正类的概率为0.6,
Figure BDA0001266287600000071
为基分类器clsa预测目标领域翻转样本预测为负类的概率为0.3;
Figure BDA0001266287600000072
为采用(2)中加权的方式集成目标领域原样本、翻转样本关于类别y的预测概率;
Figure BDA0001266287600000073
虽然基分类器clsa错误预测目标领域原样本为正类,但
Figure BDA0001266287600000074
为基分类器clsa预测目标领域翻转样本预测为负类的概率仅0.3,通过这种加权集成的方式同时考虑原样本和翻转样本的预测结果,最终使得基分类器clsa错误预测得到纠正。
(2)基于置信度的集成:置信度c取-0.3,基分类器clsb预测目标领域原样本的概率p(+|x)=0.6
Figure BDA0001266287600000075
根据公式(3)、(5)知,Δp>c=-0.3
Figure BDA0001266287600000076
最终预测原样本类别为正类。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

Claims (7)

1.一种面向产品评论的跨领域对偶情感分析方法,其特征在于,包括以下步骤:
步骤1,对于给定目标领域的产品评论数据,首先为其选定情感标注语料规模不低于目标领域四倍的领域作为源领域,获取源领域标注语料资源;随后对源领域和目标领域的样本数据预处理,包括分词、词性标注和停用词过滤;
步骤2,借助英文本体库通过迭代查询的方式遍历源领域及目标领域语料中所有特征词的反义词,并根据反义词在数据集中的词频信息,为每个特征词的多个反义词分别设置权重,构建具备一对多关系的带权反义词典;
步骤3,使用步骤2构建的带权反义词典,结合跨领域翻转样本构造规则构造翻转样本,从而扩充源领域和目标领域的样本数据;
步骤4,采用“词袋”模型对数据集中的原样本及翻转样本进行文本表示,并对翻转样本中引入的带权情感词进行加权表示;
步骤5,采用Logistic模型或Navie Bayes算法学习基分类器,具体为:
A)对偶学习阶段:使用源领域的原样本和翻转样本作为训练集训练基分类器clsa;仅使用源领域的原样本训练基分类器clsb
B)对偶预测阶段:使用基分类器clsa分别预测目标领域原样本和翻转样本;使用基分类器clsb预测目标领域原样本;
C)分类器集成阶段:
(1)基于权重的集成:如式(2)中所示,其中权重参数α(0≤α≤1),po(+|x)为基分类器clsa预测目标领域原样本为正类的概率,
Figure FDA0003220169380000011
为基分类器clsa预测目标领域翻转样本预测为负类的概率;
Figure FDA0003220169380000012
为采用(2)中加权的方式集成目标领域原样本、翻转样本关于类别y的预测概率;
Figure FDA0003220169380000013
(2)基于置信度的集成:采用置信度平滑概率,如式(3)所示,其中
Figure FDA0003220169380000014
为样本最终预测的标签,p(y|x)为基分类器clsb预测目标领域原样本的概率,Δp为
Figure FDA0003220169380000021
c为置信度,其中,当c<0时,系统更信任基于权重的集成
Figure FDA0003220169380000022
Figure FDA0003220169380000023
2.根据权利要求1所述的面向产品评论的跨领域对偶情感分析方法,其特征在于,所述步骤1具体为:
A)对于给定目标领域的产品评论数据,首先为其选定情感标注语料规模不低于目标领域四倍的领域作为源领域,获取源领域标注语料资源;
B)使用现有的开源分词和词性标注工具对源领域及目标领域的语料进行分词、词性标注,并过滤语料中的停用词。
3.根据权利要求2所述的面向产品评论的跨领域对偶情感分析方法,其特征在于,使用的分词和词性标注工具包括NLTK,Stanford-PosTagger。
4.根据权利要求1所述的面向产品评论的跨领域对偶情感分析方法,其特征在于,步骤2所述具备 一对多关系的带权反义词典的构建方法具体为:
借助英文本体库通过迭代查询的方式遍历源领域和目标领域中所有形容词、动词、副词的反义词,并根据各反义词在数据集的词频信息,为每个特征择的多个反义词分别设置权重,构建具备一对多关系的带权反义词典;
特征词的反义词权重计算策略如下:
A)BOOL权重策略,即将每个特征词的多个反义词的权重均设置为1;
B)词频权重策略,采用一种基于词频与权重映射关系的表示方法;
首先,定义一种词频和权重信息的映射关系,
Figure FDA0003220169380000024
表示为:
Figure FDA0003220169380000025
其中
Figure FDA0003220169380000026
为权重向量,维度为词表大小,
Figure FDA0003220169380000027
为词频权重,
Figure FDA0003220169380000028
为词表,#V为词表大小。
5.根据权利要求4所述的面向产品评论的跨领域对偶情感分析方法,其特征在于,使用的英文本体库为WordNet。
6.根据权利要求1所述的面向产品评论的跨领域对偶情感分析方法,其特征在于,步骤3中跨领域翻转样本构造规则具体为:
A)对样本按标点切分子句;若子句中不存在否定词或转折词,则将子句中的情感词移除,并将被移除情感词的所有反义词加入该样本的“词袋”;
若子句中存在否定或转折词,则移除否定词和转折词,否定域和转折域中的情感词保持不变,否定域外的情感词仍按子句中不存在否定词或转折词的规则构造翻转样本;
B)翻转训练集中样本的情感标签。
7.根据权利要求1所述的面向产品评论的跨领域对偶情感分析方法,其特征在于,步骤4具体为:
文本特征采用BOOL权重表示方法,对于样本中未翻转词语仍使用BOOL权重表示,对于翻转后添加的词语,使用步骤3所述带权反义词典进行加权表示。
CN201710229726.6A 2017-04-10 2017-04-10 面向产品评论的跨领域对偶情感分析方法 Active CN108694165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710229726.6A CN108694165B (zh) 2017-04-10 2017-04-10 面向产品评论的跨领域对偶情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710229726.6A CN108694165B (zh) 2017-04-10 2017-04-10 面向产品评论的跨领域对偶情感分析方法

Publications (2)

Publication Number Publication Date
CN108694165A CN108694165A (zh) 2018-10-23
CN108694165B true CN108694165B (zh) 2021-11-09

Family

ID=63843219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710229726.6A Active CN108694165B (zh) 2017-04-10 2017-04-10 面向产品评论的跨领域对偶情感分析方法

Country Status (1)

Country Link
CN (1) CN108694165B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857852B (zh) * 2019-01-24 2021-02-23 安徽商贸职业技术学院 一种电商在线评论训练集特征的筛选判断方法及系统
CN113434628B (zh) * 2021-05-14 2023-07-25 南京信息工程大学 一种基于特征级与传播关系网络的评论文本置信检测方法
CN118606480A (zh) * 2024-08-08 2024-09-06 之江实验室 一种基于知识迁移的多领域情感分类方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714135A (zh) * 2009-12-11 2010-05-26 中国科学院计算技术研究所 一种跨领域文本情感倾向性分析方法
CN101770580A (zh) * 2009-01-04 2010-07-07 中国科学院计算技术研究所 一种跨领域的文本情感分类器的训练方法和分类方法
CN101882136A (zh) * 2009-05-08 2010-11-10 中国科学院计算技术研究所 文本情感倾向性分析方法
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN102760153A (zh) * 2011-04-21 2012-10-31 帕洛阿尔托研究中心公司 将词典知识合并入svm学习以改进情感分类
CN103116637A (zh) * 2013-02-08 2013-05-22 无锡南理工科技发展有限公司 一种面向中文Web评论的文本情感分类方法
CN103544246A (zh) * 2013-10-10 2014-01-29 清华大学 互联网多种情感词典构建方法及系统
CN104317965A (zh) * 2014-11-14 2015-01-28 南京理工大学 基于语料的情感词典构建方法
CN106202584A (zh) * 2016-09-20 2016-12-07 北京工业大学 一种基于标准词典和语义规则的微博情感分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311973B1 (en) * 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers
KR101567789B1 (ko) * 2014-08-26 2015-11-11 숭실대학교산학협력단 상대적 감정 유사도를 이용한 단어의 쾌-불쾌 지수 예측 장치 및 방법

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770580A (zh) * 2009-01-04 2010-07-07 中国科学院计算技术研究所 一种跨领域的文本情感分类器的训练方法和分类方法
CN101882136A (zh) * 2009-05-08 2010-11-10 中国科学院计算技术研究所 文本情感倾向性分析方法
CN101714135A (zh) * 2009-12-11 2010-05-26 中国科学院计算技术研究所 一种跨领域文本情感倾向性分析方法
CN102760153A (zh) * 2011-04-21 2012-10-31 帕洛阿尔托研究中心公司 将词典知识合并入svm学习以改进情感分类
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN103116637A (zh) * 2013-02-08 2013-05-22 无锡南理工科技发展有限公司 一种面向中文Web评论的文本情感分类方法
CN103544246A (zh) * 2013-10-10 2014-01-29 清华大学 互联网多种情感词典构建方法及系统
CN104317965A (zh) * 2014-11-14 2015-01-28 南京理工大学 基于语料的情感词典构建方法
CN106202584A (zh) * 2016-09-20 2016-12-07 北京工业大学 一种基于标准词典和语义规则的微博情感分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《基于知识语义权重特征的朴素贝叶斯情感分类算法》;冀俊忠;《北京工业大学学报》;20141230;全文 *
《机器学习与语义规则融合的微博情感分类方法》;姜杰 等;《北京大学学报(自然科学版)》;20170320;全文 *
《跨领域迁移学习产品评论情感分析》;张志武;《数据分析与知识发现》;20130630;全文 *

Also Published As

Publication number Publication date
CN108694165A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
Alam et al. The impact of preprocessing steps on the accuracy of machine learning algorithms in sentiment analysis
CN109753566B (zh) 基于卷积神经网络的跨领域情感分析的模型训练方法
CN111160037B (zh) 一种支持跨语言迁移的细粒度情感分析方法
Tellez et al. An automated text categorization framework based on hyperparameter optimization
CN109960786A (zh) 基于融合策略的中文词语相似度计算方法
Nasim et al. Sentiment analysis on Urdu tweets using Markov chains
CN108038106B (zh) 一种基于上下文语义的细粒度领域术语自学习方法
CN107315734A (zh) 一种基于时间窗口和语义的变体词规范化的方法和系统
CN108694165B (zh) 面向产品评论的跨领域对偶情感分析方法
CN103885933A (zh) 用于评价文本的情感度的方法和设备
Gharavi et al. Scalable and language-independent embedding-based approach for plagiarism detection considering obfuscation type: no training phase
CN111626050A (zh) 基于表情词典与情感常识的微博情感分析方法
Berdyugina et al. Automatic extraction of inventive information out of patent texts in support of manufacturing design studies using Natural Languages Processing
Wang Information Extraction and Knowledge Map Construction based on Natural Language Processing
Sharma A comparative analysis of Hindi word sense disambiguation and its approaches
Sun Research on product attribute extraction and classification method for online review
Alshahrani et al. Word mover's distance for affect detection
CN114912446A (zh) 一种关键词抽取方法、装置及储存介质
Shahade et al. Deep learning approach-based hybrid fine-tuned Smith algorithm with Adam optimiser for multilingual opinion mining
Fan et al. Multi-label Chinese question classification based on word2vec
CN113590768A (zh) 一种文本关联度模型的训练方法及装置、问答方法及装置
Umidjon UNLOCKING THE POWER OF NATURAL LANGUAGE PROCESSING (NLP) FOR TEXT ANALYSIS
Surya et al. A comprehensive study on machine learning concepts for text mining
Le et al. A multi-filter BiLSTM-CNN architecture for vietnamese sentiment analysis
Nguyen et al. Text summarization on large-scale Vietnamese datasets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant