CN108647204B - 一种跨领域情感分析方法 - Google Patents

一种跨领域情感分析方法 Download PDF

Info

Publication number
CN108647204B
CN108647204B CN201810394150.3A CN201810394150A CN108647204B CN 108647204 B CN108647204 B CN 108647204B CN 201810394150 A CN201810394150 A CN 201810394150A CN 108647204 B CN108647204 B CN 108647204B
Authority
CN
China
Prior art keywords
feature
domain
node
text
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810394150.3A
Other languages
English (en)
Other versions
CN108647204A (zh
Inventor
李维华
刘慧清
段云浩
王翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan University YNU
Original Assignee
Yunnan University YNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan University YNU filed Critical Yunnan University YNU
Priority to CN201810394150.3A priority Critical patent/CN108647204B/zh
Publication of CN108647204A publication Critical patent/CN108647204A/zh
Application granted granted Critical
Publication of CN108647204B publication Critical patent/CN108647204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于数据挖掘技术领域,公开了一种跨领域情感分析方法。本发明将源领域和目标领域看作全局的边缘分布,并基于贝叶斯网进行建模;然后,通过源领域特征模型和目标领域特征模型构建全局特征模型;第三,通过全局特征模型建立全局特征之间的关联,实现源领域和目标领域的特征扩展;最后,基于扩展的标签样本训练分类器,并使用分类器对目标领域非标签样本进行预测。通过本发明能够有效地缩小领域间距离,为标签样本不足的目标领域进行分析提供技术支持。

Description

一种跨领域情感分析方法
本发明属于数据挖掘技术领域,涉及一种跨领域情感分析方法,更为具体地讲,涉及一种基于贝叶斯网的跨领域情感分析方法。
背景技术
情感文本指的是带有主观情感倾向的文本。对文本的情感倾向进行分析,是舆情监控、口碑分析、话题监控等应用的重要技术基础。跨领域情感分析,研究的是在情感带有主题相关性和领域相关性、以及目标领域样本稀疏的条件下,如何充分利用相关源领域样本进行分析的技术问题。跨领域情感分析的关键就是缩小领域间的差异。目前跨领域情感分析主要的方法是基于传统机器学习的方法,如SFA(Spectral Feature Alignment)方法。SFA方法用图普聚类对特征进行聚类,以达到将源领域和目标领域的特征映射到同一个空间的目的。其次,是基于深度学习的分析方法,例如贾熹滨等提出“一种建立大规模跨领域文本情感倾向性分析框架的方法”(2016年11月9日公布的,公布号为CN106096004A的中国发明专利申请)。然而,基于深度学习的方法往往需要调整大量的参数,而且对源领域和目标领域之间差异没有足够重视。针对文本特征扩展的思想,袁满等提出的“一种基于频繁词集的短文本特征扩展方法”(《东南大学学报》,2014,第44卷第2期),该方法基于二元共现关系,利用可信度和支持度,将相关词扩展到同一领域的短文本中。贝叶斯网是每个结点都有一张概率表的有向无环图,不仅可以有效地表示不确定性知识,同时为知识的推理和分析提供了直观、有效、可靠的计算方法。
本发明利用贝叶斯网可以有效地进行知识表示和推理的优点,通过构建全局特征模型,将所有特征词之间依赖关系表示在一个知识网络中,并利用贝叶斯网的推理将这些知识结合进行特征扩展,为缩小领域间的差异提供有效的支持。
发明内容
针对现有技术中存在的不足,本发明在现有技术的基础上提出一种基于贝叶斯网的跨领域情感分析方法,利用贝叶斯网对不确定性知识表示和推理的能力,通过全局特征模型、建立源领域和目标领域之间的特征词之间的关系。具体来说,本发明具体技术方案包括:
第一步:针对源领域的情感文本集合,计算其特征词集合上的一个联合分布p S (.);针对目标领域上的情感文本集合,计算其特征词集合上的一个联合分布p T (.);在源领域特征词集合W S 和目标领域特征词集合W T 组成的集合W S W T 中学习一个特征词优先顺序;其中,所述的特征词优先顺序满足领域间的共同特征词W S W T 优先于其它特征词W S -W T W T - W S
第二步:领域特征词集合中的每一个特征词依次对应特征模型的一个节点;领域特征词集合中任意两个特征词uv,如果两个特征词的依赖度大于预设阀值时,则对应节点uv之间存在边uv;对任意边uv,如果满足u优先于v则定义有向边uv;如果v优先于u则定义有向边vu;学习源领域特征的参数,参数包括每一个节点u在其父节点pa S (u)条件下的条件概率表p S (u|pa S (u)),而且p S (u|pa S (u))通过联合分布p S (.)计算得到;学习目标领域特征模型的参数,参数每一个节点u在其父节点pa T (u)条件下的条件概率表p T (u|pa T (u)),而且p T (u|pa T (u))通过联合分布p T (.)计算得到;
第三步:将所有出现在源领域的特征词或者目标领域的特征词W=W S W T 定义为全局节点;对任意特征u,vW,如果在一个领域特征模型中uv之间存在边,则在全局特征词模型uv之间存在相同的边;如果任意特征u,vW T W S ,如果uv在源领域特征模型中或者目标领域特征模型中不存在边,那么删除uv之间的边;计算全局特征模型的参数;
第四步:基于全局特征模型,对源领域或目标领域的文本,计算该文本特征词都出现的条件下其它特征词的后验概率,根据后验概率从大到小的顺序选择β个特征词扩展到该文本特征中,β为正整数;
第五步:基于扩展之后的标签样本,训练分类器;基于分类器预测目标领域未知类别的情感文本的情感倾向。
以上技术方案可以看出,本发明具有如下的有益效果:
(1)本发明基于贝叶斯网建立源领域和目标领域之间的关系,将所有特征词之间依赖关系表示在一个知识网络中,为定量分析他们的关系建立技术基础;
(2)本发明可以利用贝叶斯网的推理能力,将目标领域特征词扩展到源领域中,将源领域特征词扩展到目标领域中,可以有效缩小领域间的差异。
附图说明
图1.本发明具体实施方式流程图;
图2.源领域特征模型;
图3.目标领域特征模型示例;
图4.全局特征模型。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
图1为本发明实施例提供的方法流程图,如图1所示,该方法可以包括以下步骤:
步骤101:量化源和目标领域情感文本
具体包括以下步骤:
第一,对源领域情感文本集合,提取sn个特征词W S ={w s1,w s2,…,w sn };对目标领域情感文本集合,提取tm个特征词W T ={w t1,w t2,…,w tm };
本发明实施中,通过分词、去除停用词,得到特征词,英文文本可以通过分词、去除停用词之后进行词性还原,提取unigram和bigrams词作为特征词,可以采用公知的TF-IDF权值对特征词进行筛选,减少特征词的数量。
第二,针对源领域上的情感文本集合,定义其特征词集合上的一个联合分布p S (.);针对目标领域上的情感文本集合,定义其特征词集合上的一个联合分布p T (.);
本实施中,针对源领域上的情感文本集合,可以采用如下的方法获得特征词集合的一个联合分布p S (w s1,w s2,…,w sn ):
指定特征词集合{w s1,w s2,…,w sn }中每一个特征词是否出现,其中,w si =1表示特征词w si 出现在文本中,w si =0表示特征词w si 不出现在文本中;统计满足条件的源领域情感文本数量,得到频度函数c S (w s1,w s2,…,w sn ),将c S (w s1,w s2,…,w sn )归一化得到源领域{w s1,w s2,…,w sn }上的联合分布p S (w s1,w s2,…,w sn )。
针对目标领域上的情感文本集合,可以采用如下的方法获得特征词集合的一个联合分布p T (w t1,w t2,…,w tm ):
指定特征词集合{w t1,w t2,…,w tm }中每一个特征词是否出现,其中,w ti =1表示特征词w ti 出现在文本中,w ti =0表示特征词w ti 不出现在文本中;统计满足条件的目标领域情感文本数量,得到频度函数c T (w t1,w t2,…,w tm ),将c T (w t1,w t2,…,w tm )归一化得到源领域{w t1,w t2,…,w tm }上的联合分布p T (w t1,w t2,…,w tm )。
第三,学习特征词W S W T 的优先顺序;
本实施例中,可以先将领域间的共同特征词W S W T 优先排在其它特征词(W S W T )-(W S W T )的前面,然后,再用特征词权值f(w i )由大到小的顺序分别调整领域间的共同特征的顺序和领域专有特征内部的顺序,而获得特征词的优先顺序。特征词的权重可以通过逆文档频IDF值定义,具体计算过程可以为:
(1)计算W S 中每一个特征词w i 的IDF权值
Figure 92584DEST_PATH_IMAGE001
,其中|D S |是源领域文本数,n S (w i )表示w i 在源领域中出现的文本数;
(2)计算W T 中每一个特征词w i 的IDF权值
Figure 798371DEST_PATH_IMAGE002
,其中|D T |是目标领域文本数,n T (w i )表示w i 在目标领域中出现的文本数;
(3)对于W S -W T 中的特征词,定义f T (w i )=0;对于W T -W S 中的特征词,定义f S (w i )=0;
(4)对特征词w i 的权值f(w i )=g(f S (w i )+f T (w i )),本发明实施中可以采用f(w i )=f S (w i )+f T (w i )。
步骤102:建立领域特征模型
具体包括以下步骤:
第一,分别针对源领域和目标领域,学习特征模型的结构;
对源领域及特征词{w s1,w s2,…,w sn };
首先,将{w s1,w s2,…,w sn }定义为节点;其次,对{w s1,w s2,…,w sn }中任意两个特征词uv,如果两个特征词的依赖度大于预设阀值时,uv之间存在边uv;对任意边uv,如果满足u优先于v则定义有向边uv;如果v优先于u则定义有向边vu;得到源领域特征模型的结构;
对目标领域及特征词{w t1,w t2,…,w tm };
首先,将{w t1,w t2,…,w tm }定义为节点;其次,对{w t1,w t2,…,w tm }中任意两个特征词uv,如果两个特征词的依赖度大于预设阀值时,uv之间存在边uv;对任意边uv,如果满足u优先于v则定义有向边uv;如果v优先于u则定义有向边vu;得到目标领域特征模型的结构;
在本实施例中,两个特征词uv的依赖度可以定义为
Figure 133538DEST_PATH_IMAGE003
,依赖阀值可以选择大于0的实数;
第二,学习特征模型的参数;
针对源领域,参数包括源领域每一个节点u在其父节点pa S (u)条件下的条件概率表
Figure 862459DEST_PATH_IMAGE004
,且通过源领域的联合分布p S (.)计算得到,具体为:
Figure 3591DEST_PATH_IMAGE005
针对目标领域,参数包括目标领域每一个节点u在其父节点pa T (u)条件下的条件概率表
Figure 501568DEST_PATH_IMAGE006
,且通过目标领域的联合分布p T (.)计算得到,具体为:
Figure 273215DEST_PATH_IMAGE007
步骤103:构建全局特征模型
具体包括以下步骤:
第一,将所有出现在源领域的特征词或者目标领域的特征词W=W S W T 定义为节点;
第二,对任意特征词u,vW,如果在一个领域特征模型中节点uv之间存在边,则在全局特征词模型中节点uv之间存在相同的边;
第三,如果任意特征词u,vW T W S ,如果节点uv在源领域特征模型中或者目标领域特征模型中不存在边,那么删除节点uv之间的边;
例如,图2所示的是源领域特征词集合W S ={w 1,w 2,w 3,w 4}上的特征模型。图3所示的是目标领域特征词集合W T ={w 1,w 2,w 3,w 5,w 6};按照步骤103的方法,w 1w 2没有包含在全局模型中;
例如,图4所示的就是在特征词集W={w 1,w 2,w 3,w 4,w 5,w 6}上的特征模型,通过图2和图3所示两个领域特征模型得到全局特征模型。
第四,学习全局特征模型的参数;
在本实施例中,可以采用下面的步骤学习全局特征模型的参数:
(1)对于W S -W T 中的每一个节点u在其父节点pa(u)条件下的条件概率表p(u|pa(u)),使用源领域中节点u的参数p S (u|pa(u))作为全局特征模型的参数;
例如图4所示的节点w 4,使用源领域中节点w 4的参数p S (w 4|w 2,w 3),如图2所示,作为全局特征模型中的节点w 4的参数;
(2)对于W T -W S 中的每一个节点u在其父节点pa(u)条件下的条件概率表p(u|pa(u)),使用目标领域中节点u的参数p T (u|pa(u))作为全局特征模型的参数;
例如图4所示的节点w 5,使用目标领域中节点w 5的参数p T (w 5|w 1,w 2),如图3所示,作为全局特征模型中的节点w 5的参数p(w 5|w 1,w 2);节点w 6,使用目标领域中节点w 6的参数p T (w 6|w 1)作为全局特征模型中的节点w 6的参数p(w 6|w 1);
(3)对于W T W S 中的每一个节点u,源领域和目标领域其父节点分别为pa S (u)和pa T (u),如果pa S (u)=pa T (u),则全局特征模型节点u的父节点pa(u)=pa S (u)=pa T (u),参数为:
Figure 286171DEST_PATH_IMAGE008
例如节点w 3,源领域特征模型和目标领域特征模型中节点w 3的参数分别为p S (w 3|w 1,w 2)和p T (w 3|w 1,w 2),使用平均值作为全局特征模型中的节点w 3的参数p(w 3|w 1,w 2);同理可求节点w 1的参数;
如果pa S (u)≠pa T (u),则本发明的全局特征模型的结构学习方法有pa S (u)⊂pa T (u)或者pa S (u)⊃pa T (u)。如果pa S (u)⊂pa T (u),则全局特征模型节点u的父节点pa(u)=pa S (u),参数为:
Figure 168676DEST_PATH_IMAGE009
如果pa S (u)⊃pa T (u),则全局特征模型节点u的父节点pa(u)=pa T (u),参数为:
Figure 521160DEST_PATH_IMAGE010
例如,节点w 2,源领域特征模型w 2的父节点集合为{w 1}、参数为p(w 2|w 1),目标领域特征模型中节点w 2的的父节点集合为空集∅、参数为p(w 2),则全局特征模型中的节点w 2的父节点pa(u)=∅,参数为:
Figure 463708DEST_PATH_IMAGE011
步骤104:领域文本特征词扩展
具体包括:基于全局特征模型,对源领域或目标领域的文本,计算该文本特征词都出现的条件下其它特征词的后验概率,根据后验概率从大到小的顺序选择β个特征词扩展到该文本特征中,β为正整数。
在本实施例中,可以采用下面的步骤实现特征扩展:
第一,对于源领域每一条带标签的情感文本,以及目标领域每一条情感文本,计算该文本特征词都出现的条件下其它特征词的后验概率;
第二,根据后验概率从大到小的顺序进行选择β个特征词为文本的扩展特征,β为正整数;
第三,根据分类器的训练需要,每个扩展特征词w的权值可以采用计算得到的后验概率进行定义。
例如,在图4所示特征集W={w 1,w 2,w 3,w 4,w 5,w 6}上的全局贝叶斯网,若某个源领域文本d i 的特征词集合为{w 1,w 2,w 4},计算特征w 5的后验概率θ i5=p(w 5=1|w 1=1,w 2=1,w 4=1),同理计算特征w 3w 6的后验概率θ i3θ i6;如果β=1,则按照θ i3θ i5θ i6其中的大者将w 3w 5w 6扩展文本d i 中。例如,如果θ i5最大,那么d i 扩展之后得到特征集合为{w 1,w 2,w 4, w 5}。
在本实施例中,可以采用贝叶斯网的推理算法计算后验概率,并且使用后验概率作为扩展词的权值。
步骤105:训练分类器完成目标领域分类
基于扩展之后的标签样本,训练分类器;基于分类器预测目标领域未知类别的情感文本的情感倾向。
本实施例中,分类器可以选择支持向量机SVM。
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (1)

1.一种跨领域情感分析方法,该方法的特征在于包括:
S1:针对源领域的情感文本集合,计算其特征词集合上的一个联合分布p S (.);针对目标领域上的情感文本集合,计算其特征词集合上的一个联合分布p T (.);在源领域特征词集合W S 和目标领域特征词集合W T 组成的集合W S W T 中学习一个特征词优先顺序,且优先顺序满足W S W T 优于(W S W T )-(W S W T );
S2:领域特征词集合中的每一个特征词依次对应特征模型的一个节点;领域特征词集合中任意两个特征词uv,如果两个特征词的依赖度大于预设阀值时,则对应节点uv之间存在边uv;对任意边uv,如果满足u优先于v则定义有向边uv;如果v优先于u则定义有向边vu;学习源领域特征的参数,参数包括每一个节点u在其父节点pa S (u)条件下的条件概率表p S (u|pa S (u)),而且p S (u|pa S (u))通过联合分布p S (.)计算得到;学习目标领域特征模型的参数,参数每一个节点u在其父节点pa T (u)条件下的条件概率表p T (u|pa T (u)),而且p T (u|pa T (u))通过联合分布p T (.)计算得到;
S3:将所有特征词W=W S W T 定义为全局节点;对任意特征u,vW,如果在一个领域特征模型中uv之间存在边,则在全局特征词模型uv之间存在相同的边;如果任意特征u,vW T W S ,如果uv在源领域特征模型中或者目标领域特征模型中不存在边,那么删除uv之间的边;计算全局特征模型的参数;
S4:基于全局特征模型,对源领域或目标领域的文本,计算该文本特征词都出现的条件下其它特征词的后验概率,根据后验概率从大到小的顺序选择β个特征词扩展到该文本特征中,β为正整数;
S5:基于扩展之后的标签样本,训练分类器;基于分类器预测目标领域未知类别的情感文本的情感倾向。
CN201810394150.3A 2018-04-27 2018-04-27 一种跨领域情感分析方法 Active CN108647204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810394150.3A CN108647204B (zh) 2018-04-27 2018-04-27 一种跨领域情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810394150.3A CN108647204B (zh) 2018-04-27 2018-04-27 一种跨领域情感分析方法

Publications (2)

Publication Number Publication Date
CN108647204A CN108647204A (zh) 2018-10-12
CN108647204B true CN108647204B (zh) 2021-09-17

Family

ID=63747928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810394150.3A Active CN108647204B (zh) 2018-04-27 2018-04-27 一种跨领域情感分析方法

Country Status (1)

Country Link
CN (1) CN108647204B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800275A (zh) * 2018-12-14 2019-05-24 北京达佳互联信息技术有限公司 模型构建方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714135A (zh) * 2009-12-11 2010-05-26 中国科学院计算技术研究所 一种跨领域文本情感倾向性分析方法
CN101770580A (zh) * 2009-01-04 2010-07-07 中国科学院计算技术研究所 一种跨领域的文本情感分类器的训练方法和分类方法
CN101882136A (zh) * 2009-05-08 2010-11-10 中国科学院计算技术研究所 文本情感倾向性分析方法
CN106960012A (zh) * 2017-03-01 2017-07-18 云南大学 一种跨领域垃圾评价识别的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770580A (zh) * 2009-01-04 2010-07-07 中国科学院计算技术研究所 一种跨领域的文本情感分类器的训练方法和分类方法
CN101882136A (zh) * 2009-05-08 2010-11-10 中国科学院计算技术研究所 文本情感倾向性分析方法
CN101714135A (zh) * 2009-12-11 2010-05-26 中国科学院计算技术研究所 一种跨领域文本情感倾向性分析方法
CN106960012A (zh) * 2017-03-01 2017-07-18 云南大学 一种跨领域垃圾评价识别的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Cross-Domain Sentiment Analysis: An Empirical Investigation;Brian Heredia;《2016 IEEE 17th International Conference on Information Reuse and Integration》;20160730;160-165 *
Cross-domain Sentiment Classification using an Adapted Na¨ıve Bayes Approach and Features Derived from Syntax Trees;Srilaxmi Cheeti;《Proceedings of the International Conference on Knowledge Discovery and Information Retrieval and the International Conference on Knowledge Management and Information Sharing》;20131231;169-176 *
一种改进EM算法的跨领域情感分类方法;黄瑞阳;《计算机应用研究》;20170930;第34卷(第9期);2696-2699 *
基于分组提升集成的跨领域文本情感分类;赵传君;《计算机研究与发展》;20151231;第52卷(第3期);629-638 *
文本倾向性分析技术的相关研究;董晶晶;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20121015(第10期);I138-3161 *

Also Published As

Publication number Publication date
CN108647204A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108052593B (zh) 一种基于主题词向量和网络结构的主题关键词提取方法
CN109635291B (zh) 一种基于协同训练的融合评分信息和物品内容的推荐方法
CN111008274B (zh) 特征扩展卷积神经网络的案件微博观点句识别构建方法
CN108009249B (zh) 针对不平衡数据的融合用户行为规则的垃圾评论过滤方法
US9043356B2 (en) Document processing method and system
US8620837B2 (en) Determination of a basis for a new domain model based on a plurality of learned models
CN111046171B (zh) 一种基于细粒度标注数据的情感判别方法
CN107357899B (zh) 基于和积网络深度自动编码器的短文本情感分析方法
CN107729290B (zh) 一种利用局部敏感哈希优化的超大规模图的表示学习方法
CN111581368A (zh) 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN112182156B (zh) 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN114925205B (zh) 基于对比学习的gcn-gru文本分类方法
CN116521882A (zh) 基于知识图谱的领域长文本分类方法及系统
Pina et al. A simple and efficient method to generate word sense representations
CN114742071B (zh) 基于图神经网络的汉越跨语言观点对象识别分析方法
CN108647204B (zh) 一种跨领域情感分析方法
Zhang et al. Heer: Heterogeneous graph embedding for emerging relation detection from news
CN108694165B (zh) 面向产品评论的跨领域对偶情感分析方法
WO2023083176A1 (zh) 样本处理方法、设备及计算机可读存储介质
CN106815211B (zh) 一种基于循环聚焦机制进行文档主题建模的方法
CN111310451A (zh) 敏感词词典生成方法、装置及存储介质和电子设备
CN114912446A (zh) 一种关键词抽取方法、装置及储存介质
CN111199154B (zh) 基于容错粗糙集的多义词词表示方法、系统及介质
JP2006285419A (ja) 情報処理装置および方法、並びにプログラム
JP5008096B2 (ja) 文書自動分類方法及び文書自動分類システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant