CN105183807A - 一种基于结构句法的情绪原因事件识别方法及系统 - Google Patents

一种基于结构句法的情绪原因事件识别方法及系统 Download PDF

Info

Publication number
CN105183807A
CN105183807A CN201510530866.8A CN201510530866A CN105183807A CN 105183807 A CN105183807 A CN 105183807A CN 201510530866 A CN201510530866 A CN 201510530866A CN 105183807 A CN105183807 A CN 105183807A
Authority
CN
China
Prior art keywords
word
training
phrase
text
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510530866.8A
Other languages
English (en)
Inventor
李寿山
徐健
周国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhangjiagang Institute of Industrial Technologies Soochow University
Original Assignee
Zhangjiagang Institute of Industrial Technologies Soochow University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhangjiagang Institute of Industrial Technologies Soochow University filed Critical Zhangjiagang Institute of Industrial Technologies Soochow University
Priority to CN201510530866.8A priority Critical patent/CN105183807A/zh
Publication of CN105183807A publication Critical patent/CN105183807A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于结构句法的情绪原因事件识别方法及系统,包括:获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;确定所述训练词组中每个词语的结构句法特征;利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。本发明实施例提供的一种基于结构句法的情绪原因事件识别方法及系统获取待测文本的情绪原因事件的准确率较高,即对于情绪原因事件的识别性能较好。

Description

一种基于结构句法的情绪原因事件识别方法及系统
技术领域
本发明涉及信息抽取技术领域,更具体地说,涉及一种基于结构句法的情绪原因事件识别方法及系统。
背景技术
随着互联网的高速发展,网络信息数据不断增加,大量信息以电子文本的形式呈现在人们面前。而如何从这些大量的信息中迅速、准确地提取出人们所需求的重要信息就越发重要。
信息抽取是从文本信息中自动获取所需信息的一种主要手段。信息抽取是将无结构的文本信息,按照人们的需求识别和抽取出来,转化为结构化或半结构化的信息,并采用数据库的形式存储,以便人们查询和进一步的分析、利用。其中,由文本信息中获取其情绪原因事件是信息抽取中的一个重要方面,情绪原因事件是指文本信息(可以是某段语句)中情绪的触发事件。例如,对于文本信息:IamhappybecauseIhavepassedthetest。该句中情绪对应的情绪词为happy,与之对应的情绪原因事件为Ihavepassedthetest。
目前,情绪原因事件识别方法大多是基于机器学习的方法,即使用统计的方法进行研究。主要还是基于全监督的学习方法,这种方法把情绪原因事件识别看成分类问题,选择合适的特征并使用合适的分类器来完成。但是,这种方法获取待测文本的情绪原因事件的准确率较低。
综上所述,现有技术中的情绪原因事件识别方法存在获取待测文本的情绪原因事件的准确率较低的问题。
发明内容
本发明的目的是提供一种基于结构句法的情绪原因事件识别方法及系统,以解决现有技术中存在的获取待测文本的情绪原因事件的准确率较低的问题。
为了实现上述目的,本发明提供如下技术方案:
一种基于结构句法的情绪原因事件识别方法,包括:
获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;
将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;
确定所述训练词组中每个词语的结构句法特征;
利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;
利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。
优选的,所述利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型,包括:
确定每个所述训练词组中与该训练词组的情绪原因事件对应的训练情绪词;其中,所述训练词组的情绪原因事件为与所述训练词组对应的训练文本的情绪原因事件;
确定每个所述训练词组中每个词语的词特征、词性特征及词距离;其中,每个所述训练词组中每个词语的词距离为该训练词组中每个词语与该训练词组中的训练情绪词之间的距离;
利用每个所述训练词组及该训练词组中每个词语的词特征、词性特征、词距离及结构句法特征训练CRF模型。
优选的,确定每个所述训练词组中每个词语的词特征、词性特征及结构句法特征,包括:
利用Stanford工具确定所述训练词组中每个词语的词特征、词性特征及结构句法特征。
优选的,所述确定每个所述训练词组中每个词语的词特征、词性特征及词距离,包括:
确定每个所述训练词组中每个词语的词特征、词性特征及词距离;其中,每个所述训练词组中位于该训练词组中的训练情绪词左边的词语的词距离为负数,位于该训练词组中的训练情绪词右边的词语的词距离为正数。
优选的,所述利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件,包括:
获取待测文本,所述待测文本为未提供其情绪原因事件的文本;
将所述待测文本进行分词处理,得到待测词组;
确定所述待测词组中包括的待测情绪词;
确定所述待测词组中每个词语的词特征、词性特征、词距离及结构句法特征;其中,所述待测词组中每个词语的词距离为该待测词组中每个词语与待测情绪词之间的距离;
利用所述待测词组中每个词语的词特征、词性特征、词距离及结构句法特征,通过所述CRF模型,得到所述待测文本的情绪原因事件。
一种基于结构句法的情绪原因事件识别系统,包括:
获取模块,用于获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;
分词模块,用于将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;
第一确定模块,用于确定所述训练词组中每个词语的结构句法特征;
训练模块,用于利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;
第二确定模块,用于利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。
本发明提供的一种基于结构句法的情绪原因事件识别方法及系统,包括:获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;确定所述训练词组中每个词语的结构句法特征;利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。与现有技术相比,本申请中利用训练文本进行分词后的词组及词组中每个词语的结构句法特征构建CRF(conditionalrandomfieldalgorithm,条件随机场算法)模型,即建立一个统一的概率模型,进一步利用上述CRF模型确定待测文本的情绪原因事件,实验证明,本发明实施例提供的一种基于结构句法的情绪原因事件识别方法及系统获取待测文本的情绪原因事件的准确率较高,即对于情绪原因事件的识别性能较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于结构句法的情绪原因事件识别方法的流程图;
图2为本发明实施例提供的一种基于结构句法的情绪原因事件识别方法中结构句法特征中各节点的示意图;
图3为本发明实施例提供的一种基于结构句法的情绪原因事件识别方法中步骤S16的流程图;
图4为本发明实施例提供的一种基于结构句法的情绪原因事件识别系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种基于结构句法的情绪原因事件识别方法的流程图,可以包括以下步骤:
S11:获取预设量的训练文本,训练文本为已提供其情绪原因事件的文本。
其中,预设量可根据实际需要进行确定。
S12:将训练文本进行分词处理,得到分别与每个训练文本对应的训练词组。
其中,分词处理即为将一段文本分割成词语的组合,如将语句“我很高兴”,分割成“我”“很”“高兴”。另外,本发明实施例中训练文本及下文中的待测文本可以是英文文本,也可以是中文文本。
S13:确定训练词组中每个词语的结构句法特征。
S14:利用训练词组及每个训练词组包括的每个词语的结构句法特征训练CRF模型。
S15:利用CRF模型确定待测词组对应的待测文本的情绪原因事件。
本申请中利用训练文本进行分词后的词组及词组中每个词语的结构句法特征构建CRF(conditionalrandomfieldalgorithm,条件随机场算法)模型,即建立一个统一的概率模型,进一步利用上述CRF模型确定待测文本的情绪原因事件,实验证明,本发明实施例提供的一种基于结构句法的情绪原因事件识别方法获取待测文本的情绪原因事件的准确率较高,即对于情绪原因事件的识别性能较好。
其中,利用训练词组及每个训练词组包括的每个词语的结构句法特征训练CRF模型,可以是,将训练词组及每个训练词组包括的每个词语的结构句法特征处理成CRF++所需的格式,然后将其训练成CRF模型。
另外,针对序列标注模型的求解,表现较好的是条件随机场方法,即与CRF模型对应的方法。CRF模型,即条件随机场模型是Lafferty等在最大熵模型和隐马尔可夫模型的基础上提出的一种无向图学习模型,是一种用于标注和切分有序数据的条件概率模型。CRF模型对应的方法是对序列的整体优化。具体求解公式如下:
p λ ( Y | W ) = 1 Z ( W ) exp ( Σ t ∈ T Σ k λ k f k ( y t - 1 , W , t ) )
其中,Y={yt}表示对应的输出标记序列;yt∈{B,I,E,O}分别代表对应的词语是否是情绪原因对应的第一个词、情绪原因的中间词、情绪原因的最后一个词、非情绪原因中的词;W表示待测词序列,Z(W)是归一化因子,fk为特征函数,t为相应特征的下标。
需要说明的是,本发明实施例提供的一种基于结构句法的情绪原因事件识别方法中,利用训练词组及每个训练词组包括的每个词语的结构句法特征训练CRF模型,可以包括以下步骤:
确定每个训练词组中与该训练词组的情绪原因事件对应的训练情绪词;其中,训练词组的情绪原因事件为与训练词组对应的训练文本的情绪原因事件;
确定每个训练词组中每个词语的词特征、词性特征及词距离;其中,每个训练词组中每个词语的词距离为该训练词组中每个词语与该训练词组中的训练情绪词之间的距离;
利用每个训练词组及该训练词组中每个词语的词特征、词性特征、词距离及结构句法特征训练CRF模型。
可以利用Stanford工具确定训练词组中每个词语的词特征、词性特征及结构句法特征。词特征可以是词语本身。
而确定每个训练词组中每个词语的词特征、词性特征及词距离时,可以包括:确定每个训练词组中每个词语的词特征、词性特征及词距离;其中,每个训练词组中位于该训练词组中的训练情绪词左边的词语的词距离为负数,位于该训练词组中的训练情绪词右边的词语的词距离为正数。而词距离的绝对值则可以是一个词语在该训练词组中与训练情绪词之间的字数差。举例说明,训练词组为“Marie”“was”“agitated”“.”。“Agitated”为训练情绪词,则每个词语的词特性、词性特征、词距离及结构句法特征如下表所示。
每个词语的词特性、词性特征、词距离及结构句法特征的统计表
其中,结构句法特征中的父节点、到根节点路径、路径长度、左兄弟节点及右兄弟节点均是由Stanford工具获得的,如下:
图2为结构句法特征中各节点的示意图,其中was的词性特征是VBD,(VBDwas)组成一个叶子节点;该叶子节点的父节点为VP,到根节点的路径为VBD>VP>S>ROOT,路径长度为4,没有左兄弟节点,右兄弟节点为VP。
另外,可以将每个词语的词特征、词性特征、词距离及结构句法特征转换成特征向量,则每个词语均可以具有与之对应的一个特征向量,利用特征向量构建CRF模型。
由此,获取的CRF模型,能够综合考虑到文本中情绪词的上下文特征,据其建立的CRF模型能够更加准确的识别待测文本的情绪原因事件。
需要说明的是,本发明实施例提供的一种基于结构句法的情绪原因事件识别方法中,利用CRF模型确定待测词组对应的待测文本的情绪原因事件,即步骤S16,可以包括以下步骤:
S31:获取待测文本,待测文本为未提供其情绪原因事件的文本。
S32:将待测文本进行分词处理,得到待测词组。
对于进行分词处理的具体说明请参考上文中的相关内容,在此不再赘述。
S33:确定待测词组中包括的待测情绪词。
S34:确定待测词组中每个词语的词特征、词性特征、词距离及结构句法特征;其中,待测词组中每个词语的词距离为该待测词组中每个词语与待测情绪词之间的距离。
对于每个词语的词特征、词性特征、词距离及结构句法特征的具体说明请参考上文中的相关内容,在此不再赘述。
S35:利用待测词组中每个词语的词特征、词性特征、词距离及结构句法特征,通过CRF模型,得到待测文本的情绪原因事件。
其中,可以将每个词语的词特征、词性特征、词距离及结构句法特征转换成特征向量,然后将特征向量作为CRF模型的输入,以得到与之对应的输出,即待测文本的情绪原因事件。实验证明,由此,获取的待测文本的情绪原因事件的准确率较高。
与上述方法实施例相对应,本发明实施例还提供了一种基于结构句法的情绪原因事件识别系统,其结构示意图如图4所示,可以包括:
获取模块41,用于获取预设量的训练文本,训练文本为已提供其情绪原因事件的文本;
分词模块42,用于将训练文本进行分词处理,得到分别与每个训练文本对应的训练词组;
第一确定模块43,用于确定训练词组中每个词语的结构句法特征;
训练模块44,用于利用训练词组及每个训练词组包括的每个词语的结构句法特征训练CRF模型;
第二确定模块45,用于利用CRF模型确定待测词组对应的待测文本的情绪原因事件。
通过上述系统,利用训练文本进行分词后的词组及词组中每个词语的结构句法特征构建CRF模型,即建立一个统一的概率模型,进一步利用上述CRF模型确定待测文本的情绪原因事件,实验证明,本发明实施例提供的一种基于结构句法的情绪原因事件识别系统获取待测文本的情绪原因事件的准确率较高,即对于情绪原因事件的识别性能较好。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种基于结构句法的情绪原因事件识别方法,其特征在于,包括:
获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;
将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;
确定所述训练词组中每个词语的结构句法特征;
利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;
利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。
2.根据权利要求1所述的方法,其特征在于,所述利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型,包括:
确定每个所述训练词组中与该训练词组的情绪原因事件对应的训练情绪词;其中,所述训练词组的情绪原因事件为与所述训练词组对应的训练文本的情绪原因事件;
确定每个所述训练词组中每个词语的词特征、词性特征及词距离;其中,每个所述训练词组中每个词语的词距离为该训练词组中每个词语与该训练词组中的训练情绪词之间的距离;
利用每个所述训练词组及该训练词组中每个词语的词特征、词性特征、词距离及结构句法特征训练CRF模型。
3.根据权利要求2所述的方法,其特征在于,确定每个所述训练词组中每个词语的词特征、词性特征及结构句法特征,包括:
利用Stanford工具确定所述训练词组中每个词语的词特征、词性特征及结构句法特征。
4.根据权利要求2所述的方法,其特征在于,所述确定每个所述训练词组中每个词语的词特征、词性特征及词距离,包括:
确定每个所述训练词组中每个词语的词特征、词性特征及词距离;其中,每个所述训练词组中位于该训练词组中的训练情绪词左边的词语的词距离为负数,位于该训练词组中的训练情绪词右边的词语的词距离为正数。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件,包括:
获取待测文本,所述待测文本为未提供其情绪原因事件的文本;
将所述待测文本进行分词处理,得到待测词组;
确定所述待测词组中包括的待测情绪词;
确定所述待测词组中每个词语的词特征、词性特征、词距离及结构句法特征;其中,所述待测词组中每个词语的词距离为该待测词组中每个词语与待测情绪词之间的距离;
利用所述待测词组中每个词语的词特征、词性特征、词距离及结构句法特征,通过所述CRF模型,得到所述待测文本的情绪原因事件。
6.一种基于结构句法的情绪原因事件识别系统,其特征在于,包括:
获取模块,用于获取预设量的训练文本,所述训练文本为已提供其情绪原因事件的文本;
分词模块,用于将所述训练文本进行分词处理,得到分别与每个所述训练文本对应的训练词组;
第一确定模块,用于确定所述训练词组中每个词语的结构句法特征;
训练模块,用于利用所述训练词组及每个所述训练词组包括的每个词语的结构句法特征训练CRF模型;
第二确定模块,用于利用所述CRF模型确定待测词组对应的待测文本的情绪原因事件。
CN201510530866.8A 2015-08-26 2015-08-26 一种基于结构句法的情绪原因事件识别方法及系统 Pending CN105183807A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510530866.8A CN105183807A (zh) 2015-08-26 2015-08-26 一种基于结构句法的情绪原因事件识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510530866.8A CN105183807A (zh) 2015-08-26 2015-08-26 一种基于结构句法的情绪原因事件识别方法及系统

Publications (1)

Publication Number Publication Date
CN105183807A true CN105183807A (zh) 2015-12-23

Family

ID=54905890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510530866.8A Pending CN105183807A (zh) 2015-08-26 2015-08-26 一种基于结构句法的情绪原因事件识别方法及系统

Country Status (1)

Country Link
CN (1) CN105183807A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009234A (zh) * 2017-11-29 2018-05-08 苏州大学 一种非实体类型论元的抽取方法、装置及设备
CN109359181A (zh) * 2018-09-27 2019-02-19 深圳前海微众银行股份有限公司 负面情绪原因识别方法、设备及计算机可读存储介质
CN114817566A (zh) * 2022-04-29 2022-07-29 天津大学 基于情绪嵌入的情绪原因对抽取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176963A (zh) * 2013-03-08 2013-06-26 北京理工大学 基于crf++汉语句义结构模型自动标注方法
US20130318106A1 (en) * 2012-05-23 2013-11-28 Oracle International Corporation Data viewer for clinical data
CN103544242A (zh) * 2013-09-29 2014-01-29 广东工业大学 面向微博的情感实体搜索系统
CN104111933A (zh) * 2013-04-17 2014-10-22 阿里巴巴集团控股有限公司 获取业务对象标签、建立训练模型的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130318106A1 (en) * 2012-05-23 2013-11-28 Oracle International Corporation Data viewer for clinical data
CN103176963A (zh) * 2013-03-08 2013-06-26 北京理工大学 基于crf++汉语句义结构模型自动标注方法
CN104111933A (zh) * 2013-04-17 2014-10-22 阿里巴巴集团控股有限公司 获取业务对象标签、建立训练模型的方法及装置
CN103544242A (zh) * 2013-09-29 2014-01-29 广东工业大学 面向微博的情感实体搜索系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李逸薇等: "基于序列标注模型的情绪原因识别方法", 《中文信息学报》 *
马刚: "《基于语义的Web数据挖掘》", 31 January 2014 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009234A (zh) * 2017-11-29 2018-05-08 苏州大学 一种非实体类型论元的抽取方法、装置及设备
CN108009234B (zh) * 2017-11-29 2022-02-11 苏州大学 一种非实体类型论元的抽取方法、装置及设备
CN109359181A (zh) * 2018-09-27 2019-02-19 深圳前海微众银行股份有限公司 负面情绪原因识别方法、设备及计算机可读存储介质
CN109359181B (zh) * 2018-09-27 2021-11-19 深圳前海微众银行股份有限公司 负面情绪原因识别方法、设备及计算机可读存储介质
CN114817566A (zh) * 2022-04-29 2022-07-29 天津大学 基于情绪嵌入的情绪原因对抽取方法
CN114817566B (zh) * 2022-04-29 2023-03-10 天津大学 基于情绪嵌入的情绪原因对抽取方法

Similar Documents

Publication Publication Date Title
CN104699763B (zh) 多特征融合的文本相似性度量系统
CN105718586B (zh) 分词的方法及装置
CN108763510B (zh) 意图识别方法、装置、设备及存储介质
Jose et al. Prediction of election result by enhanced sentiment analysis on twitter data using classifier ensemble Approach
CN107977362B (zh) 一种用于中文文本定级以及计算中文文本难度评分的方法
CN104899298A (zh) 一种基于大规模语料特征学习的微博情感分析方法
CN108255813B (zh) 一种基于词频-逆文档与crf的文本匹配方法
Maharjan et al. A multi-task approach to predict likability of books
CN106557462A (zh) 命名实体识别方法和系统
CN104731768B (zh) 一种面向中文新闻文本的事件地点抽取方法
CN107797987B (zh) 一种基于Bi-LSTM-CNN的混合语料命名实体识别方法
CN104346326A (zh) 一种情绪文本的情绪特征确定方法及装置
CN105005557A (zh) 一种基于依存分析的中文兼类词处理方法
Moh et al. On multi-tier sentiment analysis using supervised machine learning
CN107180084A (zh) 词库更新方法及装置
CN110992988B (zh) 一种基于领域对抗的语音情感识别方法及装置
CN107526721B (zh) 一种对电商产品评论词汇的歧义消除方法及装置
CN104899335A (zh) 一种对网络舆情信息进行情感分类的方法
CN100543735C (zh) 基于文档结构的文档相似性度量方法
CN106528863B (zh) 一种crf识别器的训练及技术及其属性名关系对抽取方法
CN103473380A (zh) 一种计算机文本情感分类方法
CN107797988A (zh) 一种基于Bi‑LSTM的混合语料命名实体识别方法
CN106610937A (zh) 一种基于信息论的中文自动分词算法
CN109213998A (zh) 中文错字检测方法及系统
CN113449084A (zh) 基于图卷积的关系抽取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151223