CN108829672A - 文本的情感分析方法、装置、计算机设备和存储介质 - Google Patents
文本的情感分析方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN108829672A CN108829672A CN201810569997.0A CN201810569997A CN108829672A CN 108829672 A CN108829672 A CN 108829672A CN 201810569997 A CN201810569997 A CN 201810569997A CN 108829672 A CN108829672 A CN 108829672A
- Authority
- CN
- China
- Prior art keywords
- text
- affective tag
- sentence
- affective
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请提供了一种文本的情感分析方法、装置、计算机设备和存储介质,获取指定平台上的第一文本;对所述第一文本中包含的每一个语句构建词嵌入;将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。本申请中提供的文本的情感分析方法、装置、计算机设备和存储介质,自动化识别出公开平台上用户对企业的情感反馈。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种文本的情感分析方法、装置、计算机设备和存储介质。
背景技术
在微博等公开平台上,经常有用户针对企业、企业服务发表用户自己的意见。微博为公开平台,用户对企业的评价对企业的形象影响极大,因此,获取微博平台上用户对企业服务的反馈尤为重要,纯靠工作人员去获取反馈,不仅耗费人力,且效率低。
目前,没有针对企业官方微博在微博平台上实时收到的评论、提及和转发等文本内容进行自动化识别;无法自动化识别上述文本内容中包涵的对企业品牌及产品的情感,以及内容对企业品牌和产品的影响。
发明内容
本申请的主要目的为提供一种文本的情感分析方法、装置、计算机设备和存储介质,自动化识别出指定平台上用户对企业的情感反馈。
为实现上述目的,本申请提供了一种文本的情感分析方法,包括以下步骤:
获取指定平台上的第一文本,所述第一文本的内容与指定企业相关;
对所述第一文本中包含的每一个语句构建词嵌入;
将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;
在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
进一步地,所述长短记忆网络模型为双向长短记忆网络模型。
进一步地,所述构建词嵌入的方法包括Glove模型构建方法、word2vec方法中的一种。
进一步地,所述获取指定平台上的第一文本的步骤之前,包括:
构建训练集中训练文本包括的每一个训练语句的词嵌入;
将每一个所述训练语句的词嵌入输入至长短记忆网络模型中进行训练,以得到所述文本情感分析模型。
进一步地,所述在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,获取所述第一文本的属性信息,和/或将所述第一文本存储于数据库中;所述属性信息包括来源平台信息、发文用户信息、发文时间信息中的至少一种。
进一步地,所述在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,提取出所述第一文本中具有所述指定情感标签的语句,并将其存储于数据库中。
进一步地,所述根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤包括:
若其中一种所述情感标签的数量最多,则将数量最多的所述情感标签作为所述第一文本的情感标签;若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,则获取所述第一文本中一个指定语句对应的情感标签,作为所述第一文本对应的情感标签。
本申请还提供了一种文本的情感分析装置,包括:
获取单元,用于获取指定平台上的第一文本,所述第一文本的内容与指定企业相关;
第一构建单元,用于对所述第一文本中包含的每一个语句构建词嵌入;
输出单元,用于将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;
分析单元,用于在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请中提供的文本的情感分析方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的文本的情感分析方法、装置、计算机设备和存储介质,获取指定平台上的第一文本;对所述第一文本中包含的每一个语句构建词嵌入;将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。本申请可以自动化识别出公开平台上用户对企业的情感反馈。
附图说明
图1是本申请一实施例中文本的情感分析方法步骤示意图;
图2是本申请另一实施例中文本的情感分析方法步骤示意图;
图3是本申请一实施例中文本的情感分析装置结构框图;
图4是本申请另一实施例中文本的情感分析装置结构框图;
图5是本申请又一实施例中文本的情感分析装置结构框图;
图6为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例中提供了一种文本的情感分析方法,包括以下步骤:
步骤S1,获取指定平台上的第一文本,所述第一文本的内容与指定企业相关。
在本实施例中,上述指定平台包括微博、头条、论坛等公开平台,上述公开平台包括的用户对企业的评价对企业的形象影响极大,因此,识别上述平台上用户对企业服务的反馈尤为重要,本实施例中的平台以微博为例进行阐述。上述第一文本的文本内容与指定企业(如平安科技等任意企业)的产品、企业服务等相关联,其文本内容通常为针对企业的产品、服务等进行发表的。
具体地,在一实施例中,可以预先设置关键字,关键字通常为企业品牌名称、企业产品名称、企业服务名称等。然后,根据关键词从微博话题、微博博文、评论、提及、转发等文本中搜索出与关键词相关的文本,即获取到上述第一文本。
步骤S2,对所述第一文本中包含的每一个语句构建词嵌入。
通常,上述从微博等平台上述获取的第一文本中包括有多个语句,也可能出现上述第一文本中只有一个语句,本实施例中,对上述第一文本中包含的每一个语句都进行词嵌入的构建,便于后续分析出每一个语句中包括的用户对企业的情感评价(或情感反馈)。
构建词嵌入是使用密集向量来表示单词和文档的一类方法,是将词汇中的单词(也可能是短语)被映射到相对于词汇量的大小而言低维空间的实数向量矩阵中。每一个语句中都具有多个词,本实施例中构建每一个语句的词嵌入即是得到每一个语句的词向量,其实际上是将每一个语句中包括的词构成一个向量矩阵(或称句子矩阵),该向量矩阵则为该语句的词嵌入。
步骤S3,将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签。
在本实施例中,上述长短记忆网络模型的网络输入为上述每一个语句的词嵌入,输出结果为对上述每一个词嵌入的情感分类,本实施例中,情感分类包括三种情感标签,分别为积极、消极、中性。其中积极则表明用户对企业的情感反馈是较为满意的,若为消极则表明用户对企业的情感反馈是不满意。
在本实施例中,将上述第一文本中的每一个语句构建的词嵌入之后输入至文本情感分析模型中,都会相应输出一个情感标签作为每一语句对应的情感标签,获取到每一个语句对应的情感标签之后,则便于分析出上述第一文本中包含的用户对企业的情感反馈。
步骤S4,在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
在本实施例中,若上述第一文本中只有一个语句,则可以统计得出该语句对应的情感标签的数量为一且最多,则将该情感标签作为上述第一文本的情感标签,即得出用户对企业的情感反馈。例如,从微博评论中获取到用户A的一句评论,该评论对应的情感标签为消极,则可以判断该用户A对企业的评价是不满意的。
若上述第一文本中包括有多个语句,在得出上述第一文本中每一个语句的情感标签之后,统计每一种情感标签的数量(或者比例),则可以知道哪一种情感标签较多;例如上述第一文本中标记为消极的情感标签较多的话,则判断该第一文本中包含的用户对企业的情感反馈是不满意的;上述第一文本中标记为积极的情感标签较多的话,则判断该第一文本中包含的用户对企业的情感反馈是较为满意的。
在本实施例中,通过上述文本的情感分析方法,自动化识别微博平台上的微博话题、微博博文、评论、提及、转发等文本中包含的用户对企业的情感反馈,便于企业了解用户意愿,进一步便于企业完善自己,提升服务质量。
在一实施例中,上述长短记忆网络模型为双向长短记忆网络模型。其为一种双向循环神经网络模型,该网络模型中不仅可以在一个语句中从前向后推算,也可以从后向前推算,结合两种推算方式,推算更加准确。具体地,将上述每一个语句的词嵌入输入模型后,同时经过向前推算以及向后推算后输出连接至全连接层中的4个隐藏神经元中计算,最后经过损失函数(软性最大化函数)的收敛,直到上述损失函数不再收敛之后,输出分类结果,该分类结果即为每一个语句的情感标签。
在一实施例中,上述步骤S2中,构建词嵌入的方法包括Glove(Global vectorsfor word representation)模型构建方法、word2vec方法中的一种。上述Glove模型输入的语料库,输出的是词向量,该方法是基于语料库构建词的共现矩阵,然后基于共现矩阵和GloVe模型学习词向量。
本实施例中使用的是word2vec方法,其为Google的Tomas Mikolov在《EfficientEstimation of Word Representation in Vector Space》提出的。本实施例中使用的word2vec词嵌入方法包括:分词、统计词频、构建Huffman树、训练词向量得到词嵌入四个过程。
具体地,第一步是分词,其用于对每一个语句进行切词。对于英文的分词较为容易,单词之间有空格进行分隔,只需要进行词干提取和词形还原预处理;对于中文分词,则使用结巴分词法来进行分词。
第二步是统计词频,其用于统计每个单词出现的频率。首先统计出每个单词出现的次数,然后统计频率。其中,然后需要去掉停用词、非常高频的词和非常低频的词;去掉高频词是因为该词没有特殊性,去掉低频词是因为其没有普适性。
第三步是构建Huffman树(霍夫曼树)。
上述Huffman树包括非叶节点以及叶节点,所有的非叶节点存储有一个参数向量,参数向量初始值为0,所有的叶节点分别代表了词典中的一个词。构建完Huffman树之后,将对应的Huffman码分配给每个单词,并随机初始化每个单词的词向量。上述分配给每个单词的Huffman码,就是为每一层分类提供依据的,如果是1,则表示应当分到左节点,否则表示应当分到右节点,当然也可以反过来。
第四步是训练词向量以得到词嵌入。
本实施例中使用的word2vec模型通常为CBOW和skip-gram两种模式。CBOW模式中数据的输入是每一个语句中周围几个单词的词向量之和,输出是周围几个单词中间的那个单词。从Huffman树的根节点开始,沿着Huffman树不停地进行logistic分类,每进行一次logistic分类就沿着Huffman树往下一层并更正词向量,直到最后达到叶节点,得到每一个语句的词向量,即完成词嵌入构建。
上述skip-gram模式则与CBOW模式相反,输入是中间的单词,输出是其周围的单词;其同样是从Huffman树根节点开始,沿着Huffman树不停地进行logistic分类,每进行一次logistic分类就沿着Huffman树往下一层并更正词向量,直到最后达到叶节点,得到每一个语句的词向量。
参照图2,在上述实施例中,上述获取指定平台上的第一文本的步骤S1之前,包括:
步骤S101,构建训练集中训练文本包括的每一个训练语句的词嵌入;
步骤S102,将每一个所述训练语句的词嵌入输入至长短记忆网络模型中进行训练,以得到所述文本情感分析模型。
在本实施例中,预先需要制作出训练集,该训练集可以是用户从微博平台上选择出多个与企业相关的训练文本,且用户对训练文本中的每一个训练语句都标注有情感标签(该情感标签即为上述实施例中描述的情感标签中的一种)。然后如上述步骤S101所述,构建训练集中训练文本包括的每一个训练语句的词嵌入,该构建词嵌入的方法如上述步骤S2及上述word2vec方法所述,在此不再进行赘述。
最后,将构建出的每一个训练语句的词嵌入输入至上述长短记忆网络模型中进行训练,并训练出合适的训练参数使得上述长短记忆网络模型输出的结果无限接近于/相同于上述训练集中每一个训练语句的情感标签;将训练得到的训练参数输入至上述长短记忆网络模型中以得到上述文本情感分析模型。
在另一实施例中,还可以使用测试集验证上述步骤得到的文本情感分析模型识别情感的准确率。使用测试集进行测试的步骤与上述情感分析步骤相似,只需要检测识别出的情感标签是否为测试集中已知的情感标签一致,在此不再进行赘述。
在一个实施例中,上述在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤S4之后,包括:
步骤S5a,当所述第一文本的情感标签为指定情感标签时,获取所述第一文本的属性信息,和/或将所述第一文本存储于数据库中;所述属性信息包括来源平台信息、发文用户信息、发文时间信息中的至少一种。
例如,在一具体实施例中,当上述第一本文的情感标签为消极时,则根据上述属性信息便于分析出哪些平台或者用户对企业不满意,用户发表对企业的不满意情感的具体时间等信息。在其它实施例中,无论上述第一文本的情感标签是否为指定情感标签,都将上述第一文本保存在数据库中,便于分析出用户做出积极评价的理由,例如从第一文本中通过关键词提取,分析出涉及到的产品或者服务,便可以分析出是企业的什么产品或者服务得到用户的满意;同理,将情感反馈为消极的第一文本存储在数据库中,通过关键词提取,便于分析出用户做出消极反馈的理由,以及分析出令用户不满意的产品或者服务。
在一个实施例中,上述在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤S4之后,包括:
步骤S5b,当所述第一文本的情感标签为指定情感标签时,提取出所述第一文本中具有所述指定情感标签的语句,并将其存储于数据库中。
例如,若得出上述第一文本的中包含用户情感反馈是消极的,则将上述第一文本中带有消极的情感标签的语句全部提取出来,存储在数据库中,便于做出针对性的分析,无需对每一个语句都分析。
在一个实施例中,上述根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤包括:
若其中一种所述情感标签的数量最多,则将数量最多的所述情感标签作为所述第一文本的情感标签;若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,则获取所述第一文本中一个指定语句对应的情感标签,作为所述第一文本对应的情感标签。
本实施例中的指定语句可以是包含有企业品牌名称、产品名称、服务名称的特殊语句。在另一实施例中,若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,也可以获取多个指定语句对应的情感标签,并统计每一种情感标签的数量,再根据其数量分布确定第一文本对应的情感标签。在又一实施例中,预先在上述第一文本中包括有品牌相应的产品或者服务名词的每一个语句上做出标记,然后将第一文本输入模型中识别之后,当得到的每一种情感标签的数量一致或近似时,则统计上述做有标记的语句的每一种情感标签的数量,再根据数量大小判断文本中包含的情感评价。例如,一段文本中包括有“保险”的语句有十个,其中七个语句的情感标签为积极,则认为该文本中包含对“保险”服务的情感反馈是较为满意的。
综上所述,为本申请实施例中提供的文本的情感分析方法,获取指定平台上的第一文本;对所述第一文本中包含的每一个语句构建词嵌入;将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。本申请可以自动化识别出公开平台上用户对企业的情感反馈。
参照图3,本申请一实施例中还提供了一种文本的情感分析装置,包括:
获取单元10,用于获取指定平台上的第一文本,所述第一文本的内容与指定企业相关。
在本实施例中,上述指定平台包括微博、头条、论坛等公开平台,上述公开平台包括的用户对企业的评价对企业的形象影响极大,因此,识别上述平台上用户对企业服务的反馈尤为重要,本实施例中的平台以微博为例进行阐述。上述第一文本的文本内容与指定企业(如平安科技等任意企业)的产品、企业服务等相关联,其文本内容通常为针对企业的产品、服务等进行发表的。
具体地,在一实施例中,可以预先设置关键字,关键字通常为企业品牌名称、企业产品名称、企业服务名称等。然后,获取单元10根据关键词从微博话题、微博博文、评论、提及、转发等文本中搜索出与关键词相关的文本,即获取到上述第一文本。
第一构建单元20,用于对所述第一文本中包含的每一个语句构建词嵌入。
通常,上述从微博等平台上述获取的第一文本中包括有多个语句,也可能出现上述第一文本中只有一个语句,本实施例中,第一构建单元20对上述第一文本中包含的每一个语句都进行词嵌入的构建,便于后续分析出每一个语句中包括的用户对企业的情感评价(或情感反馈)。
构建词嵌入是使用密集向量来表示单词和文档的一类方法,是将词汇中的单词(也可能是短语)被映射到相对于词汇量的大小而言低维空间的实数向量矩阵中。每一个语句中都具有多个词,本实施例中第一构建单元20构建每一个语句的词嵌入即是得到每一个语句的词向量,其实际上是将每一个语句中包括的词构成一个向量矩阵,该向量矩阵则为该语句的词嵌入。
输出单元30,用于将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签。
在本实施例中,上述长短记忆网络模型的网络输入为上述每一个语句的词嵌入,输出结果为对上述每一个词嵌入的情感分类,本实施例中,情感分类包括三种情感标签,分别为积极、消极、中性。其中积极则表明用户对企业的情感反馈是较为满意的,若为消极则表明用户对企业的情感反馈是不满意。
在本实施例中,将上述第一文本中的每一个语句构建的词嵌入之后输入上述模型中,输出单元30都会相应输出一个情感标签作为每一语句对应的情感标签,获取到每一个语句对应的情感标签之后,则便于分析出上述第一文本中包含的用户对企业的情感反馈。
分析单元40,用于在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
在本实施例中,若上述第一文本中只有一个语句,分析单元40则可以统计得出该语句对应的情感标签的数量为一且最多,则将该情感标签作为上述第一文本的情感标签,即得出用户对企业的情感反馈。例如,从微博评论中获取到用户A的一句评论,该评论对应的情感标签为消极,则可以判断该用户A对企业的评价是不满意的。
若上述第一文本中包括有多个语句,在得出上述第一文本中每一个语句的情感标签之后,分析单元40统计每一种情感标签的数量(或者比例),则可以知道哪一种情感标签较多;例如上述第一文本中标记为消极的情感标签较多的话,则判断该第一文本中包含的用户对企业的情感反馈是不满意的;上述第一文本中标记为积极的情感标签较多的话,则判断该第一文本中包含的用户对企业的情感反馈是较为满意的。
在本实施例中,通过上述文本的情感分析装置,自动化识别微博平台上的微博话题、微博博文、评论、提及、转发等文本中包含的用户对企业的情感反馈,便于企业了解用户意愿,进一步便于企业完善自己,提升服务质量。
在一实施例中,上述长短记忆网络模型为双向长短记忆网络模型。其为一种双向循环神经网络模型,该网络模型中不仅可以在一个语句中从前向后推算,也可以从后向前推算,结合两种推算方式,推算更加准确。具体地,将上述每一个语句的词嵌入输入模型后,同时经过向前推算以及向后推算后输出连接至全连接层中的4个隐藏神经元中计算,最后经过损失函数(软性最大化函数)的收敛,直到上述损失函数不再收敛之后,输出分类结果,该分类结果即为每一个语句的情感标签。
在一实施例中,上述第一构建单元20构建词嵌入的方法包括Glove模型构建方法、word2vec方法中的一种。上述Glove模型输入的语料库,输出的是词向量,该方法是基于语料库构建词的共现矩阵,然后基于共现矩阵和GloVe模型学习词向量。
本实施例中使用的是word2vec方法,其为Google的Tomas Mikolov在《EfficientEstimation of Word Representation in Vector Space》提出的。本实施例中使用的word2vec词嵌入方法包括:分词、统计词频、构建Huffman树、训练词向量得到词嵌入四个过程。
具体地,第一步是分词,其用于对每一个语句进行切词。对于英文的分词较为容易,单词之间有空格进行分隔,只需要进行词干提取和词形还原预处理;对于中文分词,则使用结巴分词法来进行分词。
第二步是统计词频,其用于统计每个单词出现的频率。首先统计出每个单词出现的次数,然后统计频率。其中,然后需要去掉停用词、非常高频的词和非常低频的词;去掉高频词是因为该词没有特殊性,去掉低频词是因为其没有普适性。
第三步是构建Huffman树(霍夫曼树)。
上述Huffman树包括非叶节点以及叶节点,所有的非叶节点存储有一个参数向量,参数向量初始值为0,所有的叶节点分别代表了词典中的一个词。构建完Huffman树之后,将对应的Huffman码分配给每个单词,并随机初始化每个单词的词向量。上述分配给每个单词的Huffman码,就是为每一层分类提供依据的,如果是1,则表示应当分到左节点,否则表示应当分到右节点,当然也可以反过来。
第四步是训练词向量以得到词嵌入。
本实施例中使用的word2vec模型通常为CBOW和skip-gram两种模式。CBOW模式中数据的输入是每一个语句中周围几个单词的词向量之和,输出是周围几个单词中间的那个单词。从Huffman树的根节点开始,沿着Huffman树不停地进行logistic分类,每进行一次logistic分类就沿着Huffman树往下一层并更正词向量,直到最后达到叶节点,得到每一个语句的词向量,即完成词嵌入构建。
上述skip-gram模式则与CBOW模式相反,输入是中间的单词,输出是其周围的单词;其同样是从Huffman树根节点开始,沿着Huffman树不停地进行logistic分类,每进行一次logistic分类就沿着Huffman树往下一层并更正词向量,直到最后达到叶节点,得到每一个语句的词向量。
参照图4,在一实施例中,上述文本的情感分析装置,还包括:
第二构建单元50,用于构建训练集中训练文本包括的每一个训练语句的词嵌入;
训练单元60,用于将每一个所述训练语句的词嵌入输入至长短记忆网络模型中进行训练,以得到所述文本情感分析模型。
在本实施例中,预先需要制作出训练集,该训练集可以是用户从微博平台上选择出多个与企业相关的训练文本,且用户对训练文本中的每一个训练语句都标注有情感标签(该情感标签即为上述实施例中描述的情感标签中的一种)。然后如上述第二构建单元50所述,构建训练集中训练文本包括的每一个训练语句的词嵌入,该构建词嵌入的方法如上述第一构建单元20及上述word2vec方法所述,在此不再进行赘述。
最后,训练单元60将上述第二构建单元50构建出的每一个训练语句的词嵌入输入至上述长短记忆网络模型中进行训练,并训练出合适的训练参数使得上述长短记忆网络模型输出的结果无限接近于/相同于上述训练集中每一个训练语句的情感标签;将训练得到的训练参数输入至上述长短记忆网络模型中以得到上述文本情感分析模型。
参照图5,在一实施例中,上述文本的情感分析装置,还包括:
第一处理单元70,用于当所述第一文本的情感标签为指定情感标签时,获取所述第一文本的属性信息,和/或将所述第一文本存储于数据库中;所述属性信息包括来源平台信息、发文用户信息、发文时间信息中的至少一种。
例如,在一具体实施例中,当上述第一本文的情感标签为消极时,则根据上述属性信息便于分析出哪些平台或者用户对企业不满意,用户发表对企业的不满意情感的具体时间等信息。在其它实施例中,无论上述第一文本的情感标签是否为指定情感标签,第一处理单元70都将上述第一文本保存在数据库中,便于分析出用户做出积极评价的理由,例如从第一文本中通过关键词提取,分析出涉及到的产品或者服务,便可以分析出是企业的什么产品或者服务得到用户的满意;同理,将情感反馈为消极的第一文本存储在数据库中,通过关键词提取,便于分析出用户做出消极反馈的理由,以及分析出令用户不满意的产品或者服务。
在一实施例中,上述文本的情感分析装置,还包括:
第二处理单元,用于当所述第一文本的情感标签为指定情感标签时,提取出所述第一文本中具有所述指定情感标签的语句,并将其存储于数据库中。
例如,若得出上述第一文本的中包含用户情感反馈是消极的,第二处理单元则将上述第一文本中带有消极的情感标签的语句全部提取出来,存储在数据库中,便于做出针对性的分析,无需对每一个语句都分析。
在一实施例中,上述分析单元40根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的过程具体包括:
若其中一种所述情感标签的数量最多,则将数量最多的所述情感标签作为所述第一文本的情感标签;若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,则获取所述第一文本中指定语句对应的情感标签,作为所述第一文本对应的情感标签。
本实施例中的指定语句可以是包含有企业品牌名称、产品名称、服务名称的特殊语句。在另一实施例中,若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,也可以获取多个指定语句对应的情感标签,并统计每一种情感标签的数量,再根据其数量分布确定第一文本对应的情感标签。在又一实施例中,预先在上述第一文本中包括有品牌相应的产品或者服务名词的每一个语句上做出标记,然后将第一文本输入模型中识别之后,当得到的每一种情感标签的数量一致或近似时,则统计上述做有标记的语句的每一种情感标签的数量,再根据数量大小判断文本中包含的情感评价。例如,一段文本中包括有“保险”的语句有十个,其中七个语句的情感标签为积极,则认为该文本中包含对“保险”服务的情感反馈是较为满意的。
综上所述,为本申请实施例中提供的文本的情感分析装置,获取指定平台上的第一文本;对所述第一文本中包含的每一个语句构建词嵌入;将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。本申请可以自动化识别出公开平台上用户对企业的情感反馈。
参照图6,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本情感分析模型等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文本的情感分析方法。
上述处理器执行上述文本的情感分析方法的步骤:
获取指定平台上的第一文本,所述第一文本的内容与指定企业相关;
对所述第一文本中包含的每一个语句构建词嵌入;
将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;
在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
在一实施例中,所述长短记忆网络模型为双向长短记忆网络模型。
在一实施例中,所述构建词嵌入的方法包括Glove模型构建方法、word2vec方法中的一种。
在一实施例中,所述处理器获取指定平台上的第一文本的步骤之前,包括:
构建训练集中训练文本包括的每一个训练语句的词嵌入;
将每一个所述训练语句的词嵌入输入至长短记忆网络模型中进行训练,以得到所述文本情感分析模型。
在一实施例中,所述处理器在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,获取所述第一文本的属性信息,和/或将所述第一文本存储于数据库中;所述属性信息包括来源平台信息、发文用户信息、发文时间信息中的至少一种。
在一实施例中,所述处理器在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,提取出所述第一文本中具有所述指定情感标签的语句,并将其存储于数据库中。
在一实施例中,所述处理器根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤包括:
若其中一种所述情感标签的数量最多,则将数量最多的所述情感标签作为所述第一文本的情感标签;若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,则获取所述第一文本中一个指定语句对应的情感标签,作为所述第一文本对应的情感标签。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种文本的情感分析方法,具体为:
获取指定平台上的第一文本,所述第一文本的内容与指定企业相关;
对所述第一文本中包含的每一个语句构建词嵌入;
将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;
在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
在一实施例中,所述长短记忆网络模型为双向长短记忆网络模型。
在一实施例中,所述构建词嵌入的方法包括Glove模型构建方法、word2vec方法中的一种。
在一实施例中,所述处理器获取指定平台上的第一文本的步骤之前,包括:
构建训练集中训练文本包括的每一个训练语句的词嵌入;
将每一个所述训练语句的词嵌入输入至长短记忆网络模型中进行训练,以得到所述文本情感分析模型。
在一实施例中,所述处理器在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,获取所述第一文本的属性信息,和/或将所述第一文本存储于数据库中;所述属性信息包括来源平台信息、发文用户信息、发文时间信息中的至少一种。
在一实施例中,所述处理器在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,提取出所述第一文本中具有所述指定情感标签的语句,并将其存储于数据库中。
在一实施例中,所述处理器根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤包括:
若其中一种所述情感标签的数量最多,则将数量最多的所述情感标签作为所述第一文本的情感标签;若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,则获取所述第一文本中一个指定语句对应的情感标签,作为所述第一文本对应的情感标签。
综上所述,为本申请实施例中提供的文本的情感分析方法、装置、计算机设备和存储介质,获取指定平台上的第一文本;对所述第一文本中包含的每一个语句构建词嵌入;将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。本申请可以自动化识别出公开平台上用户对企业的情感反馈。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种文本的情感分析方法,其特征在于,包括以下步骤:
获取指定平台上的第一文本,所述第一文本的内容与指定企业相关;
对所述第一文本中包含的每一个语句构建词嵌入;
将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;
在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
2.根据权利要求1所述的文本的情感分析方法,其特征在于,所述长短记忆网络模型为双向长短记忆网络模型。
3.根据权利要求1所述的文本的情感分析方法,其特征在于,所述构建词嵌入的方法包括Glove模型构建方法、word2vec方法中的一种。
4.根据权利要求1所述的文本的情感分析方法,其特征在于,所述获取指定平台上的第一文本的步骤之前,包括:
构建训练集中训练文本包括的每一个训练语句的词嵌入;
将每一个所述训练语句的词嵌入输入至长短记忆网络模型中进行训练,以得到所述文本情感分析模型。
5.根据权利要求1所述的文本的情感分析方法,其特征在于,所述在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,获取所述第一文本的属性信息,和/或将所述第一文本存储于数据库中;所述属性信息包括来源平台信息、发文用户信息、发文时间信息中的至少一种。
6.根据权利要求1所述的文本的情感分析方法,其特征在于,所述在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤之后,包括:
当所述第一文本的情感标签为指定情感标签时,提取出所述第一文本中具有所述指定情感标签的语句,并将其存储于数据库中。
7.根据权利要求1所述的文本的情感分析方法,其特征在于,所述根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签的步骤包括:
若其中一种所述情感标签的数量最多,则将数量最多的所述情感标签作为所述第一文本的情感标签;若每一种所述情感标签的数量一致或者数量最多的几个所述情感标签的数量也一致时,则获取所述第一文本中一个指定语句对应的情感标签,作为所述第一文本对应的情感标签。
8.一种文本的情感分析装置,其特征在于,包括:
获取单元,用于获取指定平台上的第一文本,所述第一文本的内容与指定企业相关;
第一构建单元,用于对所述第一文本中包含的每一个语句构建词嵌入;
输出单元,用于将构建的每一个所述词嵌入输入至基于长短记忆网络模型训练得到的文本情感分析模型中,以输出每一个所述词嵌入的情感标签,作为对应于每一个语句的情感标签;
分析单元,用于在所述第一文本所有语句对应的情感标签中,统计出每一种情感标签的数量,并根据每一种所述情感标签的数量大小分析所述第一文本对应的情感标签。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810569997.0A CN108829672A (zh) | 2018-06-05 | 2018-06-05 | 文本的情感分析方法、装置、计算机设备和存储介质 |
PCT/CN2018/095666 WO2019232893A1 (zh) | 2018-06-05 | 2018-07-13 | 文本的情感分析方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810569997.0A CN108829672A (zh) | 2018-06-05 | 2018-06-05 | 文本的情感分析方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108829672A true CN108829672A (zh) | 2018-11-16 |
Family
ID=64143939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810569997.0A Pending CN108829672A (zh) | 2018-06-05 | 2018-06-05 | 文本的情感分析方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108829672A (zh) |
WO (1) | WO2019232893A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284506A (zh) * | 2018-11-29 | 2019-01-29 | 重庆邮电大学 | 一种基于注意力卷积神经网络的用户评论情感分析系统及方法 |
CN109284389A (zh) * | 2018-11-29 | 2019-01-29 | 北京国信宏数科技有限责任公司 | 一种文本数据的信息处理方法、装置 |
CN109359246A (zh) * | 2018-12-07 | 2019-02-19 | 上海宏原信息科技有限公司 | 一种基于论坛用户言论的品牌亲密度计算方法 |
CN109670171A (zh) * | 2018-11-23 | 2019-04-23 | 山西大学 | 一种基于词对非对称共现的词向量表示学习方法 |
CN110222345A (zh) * | 2019-06-18 | 2019-09-10 | 卓尔智联(武汉)研究院有限公司 | 完型填空答题方法、装置、电子设备及存储介质 |
CN110399611A (zh) * | 2019-07-03 | 2019-11-01 | 深兰科技(上海)有限公司 | 一种文本分析方法、装置及存储介质 |
CN110851569A (zh) * | 2019-11-12 | 2020-02-28 | 北京创鑫旅程网络技术有限公司 | 数据处理方法、装置、设备及存储介质 |
CN112800180A (zh) * | 2021-02-04 | 2021-05-14 | 北京易车互联信息技术有限公司 | 一种点评文本标签的自动提取方案 |
CN112818681A (zh) * | 2020-12-31 | 2021-05-18 | 北京知因智慧科技有限公司 | 文本情感分析方法、系统及电子设备 |
CN113469562A (zh) * | 2021-07-20 | 2021-10-01 | 中国银行股份有限公司 | 银行柜台服务的满意度分析方法及装置 |
WO2021259300A1 (zh) * | 2020-06-23 | 2021-12-30 | 北京字节跳动网络技术有限公司 | 音效添加方法和装置、存储介质和电子设备 |
CN114386436B (zh) * | 2022-01-21 | 2023-07-18 | 平安科技(深圳)有限公司 | 文本数据的分析方法、模型训练方法、装置及计算机设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573046A (zh) * | 2015-01-20 | 2015-04-29 | 成都品果科技有限公司 | 一种基于词向量的评论分析方法及系统 |
CN107153642A (zh) * | 2017-05-16 | 2017-09-12 | 华北电力大学 | 一种基于神经网络识别文本评论情感倾向的分析方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383815B (zh) * | 2016-09-20 | 2019-03-01 | 清华大学 | 结合用户和产品信息的神经网络情感分析方法 |
CN106599933A (zh) * | 2016-12-26 | 2017-04-26 | 哈尔滨工业大学 | 一种基于联合深度学习模型的文本情感分类方法 |
CN106649853A (zh) * | 2016-12-30 | 2017-05-10 | 儒安科技有限公司 | 一种基于深度学习的短文本聚类方法 |
CN106776581B (zh) * | 2017-02-21 | 2020-01-24 | 浙江工商大学 | 基于深度学习的主观性文本情感分析方法 |
CN107609009B (zh) * | 2017-07-26 | 2020-02-18 | 北京大学深圳研究院 | 文本情感分析方法、装置、存储介质和计算机设备 |
-
2018
- 2018-06-05 CN CN201810569997.0A patent/CN108829672A/zh active Pending
- 2018-07-13 WO PCT/CN2018/095666 patent/WO2019232893A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573046A (zh) * | 2015-01-20 | 2015-04-29 | 成都品果科技有限公司 | 一种基于词向量的评论分析方法及系统 |
CN107153642A (zh) * | 2017-05-16 | 2017-09-12 | 华北电力大学 | 一种基于神经网络识别文本评论情感倾向的分析方法 |
Non-Patent Citations (1)
Title |
---|
LASGUIDO NIO 等: "Japanese Sentiment Classification Using Bidirectional Long Short-Term Memory Recurrent Neural Network", 《言語処理学会 第24回年次大会 発表論文集》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670171A (zh) * | 2018-11-23 | 2019-04-23 | 山西大学 | 一种基于词对非对称共现的词向量表示学习方法 |
CN109284506B (zh) * | 2018-11-29 | 2023-09-29 | 重庆邮电大学 | 一种基于注意力卷积神经网络的用户评论情感分析系统及方法 |
CN109284389A (zh) * | 2018-11-29 | 2019-01-29 | 北京国信宏数科技有限责任公司 | 一种文本数据的信息处理方法、装置 |
CN109284506A (zh) * | 2018-11-29 | 2019-01-29 | 重庆邮电大学 | 一种基于注意力卷积神经网络的用户评论情感分析系统及方法 |
CN109359246A (zh) * | 2018-12-07 | 2019-02-19 | 上海宏原信息科技有限公司 | 一种基于论坛用户言论的品牌亲密度计算方法 |
CN110222345A (zh) * | 2019-06-18 | 2019-09-10 | 卓尔智联(武汉)研究院有限公司 | 完型填空答题方法、装置、电子设备及存储介质 |
CN110399611A (zh) * | 2019-07-03 | 2019-11-01 | 深兰科技(上海)有限公司 | 一种文本分析方法、装置及存储介质 |
CN110851569A (zh) * | 2019-11-12 | 2020-02-28 | 北京创鑫旅程网络技术有限公司 | 数据处理方法、装置、设备及存储介质 |
CN110851569B (zh) * | 2019-11-12 | 2022-11-29 | 北京创鑫旅程网络技术有限公司 | 数据处理方法、装置、设备及存储介质 |
WO2021259300A1 (zh) * | 2020-06-23 | 2021-12-30 | 北京字节跳动网络技术有限公司 | 音效添加方法和装置、存储介质和电子设备 |
CN112818681A (zh) * | 2020-12-31 | 2021-05-18 | 北京知因智慧科技有限公司 | 文本情感分析方法、系统及电子设备 |
CN112818681B (zh) * | 2020-12-31 | 2023-11-10 | 北京知因智慧科技有限公司 | 文本情感分析方法、系统及电子设备 |
CN112800180A (zh) * | 2021-02-04 | 2021-05-14 | 北京易车互联信息技术有限公司 | 一种点评文本标签的自动提取方案 |
CN113469562A (zh) * | 2021-07-20 | 2021-10-01 | 中国银行股份有限公司 | 银行柜台服务的满意度分析方法及装置 |
CN114386436B (zh) * | 2022-01-21 | 2023-07-18 | 平安科技(深圳)有限公司 | 文本数据的分析方法、模型训练方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019232893A1 (zh) | 2019-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829672A (zh) | 文本的情感分析方法、装置、计算机设备和存储介质 | |
CN110888990B (zh) | 文本推荐方法、装置、设备及介质 | |
CN111325029B (zh) | 一种基于深度学习集成模型的文本相似度计算方法 | |
KR20190085098A (ko) | 키워드 추출 방법, 컴퓨터 장치, 및 저장 매체 | |
Zhang et al. | Encoding conversation context for neural keyphrase extraction from microblog posts | |
Soliman et al. | Sentiment analysis of Arabic slang comments on facebook | |
CN107844533A (zh) | 一种智能问答系统及分析方法 | |
CN113821605B (zh) | 一种事件抽取方法 | |
CN114416942A (zh) | 一种基于深度学习的自动化问答方法 | |
CN109299233A (zh) | 文本数据处理方法、装置、计算机设备及存储介质 | |
CN112257452A (zh) | 情感识别模型的训练方法、装置、设备和存储介质 | |
Mohammad et al. | Knowledge-based approach for event extraction from arabic tweets | |
CN112613321A (zh) | 一种抽取文本中实体属性信息的方法及系统 | |
Van De Camp et al. | A link to the past: constructing historical social networks | |
KR102185733B1 (ko) | 프로필 자동생성서버 및 방법 | |
CN115455151A (zh) | 一种ai情绪可视化识别方法、系统及云平台 | |
CN109992723B (zh) | 一种基于社交网络的用户兴趣标签构建方法及相关设备 | |
CN110308799A (zh) | 文本联想的方法、装置、计算机设备和存储介质 | |
CN109660621A (zh) | 一种内容推送方法及服务设备 | |
CN112800771B (zh) | 文章识别方法、装置、计算机可读存储介质和计算机设备 | |
CN107577760B (zh) | 一种基于约束规范的文本分类方法及装置 | |
CN113705198B (zh) | 场景图生成方法、装置、电子设备及存储介质 | |
CN113051869B (zh) | 一种结合语义识别实现标识文本差异内容的方法及系统 | |
CN111949781B (zh) | 一种基于自然语句句法分析的智能交互方法及装置 | |
Malik et al. | Sentiment analysis on political tweets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181116 |