CN114239569A - 评估文本的分析方法及其装置、计算机可读存储介质 - Google Patents
评估文本的分析方法及其装置、计算机可读存储介质 Download PDFInfo
- Publication number
- CN114239569A CN114239569A CN202111456304.5A CN202111456304A CN114239569A CN 114239569 A CN114239569 A CN 114239569A CN 202111456304 A CN202111456304 A CN 202111456304A CN 114239569 A CN114239569 A CN 114239569A
- Authority
- CN
- China
- Prior art keywords
- word
- label
- text
- matrix
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 159
- 238000004458 analytical method Methods 0.000 title claims abstract description 90
- 239000011159 matrix material Substances 0.000 claims abstract description 235
- 239000013598 vector Substances 0.000 claims abstract description 153
- 238000013507 mapping Methods 0.000 claims abstract description 43
- 238000003062 neural network model Methods 0.000 claims abstract description 42
- 230000004927 fusion Effects 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 230000011218 segmentation Effects 0.000 claims description 49
- 230000008451 emotion Effects 0.000 claims description 33
- 230000003993 interaction Effects 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000010380 label transfer Methods 0.000 claims description 18
- 238000013527 convolutional neural network Methods 0.000 claims description 17
- 125000004122 cyclic group Chemical group 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 12
- 238000012546 transfer Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000002156 mixing Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 230000002996 emotional effect Effects 0.000 description 32
- 238000000605 extraction Methods 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000012552 review Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 235000015241 bacon Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000002932 luster Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000019542 Cured Meats Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种评估文本的分析方法及其装置、计算机可读存储介质,涉及自然语言处理领域,其中,该方法包括:获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征,将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵,并分析待处理文本中每段评估语句的标签信息。本发明解决了相关技术中无法对评估语句中的评估对象的倾向意见做出细粒化的分析的技术问题。
Description
技术领域
本发明涉及分析技术领域,具体而言,涉及一种评估文本的分析方法及其装置、计算机可读存储介质。
背景技术
随着新兴社交媒体的发展,用户可以以文本、图片、视频等形式发布个人内容,进行信息交流和意见表达,对这些海量的用户生成数据进行分析,将有助于获取多方面的信息。当前分析方式主要是面向文本,通过对文本的分析,发掘评论人对于事物或事件的观点和态度。在自然语言处理领域的研究当中,情感分析是一类常见的任务,主要是对篇章级、句子级和对象级等层级任务进行分析,例如,某电商平台的用户商品评论模块,用户可针对所购买的商品进行评价,评论等级分类方式会根据用户给予的星级分为“好评、中评、差评”,如图1所示,分别有多个对购买的商品进行了评述(图1仅示意说明了用户1、用户2和用户3的评述内容,但不仅限于此),该方式只能表现出用户对所购买物品的整体倾向意见(例如,通过图1中的用户评论内容,仅能够分析得到的评估结果为:好评,无法分析得到更为细粒的情感结果),对于用户在评论文本中针对于购买物品的某一个方面(评价对象)做出评价,并对该方面表现出的倾向态度还不能做出判断。
相关技术中,基于深度学习的方法主要包括卷积神经网络(ConvolutionalNeural Network,CNN)、以及循环神经网络(Recurrent Neural Network,RNN)两大类,其中,RNN模型具有记忆序列信息的能力,对序列建模上具备一定的优势,但一般RNN模型的参数较多,每一步的计算都需要前一步计算的结果,因此RNN模型未能充分发挥GPU(图形处理器)的并行能力且训练时间相对较长。CNN模型的结构较为简单,主要是前置的卷积层和后置的全连接层,其卷积操作具有局部特征提取的能力并且支持并行操作,因此,在自然语言处理中对某个目标的识别具有一定的优势。但是,在句子很长的情况下,CNN只能够处理卷积窗口内的信息,因此,窗口大小的选择很重要,也突出了其建模简单但是调参难的问题。
针对用户在评论文本中的某一评价对象,以及对该评价对象表现出的情感倾向分类任务,常规技术手段为:根据不同任务的特点设计不同的深度学习模型来完成任务,但是这种方式存在设计难度大且训练效率不高的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种评估文本的分析方法及其装置、计算机可读存储介质,以至少解决相关技术中无法对评估语句中的评估对象的倾向意见做出细粒化的分析的技术问题。
根据本发明实施例的一个方面,提供了一种评估文本的分析方,包括:获取待处理文本,并对所述待处理文本中的评估语句进行预处理,得到单词标识序列,其中,所述待处理文本是对某一商品对象的评估文本进行提取得到的文本,所述待处理文本包括至少一段评估语句;基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将所述单词标识序列映射为词向量矩阵,其中,所述辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵;将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入所述卷积特征,得到融合特征;将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵;基于所述预估得分矩阵,分析所述待处理文本中每段所述评估语句的标签信息,其中,所述标签信息中包含所述评估语句中所涉及评估对象的倾向标签。
可选地,对所述待处理文本中的评估语句进行预处理,得到单词标识序列的步骤,包括:对所述待处理文本中的评估语句进行分词处理以及序列化处理,得到分词序列;为所述分词序列中的每个单词分配标识,得到单词标识序列。
可选地,在获取待处理文本之前,所述分析方法还包括:对预设语料库中的文本语句进行分词处理,得到分词结果序列;对所述分词结果序列中的每个单词标注标签,其中,所述标签的类型包括:对象标签、情感标签;基于预设的联合标签规则,对每个单词的不同标签进行标签组合,得到每个所述单词的组合标签。
可选地,所述词向量矩阵包括:领域词向量矩阵和词性词向量矩阵,在将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征之前,所述分析方法还包括:将所述领域词向量矩阵与所述词嵌入向量矩阵按照第一预设规则进行拼接,得到领域嵌入输入矩阵;将所述词性词向量矩阵与所述词嵌入向量矩阵按照第二预设规则进行拼接,得到词性嵌入输入矩阵;将所述领域嵌入输入矩阵和所述词性嵌入输入矩阵分别输入到第一卷积层,其中,所述第一卷积层通过第一预设公式分别计算相对于第一任务的第一局部特征以及相对于第二任务的第二局部特征,局部特征用于指示每个单词以及单词在文本中预设范围内的特征;将所述第一局部特征和所述第二局部特征输入至第二卷积层,其中,所述第二卷积层通过第二预设公式以及第三预设规则,分别计算相对于第一任务的第一卷积特征以及相对于第二任务的第二卷积特征。
可选地,将预先分析得到的相关性矩阵融入所述卷积特征,得到融合特征还包括:通过第三预设公式,计算第一任务与第二任务的交互向量;基于所述交互向量和第四预设公式,分别计算所述第一任务与所述第二任务的交互注意力得分标量,得到相对于第一任务的第一得分标量集合以及相对于第二任务的第二得分标量集合;将所述第一得分标量集合和所述第二得分标量集合进行组合,得到第一相关性表示矩阵和第二相关性表示矩阵;将所述第一相关性表示矩阵融入所述第一卷积特征,并将所述第二相关性表示矩阵融入所述第二卷积特征,得到所述融合特征。
可选地,在将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,所述分析方法还包括:基于所述预估得分矩阵和转移得分矩阵,采用条件随机场算法CRF计算标签转移路径得分;基于所述标签转移路径得分和除标签路径之外的其它路径得分的综合,计算与每个评估对象对应的倾向标签的标签概率;基于所述倾向标签的标签概率,计算所述标签转移路径得分的损失函数。
可选地,在将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,所述分析方法还包括:基于所述预估得分矩阵,得到标签路径得分;对所述标签路径得分进行排序,确定得分排序结果;基于得分排序结果,采用维特比算法选择得分最高的路径对应的标签作为文本标签结果。
可选地,在分别基于第一任务和第二任务获取到两个情感标签后,所述分析方法还包括:以评估对象标签为边界,基于所述文本标签概率和所述文本标签结果,选择标签出现次数最多的标签为情感标签;若标签出现次数相同,选择排序第一的标签为情感标签。
根据本发明实施例的另一方面,还提供了一种评估文本的分析装置,包括:获取单元,用于获取待处理文本,并对所述待处理文本中的评估语句进行预处理,得到单词标识序列,其中,所述待处理文本是对某一商品对象的评估文本进行提取得到的文本,所述待处理文本包括至少一段评估语句;第一映射单元,用于基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将所述单词标识序列映射为词向量矩阵,其中,所述辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵;输入单元,用于将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入所述卷积特征,得到融合特征;第二映射单元,用于将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵;分析单元,用于基于所述预估得分矩阵,分析所述待处理文本中每段所述评估语句的标签信息,其中,所述标签信息包含所述评估语句中所涉及评估对象的倾向标签。
可选地,所述获取单元包括:第一处理模块,用于对所述待处理文本中的评估语句进行分词处理以及序列化处理,得到分词序列;第一分匹配模块,用于为所述分词序列中的每个单词分配标识,得到单词标识序列。
可选地,所述分析装置还包括:第二处理模块,用于在获取待处理文本之前,对预设语料库中的文本语句进行分词处理,得到分词结果序列;第一标注单元,用于对所述分词结果序列中的每个单词标注标签,其中,所述标签的类型包括:对象标签、情感标签;第一组合模块,用于基于预设的联合标签规则,对每个单词的不同标签进行标签组合,得到每个所述单词的组合标签。
可选地,所述词向量矩阵包括:领域词向量矩阵和词性词向量矩阵,所述分析装置还包括:第一拼接模块,用于在将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征之前,将所述领域词向量矩阵与所述词嵌入向量矩阵按照第一预设规则进行拼接,得到领域嵌入输入矩阵;第二拼接模块,用于将所述词性词向量矩阵与所述词嵌入向量矩阵按照第二预设规则进行拼接,得到词性嵌入输入矩阵;第一输入模块,用于将所述领域嵌入输入矩阵和所述词性嵌入输入矩阵分别输入到第一卷积层,其中,所述第一卷积层通过第一预设公式分别计算相对于第一任务的第一局部特征以及相对于第二任务的第二局部特征,局部特征用于指示每个单词以及单词在文本中预设范围内的特征;第二输入模块,用于将所述第一局部特征和所述第二局部特征输入至第二卷积层,其中,所述第二卷积层通过第二预设公式以及第三预设规则,分别计算相对于第一任务的第一卷积特征以及相对于第二任务的第二卷积特征。
可选地,所述输入单元还包括:第一计算模块,用于通过第三预设公式,计算第一任务与第二任务的交互向量;第二计算模块,用于基于所述交互向量和第四预设公式,分别计算所述第一任务与所述第二任务的交互注意力得分标量,得到相对于第一任务的第一得分标量集合以及相对于第二任务的第二得分标量集合;第二组合模块,用于将所述第一得分标量集合和所述第二得分标量集合进行组合,得到第一相关性表示矩阵和第二相关性表示矩阵;第一融入模块,用于将所述第一相关性表示矩阵融入所述第一卷积特征,并将所述第二相关性表示矩阵融入所述第二卷积特征,得到所述融合特征。
可选地,所述分析装置还包括:第三计算模块,用于在将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,基于所述预估得分矩阵和转移得分矩阵,采用条件随机场算法CRF计算标签转移路径得分;第四计算模块,用于基于所述标签转移路径得分和除标签路径之外的其它路径得分的综合,计算与每个评估对象对应的倾向标签的标签概率;第五计算模块,用于基于所述倾向标签的标签概率,计算所述标签转移路径得分的损失函数。
可选地,所述分析装置还包括:第一输出模块,用于在将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,基于所述预估得分矩阵,得到标签路径得分;第一排序模块,用于对所述标签路径得分进行排序,确定得分排序结果;第一选择模块,用于基于得分排序结果,采用维特比算法选择得分最高的路径对应的标签作为文本标签结果。
可选地,所述分析装置还包括:第二选择模块,用于在分别基于第一任务和第二任务获取到两个情感标签后,以评估对象标签为边界,基于所述文本标签概率和所述文本标签结果,选择标签出现次数最多的标签为情感标签;第三选择模块,用于若标签出现次数相同,选择排序第一的标签为情感标签。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的评估文本的分析方法。
根据本发明实施例的另一方面,还提供了一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述的评估文本的分析方法。
在本公开中,在获取待处理文本之后,对待处理文本中的评估语句进行预处理,得到单词标识序列,基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征,将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵,基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。在本申请中,可结合评价对象抽取以及针对评价对象的情感倾向分类两个任务的特点,基于交互单元得到两个任务的融合特征,通过膨胀循环卷积神经网络技术,能够同时完成针对于评估语句中的更加细粒度的评价抽取和用户情感倾向分类两个任务,进而解决了相关技术中无法对评估语句中的评估对象的倾向意见做出细粒化的分析的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是现有技术中一种可选的某平台上的评论模块中的商品评论的示意图;
图2是根据本发明实施例的一种可选的评估文本的分析方法的流程图;
图3是根据本发明实施例的一种可选的针对某一评估语句中的评论对象的情感倾向分类方法的示意图;
图4是根据本发明实施例的一种可选的用于针对更加细粒度分析任务的三个处理模块之间关系的示意图;
图5是根据本发明实施例的一种可选的语句标签的示意图;
图6是根据本发明实施例的一种可选的词向量加载的示意图;
图7是根据本发明实施例的一种可选的膨胀循环卷积神经网络模型的示意图;
图8是根据本发明实施例的一种可选的评估文本的分析装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于本领域技术人员理解本发明,下面对本发明各实施例中涉及的部分术语或名词做出解释:
评价对象抽取(Aspect Term Extraction,ATE),是分析任务中的一项基础的任务,是指从评论文本中正确地提取构成目标评价对象的单词或者词组,也可视其为一种序列标注任务。
评价对象的情感倾向分类(Aspect Sentiment Classification,ASC),是在评价对象抽取的基础上分析用户对该评价对象所表达的情感倾向的任务。
CRF算法,conditional random filed algorithm,条件随机场算法,结合了最大熵模型和隐马尔可夫模型,是一种无向图模型,在分词、词性标注和命名实体识别等序列标注任务中具有很好的效果。
维特比算法,是一种动态规划算法,用于寻找最有可能产生的观测事件序列。
本发明下述各实施例可应用于各种需要针对更加细粒度的评论对象的情感倾向分析的场景中,其中,评论对象是指从用户的评论语句中提取的对象,例如,包装、质量、尺寸等,评论语句可以来自各种应用/系统/平台的评论区中的公开发布的用户评论,例如,某电商平台的评论区中的用户评论。本发明通过基于交互模式的膨胀循环卷积神经网络模型,利用膨胀循环卷积神经网络在计算效率和语义覆盖上的优势,以及通过交互模块融合评价对象抽取以及针对评价对象的情感倾向分类的两个任务,共同完成评价抽取和用户情感倾向分类,使得针对评估语句的分析内容更加细粒度。下面结合各个实施例对本发明进行详细说明。
实施例一
根据本发明实施例,提供了一种评估文本的分析方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本发明实施例的一种可选的评估文本的分析方法的流程图,如图2所示,该方法包括如下步骤:
步骤S201,获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,其中,待处理文本是对某一商品对象的评估文本进行提取得到的文本,待处理文本包括至少一段评估语句。
步骤S202,基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,其中,辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵。
步骤S203,将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征。
步骤S204,将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵。
步骤S205,基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。
其中,本实施例中的标签信息中可以包含评估语句中所涉及评估对象的倾向标签。
通过上述步骤,可以获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征,将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵,基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。在本实施例中,可结合评价对象抽取以及针对评价对象的情感倾向分类两个任务的特点,基于交互单元得到两个任务的融合特征,通过膨胀循环卷积神经网络技术,能够同时完成针对于评估语句中的更加细粒度的评价抽取和用户情感倾向分类两个任务,进而解决了相关技术中无法对评估语句中的评估对象的倾向意见做出细粒化的分析的技术问题。
下面结合上述各步骤对本发明实施例进行详细说明。
图3是根据本发明实施例的一种可选的针对某一评估语句中的评论对象的情感倾向分类方法的示意图,如图3所示,针对某一用户评论“腊肉已经收到,包装状态完好,色泽看着很诱人,待品尝过后再来评价”,经过转化处理后,通过基于交互模式的膨胀循环卷积神经网络模型(Cross-Shared Iterated Dilated Convolutions Neural Network,CS-IDCNN),能够抽取得到该用户评论中的评价对象以及分析出用户对应的情感倾向类别,即将用户评论经过该模型处理后,能够得到分析结果:{“包装”:正向,“色泽”:正向}。
图4是根据本发明实施例的一种可选的用于针对更加细粒度分析任务的三个处理模块之间关系的示意图,如图4所示,包括:数据预处理和标签化模块、句子向量化模块、模型设计和训练模块。
可选的,在获取待处理文本之前,分析方法还包括:对预设语料库中的文本语句进行分词处理,得到分词结果序列;对分词结果序列中的每个单词标注标签,其中,标签的类型包括:对象标签、情感标签;基于预设的联合标签规则,对每个单词的不同标签进行标签组合,得到每个单词的组合标签。
本实施例在分析评估文本时,可以分析通过标签信息来指示评估对象的倾向性意见。
在本发明实施例中,通过数据预处理和标签化模块对待处理的文本进行处理,对于给定句子,需采用分词工具(例如,jieba分词工具)对其进行分词处理,得到分词结果序列,对于两个不同的任务(即评价对象抽取以及针对评价对象的情感倾向分类任务),可设计一种联合标签的规则(即预设的联合标签规则)对句子分词进行标签化处理,之后将整个语料库(即预设语料库)中处理后的文本划分训练集和测试集,以用于训练和测试模型,得到基于交互模式的膨胀循环卷积神经网络模型。
在本发明实施例中,通过预设的联合标签规则,将评价对象抽取和用户情感倾向分类两个任务视为句子序列标注的问题,例如,语料库中有评估语句“腊肉已经收到,包装状态完好,色泽看着很诱人,待品尝过后再来评价”,对于该评估语句,可以先对其进行分词处理,从而得到句子的序列组成结构(即分词结果序列)。可以采用分词工具对语料库中的句子进行分词处理,对于上述评估语句使用分词工具按照词性分类得到的分词结果为:{腊肉/n,已经/d,收到/v,了/u,,/w,包装/v,状态/n,完好/a,,/w,色泽/n,看/v,着/u,很/d,诱人/a},其中,标签n为名词词性,u为助词词性,d为副词词性,v为动词词性,a为形容词词性,w位标点符号。
针对不同的任务,可以对句子中的每个单词赋予相应的标签,对于评价对象抽取任务来说,可以采用对象标签集合{B,I,O},其中,B表示组成评价对象的第一个词,I表示除B之外其他组成该评价对象的词,O表示句子中非组成评价对象的词;对于情感倾向分类可以采用情感标签集合{PO,NT,NG,CF},该标签用于标记评价对象的情感倾向,其中,PO表示积极正向的情感倾向,NT表示中立的情感倾向,NG表示消极负向的情感倾向,CF表示未知的情感倾向。
如图5所示,根据不同的任务赋予不同的标签之后进行标签的组合,例如,对于以分词处理后的文本输入{腊肉/n,已经/d,收到/v,了/u,,/w,包装/v,状态/n,完好/a,,/w,色泽/n,看/v,着/u,很/d,诱人/a},其评论对象标签为{O,O,O,O,O,B,I,O,O,B,O,O,O,O},情感极性标签{O,O,O,O,O,PO,PO,O,O,PO,O,O,O,O},组合标签{O,O,O,O,O,B-PO,I-PO,O,O,B-PO,O,O,O,O}。对于例句中的评价对象“包装状态”,其对应的组合标签为{B-PO,I-PO},表示用户对“包装对象”所表达的情感倾向为正向。
步骤S201,获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,其中,待处理文本是对某一商品对象的评估文本进行提取得到的文本,待处理文本包括至少一段评估语句。
可选的,对待处理文本中的评估语句进行预处理,得到单词标识序列的步骤,包括:对待处理文本中的评估语句进行分词处理以及序列化处理,得到分词序列;为分词序列中的每个单词分配标识,得到单词标识序列。
在本发明实施例中,可以通过句子向量化模块,对预设语料库(该语料库存有预先提取的多种商品对象的评估文本,并且每个评估文本至少有一段评估语句)中的待处理文本使用分词工具,进行分词序列化处理(即预处理),得到分词序列V,并假设分词序列V中有|V|个不重复的单词,为分词序列中的每一个单词分配一个标识id∈{1,2,...,|V|},相当于为每个单词分配了一个唯一的标号,如此,经分词后的每一个评论句子(即评估语句)将对应一个单词标识序列。
步骤S202,基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,其中,辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵。
在本发明实施例中,可以通过句子向量化模块将单词标识序列映射为词向量矩阵,为了更好的表现词所表达的语义特征,可通过神经网络算法来训练语言模型,将词嵌入到一个维度较低且固定的空间当中,得到一种更为稠密且包含词语义的词嵌入向量表示。为满足膨胀循环卷积神经网络模型的输入要求,通过预训练的词嵌入向量矩阵将评估语句的单词标识序列映射为词向量矩阵作为该模型输入。
可以选择**百科(Mu Encyclopedia,ME)预训练中文词向量(300维)作为该模型的输入基础。如图6所示,以上述例句为例:
假设预设语料库中的句子的最大长度为n,例句的评论文本经过词序列化之后的单词标识序列为{w1,w2,...,wn},句子的标识序列可用零填充到最大长度n,得到单词标识序列后,生成对应句子的词向量矩阵可表示为:
X={x1,x2,...,xn},xi=WEei,i∈[1,n];
其中,X∈Rn×300,WE为语料库中所有单词对应的ME词嵌入矩阵(即语料库词嵌入矩阵),维度为[|V|,300]表示语料库中所有单词的词向量集合,ei={0,0,...,1,...,0}为一个独热向量,其中仅有一个位置为1,对应的单词标识值即其在语料库单词字典里的编号,对于给定的句子而言,eiWE相当于从WE中取出第wi个单词所在位置的词向量作为该句子第i个单词所对应的词向量xi,如图6所示,该过程可由深度学习框架提供的词向量查找方法(look up)实现。
为了丰富两个任务的输入语义特征,本发明实施例为两个任务分别引入两种辅助嵌入向量矩阵,针对评价对象抽取任务引入领域嵌入向量矩阵,区别于ME词嵌入矩阵(即预先训练的词嵌入向量矩阵),该嵌入方式使用的是评论所在领域的语料来训练词向量,能够更大程度的涵盖评价对象的语义特征;由于评论中单词的词性对情感倾向的判断起到很大的作用,因此,针对情感倾向分类任务可以引入词性嵌入向量矩阵,该嵌入方式可通过为评论语料库中的所有词性标签初始化一个向量得到。例如,假设WD和WP分别对应领域嵌入向量矩阵和词性嵌入向量矩阵,则生成对应句子的领域嵌入输入矩阵D和词性嵌入输入矩阵P表示为:
D={d1,d2,...,dn},di=WEei,i∈[1,n];
P={p1,p2,...,pn},pi=WEei,i∈[1,n];
步骤S203,将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征。
在本发明实施例中,可通过模型设计和训练模块得到基于交互模式的膨胀循环卷积神经网络模型(即预设的膨胀循环卷积神经网络模型),通过该模型来共同完成评价对象抽取和评论的情感倾向分类任务。图7是根据本发明实施例的一种可选的膨胀循环卷积神经网络模型的示意图,两个任务可以以词嵌入向量矩阵X以及辅助嵌入向量矩阵(包括:领域嵌入向量矩阵D或词性嵌入向量矩阵P)为输入,通过膨胀循环卷积神经网络模型,进行连接和映射处理,得到卷积特征,其中,膨胀循环卷积神经网络模型包括:词嵌入层、循环膨胀卷积层以及标记映射层。通过膨胀循环卷积神经网络模型输出卷积特征之后,两个任务(即评价对象抽取和情感倾向分类)通过设计的交互单元进行特征交互学习(即将预先分析得到的相关性矩阵融入卷积特征),得到融合特征,之后,可以使用测试集测试训练好的模型,验证效果。
可选的,词向量矩阵包括:领域词向量矩阵和词性词向量矩阵,在将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征之前,分析方法还包括:将领域词向量矩阵与词嵌入向量矩阵按照第一预设规则进行拼接,得到领域嵌入输入矩阵;将词性词向量矩阵与词嵌入向量矩阵按照第二预设规则进行拼接,得到词性嵌入输入矩阵;将领域嵌入输入矩阵和词性嵌入输入矩阵分别输入到第一卷积层,其中,第一卷积层通过第一预设公式分别计算相对于第一任务的第一局部特征以及相对于第二任务的第二局部特征,局部特征用于指示每个单词以及单词在文本中预设范围内的特征;将第一局部特征和第二局部特征输入至第二卷积层,其中,第二卷积层通过第二预设公式以及第三预设规则,分别计算相对于第一任务的第一卷积特征以及相对于第二任务的第二卷积特征。
在本发明实施例中,对于词嵌入层,两个任务(即第一任务为评价对象抽取,第二任务为情感倾向分类)根据自身任务的特点拥有不同的词向量输入方式(即领域词向量矩阵和词性词向量矩阵),设X1和X2分别对应评价对象抽取任务和情感倾向分类任务的领域嵌入输入矩阵(即将领域词向量矩阵与词嵌入向量矩阵按照第一预设规则进行拼接,得到领域嵌入输入矩阵)和词嵌入输入矩阵(即将词性词向量矩阵与词嵌入向量矩阵按照第二预设规则进行拼接,得到词性嵌入输入矩阵),其中d1,d2分别对应了领域嵌入向量和词性嵌入向量的维度,训练时可选择调整,为矩阵拼接操作。
对于循环膨胀卷积层,则包含了两个部分:第一个部分为一个普通的卷积层(即第一卷积层),其主要作用是提取句子的局部特征,卷积计算通过多个一维卷积过滤器进行,设卷积核的大小为k,其中,k=2c+1,k为奇数,在训练中作为参数选择,表示抽取每个单词及其上下文2c个单词范围内的局部特征(即局部特征用于指示每个单词以及单词在文本中预设范围内的特征),则该部分的卷积计算(即通过第一预设公式计算局部特征,局部特征包括第一任务的第一局部特征以及第二任务的第二局部特征)表示为:
其中,卷积过滤器参数矩阵,X′可为X1或者X2,即表示两个任务的嵌入输入矩阵之一,nconv为在训练中选择使用到的卷积核的个数,f表示非线性激活函数ReLU,卷积步长为1,可用0填充上下文不足k的首词和尾词,保证句子中的每一个词都涵盖在内。
第二个部分为4个大小相同的膨胀卷积块(block)堆叠在一起(即第二卷积层),用于对上下文信息进行整合并防止模型出现过拟合的情况,每一个block是膨胀率分别为1,1,2的三层膨胀卷积层,则该部分的卷积计算(即通过第二预设公式计算卷积特征,卷积特征包括第一任务的第一卷积特征以及第二任务的第二卷积特征)表示为:
i∈[1,n],j∈[1,nconv],l∈[1,2,3],t∈[1,2,3,4];
其中,定义为膨胀卷积运算,为膨胀率,其在每个block上取值分别为1,1,2;l和t分别标明了block的编号以及循环的次数,即每次循环最后的输出作为下一个循环的输入,最后,将处在各循环中的卷积输出结果进行横向拼接(即第三预设规则)作为循环卷积层的最终输出结果Cf,表示如下:
设当X′=X1时,Cf=CA,当X′=X2时,Cf=CS,即以两个任务的嵌入输入矩阵作为模型输入时,分别得到的卷积模型输出为CA和CS。
可选的,将预先分析得到的相关性矩阵融入卷积特征,得到融合特征还包括:通过第三预设公式,计算第一任务与第二任务的交互向量;基于交互向量和第四预设公式,分别计算第一任务与第二任务的交互注意力得分标量,得到相对于第一任务的第一得分标量集合以及相对于第二任务的第二得分标量集合;将第一得分标量集合和第二得分标量集合进行组合,得到第一相关性表示矩阵和第二相关性表示矩阵;将第一相关性表示矩阵融入第一卷积特征,并将第二相关性表示矩阵融入第二卷积特征,得到融合特征。
在本发明实施例中,两个任务(即ATE任务和ASC任务)的标签之间具有很强的相关性,例如,当ATE任务(即第一任务)的标签是O时,ASC任务(即第二任务)的标签也为O,若ASC任务的标签为PO时,ATE任务的标签必须为B或者I,为了捕获这种相关性,引入了一种交互单元(Cross Share Unit,CSU)来学习交互关系。
其中,Gm∈RK×2d×2d是一个三维的张量,K为可设置的超参数,A,a以及S,s分别是标识两个任务的索引标志,当m=a时,M=A,当m=p时,M=P。该操作可视为建模两个任务向量相关性的一种方式,当得到交互向量之后,可由如下公式(即第四预设公式)为两个任务计算交互注意力得分标量
其中,vm∈RK表示权重向量用来对交互向量加权,M∈{A,S},m∈{a,s}。两个任务分别得到第一得分标量集合和第二得分标量集合,将第一得分标量集合和第二得分标量集合组合在一起得到两个相关性表示矩阵:第一相关性表示矩阵TA和第二相关性表示矩阵TP。对于评价对象抽取任务而言,的值越大表示评价对象组成词i从第j个词中获取到情感极性的相关性越高;同理,对于情感倾向分类任务而言,的值越大表示情感极性词i与评价对象组成词j匹配的相关性越高。为使得两个任务的特征能够融合在一起,可使用两个任务的相关性表示矩阵融入卷积特征重新得到任务的特征表示(即将第一相关性表示矩阵融入第一卷积特征,并将第二相关性表示矩阵融入第二卷积特征,得到融合特征):
步骤S204,将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵。
在本发明实施例中,为了获得预测标签,融合特征CM需经过线性映射得到膨胀循环卷积神经网络模型对句子中每个单词标签的预测的得分矩阵R(即预估得分矩阵),也称为输出得分矩阵:
R=WCM+b;
其中,W为线性转换参数,b为对应的偏置项,矩阵R包括句子中的每个单词对应的标签的得分。
可选的,在将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,分析方法还包括:基于预估得分矩阵和转移得分矩阵,采用条件随机场算法CRF计算标签转移路径得分;基于标签转移路径得分和除标签路径之外的其它路径得分的综合,计算与每个评估对象对应的倾向标签的标签概率;基于倾向标签的标签概率,计算标签转移路径得分的损失函数。
在本发明实施例中,由于存在标签之间转换不合理的问题,会导致标签预测不够准确,因此需要CRF算法对标签之间的转移加以限制。
以评价对象抽取任务为例(情感倾向分裂任务类似),设句子的最大长度为n,CRF算法以模型的输出得分矩阵R(即预估得分矩阵)和其定义的转移得分矩阵A来作为输入,其中,A的维度为[n,n],在模型训练时可随机初始化。长度为n的句子在评价对象抽取任务当中标签组合的结果有3n种,每一种不同的组合方式称为标签转移路径,CRF训练的目的是为了突出句子的实际标签转移路径得分所占的比重,以此优化模型的参数。
以图5中语句文本为例,实际标签值y={y1,yw,...,y14}={O,..,O,B,I,O,...,O},设x={R1,O,...,R4,O,R5,B,...,R14,O}为实际标签的模型输出得分,其元素表示句子中的单词为实际标签的得分值,可由模型输出结果得到。实际标签的转移路径可表示为{y1→y2,y2→y3,...,y10→y14},即{O->O,...,O->O,O->B,B->I,...,O->O}。则可由CRF算法计算得出的实际标签转移路径得分score(x,y),表示为转移得分矩阵A加上模型得分矩阵R:
其中,表示从实际标签yl向实际标签yl+1转移的转移得分值,表示句子中索引为l的单词标签为yl的得分。根据实际标签路径得分确定损失函数(即基于倾向标签的标签概率,计算标签转移路径得分的损失函数),以表示预测的标签概率与实际标签概率的差距程度,用于及时调整该模型,其中,损失函数为标签序列的负对数似然函数loss,可以通过如下公式确定:
其中,p(y|x)为在给定x的条件下y标签的概率(即与每个评估对象对应的倾向标签的标签概率),公式中Yx为句子当中所有标签转移路径的集合,则分子为实际转移标签的得分,分母表示除实际标签路径之外的其他路径得分的总和,loss为负对数损失函数,底数为e。
可选的,在将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,分析方法还包括:基于预估得分矩阵,得到标签路径得分;对标签路径得分进行排序,确定得分排序结果;基于得分排序结果,采用维特比算法选择得分最高的路径对应的标签作为文本标签结果。
在本发明实施例中,可以根据得到的预估得分矩阵,得出标签路径得分,其中,标签路径得分为将每一种标签组合所对应的标签得分累加得到的,对所有组合的标签路径得分进行排序,采用维特比算法(Viterbi algorithm)选择得分最高的路径对应的标签作为文本标签结果。
可选的,在分别基于第一任务和第二任务获取到两个情感标签后,分析方法还包括:以评估对象标签为边界,基于文本标签概率和文本标签结果,选择标签出现次数最多的标签为情感标签;若标签出现次数相同,选择排序第一的标签为情感标签。
在本发明实施例中,当同时为两个任务产生预测标签(即分别得到第一任务和第二任务的两个情感标签(即倾向标签的标签概率和文本标签结果))时,可以以评估对象标签为边界,用下列两种方式获取极性标签(即情感标签):(1)取出现次数最多的情感极性标签;(2)若标签数量相等,取首个极性标签(即选择排序第一的标签为情感标签)。例如,当评价对象由3个词组成时,输出标签为{B,I,I},即边界为3,若极性标签输出为“PO,PO,NT”,则取PO作为极性标签,最终的组合标签为{B-PO,I-PO,I-PO},当评价对象由2个词组成时,输出标签为{B,I},即边界为2,若极性标签输出为“NT,PO”,则取NT作为极性标签,最终的组合标签为{B-NT,I-NT}。
步骤S205,基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。
本实施例中,标签信息中可以包括评估对象的情感倾向,在对评估文本进行分析,分析得到内容为文本的情感倾向,能够评估文本的情感倾向进行分析。
在本发明实施例中,通过基于交互模式的膨胀循环卷积神经网络模型,利用膨胀循环卷积神经网络在计算效率和语义覆盖上的优势,以及通过交互模块融合评价对象抽取以及针对评价对象的情感倾向分类的两个任务,共同完成评价抽取和用户情感倾向分类,得到每段评估语句中所涉及评估对象的倾向标签(具体可以包括情感倾向标签)。
本发明实施例具有以下两方面有益效果:
(1)从任务的粒度角度上,可以对用户在评论文本中针对购买物品的某一个方面做出评价,并确定在该方面表现出的情感倾向,实现了评价对象的抽取和用户情感倾向分类两个任务同时完成,使得用户评论分析更加的细粒度化。
(2)从模型的设计和效率上,以膨胀循环卷积神经网络作为模型的设计基础,能够充分发挥GPU的并行计算能力,使用一个统一的模型接口并设计了交互单元获取两个任务之间的关系,使得模型能够同时完成两个任务更加简洁和高效。
实施例二
本实施例中提供的一种评估文本的分析装置包含了多个实施单元,每个实施单元对应于上述实施例一中的各个实施步骤。
图8是根据本发明实施例的一种可选的评估文本的分析装置的示意图,如图8所示,该分析装置可以包括:获取单元80,第一映射单元81,输入单元82,第二映射单元83,分析单元84,其中,
获取单元80,用于获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,其中,待处理文本是对某一商品对象的评估文本进行提取得到的文本,待处理文本包括至少一段评估语句;
第一映射单元81,用于基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,其中,辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵;
输入单元82,用于将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征;
第二映射单元83,用于将融合特征经过线性映射得到膨胀卷积神经网络模型对每个单词标签的预估得分矩阵;
分析单元84,用于基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。其中,标签信息中包含评估语句中所涉及评估对象的倾向标签。
上述分析装置,可以通过获取单元80获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,通过第一映射单元81基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,通过输入单元82将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征,第二映射单元83将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵,通过分析单元84基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。在本实施例中,可结合评价对象抽取以及针对评价对象的情感倾向分类两个任务的特点,基于交互单元得到两个任务的融合特征,通过膨胀循环卷积神经网络技术,能够同时完成针对于评估语句中的更加细粒度的评价抽取和用户情感倾向分类两个任务,进而解决了相关技术中无法对评估语句中的评估对象的倾向意见做出细粒化的分析的技术问题。
可选的,获取单元包括:第一处理模块,用于对待处理文本中的评估语句进行分词处理以及序列化处理,得到分词序列;第一分匹配模块,用于为分词序列中的每个单词分配标识,得到单词标识序列。
可选的,分析装置还包括:第二处理模块,用于在获取待处理文本之前,对预设语料库中的文本语句进行分词处理,得到分词结果序列;第一标注单元,用于对分词结果序列中的每个单词标注标签,其中,标签的类型包括:对象标签、标签信息;第一组合模块,用于基于预设的联合标签规则,对每个单词的不同标签进行标签组合,得到每个单词的组合标签。
可选的,词向量矩阵包括:领域词向量矩阵和词性词向量矩阵,分析装置还包括:第一拼接模块,用于在将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征之前,将领域词向量矩阵与词嵌入向量矩阵按照第一预设规则进行拼接,得到领域嵌入输入矩阵;第二拼接模块,用于将词性词向量矩阵与词嵌入向量矩阵按照第二预设规则进行拼接,得到词性嵌入输入矩阵;第一输入模块,用于将领域嵌入输入矩阵和词性嵌入输入矩阵分别输入到第一卷积层,其中,第一卷积层通过第一预设公式分别计算相对于第一任务的第一局部特征以及相对于第二任务的第二局部特征,局部特征用于指示每个单词以及单词在文本中预设范围内的特征;第二输入模块,用于将第一局部特征和第二局部特征输入至第二卷积层,其中,第二卷积层通过第二预设公式以及第三预设规则,分别计算相对于第一任务的第一卷积特征以及相对于第二任务的第二卷积特征。
可选的,输入单元还包括:第一计算模块,用于通过第三预设公式,计算第一任务与第二任务的交互向量;第二计算模块,用于基于交互向量和第四预设公式,分别计算第一任务与第二任务的交互注意力得分标量,得到相对于第一任务的第一得分标量集合以及相对于第二任务的第二得分标量集合;第二组合模块,用于将第一得分标量集合和第二得分标量集合进行组合,得到第一相关性表示矩阵和第二相关性表示矩阵;第一融入模块,用于将第一相关性表示矩阵融入第一卷积特征,并将第二相关性表示矩阵融入第二卷积特征,得到融合特征。
可选的,分析装置还包括:第三计算模块,用于在将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,基于预估得分矩阵和转移得分矩阵,采用条件随机场算法CRF计算标签转移路径得分;第四计算模块,用于基于标签转移路径得分和除标签路径之外的其它路径得分的综合,计算与每个评估对象对应的倾向标签的标签概率;第五计算模块,用于基于倾向标签的标签概率,计算标签转移路径得分的损失函数。
可选的,分析装置还包括:第一输出模块,用于在将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,基于预估得分矩阵,得到标签路径得分;第一排序模块,用于对标签路径得分进行排序,确定得分排序结果;第一选择模块,用于基于得分排序结果,采用维特比算法选择得分最高的路径对应的标签作为文本标签结果。
可选的,分析装置还包括:第二选择模块,用于在分别基于第一任务和第二任务获取到两个情感标签后,以评估对象标签为边界,基于文本标签概率和文本标签结果,选择标签出现次数最多的标签为情感标签;第三选择模块,用于若标签出现次数相同,选择排序第一的标签为情感标签。
上述的分析装置还可以包括处理器和存储器,上述获取单元80,第一映射单元81,输入单元82,第二映射单元83,分析单元84等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数分析待处理文本中每段评估语句的标签信息。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取待处理文本,并对待处理文本中的评估语句进行预处理,得到单词标识序列,基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将单词标识序列映射为词向量矩阵,将词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入卷积特征,得到融合特征,将融合特征经过线性映射得到膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵,基于预估得分矩阵,分析待处理文本中每段评估语句的标签信息。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的评估文本的分析方法。
根据本发明实施例的另一方面,还提供了一种电子设备,其特征在于,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项的评估文本的分析方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种评估文本的分析方法,其特征在于,包括:
获取待处理文本,并对所述待处理文本中的评估语句进行预处理,得到单词标识序列,其中,所述待处理文本是对某一商品对象的评估文本进行提取得到的文本,所述待处理文本包括至少一段评估语句;
基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将所述单词标识序列映射为词向量矩阵,其中,所述辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵;
将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入所述卷积特征,得到融合特征;
将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵;
基于所述预估得分矩阵,分析所述待处理文本中每段所述评估语句的标签信息,其中,所述标签信息中包含所述评估语句中所涉及评估对象的倾向标签。
2.根据权利要求1所述的分析方法,其特征在于,对所述待处理文本中的评估语句进行预处理,得到单词标识序列的步骤,包括:
对所述待处理文本中的评估语句进行分词处理以及序列化处理,得到分词序列;
为所述分词序列中的每个单词分配标识,得到单词标识序列。
3.根据权利要求1所述的分析方法,其特征在于,在获取待处理文本之前,所述分析方法还包括:
对预设语料库中的文本语句进行分词处理,得到分词结果序列;
对所述分词结果序列中的每个单词标注标签,其中,所述标签的类型包括:对象标签、情感标签;
基于预设的联合标签规则,对每个单词的不同标签进行标签组合,得到每个所述单词的组合标签。
4.根据权利要求3所述的分析方法,其特征在于,所述词向量矩阵包括:领域词向量矩阵和词性词向量矩阵,在将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征之前,所述分析方法还包括:
将所述领域词向量矩阵与所述词嵌入向量矩阵按照第一预设规则进行拼接,得到领域嵌入输入矩阵;
将所述词性词向量矩阵与所述词嵌入向量矩阵按照第二预设规则进行拼接,得到词性嵌入输入矩阵;
将所述领域嵌入输入矩阵和所述词性嵌入输入矩阵分别输入到第一卷积层,其中,所述第一卷积层通过第一预设公式分别计算相对于第一任务的第一局部特征以及相对于第二任务的第二局部特征,局部特征用于指示每个单词以及单词在文本中预设范围内的特征;
将所述第一局部特征和所述第二局部特征输入至第二卷积层,其中,所述第二卷积层通过第二预设公式以及第三预设规则,分别计算相对于第一任务的第一卷积特征以及相对于第二任务的第二卷积特征。
5.根据权利要求4所述的分析方法,其特征在于,将预先分析得到的相关性矩阵融入所述卷积特征,得到融合特征还包括:
通过第三预设公式,计算第一任务与第二任务的交互向量;
基于所述交互向量和第四预设公式,分别计算所述第一任务与所述第二任务的交互注意力得分标量,得到相对于第一任务的第一得分标量集合以及相对于第二任务的第二得分标量集合;
将所述第一得分标量集合和所述第二得分标量集合进行组合,得到第一相关性表示矩阵和第二相关性表示矩阵;
将所述第一相关性表示矩阵融入所述第一卷积特征,并将所述第二相关性表示矩阵融入所述第二卷积特征,得到所述融合特征。
6.根据权利要求5所述的分析方法,其特征在于,在将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,所述分析方法还包括:
基于所述预估得分矩阵和转移得分矩阵,采用条件随机场算法CRF计算标签转移路径得分;
基于所述标签转移路径得分和除标签路径之外的其它路径得分的综合,计算与每个评估对象对应的倾向标签的标签概率;
基于所述倾向标签的标签概率,计算所述标签转移路径得分的损失函数。
7.根据权利要求5所述的分析方法,其特征在于,在将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵之后,所述分析方法还包括:
基于所述预估得分矩阵,得到标签路径得分;
对所述标签路径得分进行排序,确定得分排序结果;
基于得分排序结果,采用维特比算法选择得分最高的路径对应的标签作为文本标签结果。
8.根据权利要求7所述的分析方法,其特征在于,在分别基于第一任务和第二任务获取到两个情感标签后,所述分析方法还包括:
以评估对象标签为边界,基于所述文本标签概率和所述文本标签结果,选择标签出现次数最多的标签为情感标签;
若标签出现次数相同,选择排序第一的标签为情感标签。
9.一种评估文本的分析装置,其特征在于,包括:
获取单元,用于获取待处理文本,并对所述待处理文本中的评估语句进行预处理,得到单词标识序列,其中,所述待处理文本是对某一商品对象的评估文本进行提取得到的文本,所述待处理文本包括至少一段评估语句;
第一映射单元,用于基于预先训练的词嵌入向量矩阵和/或辅助嵌入向量矩阵,将所述单词标识序列映射为词向量矩阵,其中,所述辅助嵌入向量矩阵为领域嵌入向量矩阵或者词性嵌入向量矩阵;
输入单元,用于将所述词向量矩阵输入至预设的膨胀循环卷积神经网络模型中,得到卷积特征,并将预先分析得到的相关性矩阵融入所述卷积特征,得到融合特征;
第二映射单元,用于将所述融合特征经过线性映射得到所述膨胀循环卷积神经网络模型对每个单词标签的预估得分矩阵;
分析单元,用于基于所述预估得分矩阵,分析所述待处理文本中每段所述评估语句的标签信息,其中,所述标签信息中包含所述评估语句中所涉及评估对象的倾向标签。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8中任意一项所述的评估文本的分析方法。
11.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任意一项所述的评估文本的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111456304.5A CN114239569A (zh) | 2021-12-01 | 2021-12-01 | 评估文本的分析方法及其装置、计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111456304.5A CN114239569A (zh) | 2021-12-01 | 2021-12-01 | 评估文本的分析方法及其装置、计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114239569A true CN114239569A (zh) | 2022-03-25 |
Family
ID=80752632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111456304.5A Pending CN114239569A (zh) | 2021-12-01 | 2021-12-01 | 评估文本的分析方法及其装置、计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114239569A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115756336A (zh) * | 2022-12-02 | 2023-03-07 | 邵健康 | 基于存储服务系统的数据迁移处理方法、系统及云平台 |
-
2021
- 2021-12-01 CN CN202111456304.5A patent/CN114239569A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115756336A (zh) * | 2022-12-02 | 2023-03-07 | 邵健康 | 基于存储服务系统的数据迁移处理方法、系统及云平台 |
CN115756336B (zh) * | 2022-12-02 | 2023-09-15 | 深圳市大道四九科技有限公司 | 基于存储服务系统的数据迁移处理方法、系统及云平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488931B (zh) | 文章质量评估方法、文章推荐方法及其对应的装置 | |
CN106599226B (zh) | 一种内容推荐方法及内容推荐系统 | |
CN110209805B (zh) | 文本分类方法、装置、存储介质和计算机设备 | |
CN113095415B (zh) | 一种基于多模态注意力机制的跨模态哈希方法及系统 | |
CN113011186B (zh) | 命名实体识别方法、装置、设备及计算机可读存储介质 | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
CN113326380B (zh) | 基于深度神经网络的设备量测数据处理方法、系统及终端 | |
CN114238577B (zh) | 融合多头注意力机制的多任务学习情感分类方法 | |
CN111858843A (zh) | 一种文本分类方法及装置 | |
CN111613341A (zh) | 基于语义成分的实体链接方法及装置 | |
CN111859909B (zh) | 一种语义场景一致性识别阅读机器人 | |
CN111985243A (zh) | 情感模型的训练方法、情感分析方法、装置及存储介质 | |
CN112862569A (zh) | 基于图像和文本多模态数据的产品外观风格评价方法和系统 | |
CN107247753A (zh) | 一种相似用户选取方法及装置 | |
CN114896386A (zh) | 基于BiLSTM的电影评论语义情感分析方法及系统 | |
CN114627282A (zh) | 目标检测模型的建立方法、应用方法、设备、装置及介质 | |
Phukan et al. | An efficient technique for image captioning using deep neural network | |
CN114239569A (zh) | 评估文本的分析方法及其装置、计算机可读存储介质 | |
JP4054046B2 (ja) | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
CN110851600A (zh) | 基于深度学习的文本数据处理方法及装置 | |
CN116089605A (zh) | 基于迁移学习和改进词袋模型的文本情感分析方法 | |
Polat et al. | Fake News Classification using BLSTM with Glove Embedding | |
Noorbehbahani et al. | Customer Loyalty Prediction of E-marketplaces Via Review Analysis | |
Ardiyanto et al. | Application Of Artificial Intelligence (AI) For Hijab Business In Mojokerto Using Sentiment Analysis Method Natural Language Processing (NLP) | |
CN112364666A (zh) | 文本表征方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |