CN111651604B - 基于人工智能的情感分类方法和相关装置 - Google Patents
基于人工智能的情感分类方法和相关装置 Download PDFInfo
- Publication number
- CN111651604B CN111651604B CN202010501466.5A CN202010501466A CN111651604B CN 111651604 B CN111651604 B CN 111651604B CN 202010501466 A CN202010501466 A CN 202010501466A CN 111651604 B CN111651604 B CN 111651604B
- Authority
- CN
- China
- Prior art keywords
- emotion
- text
- capsule
- word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 398
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000013473 artificial intelligence Methods 0.000 title abstract description 12
- 239000002775 capsule Substances 0.000 claims abstract description 353
- 239000013598 vector Substances 0.000 claims abstract description 81
- 238000012549 training Methods 0.000 claims description 64
- 230000007246 mechanism Effects 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 15
- 230000009849 deactivation Effects 0.000 claims description 5
- 230000008909 emotion recognition Effects 0.000 abstract description 15
- 235000013305 food Nutrition 0.000 description 52
- 230000006870 function Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 25
- 241000251468 Actinopterygii Species 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000013550 pizza Nutrition 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 244000245420 ail Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 235000021185 dessert Nutrition 0.000 description 1
- 235000011850 desserts Nutrition 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 235000015277 pork Nutrition 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例公开了一种基于人工智能的情感分类方法和相关装置,针对需要进行情感分类的待分类文本,可以根据文本特征,通过胶囊网络模型中的胶囊结构获取对应的输出结果。胶囊网络模型中包括与要素一一对应的胶囊结构,针对任意一个胶囊结构,该胶囊结构中包括所对应目标要素的特征向量,通过该特征向量可以得到输出结果中的第一识别结果和第二识别结果。基于胶囊网络模型中每个胶囊结构的输出数据,可以确定待分类文本对应于要素的情感分类结果。基于胶囊结构的特点,实现了通过胶囊网络模型对不同要素的针对性情感识别,将要素和情感有机的关联起来,不仅降低了人为经验的在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种情感分类方法和相关装置。
背景技术
用户在使用互联网的过程中会产生大量的文本信息,例如购物评价、商品点评、博客、朋友圈等等。
这些文本信息可以体现出用户的不同类别情感,例如正向情感、负向情感等。如果能够准确确定出文本信息中用户情感的类别,可以为产品研发、内容推荐、市场预测等提供重要数据依据。
在确定文本信息所体现情感类别的相关技术中,主要采用情感字典作为的依据。情感字典中需要包括了大量人工标注类别的情感词,标注过程非常依赖人为经验,且难以覆盖全面。而且,同一情感词针对不同的要素(例如食物、价格)所体现出的情感可能完全不同,即使使用人工标注也难以实现准确区分。
发明内容
为了解决上述技术问题,本申请提供了一种情感分类方法和相关装置,提高了对应于要素的情感分类精度。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供了一种情感分类方法,所述方法包括:
获取待分类文本;所述待分类文本包括多个词;
根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。
另一方面,本申请实施例提供了一种情感分类装置,所述装置包括第一获取单元、第一确定单元、第二获取单元和第二确定单元:
所述第一获取单元,用于获取待分类文本;所述待分类文本包括多个词;
所述第一确定单元,用于根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
所述第二获取单元,用于获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
所述第二确定单元,用于根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。
另一方面,本申请实施例提供了一种情感分类设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行上述情感分类方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述情感分类方法。
由上述技术方案可以看出,针对需要进行情感分类的待分类文本,可以根据待分类文本的文本特征,通过胶囊网络模型中的胶囊结构获取对应的输出结果。胶囊网络模型中包括与要素一一对应的胶囊结构,针对任意一个胶囊结构,该胶囊结构中包括所对应目标要素的特征向量,通过该特征向量并基于注意力机制,可以得到输出结果中的第一识别结果和第二识别结果。由于文本特征具有待分类文本所包括多个词分别对应的词特征向量,故通过胶囊结构中的特征向量,可以从单个词的角度确定出多个词中是否具有符合目标要素的词,即第一识别结果,以及从文本整体的角度确定多个词相对于目标要素的情感类别,即第二识别结果。从而,基于胶囊网络模型中每个胶囊结构的输出数据,可以确定待分类文本对应于要素的情感分类结果。基于胶囊结构的特点,实现了通过胶囊网络模型对不同要素的针对性情感识别,将要素和情感有机的关联起来,不仅降低了人为经验的在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种情感分类方法的应用场景示意图;
图2为本申请实施例提供的一种情感分类方法流程图;
图3为本申请实施例提供的一种胶囊结构示意图;
图4为本申请实施例提供的一种得到胶囊网络模型的方法流程图;
图5为本申请实施例提供的一种应用胶囊网络模型进行情感分类的流程图;
图6为本申请实施例提供的一种情感分类装置示意图;
图7为本申请实施例提供的一种数据处理设备结构图;
图8为本申请实施例提供的一种服务器的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
目前,在确定文本信息所体现情感类别的相关技术中,主要采用情感字典作为依据。该情感字典中包括大量人工标注类别的情感词,以及为情感词添加的关于情感类别的标签,如情感字典中的“高”这一情感词,为其添加有情感类别为“正向情感”的标签。可以理解,该标注过程非常依赖人为经验,且难以全面覆盖各类情感词,影响文本信息的情感类别确定准确率。
而且,同一情感词针对不同的要素(Aspect)(例如食物(Food)、价格(Price)等),所体现出的情感类别可能完全不同,即情感词的要素适应性较差。例如,“高”这一情感词对“价格”的情感类别为“负向情感”,对于“食物”的情感类别是不明确的,对“分辨率”的情感类别为“正向情感”。可见,即使使用人工标注也难以实现情感类别的准确区分。
为此,本申请实施例提供了一种情感分类方法,以降低人为经验在情感识别上的影响,提高待分类文本的情感类别分类精度。
需要说明,本申请实施例涉及的情感分类可以是指,当待分类文本中包括属于某些要素的词时,确定该待分类文本针对该要素体现的情感类别。
其中,所提及的要素可以用于标识能够被形容、被评价的对象类别,如“食物”,“价格”等。且针对这些对象类别,可以具有相关的情感词来表达对这些对象类别所包括对象的情感。例如,对于对象类别“食物”,具有如“美味”、“好吃”等情感词来表达对该对象类别包括的对象如“烤鱼”的情感。
情感类别用于体现针对要素的情感倾向。情感类别的维度可以根据实际场景或需求进行设置,如仅需要确定待分类文本针对某一要素的评价好坏,可以设置情感类别包括正向情感和负向情感这两个维度的情感类别,在一些场景下,也可以将情感类别分为三个维度(正向情感、中性情感、负向情感)、五个维度(正向情感+、正向情感、中性情感、负向情感、负向情感+)等等。
本申请实施例提供的情感分类方法可以是基于人工智能实现的,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。
在本申请实施例中,主要涉及的人工智能软件技术包括上述自然语言处理技术和深度学习等方向。
下面,对本申请实施例的执行主体进行介绍。本申请提供的情感分类方法可以通过数据处理设备执行。该数据处理设备可以是终端设备,该终端设备例如可以是智能手机、计算机、个人数字助理(Personal Digital Assistant,PDA)、平板电脑、销售终端(Pointof Sales,POS)、车载电脑等设备。该数据处理设备还可以是服务器,其中,服务器可以是独立的服务器、集群中的服务器或云服务器等。
在本申请实施例中,数据处理设备可以具有实施自然语言处理的能力,其是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解等技术。
例如可以涉及自然语言处理(Nature Language processing,NLP)中的文本预处理(Text preprocessing)和语义理解(Semantic understanding)等,其中包括词、句切分(word/sentence segementation)、词性标注(word tagging)、语句分类(word/sentenceclassification)等。
在本申请实施例中,数据处理设备通过实施上述NLP技术,可以实现对待分类文本进行文本预处理,如词切分等。
该数据处理设备可以具备机器学习(Machine Learning,ML)能力。ML是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络等技术。
例如可以涉及机器学习(Machine learning,ML)中的深度学习(Deep Learning),包括各类人工神经网络(artificial neural network)。
在本申请实施例中,情感分类方法主要涉及对各类人工神经网络的应用以及注意学习等,例如应用循环神经网络构建胶囊网络模型等。
接下来以服务器作为前述数据处理设备,结合实际应用场景对本申请实施例提供的情感分类方法进行介绍。
参见图1,该图示出了本申请实施例提供的一种情感分类方法的应用场景示意图。如图1所示,服务器101中部署有胶囊网络模型,以用于对待分类文进行情感分类。
在图1示出的场景中,该胶囊网络模型中包括两个胶囊结构,分别为对应要素“食物”的胶囊结构1和对应要素“价格”的胶囊结构2,该对应要素“食物”的胶囊结构1中包括要素“食物”的特征向量,以用于基于注意力机制进行针对“食物”的情感分类;对应要素“价格”的胶囊结构2中包括要素“价格”的特征向量,以用于基于注意力机制进行针对“价格”的情感分类。
待分类文本为点评类应用中收集的用户评价内容,其中可能会包括与要素“食物”、“价格”相关的评价内容,可以采用上述胶囊网络模型进行针对要素的情感分类。
包括多个词的待分类文本为具有语义的短语、句子,其表达语种并不限定,例如可以是中文、英文等。待分类文本例如可以为“这家餐厅的烤鱼是非常好吃的”。为了便于描述,以下实施例中待分类文本主要以中文为例进行说明。
由于待分类文本中包括多个词,每个词均有可能与需要进行情感分类的要素相关,且每个词均有可能体现针对要素的情感倾向。由此,服务器101在确定待分类文本的文本特征时,可以通过编码得到包括有待分类文本中每个词分别对应词特征向量的文本特征,一个词特征向量对应于待分类文本中的一个词,在文本特征中,词特征向量按照所对应词在待分类文本中的位置关系进行排列。
服务器101根据待分类文本对应的文本特征,确定分别对应胶囊结构1和胶囊结构2的输入数据,并通过这两个胶囊结构,对待分类文本进行分别对应不同要素(食物、价格)的情感分类,从而得到胶囊结构1的输出数据1(对应“食物”的识别结果)和胶囊结构2的输出数据2(对应“价格”的识别结果)。
可以理解,由于文本特征中包括待分类文本所包括多个词分别对应的词特征向量,通过这些词的词特征向量和胶囊结构所对应要素的特征向量,有利于从单个词的角度,更准确的得到这些词中是否具有属于胶囊结构所对应要素(记为目标要素)的词,即得到输出数据中的第一识别结果。
另外,基于文本特征中包括了多个词分别对应的词特征向量,有助于在文本整体的角度来确定多个词相对于胶囊结构所对应要素即目标要素的情感类别,以得到输出数据中的第二识别结果,提高了情感识别的准确性。以及,通过将目标要素对应的特征向量与该文本特征结合起来进行情感识别,即考虑了文本特征针对该目标要素的要素适应性,进一步提高了情感识别的准确性。
例如,对于胶囊结构1,通过根据要素“食物”的特征向量,以及该待分类文本中各个词对应的词特征向量,可以确定待分类文本中具有属于该要素“食物”的词即“烤鱼”,由此该胶囊结构1的输出数据中第一识别结果为“食物”。在对待分类文本进行针对要素“食物”的情感分类时,通过将“食物”的特征向量结合进来,并对文本特征进行整体考虑,可以确定待分类文本中的词“非常”和“好吃”,体现了待分类文本针对该要素“食物”的正向情感,由此该输出数据中的第二识别结果为“正向情感”。
而对于胶囊结构2,由于待分类文本中不包括属于要素“价格”的词,以此得到的输出数据中,对应的第一识别结果为待分类文本中不包括属于其要素“价格”的词,由此对应输出标识“无”来表征该第一识别结果。另外,该待分类文本中不包括与要素“价格”相关的情感词,由此所确定输出数据中的第二识别结果为,待分类文本中的词相对于目标要素不具有对应的情感类别,仍对应输出标识“无”来表征该第二识别结果。
需要说明,如果胶囊结构确定待分类文本中不包括属于目标要素的词,即第一识别结果对应输出标识“无”,该种情形下,即使待分类文本中具有与该目标要素的情感词,也可以确定出待分类文本针对目标要素的情感类别,由于待分类文本中的情感词并不是针对该目标要素表达情感的,故对应的第二识别结果仍输出标识“无”。
在本申请实施例中,当胶囊结构从待分类文本中识别到属于其目标要素的词时,该胶囊结构相当于被激活。若未识别出属于其目标要素的词,则该胶囊结构未被激活。通过确定胶囊结构激活与否,可以明确其输出数据是否作为确定情感分类结果的参考,一般情况下,若胶囊结构未被激活,其输出数据不作为确定情感分类结果的参考,或者对确定情感分类结果的影响很小。在图1示出的场景中,胶囊结构1为激活状态,胶囊结构2为未激活状态。
从而,服务器101可以获取胶囊网络模型中每个胶囊结构的输出数据,即包括“食物:正向情感”和“无:无”。并根据该输出数据,确定待分类文本对应于要素的情感分类结果。由于胶囊结构被激活可以体现待分类文本中具有属于其目标要素的词,由此,可以仅根据胶囊结构1的输出数据,确定情感分类结果。例如确定对待分类文本针对要素“食物”和要素“价格”的情感分类结果为“食物:正向情感”。
该方法中,基于胶囊结构可以作为独立逻辑单元进行计算的特点,实现了胶囊网络模型对不同要素的针对性情感识别,且在情感分类过程中将要素和情感有机关联起来,不仅降低了人为经验在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。
接下来,将以服务器作为数据处理设备,对本申请实施例提供的情感分类方法进行介绍。参见图2,该图示出了本申请实施例提供的一种情感分类方法流程图,所述方法可以包括:
S201:获取待分类文本。
其中,待分类文本中可以包括多个词,词可以是能够独立体现语义的最小语言单位。待分类文本所包括的词可以通过各类分词方式确定,本申请不做限定。
本申请实施例不限定一条待分类文本所包括的词数量,只需待分类文本可以体现较为完整的语义即可。例如,对于文本“这家餐厅的烤鱼是非常好吃的,但是价格也太高了吧”,可以将其作为一条待分类文本,也可以将其作为两条待分类文本,分别为“这家餐厅的烤鱼是非常好吃的”和“但是价格也太高了吧”。
在本申请实施例中,所获取的待分类文本可以是与本次情感分类中所涉及要素相关的待分类文本。例如,如前所述,可以获取网络中针对某一餐厅的评价内容作为待分类文本,以对其进行针对要素“食物”和“价格”的情感分类,确定网络上针对该餐厅的评价好坏。
S202:根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据。
在本申请实施例中,是通过胶囊网络模型中的胶囊结构对待分类文本进行情感分类的。其中,胶囊网络模型中可以包括一个或多个胶囊结构。胶囊结构可以是一组神经元,其可以根据输入数据执行一些复杂的内部计算,并将计算结果封装到一个具有高度信息输出的小向量中。即胶囊结构是一种可以在内部进行复杂计算的独立的逻辑单元,其中保留了输入数据的大部分信息,相对其它模型结构,减小了因信息损失造成的情感分类错误的可能性。
在本申请实施例中,每个胶囊结构可以与一个要素一一对应,胶囊结构中包括所对应目标要素的特征向量。其中,该要素可以用于标识对象类别。从而,胶囊结构可以结合其目标要素的特征向量并基于注意力机制,对待分类文本进行针对该目标要素的情感分类。也就是说,胶囊网络模型通过其中包括的胶囊结构,对待分类文本进行针对特定要素(其中的胶囊结构对应的要素)的情感分类。
其中,目标要素是基于当前描述的胶囊结构确定的,其目的是为了清楚说明本申请实施例提供的技术方案。例如在针对胶囊结构1进行说明时,其对应的要素“食物”可以为目标要素,在针对胶囊结构2进行说明时,其对应的要素“价格”可以为目标要素。
在应用胶囊网络模型进行情感分类时,在获取待分类文本后,可以根据待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据,以通过胶囊结构根据输入数据和其目标要素对应的特征向量,基于注意力机制进行情感分类。
由于待分类文本中的每个词均有可能与需要进行情感分类的要素相关,且有可能体现关于要素的情感,故,在本申请实施例中,用于确定胶囊结构输入数据的文本特征可以包括待分类文本中每个词分别对应的词特征向量,以提高后续胶囊结构基于输入数据进行情感分类的准确性。
S203:获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据。
在本申请实施例中,通过胶囊网络模型中任一个胶囊结构,可以根据输入数据和包括的目标要素的特征向量,基于注意力机制确定待分类文本中是否具有属于目标要素的词,以及该待分类文本针对目标要素的情感类别,并得到输出数据。
其中,输出数据包括第一识别结果和第二识别结果,第一识别结果用于标识待分类文本包括的多个词中是否包括属于目标要素的词,第二识别结果用于标识待分类文本包括的多个词相对于目标要素的情感类别。
本申请实施例中的胶囊结构可以是根据注意力机制来进行情感分类的,通过注意力机制可以确定待分类文本中的词与目标要素间的相关程度,从而有利于基于该相关程度对待分类文本中的词进行有针对性的情感分类,以提高胶囊结构的情感分类准确性。
S204:根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。
其中,情感分类结果可以是对待分类文本进行情感分类后得到的要素情感对。要素情感对可以是要素和情感类别的组合,如前述示例中的“食物:正向情感”。
当胶囊网络模型中包括多个胶囊结构时,针对一个待分类文本,若其中包括针对这些胶囊结构中对应的多个要素的情感表达内容,则所确定的情感分类结果中可以包括多个要素情感对。例如,对于待分类文本“这家餐厅的烤鱼是非常好吃的,但是价格也太高了吧”,通过图1对应示例中的胶囊网络模型进行情感分类后,得到的情感分类结果可以包括两个要素情感对,分别为“食物:正向情感”、“价格:负向情感”。
本申请实施例不限定S204中确定情感分类结果的方式。在一些场景中,为了提高效率,可以根据胶囊网络模型中激活胶囊结构对应的输出数据,确定待分类文本对应于要素的情感分类结果。
由上述技术方案可以看出,针对需要进行情感分类的待分类文本,可以根据待分类文本的文本特征,通过胶囊网络模型中的胶囊结构获取对应的输出结果。胶囊网络模型中包括与要素一一对应的胶囊结构,针对任意一个胶囊结构,该胶囊结构中包括所对应目标要素的特征向量,通过该特征向量并基于注意力机制可以得到输出结果中的第一识别结果和第二识别结果。由于文本特征具有待分类文本所包括多个词分别对应的词特征向量,故通过胶囊结构中的特征向量,可以从单个词的角度确定出多个词中是否具有符合目标要素的词,即第一识别结果,以及从文本整体的角度确定多个词相对于目标要素的情感类别,即第二识别结果。从而,基于胶囊网络模型中每个胶囊结构的输出数据,可以确定待分类文本对应于要素的情感分类结果。基于胶囊结构的特点,实现了通过胶囊网络模型对不同要素的针对性情感识别,将要素和情感有机的关联起来,不仅降低了人为经验的在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。
本申请实施例提供了关于胶囊结构的优选方案,在一种可能的实现方式中,参见图3,该图示出了本申请实施例提供的一种胶囊结构示意图,如图3所示,该胶囊结构包括目标要素对应的特征向量(ec),以用于参与胶囊结构中的计算。该胶囊结构还包括要素注意力模块(AT-asp)和情感注意力模块(AT-sen)。
其中,要素注意力模块可以用于根据目标要素的特征向量和待分类文本对应的输入数据,确定相对于目标要素,该待分类文本中每个词分别对应的注意力权值,记为第一注意力权重。每个词的第一注意力权值可以用于标识所对应词属于该目标要素的可能性。
情感注意力模块可以用于根据目标要素的特征向量和待分类文本对应的输入数据,确定相对于目标要素,该待分类文本中每个词分别对应的注意力权值,记为第二注意力权重。每个词的第二注意力权值可以用于标识所对应词属于与目标要素相关的情感词的可能性。
这里所述的情感词是指表达情感的词,如“不错”、“棒”等,与目标要素相关的情感词可以是用于表达对该目标要素的情感的词,例如,对于要素“食物”,与其相关的情感词包括“好吃”、“难吃”等。
该胶囊结构基于注意力机制来进行情感分类,由于要素注意力模块可以确定待分类文本中每个词属于目标要素的可能性即第一注意力权值,故胶囊结构在确定第一识别结果时,可以根据第一注意力权值(对应于图3中的Va,h),主要关注更可能属于目标要素的词,降低属于目标要素可能性较小的词带来的影响,从而提高确定第一识别结果的准确率。类似的,通过情感注意力模块确定待分类文本中每个词属于与目标要素相关的情感词的可能性即第二注意力权值,以使胶囊结构在确定第二识别结果时,根据第二注意力权值(对应于图3中的Vo,h),主要关注更可能属于目标要素的情感词的词,降低具有较低可能性属于目标要素的情感词的词所带来的影响,以提高确定第二识别结果的准确率。
另外,基于图3示出的包括要素注意力模块和情感注意力模块的胶囊结构,优选的,该胶囊结构中还可以包括点乘模块(Point_mul1)和点乘模块(Point_mul2),可以用于对待分类文本的文本特征进行点乘等低阶运算,以得到待分类文本关于要素和情感的低阶特征,分别为特征Va,l和特征Vo,l。
其中,低阶特征可以是指包括与文本特征的细节相关的特征。也就是说,该关于要素和情感的低阶特征中携带有更多与词的具体词义相关的信息,如此,使得胶囊结构在确定第一识别结果和第二识别结果时,除了考虑第一注意力权值和第二注意力权重外,还结合了低阶特征来确定,由此提高了输出数据确定的准确性。
基于待分类文本中属于要素的词和与要素相关的情感词间具有较大的关联性,由此,为了提高对待分类文本的情感分类准确率,优选的,该胶囊结构还可以包括共享注意力模块,共享注意力模块可以用于根据胶囊结构所对应目标要素的特征向量和输入数据,确定相对于目标要素,待分类文本中每个词分别对应的第三注意力权值。其中,该第三注意力权值可以用于标识所对应词在属于目标要素的偏向程度,以及属于与目标要素相关的情感词的偏向程度。
通过该第三注意力权值的引入,使得胶囊结构无论在确定待分类文本中是否包括属于目标要素的词即确定第一识别结果时,还是在确定待分类文本相对目标要素的情感类别即确定第二识别结果时,可以参考待分类文本中每个词针对目标要素和情感这两方面的注意力信息,加强了要素和情感间的关联性对确定第一识别结果及第二识别结果的影响程度,有利于提高胶囊结构确定第一识别结果和第二识别结果的准确性。
举例来说,针对待分类文本“这家餐厅的烤鱼是非常好吃的,但是价格也太高了吧”,要素“食物”的胶囊结构在确定词“烤鱼”是否为属于要素“食物”的词时,可以通过第三注意力权值,考虑到待分类文本中的词“好吃”更偏向于属于与该要素“食物”有关的情感词,由此,提高了将词“烤鱼”确定为属于要素“食物”的词的可能性,进而提高了确定第一识别结果的准确性。
另外,要素“价格”的胶囊结构在确定词“高”对要素“价格”的情感类别时,可以通过第三注意力权值,考虑到待分类文本中的“价格”为偏向属于要素“价格”的词,故,通过将该词“价格”也考虑进来,有助于胶囊要素根据该词“高”确定待分类文本针对要素“价格”的情感类别为“负向情感”,提高了确定第二识别结果的准确性。
在完成对上述胶囊网络模型和胶囊结构中涉及的各计算模块的介绍后,对本申请实施例提供的方案进行介绍。
在一种可能的实现方案中,胶囊结构中可以包括上述提及的要素注意力模块和情感注意力模块,如此,S203中获取胶囊结构基于特征向量确定的输出数据的方式,可以包括:
根据特征向量和输入数据,通过要素注意力模块确定相对于目标要素该待分类文本中每个词分别对应的第一注意力权值。
从而,可以根据第一注意力权值,确定第一识别结果。
在具体实现中,可以根据第一注意力权值,按所对应词在待分类文本中的位置关系进行排列,组成特征Va,h,根据图3所示胶囊结构中的逻辑回归(Sigmoid)函数,确定第一识别结果。其中,Sigmoid函数可以是一种激活函数,神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值,并将输入值传递给下一层,输入层神经元节点会将输入属性值直接传递给下一层。在多层神经网络中,上层节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数(也称传导函数)。通过Sigmoid函数,可以实现根据特征Va,h映射到(0,1)的区间,得到待分类文本中包括属于目标要素的词的概率,进而确定第一识别结果。
另外,可以根据特征向量和输入数据,通过情感注意力模块确定相对于目标要素,该待分类文本中每个词分别对应的第二注意力权值。
从而,可以根据第二注意力权值,确定第二识别结果。
在具体实现中,可以根据第二注意力权值,按所对应词在待分类文本中的位置关系进行排列,组成特征Vo,h,根据图3所示胶囊结构中的归一化指数(Softmax)函数,以确定第二识别结果。其中,Softmax函数可以根据特征Vo,h,确定待分类文本针对预设的各个情感类别的概率,进而确定第二识别结果。例如,针对预设的两个情感类别(正向情感和负向情感),可以通过Softmax函数,确定待分类文本针对正向情感和负向情感的概率,从而确定出第二识别结果即情感类别。
该方法中,胶囊结构基于注意力机制进行情感分类,可以提高待分类文本中与要素和情感更为相关的词对情感分类结果的影响,进而提高胶囊结构进行针对性情感分类的准确性。
当胶囊结构通过上述注意力机制进行情感分类时,在一种可能的实现方式中,上述根据第一注意力权值确定第一识别结果的方式,可以包括:
根据文本特征和第一注意力权值,确定第一识别结果。
上述根据第二注意力权值确定第二识别结果的方式,可以包括:
根据文本特征和第二注意力权值,确定第二识别结果。
需要说明,在引入文本特征确定第一识别结果和第二识别结果时,可以通过直接引入该文本特征进行确定。另外,也可以通过对文本特征进行低阶运算得到低阶特征,例如图3中对文本特征通过点乘运算得到低阶特征Va,l和Vo,l,从而基于低阶特征进行针对第一识别结果和第二识别结果的确定。
其中,上述文本特征可以是胶囊结构的一个输入数据。
该方法在确定第一识别结果和第二识别结果的过程中,通过文本特征引入了待分类文本对应的低阶特征,由于低阶特征携带有更多与词的具体词义相关的信息,使得结合低阶特征确定出的输出数据具有更高的准确性。
胶囊结构在包括要素注意力模块和情感注意力模块的基础上,在一种可能的实现方式中,还可以包括共享注意力模块,所述方法还包括:
根据特征向量和输入数据,通过共享注意力模块确定相对于目标要素,待分类文本中每个词分别对应的第三注意力权值。
从而,上述根据第一注意力权值确定第一识别结果的方法,可以包括:
根据第一注意力权值和第三注意力权值,确定第一识别结果。
在具体实现中,针对待分类文本中每个词分别对应的第三注意力权值,可以按所对应词在待分类文本中的位置关系进行排列,得到图3中的特征Vs,然后,可以将特征Va,h和特征Vs通过如图3所示胶囊结构中的全连接层进行连接,并将通过连接后的特征通过Sigmoid函数确定第一识别结果。
上述根据第二注意力权值确定第二识别结果的方法,可以包括:
根据第二注意力权值和第三注意力权值,确定第二识别结果。
类似的,可以将特征Vo,h和特征Vs,通过如图3所示胶囊结构中的全连接层进行连接,并将通过连接后的特征通过Softmax函数确定第二识别结果。
该种引入第三注意力权值的方式,有利于提高识别结果确定的准确性,尤其对于包括要素适应性差的情感词的待分类文本,可以有效提高这类待分类文本的情感分类准确率。
在本申请实施例中,当待分类文本中包括针对多个要素的词,且包括针对这些要素的情感词即多个情感词时,可能会产生如下情况:针对待分类文本中属于某要素的词,应用与另一个要素相关情感词的词对其进行情感分类。例如,待分类文本为“这家餐厅的烤鱼是非常好吃的,但是价格也太高了吧”,要素“食物”的胶囊结构对该待分类文本进行针对“食物”的情感分类时,在根据词“烤鱼”确定第一识别结果为待分类文本中具有属于要素“食物”的词的情况下,可能根据词“高”来确定待分类文本针对该要素“食物”的情感类别,由此导致无法识别出待分类文本对要素“食物”的情感类别。最终导致胶囊结构的情感分类错误。
为此,在一种可能的实现方式中,所述胶囊网络模型还可以包括由多个胶囊结构共享的预处理层,则,S202中根据待分类文本的文本特征确定对应胶囊网络模型中胶囊结构的输入数据的方法,可以包括:
根据多个胶囊结构分别对应的要素,通过预处理层对文本特征进行针对多个胶囊结构的预处理,得到多个胶囊结构分别对应的输入数据。
其中,针对多个胶囊结构中的一个胶囊结构,这个胶囊结构对应的输入数据是结合多个胶囊结构中其他胶囊结构所对应输入数据确定的。
也就是说,针对胶囊网络模型中的任意一个胶囊结构A,为该胶囊结构A确定的输入数据中,不仅携带有其自身(即胶囊结构A)所对应要素的特征向量与文本特征间的关联信息,还具有该胶囊网络模型中其它胶囊结构(除胶囊结构A外)所对应要素的特征向量与文本特征间的关联信息。
通过该种确定每个胶囊结构的输入数据的方式,使得每个胶囊结构的输入数据中携带有其它胶囊结构所对应要素与该待分类文本间的相关信息。如此,在后续胶囊结构通过输入数据进行情感分类时,可以考虑到待分类文本与该胶囊网络模型中其它要素间的偏向性,从而有利于每个胶囊结构从多要素的角度,来确定待分类文本中的词是否属于本胶囊结构所对应目标要素的词,以及是否属于与目标要素相关的情感词等,进而有助于提高情感分类的准确性。例如,在确定待分类文本中的词是否属于目标要素的词时,如果确定该词与其他要素的偏向性较高时,可以适当拉低该词针对目标要素的偏向性。
举例来说,当待分类文本为“这家餐厅的烤鱼是非常好吃的,但是价格也太高了吧”时,所确定的每个胶囊结构的输入数据中均包括该待分类文本与其他胶囊结构所对应要素的相关信息,如此,要素“食物”的胶囊结构在根据输入数据进行情感分类时,由于待分类文本中的词“高”与要素“价格”间的关联性较高,故,该胶囊结构在确定该词“高”是否是与要素“食物”有关的情感词时,会拉低将该词作为要素“食物”对应的情感词的可能性。
通过引入该预处理层,使得每个胶囊结构可以在进行情感分类时考虑待分类文本与其他要素间的关联信息,提高了情感分类准确率。
可以理解,胶囊结构在通过注意力机制进行情感分类的过程中,可以确定待分类文本中每个词相对目标要素的第一注意力权值,第一注意力权值标识所对应词属于目标要素的可能性。也就是说,基于第一注意力权值,可以确定待分类文本中是否具有属于目标要素的词。
为此,在一种可能的实现方式中,可以为胶囊结构设置对应的字典库,以通过字典库,从文本集合包括的文本中提取很可能属于目标要素的词。其中,字典库中可以包括词与要素权重参数间的对应关系,要素权重参数可以用于标识所对应词属于目标要素的可能性。文本集合中的每条文本可以作为待分类文本进行情感识别。
由此,所述方法还包括:
S301:若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述目标要素的第一词,以及所述第一词对应的第一注意力权值。
其中,子情感分类结果可以是指,在胶囊网络模型对待分类文本进行情感分类之后,由激活状态的胶囊结构的输出结果所确定出的要素情感对。
在通过胶囊网络模型对待分类文本进行情感分类后,如果情感分类结果中包括对应目标要素的子情感分类结果,即表示待分类文本中包括属于该目标要素的词。由此,可以确定待分类文本中属于该目标要素的词,记为第一词,确定第一词对应的第一注意力权值。
本申请实施例不限定该第一词的确定方式,例如当胶囊结构被激活后,可以将待分类文本的全部词均确定为第一词,从而确定第一词和对应的第一注意力权值。又如,可以将待分类文本中第一注意力权值高于预设的要素注意力阈值的词确定为第一词,并确定第一词对应的第一注意力权值。
S302:根据所述第一词对应的第一注意力权值,更新所述字典库中所述第一词对应的要素权重参数。
本申请实施例不限定对字典库中第一词对应的要素权重参数进行更新的方式。在具体实现中,可以根据第一注意力权值与要素权重参数间的转换关系来进行更新。
例如,若第一注意力权值与要素权重参数的转化关系为,将待分类文本中第一词对应的第一注意力权值,累加至当前字典库中第一词对应的要素权重参数中,以实现对要素权重参数的更新。即,字典库包括{key1:word,value1:the sum of attention weight},其中,key1对应于第一词,value1对应于要素权重参数,即文本集合中第一词对应的第一注意力权值之和。如此,在S302中,可以直接将第一词对应的第一注意力权值累加至字典库中该第一词对应的要素权重参数中。
S303:在完成针对文本集合的情感分类后,根据所述字典库中的要素权重参数,确定所述目标要素对应的要素词列表,所述文本集合包括所述待分类文本。
其中,要素词列表为从文本集合里的文本中提取的属于目标要素的词的列表。
也就是说,在完成针对文本集合中每条文本的情感分类后,可以根据字典库中每个第一词对应的要素权重参数,确定目标要素对应的要素词列表。
本申请实施例不限定确定目标要素对应的要素词列表的方式,例如可以从字典库中提取要素权重参数高于要素权重阈值的第一词,组成要素词列表。
在实际场景中,可能出现如下情形:虽然第一词不属于目标要素的词,由于它在文本集合中出现的次数较高,导致字典库中关于该第一词对应的要素权重参数,体现出该第一词属于目标要素的词的可能性较高,进而造成错误的将其确定为目标要素所对应要素词列表中的词。
为此,在本申请实施例中,在更新字典库中第一词对应的要素权重参数时,还可以统计该第一词在文本集合中出现的次数,从而,在确定目标要素对应的要素词列表时,还可以将第一词在文本集合中出现的次数考虑在内,从而可以提高要素词列表中的词属于目标要素的词的可能性。
例如,基于S302中通过累加第一注意力权值更新要素权重参数的示例,在完成针对文本集合的情感分类后,可以将字典库中每个词的要素权重参数除以该词在文本集合中的出现次数,得到该词每次出现对应的平均要素权重参数。从而,根据字典库中每个第一词对应的平均要素权重参数,确定目标要素对应的要素词列表。
例如,基于要素“食物”对应的胶囊结构,所确定的关于要素“食物”的要素词列表包括以下词:食物、寿司(Sushi)、比萨(Pizza)、膳食(Meal)、菜单(Menu)、甜品(Desserts)、……。
通过该方式,可以更准确的从文本集合中提取出属于目标要素的词,从而可以丰富关于要素的知识资源,应用在需要的场景中,如作为模型训练样本等。
另外,基于通过胶囊网络模型对文本集合进行的情感分类,还可以通过为胶囊结构设置的字典库,从文本集合包括的多条文本中提取很可能属于目标要素的情感词的词。由此,在一种可能的实现方式中,该字典库还可以包括词与情感权重参数间的对应关系,其中,情感权重参数可以是待分类文本中的词属于与目标要素相关的情感词的可能性。
则,所述方法还包括:
S401:若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述情感词的第二词,以及所述第二词对应的第二注意力权值。
类似的,本申请实施例不限定该第二词的确定方式,例如当胶囊结构被激活后,可以将待分类文本的全部词均作为第二词,以确定第二词和对应的第二注意力权值。又如,可以将待分类文本中的第二注意力权值高于预设的情感注意力阈值的词确定为第二词,以及确定第二词对应的第二注意力权值。
S402:根据所述第二词对应的第二注意力权值,更新所述字典库中所述第二词对应的情感权重参数。
本申请实施例不限定对字典库中第二词对应的情感权重参数进行更新的方式。在具体实现中,可以根据第二注意力权值与情感权重参数间的转换关系来进行更新。
例如,若第二注意力权值与情感权重参数的转化关系为,将待分类文本中第二词对应的第二注意力权值,累加至当前字典库中第二词对应的情感权重参数中,以实现对情感权重参数的更新。即,字典库包括{key2:word,value2:the sum of attention weight},其中,key2对应于第二词,value2对应于情感权重参数,即文本集合中第二词对应的第二注意力权值之和。如此,在S402中,可以直接将第二词对应的第二注意力权值累加至字典库中该第二词对应的情感权重参数中。
S403:在完成针对所述文本集合的情感分类后,根据所述字典库中的情感权重参数,确定所述目标要素对应的情感词列表。
其中,情感词列表为从文本集合中提取的属于目标要素的情感词的列表。
本申请实施例不限定确定目标要素对应的情感词列表的方式,例如可以从字典库中提取情感权重参数高于情感权重阈值的第二词,组成情感词列表。
在实际场景中,可能出现如下情形:虽然第二词不属于目标要素的情感词,由于它在文本集合中出现的次数较高,导致字典库中关于该第二词对应的情感权重参数,体现出该第二词属于目标要素的情感词的可能性较高,进而造成错误的将其确定为目标要素所对应情感词列表中的词。
为此,在本申请实施例中,在更新字典库中第二词对应的情感权重参数时,还可以统计该第二词在文本集合中出现的次数,从而,在确定目标要素对应的情感词列表时,还可以将第二词在文本集合中出现的次数考虑在内,从而可以提高情感词列表中的词属于目标要素的情感词的可能性。
例如,基于S402中通过累加第二注意力权值更新情感权重参数的示例,在完成针对文本集合的情感分类后,可以将字典库中每个词的情感权重参数除以该词在文本集合中的出现次数,得到该词每次出现对应的平均情感权重参数。从而,根据字典库中每个第二词对应的平均情感权重参数,确定目标要素对应的情感词列表。
例如,基于要素“食物”对应的胶囊结构,所确定的关于要素“食物”的情感词列表包括以下词:美味的(Delicious)、可口(Tasty)、好吃(Yummy)、优秀的(Excellent)、新鲜(Fresh)、太棒了(Fantastic)、太好了(Great),……。
另外,在S402中,还可以根据对应目标要素的子情感分类结果,在字典库中为第二词确定对应的情感类别。如此,在S403中,可以根据字典库中第二词对应的情感类别,为加入情感词列表中的词确定对应的情感类别,以使情感词列表可以包括对应相应情感类别(根据预设的情感类别种类确定)的子列表,每个子列表包括针对目标要素体现对应情感类别的情感词。例如,情感词列表中可以包括正向情感的子列表,该子列表中的词为针对目标要素体现正向情感的情感词。
通过该方式,可以更准确的从文本集合中提取与目标要素相关的情感词,从而可以丰富关于各种要素的关于情感词的知识资源,以应用在需要的场景中,如作为模型训练样本等。
下面对该胶囊网络模型的训练方式进行介绍,在一种可能的实现方式中,该训练方式包括:
S501:获取训练样本集。
其中,该训练样本集中可以具有训练样本,训练样本可以具有训练文本和对应的要素情感对,该要素情感对可以用于标识训练文本所包括词属于的要素标签以及对应的情感类别标签。
需要说明,本申请实施例不限定上述训练样本集的内容,除了包括由训练样本组成的训练集外,还可以包括验证集、测试集等,以用于对训练后得到的胶囊网络模型进行验证、测试等。
S502:根据所述训练样本集对初始胶囊网络模型进行训练,通过训练得到所述胶囊网络模型。
在本申请实施例中,可以构建初始胶囊网络模型,该初始胶囊网络模型可以包括多个胶囊结构,每个胶囊结构与要素一一对应,且胶囊结构中包括所对应目标要素的特征向量。
从而,可以根据训练样本集对初始胶囊网络模型进行训练,得到用于情感分类的胶囊网络模型。
需要说明,训练得到的胶囊网络模型可以具有通过训练确定的最大激活概率和最小未激活概率。
该最大激活概率为通过胶囊结构识别训练文本中具有对应要素标签的词时,胶囊结构输出的最小概率。该最小未激活概率为通过胶囊结构识别训练文本中不具有对应要素标签的词时,胶囊结构输出的最大概率。
也就是说,在训练过程中,需要尽量保证,针对一个训练样本中的训练文本激活一个胶囊结构时,该训练文本通过这个胶囊结构输出的概率至少应该达到最大激活概率;同理,针对一个训练样本中的训练文本未激活一个胶囊结构时,该训练文本通过这个胶囊结构输出的概率至多只能达到最小未激活概率。
该最大激活概率和最小未激活概率为训练该胶囊网络模型的训练目的,一般情况下,最大激活概率会设置的比较高,最小未激活概率会设置的相对较低,由此使得训练后的胶囊结构在处理属于所对应要素的词时,会学习到更多的信息,在处理不属于所对应要素的词时,会学习到更少的信息。从而,从注意力机制的角度来说,胶囊结构在进行实际的情感分类时,会更容易注意到与所对应要素相关的词,更不容易注意到与所对应要素不相关的词。
通过上述训练方式和训练目的的设置,使得训练得到的胶囊网络模型准确性更高,具有更好的鲁棒性。
接下来,将结合实际应用场景对本申请实施例提供的情感分类方法进行介绍。
在本申请实施例中,当需要确定顾客对某一餐厅的“食物”、“价格”等要素的评价好坏,以作为后续改进依据时,可以通过本申请实施例提供的情感分类方法来进行情感分类。基于该情感分类方法主要通过胶囊网络模型来实现情感分类,由此,可以通过模型训练得到一个胶囊网络模型,以使在将一条体现对该餐厅的评价语料输入至胶囊网络模型后,输出该评价语料体现的对该餐厅相应要素的情感类别。
其中,该胶囊网络模型中可以包括对应于需要评价的各个要素的胶囊结构,可以根据实际需求来确定需要评价的要素。在该实施例中,需要评价的要素分别为“食物”、“价格”、“服务(Service)”、“环境(Ambience)”和“轶事(Anecdote)”,由此该胶囊网络模型中包括五个胶囊结构,分别对应于上述要素。
另外,可以设置关于要素进行情感分类的情感类别。在该实施例中,可以设置三个情感类别,分别为正向情感、负向情感、中性情感。
下面对该胶囊网络模型的训练方式进行介绍,参见图4,该图示出了本申请实施例提供的一种得到胶囊网络模型的方法流程图,如图4所示,首先,可以构建与这五个要素相关的数据集,包括:收集针对要素的情感分类的数据集,并分析数据集中的要素和情感类别。
然后,可以针对多个胶囊网络模型进行模型训练,包括:根据数据库的数据规模,从中抽取多条文本构建验证集和测试集,将其余的文本构建为训练集。通过训练集对多个胶囊网络模型进行训练。在完成训练后,可以通过验证集从训练好的胶囊网络模型中选择情感分类效果最优的胶囊网络模型,并通过测试集来测试该最优的胶囊网络模型的情感分类效果,得到针对这五个要素进行情感分类的胶囊网络模型。
最后,可以通过得到的胶囊网络模型进行情感分类,包括:获取与这些要素相关的文本作为待分类文本,以通过胶囊网络模型进行情感分类。
在完成模型训练后,可以通过该胶囊网络模型进行情感分类。
参见图5,该图示出了本申请实施例提供的一种应用胶囊网络模型进行情感分类的流程图,如图5所示,胶囊网络模型中包括编码模块(Encoder)、预处理层(RNNS)、五个胶囊结构以及分析层(Analyzer)。
在本应用场景中,可以通过网络爬取,第三方提供等方式获取某一点评应用中针对一个餐厅的用户评价语料(即文本集合),其中任一个用户评价语料都可以作为本次的待分类样本。通过对这些待分类样本进行情感分类,可以确定该餐厅的用户评价情感分类情况。
其中,以待分类文本为“这家餐厅的烤鱼是非常好吃的”为例进行说明,在将待分类文本输入至胶囊网络模型之后,可以根据其中的每个词(即“这家”、“餐厅”、“的”、“烤鱼”、“是”、“非常”、“好吃”、“的”)得到对应的词嵌入向量(Word Embedding),并通过编码模块进行编码,得到每个词对应的词表征(Word Representation),按照所对应词在待分类文本中的位置关系进行排列,得到文本特征。
其中,词特征向量可以是上述的词嵌入向量或词表征。编码模块可以为卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、变压器的双向编码器表示(Bidirectional Encoder Representation fromTransformers,BERT)等。
对于不同语种的待分类文本,可以确定是否需要进行分词后输入胶囊网络模型。例如,对于上述示例的中文语种的待分类文本,可以对其进行分词后输入胶囊网络模型,对于英文语种的待分类文本,由于其中的空格即对文本进行了分词,由此可以直接将待分类文本输入至胶囊网络模型。
如图5所示,在该胶囊网络模型中,可以包括供多个胶囊结构共享的预处理层,通过将每个胶囊结构所对应要素的特征向量(对应于要素“食物”、“价格”、“服务”、“环境”和“轶事”)和待分类文本对应的文本特征输入至预处理层,可以得到针对每个胶囊结构的输入数据。
另外,对每个胶囊结构确定的输入数据还包括待分类文本的文本特征。
然后,通过每个胶囊结构基于特征向量和注意力机制,根据对应的输入数据进行情感分类。
该示例中,每个胶囊结构中均包括上述提及的要素注意力模块、情感注意力模块、点乘模块1、点乘模块2和共享注意力模块,这些计算模块通过输入数据和目标要素对应的特征向量进行计算,可以得到对应的特征Va,l、Va,h、Vs、Vo,l和Vo,h。
从而,胶囊结构可以根据特征Va,l、Va,h和Vs通过全连接层(FC)进行连接,并根据该经过连接的特征,通过Sigmoid函数确定待分类文本中是否包括属于与目标要素相关的情感词,得到第一识别结果。另外,可以根据特征Vo,l、Vo,h和Vs通过全连接层进行连接,并根据该经过连接的特征,通过Softmax函数确定待分类文本中的词相对目标要素的情感类别,得到第二识别结果。
在该实施例中,对应于要素“食物”、“价格”、“服务”、“环境”和“轶事”的胶囊结构的输出数据分别为:“食物:正向情感”、“无:无”、“无:无”、“无:无”和“无:无”。
进而,将每个胶囊结构的输出数据输入至分析层,分析层根据这些输出数据,确定的情感分类结果为“食物:正向情感”,即该条评价语料体现了顾客对该餐厅的食物具有正向情感。
另外,对于关于该餐厅的其他评价语料,也可以分别作为待分类文本,并通过上述方式进行情感分类,此处不再赘述。
如此,可以根据所获取的顾客对该餐厅的评价语料,得到针对不同要素的总体情感分类情况,例如,针对“食物”这一要素,正向情感占比75%,负向情感占比30%,针对“服务”这一要素,正向情感占比52%,负向情感占比48%,针对“价格”这一要素,正向情感占比90%,负向情感占比10%等。
相应的,若针对每个胶囊结构设置了对应的字典库,在完成全部待分类文本(即文本集合)的情感分类后,还可以基于字典库中针对不同词所统计的要素权重参数、情感权重参数等,输出具体的要要素情感对列表,例如针对“食物”这一要素,对应的要素词列表可以包括:水煮牛肉、酱爆肉丝、蒜蓉青菜…等,对应的情感词列表可以包括:太赞了、原汁原味、儿时的味道…等。
通过本申请实施例提供的情感分类方法,可以准确量化出顾客关于该餐厅各要素体现的情感类别,对于餐厅来说有着至关重要的指导意义。
本申请实施例还提供了一种情感分类装置,该情感分类装置可以应用于上述数据处理模型中,参见图6,该图示出了本申请实施例提供的一种情感分类装置示意图,如图6所示,所述装置包括第一获取单元601、第一确定单元602、第二获取单元603和第二确定单元604:
所述第一获取单元601,用于获取待分类文本;所述待分类文本包括多个词;
所述第一确定单元602,用于根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
所述第二获取单元603,用于获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
所述第二确定单元604,用于根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。
在一种可能的实现方式中,所述第二获取单元603,具体用于:
所述胶囊结构包括要素注意力模块和情感注意力模块,根据所述特征向量和所述输入数据,通过所述要素注意力模块确定相对于所述目标要素,所述多个词分别对应的第一注意力权值;所述第一注意力权值用于标识所对应词属于所述目标要素的可能性;
根据所述第一注意力权值,确定所述第一识别结果;
根据所述特征向量和所述输入数据,通过所述情感注意力模块确定相对于所述目标要素,所述多个词分别对应的第二注意力权值;所述第二注意力权值用于标识所对应词属于与所述目标要素相关的情感词的可能性;
根据所述第二注意力权值,确定所述第二识别结果。
在一种可能的实现方式中,所述第二获取单元603,具体用于:
根据所述文本特征和所述第一注意力权值,确定所述第一识别结果;
根据所述文本特征和所述第二注意力权值,确定所述第二识别结果。
在一种可能的实现方式中,所述第二获取单元603,具体用于:
所述胶囊结构还包括共享注意力模块,根据所述特征向量和所述输入数据,通过所述共享注意力模块确定相对于所述目标要素,所述多个词分别对应的第三注意力权值;所述第三注意力权值用于标识所对应词在属于所述目标要素和属于所述情感词间的偏向程度;
根据所述第一注意力权值和所述第三注意力权值,确定所述第一识别结果;
根据所述第二注意力权值和所述第三注意力权值,确定所述第二识别结果。
在一种可能的实现方式中,所述第一确定单元602,具体用于:
所述胶囊网络模型包括由多个胶囊结构共享的预处理层,根据所述多个胶囊结构分别对应的要素,通过所述预处理层对所述文本特征进行针对所述多个胶囊结构的预处理,得到所述多个胶囊结构分别对应的输入数据;其中,针对所述多个胶囊结构中的一个胶囊结构,这个胶囊结构对应的输入数据是结合所述多个胶囊结构中其他胶囊结构所对应输入数据确定的。
在一种可能的实现方式中,所述第二确定单元604,具体用于:
所述胶囊结构设置有对应的字典库,所述字典库包括词与要素权重参数间的对应关系,若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述目标要素的第一词,以及所述第一词对应的第一注意力权值;
根据所述第一词对应的第一注意力权值,更新所述字典库中所述第一词对应的要素权重参数;
在完成针对文本集合的情感分类后,根据所述字典库中的要素权重参数,确定所述目标要素对应的要素词列表,所述文本集合包括所述待分类文本。
在一种可能的实现方式中,所述第二确定单元604,具体用于:
所述字典库还包括词与情感权重参数间的对应关系,若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述情感词的第二词,以及所述第二词对应的第二注意力权值;
根据所述第二词对应的第二注意力权值,更新所述字典库中所述第二词对应的情感权重参数;
在完成针对所述文本集合的情感分类后,根据所述字典库中的情感权重参数,确定所述目标要素对应的情感词列表。
在一种可能的实现方式中,所述第一获取单元601,还用于对所述胶囊网络模型进行模型训练,所述胶囊网络模型是通过如下方式训练得到的:
获取训练样本集,所述训练样本集中的训练样本具有训练文本和对应的要素情感对,所述要素情感对用于标识所述训练文本所包括词属于的要素标签,以及对应的情感类别标签;
根据所述训练样本集对初始胶囊网络模型进行训练,通过训练得到所述胶囊网络模型;
其中,所述初始胶囊网络模型包括多个胶囊结构,所述胶囊结构与要素一一对应,所述胶囊结构中包括所对应目标要素的特征向量;所述胶囊网络模型具有通过训练确定的最大激活概率和最小未激活概率,所述最大激活概率为通过所述胶囊结构识别所述训练文本中具有对应所述要素标签的词时,所述胶囊结构输出的最小概率;所述最小未激活概率为通过所述胶囊结构识别所述训练文本中不具有对应所述要素标签的词时,所述胶囊结构输出的最大概率。
由上述技术方案可以看出,针对需要进行情感分类的待分类文本,可以根据待分类文本的文本特征,通过胶囊网络模型中的胶囊结构获取对应的输出结果。胶囊网络模型中包括与要素一一对应的胶囊结构,针对任意一个胶囊结构,该胶囊结构中包括所对应目标要素的特征向量,通过该特征向量并基于注意力机制,可以得到输出结果中的第一识别结果和第二识别结果。由于文本特征具有待分类文本所包括多个词分别对应的词特征向量,故通过胶囊结构中的特征向量,可以从单个词的角度确定出多个词中是否具有符合目标要素的词,即第一识别结果,以及从文本整体的角度确定多个词相对于目标要素的情感类别,即第二识别结果。从而,基于胶囊网络模型中每个胶囊结构的输出数据,可以确定待分类文本对应于要素的情感分类结果。基于胶囊结构的特点,实现了通过胶囊网络模型对不同要素的针对性情感识别,将要素和情感有机的关联起来,不仅降低了人为经验的在情感识别上的影响,而且大大提高了对应于要素的情感分类精度。
本申请实施例还提供了一种情感分类设备,该情感分类设备即为上述提及的数据处理设备,下面结合附图对数据处理设备(情感分类设备)进行介绍。请参见图7所示,本申请实施例提供了一种数据处理设备结构图,该设备700还可以是终端设备,以终端设备为手机为例:
图7示出的是与本申请实施例提供的手机的部分结构框图。参考图7,手机包括:射频(Radio Frequency,简称RF)电路710、存储器720、输入单元730、显示单元740、传感器750、音频电路760、无线保真(wireless fidelity,简称WiFi)模块770、处理器780、以及电源790等部件。本领域技术人员可以理解,图7中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对手机的各个构成部件进行具体的介绍:
RF电路710可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器780处理;另外,将设计上行的数据发送给基站。通常,RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称LNA)、双工器等。此外,RF电路710还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobile communication,简称GSM)、通用分组无线服务(GeneralPacket Radio Service,简称GPRS)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、长期演进(Long Term Evolution,简称LTE)、电子邮件、短消息服务(Short Messaging Service,简称SMS)等。
存储器720可用于存储软件程序以及模块,处理器780通过运行存储在存储器720的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器720可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元730可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元730可包括触控面板731以及其他输入设备732。触控面板731,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板731上或在触控面板731附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板731可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器780,并能接收处理器780发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板731。除了触控面板731,输入单元730还可以包括其他输入设备732。具体地,其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元740可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元740可包括显示面板741,可选的,可以采用液晶显示器(Liquid CrystalDisplay,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板741。进一步的,触控面板731可覆盖显示面板741,当触控面板731检测到在其上或附近的触摸操作后,传送给处理器780以确定触摸事件的类型,随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图7中,触控面板731与显示面板741是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板731与显示面板741集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器750,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板741的亮度,接近传感器可在手机移动到耳边时,关闭显示面板741和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路760、扬声器761,传声器762可提供用户与手机之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号,传输到扬声器761,由扬声器761转换为声音信号输出;另一方面,传声器762将收集的声音信号转换为电信号,由音频电路760接收后转换为音频数据,再将音频数据输出处理器780处理后,经RF电路710以发送给比如另一手机,或者将音频数据输出至存储器720以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块770,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器780是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器720内的软件程序和/或模块,以及调用存储在存储器720内的数据,执行手机的各种功能和处理数据。可选的,处理器780可包括一个或多个处理单元;优选的,处理器780可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器780中。
手机还包括给各个部件供电的电源790(比如电池),优选的,电源可以通过电源管理系统与处理器780逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本实施例中,该终端设备所包括的处理器780还具有以下功能:
获取待分类文本;所述待分类文本包括多个词;
根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果。
本申请实施例提供的数据处理设备可以是服务器,请参见图8所示,图8为本申请实施例提供的一种服务器的结构图,服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,简称CPU)822(例如,一个或一个以上处理器)和存储器832,一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器822可以设置为与存储介质830通信,在服务器800上执行存储介质830中的一系列指令操作。
服务器800还可以包括一个或一个以上电源826,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口858,和/或,一个或一个以上操作系统841,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中的步骤也可以由服务器执行,该服务器可以基于该图8所示的服务器结构。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行前述各个实施例所述的方法。
本申请实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述各个实施例所述的方法。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (13)
1.一种情感分类方法,其特征在于,所述方法包括:
获取待分类文本;所述待分类文本包括多个词;
根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果;
所述胶囊网络模型包括由多个胶囊结构共享的预处理层,所述根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据,包括:
根据所述多个胶囊结构分别对应的要素,通过所述预处理层对所述文本特征进行针对所述多个胶囊结构的预处理,得到所述多个胶囊结构分别对应的输入数据;其中,针对所述多个胶囊结构中的一个胶囊结构,这个胶囊结构对应的输入数据是结合所述多个胶囊结构中其他胶囊结构所对应输入数据确定的。
2.根据权利要求1所述的方法,其特征在于,所述胶囊结构包括要素注意力模块和情感注意力模块,所述获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,包括:
根据所述特征向量和所述输入数据,通过所述要素注意力模块确定相对于所述目标要素,所述多个词分别对应的第一注意力权值;所述第一注意力权值用于标识所对应词属于所述目标要素的可能性;
根据所述第一注意力权值,确定所述第一识别结果;
根据所述特征向量和所述输入数据,通过所述情感注意力模块确定相对于所述目标要素,所述多个词分别对应的第二注意力权值;所述第二注意力权值用于标识所对应词属于与所述目标要素相关的情感词的可能性;
根据所述第二注意力权值,确定所述第二识别结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一注意力权值,确定所述第一识别结果,包括:
根据所述文本特征和所述第一注意力权值,确定所述第一识别结果;
所述根据所述第二注意力权值,确定所述第二识别结果,包括:
根据所述文本特征和所述第二注意力权值,确定所述第二识别结果。
4.根据权利要求2所述的方法,其特征在于,所述胶囊结构还包括共享注意力模块,所述方法还包括:
根据所述特征向量和所述输入数据,通过所述共享注意力模块确定相对于所述目标要素,所述多个词分别对应的第三注意力权值;所述第三注意力权值用于标识所对应词在属于所述目标要素和属于所述情感词间的偏向程度;
所述根据所述第一注意力权值,确定所述第一识别结果,包括:
根据所述第一注意力权值和所述第三注意力权值,确定所述第一识别结果;
所述根据所述第二注意力权值,确定所述第二识别结果,包括:
根据所述第二注意力权值和所述第三注意力权值,确定所述第二识别结果。
5.根据权利要求2所述的方法,其特征在于,所述胶囊结构设置有对应的字典库,所述字典库包括词与要素权重参数间的对应关系,所述方法还包括:
若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述目标要素的第一词,以及所述第一词对应的第一注意力权值;
根据所述第一词对应的第一注意力权值,更新所述字典库中所述第一词对应的要素权重参数;
在完成针对文本集合的情感分类后,根据所述字典库中的要素权重参数,确定所述目标要素对应的要素词列表,所述文本集合包括所述待分类文本。
6.根据权利要求5所述的方法,其特征在于,所述字典库还包括词与情感权重参数间的对应关系,所述方法还包括:
若所述情感分类结果中包括对应所述目标要素的子情感分类结果,确定所述待分类文本中属于所述情感词的第二词,以及所述第二词对应的第二注意力权值;
根据所述第二词对应的第二注意力权值,更新所述字典库中所述第二词对应的情感权重参数;
在完成针对所述文本集合的情感分类后,根据所述字典库中的情感权重参数,确定所述目标要素对应的情感词列表。
7.根据权利要求1-4任意一项所述的方法,其特征在于,所述胶囊网络模型是通过如下方式训练得到的:
获取训练样本集,所述训练样本集中的训练样本具有训练文本和对应的要素情感对,所述要素情感对用于标识所述训练文本所包括词属于的要素标签,以及对应的情感类别标签;
根据所述训练样本集对初始胶囊网络模型进行训练,通过训练得到所述胶囊网络模型;
其中,所述初始胶囊网络模型包括多个胶囊结构,所述胶囊结构与要素一一对应,所述胶囊结构中包括所对应目标要素的特征向量;所述胶囊网络模型具有通过训练确定的最大激活概率和最小未激活概率,所述最大激活概率为通过所述胶囊结构识别所述训练文本中具有对应所述要素标签的词时,所述胶囊结构输出的最小概率;所述最小未激活概率为通过所述胶囊结构识别所述训练文本中不具有对应所述要素标签的词时,所述胶囊结构输出的最大概率。
8.一种情感分类装置,其特征在于,所述装置包括第一获取单元、第一确定单元、第二获取单元和第二确定单元:
所述第一获取单元,用于获取待分类文本;所述待分类文本包括多个词;
所述第一确定单元,用于根据所述待分类文本的文本特征,确定对应胶囊网络模型中胶囊结构的输入数据;所述文本特征包括所述多个词分别对应的词特征向量,所述胶囊结构与要素一一对应,所述要素用于标识对象类别,所述对象类别所包括的对象具有相关的情感词,所述胶囊结构中包括所对应目标要素的特征向量;
所述第二获取单元,用于获取所述胶囊结构基于所述特征向量和注意力机制确定的输出数据,所述输出数据包括第一识别结果和第二识别结果,所述第一识别结果用于标识所述多个词中是否包括属于所述目标要素的词,所述第二识别结果用于标识所述多个词相对于所述目标要素的情感类别;
所述第二确定单元,用于根据所述胶囊网络模型中每个胶囊结构的输出数据,确定所述待分类文本对应于要素的情感分类结果;
所述胶囊网络模型包括由多个胶囊结构共享的预处理层,所述第一确定单元,具体用于:
根据所述多个胶囊结构分别对应的要素,通过所述预处理层对所述文本特征进行针对所述多个胶囊结构的预处理,得到所述多个胶囊结构分别对应的输入数据;其中,针对所述多个胶囊结构中的一个胶囊结构,这个胶囊结构对应的输入数据是结合所述多个胶囊结构中其他胶囊结构所对应输入数据确定的。
9.根据权利要求8所述的装置,其特征在于,所述第二获取单元,具体用于:
所述胶囊结构包括要素注意力模块和情感注意力模块,根据所述特征向量和所述输入数据,通过所述要素注意力模块确定相对于所述目标要素,所述多个词分别对应的第一注意力权值;所述第一注意力权值用于标识所对应词属于所述目标要素的可能性;
根据所述第一注意力权值,确定所述第一识别结果;
根据所述特征向量和所述输入数据,通过所述情感注意力模块确定相对于所述目标要素,所述多个词分别对应的第二注意力权值;所述第二注意力权值用于标识所对应词属于与所述目标要素相关的情感词的可能性;
根据所述第二注意力权值,确定所述第二识别结果。
10.根据权利要求9所述的装置,其特征在于,所述第二获取单元,具体用于:
根据所述文本特征和所述第一注意力权值,确定所述第一识别结果;
根据所述文本特征和所述第二注意力权值,确定所述第二识别结果。
11.根据权利要求9所述的装置,其特征在于,所述第二获取单元,具体用于:
所述胶囊结构还包括共享注意力模块,根据所述特征向量和所述输入数据,通过所述共享注意力模块确定相对于所述目标要素,所述多个词分别对应的第三注意力权值;所述第三注意力权值用于标识所对应词在属于所述目标要素和属于所述情感词间的偏向程度;
根据所述第一注意力权值和所述第三注意力权值,确定所述第一识别结果;
根据所述第二注意力权值和所述第三注意力权值,确定所述第二识别结果。
12.一种情感分类设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-7任意一项所述的情感分类方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-7任意一项所述的情感分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010501466.5A CN111651604B (zh) | 2020-06-04 | 2020-06-04 | 基于人工智能的情感分类方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010501466.5A CN111651604B (zh) | 2020-06-04 | 2020-06-04 | 基于人工智能的情感分类方法和相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111651604A CN111651604A (zh) | 2020-09-11 |
CN111651604B true CN111651604B (zh) | 2023-11-10 |
Family
ID=72347132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010501466.5A Active CN111651604B (zh) | 2020-06-04 | 2020-06-04 | 基于人工智能的情感分类方法和相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651604B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257281B (zh) * | 2021-07-02 | 2021-09-21 | 四川省人工智能研究院(宜宾) | 一种对多模态情绪识别进行层次不确定性量化估计的方法 |
CN113268994B (zh) * | 2021-07-16 | 2021-10-01 | 中国平安人寿保险股份有限公司 | 基于胶囊网络的意图识别方法及装置 |
CN114791951A (zh) * | 2022-05-13 | 2022-07-26 | 青岛文达通科技股份有限公司 | 基于胶囊网络的情感分类方法及系统 |
CN116304585B (zh) * | 2023-05-18 | 2023-08-15 | 中国第一汽车股份有限公司 | 情感识别及模型训练方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682124A (zh) * | 2012-05-16 | 2012-09-19 | 苏州大学 | 一种文本的情感分类方法及装置 |
CN109710769A (zh) * | 2019-01-23 | 2019-05-03 | 福州大学 | 一种基于胶囊网络的水军评论检测系统及方法 |
CN110008339A (zh) * | 2019-03-22 | 2019-07-12 | 武汉大学 | 一种用于目标情感分类的深度记忆网络模型及其分类方法 |
CN110046671A (zh) * | 2019-04-24 | 2019-07-23 | 吉林大学 | 一种基于胶囊网络的文本分类方法 |
CN110990523A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法及系统 |
CN111143564A (zh) * | 2019-12-27 | 2020-05-12 | 北京百度网讯科技有限公司 | 无监督的多目标篇章级情感分类模型训练方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140365208A1 (en) * | 2013-06-05 | 2014-12-11 | Microsoft Corporation | Classification of affective states in social media |
-
2020
- 2020-06-04 CN CN202010501466.5A patent/CN111651604B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682124A (zh) * | 2012-05-16 | 2012-09-19 | 苏州大学 | 一种文本的情感分类方法及装置 |
CN110990523A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法及系统 |
CN109710769A (zh) * | 2019-01-23 | 2019-05-03 | 福州大学 | 一种基于胶囊网络的水军评论检测系统及方法 |
CN110008339A (zh) * | 2019-03-22 | 2019-07-12 | 武汉大学 | 一种用于目标情感分类的深度记忆网络模型及其分类方法 |
CN110046671A (zh) * | 2019-04-24 | 2019-07-23 | 吉林大学 | 一种基于胶囊网络的文本分类方法 |
CN111143564A (zh) * | 2019-12-27 | 2020-05-12 | 北京百度网讯科技有限公司 | 无监督的多目标篇章级情感分类模型训练方法和装置 |
Non-Patent Citations (4)
Title |
---|
Enhanced sentiment labeling and implicit aspect identification by integration of deep convolution neural network and sequential algorithm;Jinzhan Feng etc.;《Cluster Computing》;第5839–5857页 * |
SC-BiCapsNet: A Sentiment Classification Model Based on Bi-Channel Capsule Network;Kejun Zhang etc.;《IEEE Access》;第171801 - 171813页 * |
一种基于混合词向量的胶囊网络文本分类方法;王弘中 等;《小型微型计算机系统》;第218-224页 * |
多维度用户评论情感分析系统的研究与实现;任鑫涛;《中国优秀硕士学位论文全文数据库(信息科技辑)》;第I138-1322页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111651604A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111651604B (zh) | 基于人工智能的情感分类方法和相关装置 | |
KR102646667B1 (ko) | 이미지 영역을 찾기 위한 방법, 모델 훈련 방법 및 관련 장치 | |
CN111553162B (zh) | 一种意图识别的方法以及相关装置 | |
CN109145303A (zh) | 命名实体识别方法、装置、介质以及设备 | |
CN111339774A (zh) | 文本的实体关系抽取方法和模型训练方法 | |
CN110704661B (zh) | 一种图像分类方法和装置 | |
CN111931501B (zh) | 一种基于人工智能的文本挖掘方法、相关装置及设备 | |
CN110298212B (zh) | 模型训练方法、情绪识别方法、表情显示方法及相关设备 | |
CN111914113A (zh) | 一种图像检索的方法以及相关装置 | |
CN111597804B (zh) | 一种实体识别模型训练的方法以及相关装置 | |
CN110276010B (zh) | 一种权重模型训练方法和相关装置 | |
CN111539212A (zh) | 文本信息处理方法、装置、存储介质及电子设备 | |
CN112749252B (zh) | 一种基于人工智能的文本匹配方法和相关装置 | |
CN112214605A (zh) | 一种文本分类方法和相关装置 | |
CN113821589A (zh) | 一种文本标签的确定方法及装置、计算机设备和存储介质 | |
CN113761122A (zh) | 一种事件抽取方法、相关装置、设备及存储介质 | |
CN113392644A (zh) | 模型训练、文本信息处理方法、系统、装置和存储介质 | |
CN111738000B (zh) | 一种短语推荐的方法以及相关装置 | |
CN111611369B (zh) | 基于人工智能的交互方法和相关装置 | |
CN113569572A (zh) | 文本实体生成方法、模型训练方法及装置 | |
CN115168568B (zh) | 一种数据内容的识别方法、装置以及存储介质 | |
CN116259083A (zh) | 一种图像质量识别模型的确定方法和相关装置 | |
CN115080840A (zh) | 一种内容推送方法、装置及存储介质 | |
CN113569043A (zh) | 一种文本类别确定方法和相关装置 | |
CN110781274A (zh) | 一种问答对生成的方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |