CN116756306A - 对象分类方法、装置、计算机设备及计算机可读存储介质 - Google Patents
对象分类方法、装置、计算机设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN116756306A CN116756306A CN202210204715.3A CN202210204715A CN116756306A CN 116756306 A CN116756306 A CN 116756306A CN 202210204715 A CN202210204715 A CN 202210204715A CN 116756306 A CN116756306 A CN 116756306A
- Authority
- CN
- China
- Prior art keywords
- text
- evaluated
- feature information
- target
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 230000008451 emotion Effects 0.000 claims abstract description 181
- 238000013145 classification model Methods 0.000 claims description 85
- 238000000605 extraction Methods 0.000 claims description 56
- 238000012549 training Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000007499 fusion processing Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 16
- 238000013473 artificial intelligence Methods 0.000 abstract description 10
- 235000013305 food Nutrition 0.000 description 19
- 230000006870 function Effects 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000011176 pooling Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000011218 segmentation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004140 cleaning Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 239000004973 liquid crystal related substance Substances 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012550 audit Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种对象分类方法、装置、计算机设备及计算机可读存储介质,可以应用于于云技术、人工智能、智慧交通、车联网等各种场景;本申请实施例可以获取针对待评估对象的待分类文本;对待分类文本进行语义特征提取,得到第一文本特征信息;对第一文本特征信息进行序列特征提取,得到第二文本特征信息;根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别;本申请实施例可以提取到具有文本语义特征信息和序列特征信息的高质量第二文本特征信息,从而可以根据第二文本特征信息,准确地确定待评估对象中目标待评估对象对应的目标情感类别。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及一种对象分类方法、装置、计算机设备及计算机可读存储介质。
背景技术
情感分析是自然语言处理领域的重要问题之一,其旨在挖掘出文本中情感的倾向性,这在学术和应用上都有很大的研究价值。其中,情感分析包括多标签的情感分析。
目前,多标签的情感分析一般将任务视作多标签文本分类任务,使用神经网络模型对待分类文本进行分类,得到针对待分类文本的情感类别。但是,目前的多标签的情感分析对待分类文本进行文本分类所得到的情感类别的准确性不高。
综上,现有的多标签情感分析无法准确确定出情感类别。
发明内容
本申请实施例提供一种对象分类方法、装置、计算机设备及计算机可读存储介质,能够准确地确定出待评估对象的目标情感类别。
一种对象分类方法,包括:
获取针对待评估对象的待分类文本;
对待分类文本进行语义特征提取,得到第一文本特征信息;
对第一文本特征信息进行序列特征提取,得到第二文本特征信息;
根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
相应地,本申请实施例提供一种对象分类装置,包括:
第一获取单元,可以用于获取针对待评估对象的待分类文本;
第一提取单元,可以用于对待分类文本进行语义特征提取,得到第一文本特征信息;
第二提取单元,可以用于对第一文本特征信息进行序列特征提取,得到第二文本特征信息;
确定单元,可以用于根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
在一些实施例中,第一文本特征信息为采用训练后对象分类模型进行特征提取到的信息;对象分类装置还包括训练单元,具体可以用于获取文本样本集合,文本样本集合包括至少一个标注情感分类标签的文本样本;采用待训练对象分类模型对文本样本进行特征提取,得到文本样本对应的目标特征信息;根据目标特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
在一些实施例中,训练单元,具体可以用于获取至少一个待评估对象对应的参考文本特征信息;计算目标特征信息针对参考文本特征信息的参考权重信息;根据参考权重信息,对文本样本的目标特征信息进行融合处理,得到文本样本针对待评估对象的融合后特征信息;根据融合后特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
在一些实施例中,训练单元,具体可以用于获取候选文本样本集合和情感分类标签,候选文本样本集合包括至少一个候选文本样本;对候选文本样本进行预处理,得到文本样本;根据情感分类标签对文本样本进行标注,生成文本样本集合。
在一些实施例中,训练单元,具体可以用于采用待训练对象分类模型的语义特征提取层对文本样本进行语义特征提取,得到文本样本对应的第一样本特征信息;采用待训练对象分类模型的序列特征提取层对文本样本进行序列特征提取,得到文本样本的第二样本特征信息;将第二样本特征信息作为目标特征信息。
在一些实施例中,对象分类装置还包括第二获取单元,第二获取单元具体可以用于获取至少一个待评估对象对应的模板文本特征信息。
对应地,确定单元,具体可以用于根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元,具体可以用于计算第二文本特征信息针对模板文本特征信息的权重信息;根据权重信息,对第二文本特征信息进行融合处理,得到待分类文本针对待评估对象的目标融合后文本特征信息;根据目标融合后文本特征信息,计算得到待评估对象中目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元,具体可以用于计算第二文本特征信息和模板文本特征信息之间的目标相似度信息;根据目标相似度信息,计算得到第二文本特征信息针对模板文本特征信息的权重信息。
在一些实施例中,确定单元,具体可以用于根据第二文本特征信息和模板文本特征信息,计算得到待评估对象的分类信息;根据分类信息,确定目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元,具体可以用于根据第二文本特征信息,从待评估对象中筛选出待分类文本对应的目标待评估对象;根据目标待评估对象对应的模板文本特征信息和第二文本特征信息,计算得到目标待评估对象对应的目标情感类别。
在一些实施例中,第一提取单元,具体可以用于对待分类文本进行特征提取,得到初始文本特征信息;根据初始文本特征信息,确定第一文本特征信息。
此外,本申请实施例还提供一种计算机设备,包括存储器和处理器;存储器存储有计算机程序,处理器用于运行存储器内的计算机程序,以执行本申请实施例提供的任一种对象分类方法。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序适于处理器进行加载,以执行本申请实施例提供的任一种对象分类方法。
此外,本申请实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现本申请实施例所提供的任一种对象分类方法。
本申请实施例可以获取针对待评估对象的待分类文本;对待分类文本进行语义特征提取,得到第一文本特征信息;对第一文本特征信息进行序列特征提取,得到第二文本特征信息;根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别;由于本申请实施例可以对待分类文本进行语义特征提取,得到第一文本特征信息且对第一文本特征信息进行序列特征提取,得到第二文本特征信息,如此可以提取到具有文本语义特征信息和序列特征信息的高质量第二文本特征信息,从而可以根据第二文本特征信息,准确地确定待评估对象中目标待评估对象对应的目标情感类别。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的对象分类方法的场景示意图;
图2是本申请实施例提供的对象分类方法的流程示意一图;
图3是本申请实施例提供的对待训练对象分类模型进行训练,以得到训练后对象分类模型的流程示意图;
图4是本申请实施例提供的对象分类方法的流程示意二图;
图5是本申请实施例提供的对象分类方法的流程示意三图;
图6是本申请实施例提供的待训练对象分类模型的结构图;
图7是本申请实施例提供的transformer Encoder模块的结构图;
图8是本申请实施例提供的GRU模块的结构图;
图9是本申请实施例提供的Attention-Pooling模块的结构图;
图10是本申请实施例提供的线性分类器的结构图;
图11是本申请实施例提供的对象分类装置的结构示意图;
图12是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种对象分类方法、装置、计算机设备和计算机可读存储介质。其中,该对象分类装置可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。本申请实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
其中,本申请实施例涉及人工智能(Artificial Intelligence,AI),人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
例如,参见图1,以对象分类装置集成在计算机设备中为例,计算机设备可以获取针对待评估对象的待分类文本;对待分类文本进行语义特征提取,得到第一文本特征信息;对第一文本特征信息进行序列特征提取,得到第二文本特征信息;根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
其中,待评估对象可以是指对象一个待评估维度上的子对象。对象可以包括待评价对象、待推荐对象,待评估对象具体例如,商家、商品、美食、app、影视作品等。待评估对象可以是预设的待评估对象,也可以是确定出来的待评估对象。
例如,当对象为美食商家时,待评估对象可以包括美食商家的餐食味道、美食商家的卫生、美食商家的服务质量;例如,当对象为影视作品时,待评估对象可以包括影视作品的演员演技、影视作品的特效、影视作品的剧情;等等。
其中,第一文本特征信息可以是指表征待分类文本的文本语义的特征信息。由于第二文本特征信息为对第一文本特征信息进行序列特征提取到的特征信息,基于此,第二文本特征信息可以为按照一定序列排布的文本语义特征信息,也即,第二文本特征信息可以为携带文本语义特征信息的文本序列特征信息。
其中,情感类别可以包括正面情感类别、负面情感类别、中性情感类别。目标情感类别可以是指情感类别中的至少一种情感类别。
正面情感类别可以是指在针对待评估对象具有积极情感倾向的类别;负面情感类别可以是指在针对待评估对象具有消极情感倾向的类别;中性情感类别可以是指在针对待评估对象既不是积极情感倾向,也不是消极情感倾向的类别。比如,当待评估对象为美食商家的餐食味道时,情感类别包括针对美食商家餐食味道的好评、针对美食商家餐食味道的差评;针对美食商家餐食味道的好评即为美食商家的餐食味道下的正面情感类别,针对美食商家餐食味道的差评即为美食商家的餐食味道下的负面情感类别。
其中,模板文本特征信息可以是指预先收集并按照分类类别进行存储的文本信息。例如,当分类类别为美食商家的餐食味道分类类别时,模板文本特征信息可以是针对餐食味道的评价的文本信息,比如,味道很好;又比如,食物难吃;等。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从对象分类装置的角度进行描述,该对象分类装置具体可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备;其中,该终端可以包括平板电脑、笔记本电脑、以及个人计算机(PC,Personal Computer)、可穿戴设备、虚拟现实设备或其他可以获取数据的智能设备等设备。
如图2所示,该对象分类方法的具体流程如步骤S101-S104:
S101、获取针对待评估对象的待分类文本。
其中,待评估对象可以是指对象一个待评估维度上的子对象。对象可以包括待评价对象、待推荐对象,具体例如,商家、商品、美食、app、影视作品等。待评估对象可以是预设的待评估对象,也可以是确定出来的待评估对E象。
其中,在本申请实施例中的待分类文本可以是计算机设备实时获取到的文本,也可以是存储在数据库中的文本。
S102、对待分类文本进行语义特征提取,得到第一文本特征信息。
其中,第一文本特征信息可以是指表征待分类文本的文本语义的特征信息。
本申请实施例对待分类文本进行语义特征提取,得到第一文本特征信息的方式可以如下:
例如,计算机设备对待分类文本进行特征提取,得到初始文本特征信息;根据初始文本特征信息,确定第一文本特征信息。
其中,本申请实施例的第一文本特征信息可以为采用相关技术中的语义特征提取模型进行特征提取到的特征信息。该语义特征提取模型具有多层神经网络层。基于此,本申请实施例可以采用语义特征提取模型中第一层神经网络层进行特征提取,得到初始文本特征信息;然后,采用语义特征提取模型中第一层神经网络层之后的至少一层神经网络层对初始文本特征信息进行语义特征提取,得到第一文本特征信息。
其中,本申请实施例的第一文本特征信息可以为采用训练后对象分类模型进行特征提取到的特征信息。计算机设备可以采用训练后对象分类模型的词嵌入层对待分类文本进行特征提取,得到初始文本特征信息。
由于初始文本特征信息可以以矩阵的形式表征,基于此,本申请实施例可以通过训练后对象分类模型将初始文本特征信息的矩阵切分为若干份,形成若干子初始文本特征信息;根据子初始文本特征信息,确定子初始文本特征信息对应的注意力文本特征信息。然后,本申请实施例通过训练后对象分类模型将注意力文本特征信息进行融合,得到融合后文本特征信息;将融合后文本特征信息与初始文本特征信息进行融合,得到候选融合后文本特征信息;根据候选融合后文本特征信息,确定第一文本特征信息。
其中,当本申请实施例的第一文本特征信息为采用训练后对象分类模型进行特征提取到的特征信息时,本申请实施例可以对待训练对象分类模型进行训练,以得到训练后对象分类模型。
如图3所示,本申请实施例对待训练对象分类模型进行训练,以得到训练后对象分类模型的过程可以详见下述步骤A1-A3:
A1、获取文本样本集合。
其中,文本样本集合包括至少一个标注情感分类标签的文本样本。
本申请实施例可以对文本样本标注情感分类标签,如此可以得到标注情感分类标签的文本样本。
在步骤A1之前,计算机设备可以对数据进行预处理,计算机设备对数据进行预处理的方式包括对数据进行清洗和对数据进行扩增。
基于上述,计算机设备对数据进行预处理的具体可以为:计算机设备可以获取候选文本样本集合和情感分类标签,候选文本样本集合包括至少一个候选文本样本;对候选文本样本进行预处理,得到文本样本;根据情感分类标签对文本样本进行标注,生成文本样本集合。
其中,当对数据进行预处理的方式为对数据进行清洗时,候选文本样本可以是指尚未预处理过的存在噪声的初始文本样本,例如,当初始文本样本中存在无效字符时,此种情况可以称初始文本样本为候选文本样本;其中,无效字符可以包括表情符号、乱码符号、连续重复的标点符号、空格等。又例如,当初始文本样本中存在与预设字体不同的字体时,此种情况也可以称初始文本样本为候选文本样本;比如,预设字体为简体字,当初始文本样本中存在繁体字时,此种情况可以称初始文本样本为候选文本样本。
基于上述,当对数据进行预处理的方式为对数据进行清洗时,本申请实施例对候选文本样本进行预处理,得到文本样本的方式可以包括但不限于:当候选文本样本中存在无效字符时,计算机设备可以删除无效字符;当候选文本样本中存在与预设字体不同的字体时,计算机设备可以将与预设字体不同的字体转化为预设字体。
本申请实施例对数据进行清洗之后,也即对候选文本样本进行清洗之后,得到清洗后候选文本样本,还可以对清洗后候选文本样本进行分词处理和去停用词处理,得到处理后候选文本样本。对于分词处理,本申请实施例使用了开源的分词工具-结巴分词器进行分词处理。对于去停用词处理,本申请实施例直接停用词表,删除句子中的停用词。
其中,当对数据进行预处理的方式为对数据进行扩增时,本申请实施例对候选文本样本进行预处理,得到文本样本的方式可以包括但不限于下述方式的其中一种:(1)随机插入:计算机设备获取预设文本,并将预设文本随机插入候选文本样本,得到文本样本;其中,预设文本可以包括非停用词、停用词。预设文本可以是词典中的文本。(2)同义词替换:计算机设备从候选文本样本中随机抽取目标文本;获取该目标文本的同义文本,并将同义文本替换候选文本样本中的该目标文本,如此得到文本样本。其中,目标文本可以是非停用词,目标文本可以包括至少一个目标文本。(3)随机交换:计算机设备从不同的候选文本样本中随机抽取不同的文本进行交换,如此得到文本样本。(4)随机删除:计算机设备将候选文本样本中的标点符号随机删除,得到删除后候选文本样本;从不同的删除后候选文本样本中随机抽取预设长度的文本进行交换,并重复多次,如此得到文本样本。(5)数据回译:计算机设备将候选文本样本翻译为与候选文本样本语言不同的第一翻译后候选文本样本;将翻译后候选文本样本翻译为与候选文本样本语言相同的第二翻译后候选文本样本,第二翻译后候选文本样本和候选文本样本即为文本样本。其中,数据回译可以最大限度保证候选文本样本和第二翻译后候选文本样本在语义一致的情况下,更改用词和语言顺序,从而增加数据的多样性和数据量。本申请实施例中,计算机设备可以调用翻译接口实现数据回译。
本申请实施例对数据进行扩增,可以防止文本样本不足的情况,从而可以训练后对象分类模型的准确性。本申请实施例通过上述对数据进行扩增的方式,可以将文本样本量提升至原本的5倍。
其中,文本样本对应的情感类别标签可以是对文本样本进行标注得到的。但由于计算机设备可能存在采用不同标注策略对文本样本进行标注,从而会导致文本样本的情感分类标签存在差异,例如,标注策略包括第一标注策略和第二标注策略,相同的两个文本样本为第一文本样本、和第二文本样本,第一文本样本采用第一标注策略进行标注,得到第一情感分类标签,第二文本样本采用第二标注策略进行标注,得到第二情感分类标签;因此,本申请实施例需要对文本样本对应的预设情感分类标签进行预处理,从而得到情感分类标签。
基于上述,本申请实施例获取文本样本对应的情感分类标签的方式可以为:计算机设备获取文本样本对应的预设情感分类标签;对预设情感分类标签进行预处理,得到情感分类标签。
其中,本申请实施例对预设情感分类标签进行预处理的方式可以为:计算机设备获取预设情感分类标签的修改指令;根据修改指令,对预设情感分类标签进行修改,得到情感分类标签。
A2、采用待训练对象分类模型对文本样本进行特征提取,得到文本样本对应的目标特征信息。
其中,本申请实施例采用待训练对象分类模型对文本样本进行特征提取,得到文本样本对应的目标特征信息的方式可以如下:计算机设备对文本样本进行语义特征提取,得到第一样本特征信息;对第一样本特征信息进行序列特征提取,得到第二样本特征信息;将第二样本特征信息作为目标特征信息。
具体地,本申请实施例可以采用待训练对象分类模型的语义特征提取层对文本样本进行语义特征提取,得到文本样本对应的第一样本特征信息;采用待训练对象分类模型的序列特征提取层对文本样本进行序列特征提取,得到文本样本的第二样本特征信息。
A3、根据目标特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
本申请实施例根据目标特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型的方式可以有多种,详见下述:
例如,计算机设备可以根据目标特征信息对文本样本进行预测,得到文本样本对应的预测情感类别;采用损失函数计算预测情感类别和情感分类标签之间的第一损失值;根据第一损失值,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
又例如,计算机设备可以获取至少一个待评估对象对应的参考文本特征信息;计算目标特征信息针对参考文本特征信息的参考权重信息;根据参考权重信息,对文本样本的目标特征信息进行融合处理,得到文本样本针对待评估对象的融合后特征信息;根据融合后特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
其中,目标特征信息包括文本样本的若干目标特征信息。本申请实施例可以对文本样本进行分词处理,得到文本样本的若干分词文本;对每一分词文本进行特征提取的,得到文本样本对应的若干目标特征信息。
其中,本申请实施例计算目标特征信息针对参考文本特征信息的参考权重信息的方式可以为:计算机设备计算目标特征信息和参考文本特征信息之间的候选相似度信息;根据候选相似度信息,确定目标特征信息针对参考文本特征信息的参考权重信息。
本申请实施例可以对候选相似度信息进行归一化处理,得到参考权重信息。
S103、对第一文本特征信息进行序列特征提取,得到第二文本特征信息。
由于第二文本特征信息为对第一文本特征信息进行序列特征提取到的特征信息,基于此,第二文本特征信息可以为按照一定序列排布的文本语义特征信息,也即,第二文本特征信息可以为携带文本语义特征信息的文本序列特征信息。
本申请实施例可以采用LSTM神经网络对第一文本特征信息进行序列特征提取,得到第二文本特征信息。LSTM神经网络可以集成于训练后对象分类模型。
除上述之外,本申请实施例还可以采用GRU神经网络对第一文本特征信息进行序列特征提取,得到第二文本特征信息。GRU神经网络可以集成于训练后对象分类模型。
S104、根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
其中,本申请实施例在根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的步骤之前,还可以获取至少一个待评估对象对应的模板文本特征信息。
在本申请实施例中,计算机设备可以获取到目标待评估对象对应的模板文本,并对该模板文本进行特征提取,得到目标待评估对象对应的模板文本特征信息。本申请实施例中的模板文本可以是指预先收集并对应待评估对象进行存储的文本。
基于上述,本申请实施例根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式可以为:计算机设备根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
基于上述,计算机设备根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式有多种:
例如,计算机设备可以计算第二文本特征信息针对模板文本特征信息的权重信息;根据权重信息,对第二文本特征信息进行融合处理,得到待分类文本针对待评估对象的目标融合后文本特征信息;根据目标融合后文本特征信息,计算得到待评估对象中目标待评估对象对应的目标情感类别。
其中,本申请实施例计算第二文本特征信息针对模板文本特征信息的权重信息的方式可以为:计算第二文本特征信息和模板文本特征信息之间的目标相似度信息;根据目标相似度信息,计算得到第二文本特征信息针对模板文本特征信息的权重信息。
其中,本申请实施例可以将目标相似度信息进行归一化处理,得到第二文本特征信息针对模板文本特征信息的权重信息。
其中,本申请实施例根据权重信息,对第二文本特征信息进行融合处理的方式可以是加权求和,从而实现融合处理。
基于上述,计算机设备根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式可以为:计算机设备可以根据目标融合后文本特征信息,计算得到待评估对象的分类信息;根据分类信息,确定目标待评估对象对应的目标情感类别。
其中,本申请实施例采用分类器根据目标融合后文本特征信息对待评估对象进行分类处理,得到待评估对象的分类信息,分类信息表征待评估对象中每一情感类别的分类概率。当分类信息大于预设概率阈值时,分类信息对应的情感类别为目标待评估对象对应的目标情感类别。
又例如,本申请实施例根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式可以为:计算机设备可以根据第二文本特征信息,从待评估对象中筛选出待分类文本对应的目标待评估对象;根据目标待评估对象对应的模板文本特征信息和第二文本特征信息,计算得到目标待评估对象对应的目标情感类别。
其中,本申请实施例根据第二文本特征信息,从待评估对象中筛选出待分类文本对应的目标待评估对象的方式可以为:获取待评估对象的预设评估文本;对预设评估文本进行特征提取,得到预设评估文本特征信息;根据预设评估文本特征信息和第二文本特征信息,计算预设评估文本和待分类文本之间的参考相似度;将最大的参考相似度对应的待评估对象作为目标待评估对象。
此处的根据目标待评估对象对应的模板文本特征信息和第二文本特征信息,计算得到目标待评估对象对应的目标情感类别的流程可参见前述,此处不再赘述。
本申请实施例可以获取针对待评估对象的待分类文本;对待分类文本进行语义特征提取,得到第一文本特征信息;对第一文本特征信息进行序列特征提取,得到第二文本特征信息;根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别;由于本申请实施例可以对待分类文本进行语义特征提取,得到第一文本特征信息且对第一文本特征信息进行序列特征提取,得到第二文本特征信息,如此可以提取到具有文本语义特征信息和序列特征信息的高质量第二文本特征信息,从而可以根据第二文本特征信息,准确地确定待评估对象中目标待评估对象对应的目标情感类别。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该对象分类装置具体集成在计算机设备,计算机设备可以为服务器,也可以为终端。
首先要说明的是,本申请实施例可以应用在到电商、推荐、物流与外卖、安全审核等业务。
具体来说:(1)、在电商业务中,本申请实施例可以用来分析用户对商品的评价,校验不同商家、不同商品的优缺点,对每个待评估对象给出评价结论,如此从待评估对象下的负面情感类别方面入手,以改善用户体验。(2)、在推荐业务中,本申请实施例能用于标注出不同用户感兴趣的内容,如美食推荐中定向推荐评价为:味道的情感类别为正面情感类别、价格为正面的情感类别的商家。(3)、在物流与外卖业务中,本申请实施例可以用来标注不同责任人,如外卖中味道的情感类别为正面情感类别、配送的情感类别为负面情感类别的评价,以改善服务质量。(4)、在安全审核业务中,本申请实施例可以可以用来对弹幕评论、文章评论等进行分析,如提取负面辱骂等信息以进行屏蔽等。
如图4所示,一种对象分类方法,具体流程如步骤S201至步骤S207:
S201、计算机设备获取文本样本集合。
其中,文本样本集合包括至少一个标注情感分类标签的文本样本。
本申请实施例可以对文本样本标注情感分类标签,如此可以得到情感分类标签对应的文本样本。
本申请实施例在计算机设备获取文本样本集合之前,计算机设备可以对数据进行预处理。计算机设备对数据进行预处理的具体可以为:计算机设备可以计算机设备可以获取候选文本样本集合和情感分类标签,候选文本样本集合包括至少一个候选文本样本;对候选文本样本进行预处理,得到文本样本;根据情感分类标签对文本样本进行标注,生成文本样本集合。
其中,计算机设备对数据进行预处理的方式包括对数据进行清洗和对数据进行扩增。
如图5所示,本申请实施例可先对数据进行清洗、再对数据进行扩增。
具体地,本申请实施例可以对候选文本样本进行清洗,得到清洗后候选文本样本;对清洗后候选文本样本进行扩增,得到文本样本。
其中,本申请实施例可以对候选文本样本进行清洗,清洗方式可参见前述当候选文本样本中存在无效字符时,以及当候选文本样本中存在与预设字体不同的字体时的清洗过程,此处不再赘述。
其中,本申请实施例可以对清洗后候选文本样本进行扩增,扩增方式可参见前述随机插入、同义词替换、随机交换、随机删除、数据回译等过程,此处不再赘述。
其中,文本样本对应的情感分类标签可以是对文本样本进行标注得到的。但由于计算机设备可能存在采用不同标注策略对文本样本进行标注,从而会导致文本样本的情感分类标签存在差异,因此,本申请实施例需要对文本样本对应的预设情感分类标签进行预处理,从而得到情感分类标签。
基于上述,如图5所示,本申请实施例在对数据进行预处理之前,本申请实施例可以对预设情感分类标签进行预处理,也即本申请实施例获取文本样本对应的情感分类标签的方式可以为:计算机设备获取文本样本对应的预设情感分类标签;对预设情感分类标签进行预处理,得到情感分类标签。
其中,本申请实施例对预设情感分类标签进行预处理的方式可以为:计算机设备获取针对预设情感分类标签的修改指令;根据修改指令,对预设情感分类标签进行修改,得到情感分类标签。
S202、计算机设备采用待训练对象分类模型对文本样本进行特征提取,得到文本样本对应的目标特征信息。
其中,本申请实施例可以采用待训练对象分类模型的语义特征提取层对文本样本进行语义特征提取,得到文本样本对应的第一样本特征信息;采用待训练对象分类模型的序列特征提取层对文本样本进行序列特征提取,得到文本样本的第二样本特征信息。
其中,如图6所示,本申请实施例的待训练对象分类模型包括:TransformerEncoder模块、GRU模块、Attention-Pooling模块、线性分类器模块。
其中,上述的语义特征提取层为Transformer Encoder模块中的神经网络层,序列特征提取层为GRU模块中的神经网络层。
本申请实施例可以先采用待训练对象分类模型的词嵌入层对文本样本进行特征提取,得到初始文本样本特征信息。例如,本申请实施例文本样本包括“这家餐厅饭很好吃,但是服务质量很差”。词嵌入层可以集成于语义特征提取层。
然后,本申请实施例可以采用Transformer Encoder模块对初始文本样本特征信息进行语义特征提取,得到第一样本特征信息;采用GRU模块对第一样本特征信息进行序列特征提取,得到第二样本特征信息;将第二样本特征信息作为目标特征信息。
其中,Transformer Encoder模块取自Transformer的Encoder部分,结构如图7所示。Transformer Encoder模块中包含Multi-head self-attention(即,多头注意力层)、Add&Norm(即,残差和归一化层)、FFW(即,前馈网络层)。Add&Norm具有两层,在本申请实施例中将两层Add&Norm分别称为第一Add&Norm、第二Add&Norm。Transformer Encoder模块每一层的计算公式如下:
本申请实施例中,Multi-head self-attention的计算公式详见公式(1)和公式(2):
本申请实施例中,初始文本样本特征信息可以以矩阵的形式表征,Multi-headself-attention可以将初始文本样本特征信息的矩阵切分为若干份,形成若干子初始文本样本特征信息;针对每一子初始文本样本特征信息,本申请实施例可以采用公式(1)计算,得到每一子初始文本样本特征信息对应的注意力文本样本特征信息:
其中,Q是指初始文本样本特征信息对应的Query(即,查询特征);KT是指初始文本样本特征信息对应的Key(即,键特征)的转置;V是指初始文本样本特征信息对应的Value(即,值项特征);是指用于将Q KT的计算结果变成正态分布的参数;Atti是指第i个子初始文本样本特征信息对应的注意力文本样本特征信息。
本申请实施例将由公式(1)计算得到的所有注意力文本样本特征信息进行融合,得到融合后文本样本特征信息,详见公式(2):
MH(QKV)=Concat(Att1,Att2,...) 公式(2)
其中,MH(QKV)是指融合后文本样本特征信息;Concat函数用于将所有注意力文本样本特征信息进行拼接。
本申请实施例中通过第一Add&Norm将初始文本样本特征信息和融合后文本样本特征信息进行融合处理,得到目标融合后文本样本特征信息,详见公式(3):
其中,是指目标融合后文本样本特征信息;X是指初始文本样本特征信息;norml函数是激活函数。
本申请实施例通过FFW采用对目标融合后文本样本特征信息进行处理,得到处理后文本样本特征信息,FFW的计算公式详见公式(4):
其中,是指处理后文本样本特征信息;Linear函数是FFW的激活函数。
本申请实施例中,第二Add&Norm将目标融合后文本样本特征信息和处理后文本样本特征信息进行融合,得到第一样本特征信息,详见公式(5):
/>
其中,是指第一样本特征信息。
本申请实施例的GRU模块取自现有相关技术中的GUR循环神经网络,GRU模块可以一定程度上解决长期记忆和反向传播中梯度爆炸和梯度消失的问题。相比LSTM,使用GRU模块能够更容易对待训练对象分类模型进行训练,并且能够很大程度上提高待训练对象分类模型训练效率。
当然,在本申请实施例中,可以采用LSTM神经网络替换GRU模块。
本申请实施例采用GRU模块对第一样本特征信息进行序列特征提取,得到第二样本特征信息。
其中,本申请实施例的GRU模块的结构如图8所示,GRU模块具有有更新门和重置门,更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。重置门控制前一状态有多少信息被写入到当前的候选集上,重置门越小,前一状态的信息被写入的越少。
S203、计算机设备根据目标特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
本申请实施例根据目标特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型的方式可以如下:
例如,计算机设备可以获取至少一个待评估对象对应的参考文本特征信息;计算目标特征信息针对参考文本特征信息的参考权重信息;根据参考权重信息,对文本样本的目标特征信息进行融合处理,得到文本样本针对待评估对象的融合后特征信息;根据融合后特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
其中,在本申请实施例中,当目标特征信息为第二样本特征信息时,本申请实施例的Attention-Pooling模块可以用于将GRU模块得到的第二样本特征信息和参考文本特征信息相关联,从而增加训练后对象分类模型对文本分类的准确性。
其中,本申请实施例获取至少一个待评估对象对应的参考文本特征信息的方式可以为:本申请实施例获取至少一个待评估对象的参考文本;采用词嵌入层对参考文本进行特征提取,得到至少一个待评估对象对应的参考文本特征信息。
其中,本申请实施例可以对候选参考文本进行修改,得到参考文本,如此使得不同待评估对象的参考文本之间具有差异性,且参考文本与所属的待评估对象相关联。
其中,目标特征信息包括文本样本的若干目标特征信息。本申请实施例可以对文本样本进行分词处理,得到文本样本的若干分词文本;对每一分词文本进行特征提取的,得到文本样本对应的若干目标特征信息。
其中,本申请实施例计算目标特征信息针对参考文本特征信息的参考权重信息的方式可以为:计算机设备计算目标特征信息和参考文本特征信息之间的候选相似度信息;根据候选相似度信息,确定目标特征信息针对参考文本特征信息的参考权重信息。
本申请实施例可以对候选相似度信息进行归一化处理,得到参考权重信息。
例如,本申请实施例的Attention-Pooling模块的结构如图9所示。本申请实施例的Attention-Pooling模块将目标特征信息作为Attention-Pooling模块的Key(即,键特征)和Value(即,值项特征),将参考文本特征信息作为Query(即,查询特征),先将Query和Key进行点积,得到Query和Key之间的候选相似度信息,然后将候选相似度信息输入Softmax层,通过Softmax函数计算,得到归一化后目标特征信息和参考文本特征信息的概率权重,概率权重即为参考权重信息。
其中,当对象为美食商家时,参考文本特征信息可以包括待评估对象为餐食味道的参考文本特征信息、待评估对象为卫生的参考文本特征信息、待评估对象为服务质量的参考文本特征信息。
然后,针对每一待评估对象对应的参考文本特征信息,Attention-Pooling模块根据参考文本特征信息对应的参考权重信息,将文本样本的若干目标特征信息进行加权求和,得到参考分类信息,参考分类信息表征每一待评估对象对应的参考分类信息。
基于上述,每一待评估对象对应的参考分类信息通过Attention-Pooling模块的Attention层后,可以得到维度为m×n的张量,其中m为标签个数,n为隐藏层维度。
基于上述Attention-Pooling模块基于参考分类信息所得到的维度为m×n的张量,本申请实施例通过线性分类器模块对文本样本进行分类处理。线性分类器模块的结构如图10所示,线性分类器模块包括线性层和softmax层。
其中,根据参考分类信息,线性分类器模块的线性层输出每一待评估对象的情感类别数量,然后,通过线性分类器模块的softmax层,输出每一待评估对象的情感类别的分类概率;针对每一待评估对象,根据待评估对象的情感类别的分类概率,选择文本样本的参考情感类别。其中,当待评估对象下的情感类别的分类概率最大时,该情感类别为该待评估对象的参考情感类别。
其中,本申请实施例中的线性分类器模块的线性层输出的每一待评估对象下的情感类别数量可以根据需求设定,例如,当情感类别的数量为3时,情感类别包括针对待评估对象的正面情感类别、负面情感类别、中性情感类别;当情感类别的数量为2时,情感类别包括针对待评估对象的正面情感类别、负面情感类别。
基于上述,本申请实施例计算参考情感类别和情感分类标签之间的第二损失值;根据第二损失值对待训练对象分类模型进行收敛,得到训练后对象分类模型。
另外,如图5所示,本申请实施例在待训练对象分类模型的线性分类器模块输出文本样本的参考情感类别之后,计算机设备获取参考情感类别对应的文本样本,并对参考情感类别对应的文本样本进行抽样复核,也即可以从参考情感类别对应的文本样本随机抽取目标文本样本,对目标文本样本重复数据清洗、数据扩增以及训练待训练对象分类模型等过程。
S204、计算机设备获取针对待评估对象的待分类文本。
其中,在本申请实施例中的待分类文本可以是计算机设备实时获取到的文本,例如,视频中的弹幕、美食商家的文字评论等。
S205、计算机设备采用训练后对象分类模型对待分类文本进行语义特征提取,得到第一文本特征信息。
其中,本申请实施例的第一文本特征信息可以为采用训练后对象分类模型的语义特征提取层进行特征提取到的特征信息。计算机设备采用训练后对象分类模型的词嵌入层对待分类文本进行特征提取,得到初始文本特征信息。
由于初始文本特征信息可以以矩阵的形式表征,基于此,本申请实施例可以通过训练后对象分类模型的语义特征提取层将初始文本特征信息的矩阵切分为若干份,形成若干子初始文本特征信息;根据子初始文本特征信息,确定子初始文本特征信息对应的注意力文本特征信息。然后,本申请实施例通过训练后对象分类模型将注意力文本特征信息进行融合,得到融合后文本特征信息;将融合后文本特征信息与初始文本特征信息进行融合,得到候选融合后文本特征信息;根据候选融合后文本特征信息,确定第一文本特征信息。此处的具体过程可参见前述待训练对象分类模型中Transformer Encoder模块的训练部分,此处不再赘述。
S206、计算机设备采用训练后对象分类模型对第一文本特征信息进行序列特征提取,得到第二文本特征信息。
本申请实施例可以采用序列特征提取层对第一文本特征信息进行序列特征提取,得到第二文本特征信息。序列特征提取层为训练后对象分类模型的GRU模块中的神经网络层。此处的具体过程可参见前述待训练对象分类模型中GRU模块的训练部分,此处不再赘述。
S207、计算机设备根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
其中,本申请实施例在根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的步骤之前,还可以获取至少一个待评估对象对应的模板文本特征信息。
在本申请实施例中,计算机设备可以获取到目标待评估对象对应的模板文本,并对该模板文本进行特征提取,得到目标待评估对象对应的模板文本特征信息。本申请实施例中的模板文本可以是指预先收集并对应待评估对象进行存储的文本。
基于上述,本申请实施例根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式可以为:计算机设备根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
基于上述,计算机设备根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式可以如下:
例如,计算机设备可以计算第二文本特征信息针对模板文本特征信息的权重信息;根据权重信息,对第二文本特征信息进行融合处理,得到待分类文本针对待评估对象的目标融合后文本特征信息;根据目标融合后文本特征信息,计算得到待评估对象中目标待评估对象对应的目标情感类别。
其中,本申请实施例计算第二文本特征信息针对模板文本特征信息的权重信息的方式可以为:计算第二文本特征信息和模板文本特征信息之间的目标相似度信息;根据目标相似度信息,计算得到第二文本特征信息针对模板文本特征信息的权重信息。
其中,本申请实施例可以将目标相似度信息进行归一化处理,得到第二文本特征信息针对模板文本特征信息的权重信息。
其中,本申请实施例根据权重信息,对第二文本特征信息进行融合处理的方式可以是加权求和,从而实现融合处理。
基于上述,计算机设备根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别的方式可以为:计算机设备可以根据目标融合后文本特征信息,计算得到待评估对象的分类信息;根据分类信息,确定目标待评估对象对应的目标情感类别。
其中,本申请实施例采用线性分类器根据目标融合后文本特征信息对待评估对象进行分类处理,得到待评估对象的分类信息,分类信息表征待评估对象中每一情感类别的分类概率。当分类信息大于预设概率阈值时,分类信息对应的情感类别为目标待评估对象对应的目标情感类别。
步骤S207的具体内容可参见前述待训练对象分类模型中Attention-Pooling模块和线性分类器模块的训练部分,此处不再赘述。
基于上述,本申请实施例可以将Transformer Encoder模块和GRU模块相结合,保留了Transformer Encoder模块和GRU模块两者的优点,使训练后对象分类模型既能像循环神经网络一样很好的提取文本序列特征信息,防止长文本的梯度消失、梯度爆炸问题,又可以更好地提取文本语义特征信息。再之后的Attention-Pooling模块将参考文本特征信息与GRU模块提取到的第二样本特征信息进行计算,引入参考文本特征信息的语义信息,如此可以提高训练后对象分类模型对情感类别预测的准确性和可靠性。
除上述之外,本申请实施例可以通过更改待训练对象分类模型的网络参数,以及参考文本特征信息的待评估对象、参考文本特征信息的数量,可以满足不同业务场景下对高召回率、高准确率的不同业务逻辑要求,例如,本申请实施例可以应用于图文安全审核的辱骂屏蔽、直播互动、情感分析、定向推荐等业务中,可以增加业务处理效率,从而减少人工操作,并规避业务风险。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本申请实施例可以获取针对待评估对象的待分类文本;对待分类文本进行语义特征提取,得到第一文本特征信息;对第一文本特征信息进行序列特征提取,得到第二文本特征信息;根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别;由于本申请实施例可以对待分类文本进行语义特征提取,得到第一文本特征信息且对第一文本特征信息进行序列特征提取,得到第二文本特征信息,如此可以提取到具有文本语义特征信息和序列特征信息的高质量第二文本特征信息,从而可以根据第二文本特征信息,准确地确定待评估对象中目标待评估对象对应的目标情感类别。
为了更好地实施以上方法,本申请实施例还提供一种对象分类装置,该对象分类装置可以集成在计算机设备,比如服务器或终端等设备中,该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。
例如,如图11所示,该对象分类装置可以包括第一获取单元301、第一提取单元302、第二提取单元303、确定单元304、训练单元305和第二获取单元306,如下:
(1)第一获取单元301;
第一获取单元301,可以用于获取针对待评估对象的待分类文本。
(2)第一提取单元302;
第一提取单元302,可以用于对待分类文本进行语义特征提取,得到第一文本特征信息。
在一些实施例中,第一提取单元302,具体可以用于对待分类文本进行特征提取,得到初始文本特征信息;根据初始文本特征信息,确定第一文本特征信息。
(3)第二提取单元303;
第二提取单元303,可以用于对第一文本特征信息进行序列特征提取,得到第二文本特征信息。
(4)确定单元304;
确定单元304,可以用于根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元304,具体可以用于根据第二文本特征信息和模板文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元304,具体可以用于计算第二文本特征信息针对模板文本特征信息的权重信息;根据权重信息,对第二文本特征信息进行融合处理,得到待分类文本针对待评估对象的目标融合后文本特征信息;根据目标融合后文本特征信息,计算得到待评估对象中目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元304,具体可以用于计算第二文本特征信息和模板文本特征信息之间的目标相似度信息;根据目标相似度信息,计算得到第二文本特征信息针对模板文本特征信息的权重信息。
在一些实施例中,确定单元304,具体可以用于根据根据目标融合后文本特征信息,计算得到待评估对象的分类信息;根据分类信息,确定目标待评估对象对应的目标情感类别。
在一些实施例中,确定单元304,具体可以用于根据第二文本特征信息,从待评估对象中筛选出待分类文本对应的目标待评估对象;根据目标待评估对象对应的模板文本特征信息和第二文本特征信息,计算得到目标待评估对象对应的目标情感类别。
(5)训练单元305;
第一文本特征信息为采用训练后对象分类模型进行特征提取到的信息;训练单元305,可以用于获取文本样本集合,文本样本集合包括至少一个标注情感分类标签的文本样本;采用待训练对象分类模型对文本样本进行特征提取,得到文本样本对应的目标特征信息;根据目标特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
在一些实施例中,训练单元305,具体可以用于获取至少一个待评估对象对应的参考文本特征信息;计算目标特征信息针对参考文本特征信息的参考权重信息;根据参考权重信息,对文本样本的目标特征信息进行融合处理,得到文本样本针对待评估对象的融合后特征信息;根据融合后特征信息和情感分类标签,对待训练对象分类模型进行收敛,得到训练后对象分类模型。
在一些实施例中,训练单元305,具体可以用于获取候选文本样本集合和情感分类标签,候选文本样本集合包括至少一个候选文本样本;对候选文本样本进行预处理,得到文本样本;根据情感分类标签对文本样本进行标注,生成文本样本集合。
在一些实施例中,训练单元305,具体可以用于采用待训练对象分类模型的语义特征提取层对文本样本进行语义特征提取,得到文本样本对应的第一样本特征信息;采用待训练对象分类模型的序列特征提取层对文本样本进行序列特征提取,得到文本样本的第二样本特征信息;将第二样本特征信息作为目标特征信息。
(6)第二获取单元306;
第二获取单元306,可以用于获取至少一个待评估对象对应的模板文本特征信息。
由上可知,本申请实施例的第一获取单元301可以用于获取针对待评估对象的待分类文本;第一提取单元302可以用于对待分类文本进行语义特征提取,得到第一文本特征信息;第二提取单元303可以用于对第一文本特征信息进行序列特征提取,得到第二文本特征信息;确定单元304可以用于根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别;由于本申请实施例可以对待分类文本进行语义特征提取,得到第一文本特征信息且对第一文本特征信息进行序列特征提取,得到第二文本特征信息,如此可以提取到具有文本语义特征信息和序列特征信息的高质量第二文本特征信息,从而可以根据第二文本特征信息,准确地确定待评估对象中目标待评估对象对应的目标情感类别。
本申请实施例还提供一种计算机设备,如图12所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图12中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行计算机设备的各种功能和处理数据。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和计算机程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
计算机设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息通讯,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器401会按照如下的指令,将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的计算机程序,从而实现各种功能,如下:
获取针对待评估对象的待分类文本;对待分类文本进行语义特征提取,得到第一文本特征信息;对第一文本特征信息进行序列特征提取,得到第二文本特征信息;根据第二文本特征信息,确定待评估对象中目标待评估对象对应的目标情感类别。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种对象分类方法。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种对象分类方法中的步骤,因此,可以实现本申请实施例所提供的任一种对象分类方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种对象分类方法、装置、计算机设备、计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (15)
1.一种对象分类方法,其特征在于,包括:
获取针对待评估对象的待分类文本;
对所述待分类文本进行语义特征提取,得到第一文本特征信息;
对所述第一文本特征信息进行序列特征提取,得到第二文本特征信息;
根据所述第二文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别。
2.根据权利要求1所述的对象分类方法,其特征在于,所述第一文本特征信息为采用训练后对象分类模型进行特征提取到的信息;所述对所述待分类文本进行语义特征提取之前,所述方法还包括:
获取文本样本集合,所述文本样本集合包括至少一个标注情感分类标签的文本样本;
采用待训练对象分类模型对所述文本样本进行特征提取,得到所述文本样本对应的目标特征信息;
根据所述目标特征信息和所述情感分类标签,对所述待训练对象分类模型进行收敛,得到所述训练后对象分类模型。
3.根据权利要求2所述的对象分类方法,其特征在于,所述根据所述目标特征信息和所述情感分类标签,对所述待训练对象分类模型进行收敛,得到所述训练后对象分类模型,包括:
获取至少一个待评估对象对应的参考文本特征信息;
计算所述目标特征信息针对所述参考文本特征信息的参考权重信息;
根据所述参考权重信息,对所述文本样本的目标特征信息进行融合处理,得到所述文本样本针对所述待评估对象的融合后特征信息;
根据所述融合后特征信息和所述情感分类标签,对所述待训练对象分类模型进行收敛,得到所述训练后对象分类模型。
4.根据权利要求2所述的对象分类方法,其特征在于,所述获取文本样本集合之前,所述方法还包括:
获取候选文本样本集合和所述情感分类标签,所述候选文本样本集合包括至少一个候选文本样本;
对所述候选文本样本进行预处理,得到文本样本;
根据所述情感分类标签对所述文本样本进行标注,生成文本样本集合。
5.根据权利要求2所述的对象分类方法,其特征在于,所述采用待训练对象分类模型对所述文本样本进行特征提取,得到所述文本样本对应的目标特征信息,包括:
采用所述待训练对象分类模型的语义特征提取层对所述文本样本进行语义特征提取,得到所述文本样本对应的第一样本特征信息;
采用所述待训练对象分类模型的序列特征提取层对所述文本样本进行序列特征提取,得到所述文本样本的第二样本特征信息;
将所述第二样本特征信息作为所述目标特征信息。
6.根据权利要求1所述的对象分类方法,其特征在于,所述根据所述第二文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别之前,所述方法还包括:
获取至少一个所述待评估对象对应的模板文本特征信息;
所述根据所述第二文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别,包括:根据所述第二文本特征信息和所述模板文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别。
7.根据权利要求6所述的对象分类方法,其特征在于,所述根据所述第二文本特征信息和所述模板文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别,包括:
计算所述第二文本特征信息针对所述模板文本特征信息的权重信息;
根据所述权重信息,对所述第二文本特征信息进行融合处理,得到所述待分类文本针对所述待评估对象的目标融合后文本特征信息;
根据所述目标融合后文本特征信息,计算得到所述待评估对象中目标待评估对象对应的目标情感类别。
8.根据权利要7所述的对象分类方法,其特征在于,所述计算所述第二文本特征信息针对所述模板文本特征信息的权重信息,包括:
计算所述第二文本特征信息和所述模板文本特征信息之间的目标相似度信息;
根据所述目标相似度信息,计算得到所述第二文本特征信息针对所述模板文本特征信息的权重信息。
9.根据权利要求7所述的对象分类方法,其特征在于,所述根据所述目标融合后文本特征信息,计算得到所述待评估对象中目标待评估对象对应的目标情感类别,包括:
根据所述目标融合后文本特征信息,计算得到所述待评估对象的分类信息;
根据所述分类信息,确定所述目标待评估对象对应的目标情感类别。
10.根据权利要求6所述的对象分类方法,其特征在于,所述根据所述第二文本特征信息和所述模板文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别,包括:
根据所述第二文本特征信息,从所述待评估对象中筛选出待分类文本对应的目标待评估对象;
根据所述目标待评估对象对应的模板文本特征信息和所述第二文本特征信息,计算得到所述目标待评估对象对应的目标情感类别。
11.根据权利要求1所述的对象分离方法,其特征在于,所述对所述待分类文本进行语义特征提取,得到第一文本特征信息,包括:
对所述待分类文本进行特征提取,得到初始文本特征信息;
根据所述初始文本特征信息,确定第一文本特征信息。
12.一种对象分类装置,其特征在于,包括:
第一获取单元,用于获取针对待评估对象的待分类文本;
第一提取单元,用于对所述待分类文本进行语义特征提取,得到第一文本特征信息;
第二提取单元,用于对所述第一文本特征信息进行序列特征提取,得到第二文本特征信息;
确定单元,用于根据所述第二文本特征信息,确定所述待评估对象中目标待评估对象对应的目标情感类别。
13.一种计算机设备,其特征在于,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至11任一项所述的对象分类方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至11任一项所述的对象分类方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至11任一项所述的对象分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210204715.3A CN116756306A (zh) | 2022-03-03 | 2022-03-03 | 对象分类方法、装置、计算机设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210204715.3A CN116756306A (zh) | 2022-03-03 | 2022-03-03 | 对象分类方法、装置、计算机设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116756306A true CN116756306A (zh) | 2023-09-15 |
Family
ID=87959553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210204715.3A Pending CN116756306A (zh) | 2022-03-03 | 2022-03-03 | 对象分类方法、装置、计算机设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116756306A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079081A (zh) * | 2023-10-16 | 2023-11-17 | 山东海博科技信息系统股份有限公司 | 一种多模态视频文本处理模型训练方法及系统 |
-
2022
- 2022-03-03 CN CN202210204715.3A patent/CN116756306A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117079081A (zh) * | 2023-10-16 | 2023-11-17 | 山东海博科技信息系统股份有限公司 | 一种多模态视频文本处理模型训练方法及系统 |
CN117079081B (zh) * | 2023-10-16 | 2024-01-26 | 山东海博科技信息系统股份有限公司 | 一种多模态视频文本处理模型训练方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Sentiment analysis of multimodal twitter data | |
CN110188194B (zh) | 一种基于多任务学习模型的假新闻检测方法及系统 | |
CN105426356B (zh) | 一种目标信息识别方法和装置 | |
CN111767403B (zh) | 一种文本分类方法和装置 | |
CN113392209B (zh) | 一种基于人工智能的文本聚类方法、相关设备及存储介质 | |
CN112307351A (zh) | 用户行为的模型训练、推荐方法、装置和设备 | |
CN111708888A (zh) | 基于人工智能的分类方法、装置、终端和存储介质 | |
CN112069312B (zh) | 一种基于实体识别的文本分类方法及电子装置 | |
CN111339260A (zh) | 一种基于bert和qa思想的细粒度情感分析方法 | |
CN113590928A (zh) | 内容推荐方法、装置及计算机可读存储介质 | |
CN110489649B (zh) | 标签关联内容的方法及装置 | |
CN112257452A (zh) | 情感识别模型的训练方法、装置、设备和存储介质 | |
CN112100375A (zh) | 文本信息生成方法、装置、存储介质及设备 | |
CN110955750A (zh) | 评论区域和情感极性的联合识别方法、装置、电子设备 | |
US20230073602A1 (en) | System of and method for automatically detecting sarcasm of a batch of text | |
CN111753082A (zh) | 基于评论数据的文本分类方法及装置、设备和介质 | |
CN115017303A (zh) | 基于新闻文本进行企业风险评估的方法、计算设备和介质 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN111462752A (zh) | 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法 | |
CN116226785A (zh) | 目标对象识别方法、多模态识别模型的训练方法和装置 | |
Nasim et al. | ABSA toolkit: An open source tool for aspect based sentiment analysis | |
CN115659008A (zh) | 大数据信息反馈的信息推送系统、方法、电子设备及介质 | |
CN115269781A (zh) | 模态关联度预测方法、装置、设备、存储介质及程序产品 | |
CN116756306A (zh) | 对象分类方法、装置、计算机设备及计算机可读存储介质 | |
CN113435182A (zh) | 自然语言处理中分类标注的冲突检测方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |