CN114297380A - 一种数据处理方法、装置、设备及存储介质 - Google Patents

一种数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114297380A
CN114297380A CN202111583599.2A CN202111583599A CN114297380A CN 114297380 A CN114297380 A CN 114297380A CN 202111583599 A CN202111583599 A CN 202111583599A CN 114297380 A CN114297380 A CN 114297380A
Authority
CN
China
Prior art keywords
text
processed
target
target object
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111583599.2A
Other languages
English (en)
Inventor
刘佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111583599.2A priority Critical patent/CN114297380A/zh
Publication of CN114297380A publication Critical patent/CN114297380A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本公开关于一种数据处理方法、装置、设备及存储介质,涉及计算机技术领域,可以准确地确定目标账户针对于目标对象的情感倾向。该数据处理方法包括:获取目标账户发布的待处理文本;从预设对象集合中,确定与待处理文本匹配的至少一个目标对象;基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果;分类结果用于表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息。

Description

一种数据处理方法、装置、设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
目前,在用户消耗大量时间于短视频应用上的同时,这些应用上产生了大量的用户原创内容(user generated content,UCG)。这些内容大多是用户对于各种事物的评论,不仅代表了用户的观点和看法,往往也蕴含了用户对于各种事物的喜好和情感。
相关技术,一般是通过短视频品牌识别系统,识别关于一个品牌的短视频,结合评论内容的整体情感倾向来对该品牌进行评价。然而,一个品牌的短视频下所有的评论并不一定和该品牌相关,通过该方法很可能导致错误分析对该品牌的情感倾向。
发明内容
本公开提供一种数据处理方法、装置、设备及存储介质,可以准确地确定目标账户针对于目标对象的情感倾向。
本公开实施例的技术方案如下:
根据本公开实施例的第一方面,提供一种数据处理方法,该方法可以应用于电子设备。该方法可以包括:获取目标账户发布的待处理文本;从预设对象集合中,确定与待处理文本匹配的至少一个目标对象;基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果;分类结果用于表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息。
可选的,基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果的方法具体包括:获取至少一个目标对象的对象关联信息;对象关联信息用于表征与目标对象关联的特征信息;基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,获得待处理文本对应的分类结果。
可选的,基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,获得待处理文本对应的分类结果的方法具体包括:分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对;将至少一个目标文本对输入到情感分类模型,对目标文本对进行处理,以得到待处理文本的分类结果。
可选的,获取至少一个目标对象的对象关联信息的方法具体包括:调用知识增强模块,获取目标对象的对象关联信息;知识增强模块中存储有包括目标对象在内的多个对象的对象关联信息。
可选的,从预设对象集合中,确定与待处理文本匹配的目标对象的方法具体包括:获取预设对象集合,预设对象集合包括多个候选对象;确定预设对象集合中的每个候选对象与待处理文本的匹配度;从预设对象集合中,选取匹配度大于预设阈值的候选对象作为目标对象。
可选的,确定预设对象集合中的每个候选对象与待处理文本的匹配度的方法具体包括:确定与多个候选对象一一对应的多个待匹配集合;每个待匹配集合包括一个初始对象和待处理文本;将多个待匹配集合输入到对象匹配模型中,以得到每个候选对象与待处理文本的匹配度;对象匹配模型用于确定每个候选对象与待处理文本的匹配度。
可选的,该数据处理方法还包括:获取多个第一训练样本;多个第一训练样本包括正样本和负样本;多个第一训练样本中的正样本包括第一文本以及、与第一文本相匹配的第一对象所构成的样本文本对;多个第一训练样本中的负样本包括第二文本以及、与第二文本不匹配的第二对象所构成的样本文本对;基于多个第一训练样本对初始对象匹配模型进行训练,训练得到对象匹配模型。
可选的,该数据处理方法还包括:获取多个第二训练样本;多个第二训练样本包括正样本、中性样本和负样本;多个第二训练样本中的正样本包括:第三对象、针对于第三对象的情感倾向为正向情感倾向的第三文本、第三对象的对象关联信息;多个第二训练样本中的中性样本包括:第四对象、针对于第四对象的情感倾向为中性情感倾向的第四文本、第四对象的对象关联信息;多个第二训练样本中的负样本包括:第五对象、针对于第五对象的情感倾向为负向情感倾向的第五文本、第五对象的对象关联信息;基于多个第二训练样本对初始情感分类模型进行训练,训练得到情感分类模型。
根据本公开实施例的第二方面,提供一种数据处理装置,可以应用于电子设备。该数据处理装置可以包括:获取单元、确定单元和处理单元;获取单元,用于获取目标账户发布的待处理文本;确定单元,用于从预设对象集合中,确定与待处理文本匹配的至少一个目标对象;处理单元,用于基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果;分类结果用于表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息。
可选的,处理单元,具体用于:获取至少一个目标对象的对象关联信息;对象关联信息用于表征与目标对象关联的特征信息;基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,获得待处理文本对应的分类结果。
可选的,处理单元,具体用于:分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对;将至少一个目标文本对输入到情感分类模型,对目标文本对进行处理,以得到待处理文本的分类结果。
可选的,处理单元,具体用于:调用知识增强模块,获取目标对象的对象关联信息;知识增强模块中存储有包括目标对象在内的多个对象的对象关联信息。
可选的,确定单元,具体用于:获取预设对象集合,预设对象集合包括多个候选对象;确定预设对象集合中的每个候选对象与待处理文本的匹配度;从预设对象集合中,选取匹配度大于预设阈值的候选对象作为目标对象。
可选的,确定单元,具体用于:确定与多个候选对象一一对应的多个待匹配集合;每个待匹配集合包括一个初始对象和待处理文本;将多个待匹配集合输入到对象匹配模型中,以得到每个候选对象与待处理文本的匹配度;对象匹配模型用于确定每个候选对象与待处理文本的匹配度。
可选的,该数据处理装置还包括:第一训练单元;获取单元,还用于获取多个第一训练样本;多个第一训练样本包括正样本和负样本;多个第一训练样本中的正样本包括第一文本以及、与第一文本相匹配的第一对象所构成的样本文本对;多个第一训练样本中的负样本包括第二文本以及、与第二文本不匹配的第二对象所构成的样本文本对;第一训练单元,用于基于多个第一训练样本对初始对象匹配模型进行训练,训练得到对象匹配模型。
可选的,该数据处理装置还包括:第二训练单元;获取单元,还用于获取多个第二训练样本;多个第二训练样本包括正样本、中性样本和负样本;多个第二训练样本中的正样本包括:第三对象、针对于第三对象的情感倾向为正向情感倾向的第三文本、第三对象的对象关联信息;多个第二训练样本中的中性样本包括:第四对象、针对于第四对象的情感倾向为中性情感倾向的第四文本、第四对象的对象关联信息;多个第二训练样本中的负样本包括:第五对象、针对于第五对象的情感倾向为负向情感倾向的第五文本、第五对象的对象关联信息;第二训练单元,用于基于多个第二训练样本对初始情感分类模型进行训练,训练得到情感分类模型。
根据本公开实施例的第三方面,提供一种电子设备,可以包括:处理器和用于存储处理器可执行指令的存储器;其中,处理器被配置为执行所述指令,以实现上述第一方面中任一种可选地数据处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述第一方面中任一种可选地数据处理方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面中任一种可选地实现方式所述的数据处理方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
本公开的实施例提供的技术方案至少带来以下有益效果:
基于上述任一方面,本公开中,在获取目标账户发布的待处理文本,以及从预设对象集合中,确定与待处理文本匹配的至少一个目标对象后,可以基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,以获得待处理文本对应的分类结果。这样一来,由于至少一个目标对象为与目标账户发布的待处理文本匹配的对象,因此,本公开中情感分类模型输出的分类结果,可以准确地表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息,提高了确定目标账户针对于目标对象的情感倾向的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1示出了本公开实施例提供的一种数据处理方法的流程示意图;
图2示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图3A示出了本公开实施例提供的一种数据处理方法的流程示意图;
图3B示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图4示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图5示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图6示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图7示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图8A示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图8B示出了本公开实施例提供的又一种数据处理方法的流程示意图;
图9示出了本公开实施例提供的一种数据处理装置的结构示意图;
图10示出了本公开实施例提供的一种终端的结构示意图;
图11示出了本公开实施例提供的一种服务器的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
还应当理解的是,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素和/或组件的存在或添加。
本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据。
如背景技术中所描述,为了挖掘用户评论中所蕴含的用户的情感,实时捕捉用户的兴趣,从而实现广告推广的主人群划分和关于具体事物的舆情分析等。现有对于用户评论分析的方案,一般是通过短视频品牌识别系统,识别关于一个品牌的短视频,直接将该品牌作为目标,结合评论内容的整体情感倾向进行评价。即如果评论整体为负向,那么判断发表评论用户对品牌是负向情感,如果评论整体为正向,那么判断发表评论用户对品牌是正向情感,对品牌感兴趣。
但是,一个品牌的短视频下所有的评论并不一定和该品牌相关,若仅对评论内容的整体情感倾向进行分析,则很可能将对于其他品牌或事物的评论错判为对于该品牌的评论,因此,如何准确地分析用户发表的评论对于该品牌的情感倾向,是亟待解决的问题。
基于此,本公开实施例提供一种数据处理方法,本公开中,在获取目标账户发布的待处理文本,以及从预设对象集合中,确定与待处理文本匹配的至少一个目标对象后,可以基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,以获得待处理文本对应的分类结果。这样一来,由于至少一个目标对象为与目标账户发布的待处理文本匹配的对象,因此,本公开中情感分类模型输出的分类结果,可以准确地表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息,提高了确定目标账户针对于目标对象的情感倾向的准确性。
以下对本公开实施例提供的数据处理方法进行示例性说明:
本公开提供的数据处理方法可以应用于电子设备。
一些实施例中,电子设备可以是服务器,也可以是终端,还可以是其他用于进行数据处理的电子设备,本公开对此不作限定。
其中,服务器可以是单独的一个服务器,或者,也可以是由多个服务器构成的服务器集群。部分实施方式中,服务器集群还可以是分布式集群。本公开对服务器的具体实现方式也不作限制。
终端可以是手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(personal digital assistant,PDA)、增强现实(augmented reality,AR)\虚拟现实(virtual reality,VR)设备等可以安装并使用内容社区应用(如快手)的设备,本公开对该电子设备的具体形态不作特殊限制。其可以与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互。
下面结合附图对本公开实施例提供的数据处理方法进行详细介绍。
当数据处理方法应用于电子设备时,本公开实施例提供的数据处理方法包括:电子设备基于多个第一训练数据对初始对象匹配模型进行训练,训练得到对象匹配模型的流程(简称为“对象匹配模型训练流程”)、电子设备基于多个第二训练数据对初始情感分类模型进行训练,训练得到情感分类模型的流程(简称为“情感分类模型训练流程”),以及电子设备根据对象匹配模型和情感分类模型,确定目标账户对待处理文本对应的至少一个目标对象的情感倾向信息的流程(简称为“情感倾向信息确定流程”)。
下面先对“对象匹配模型训练流程”进行描述。
如图1所示,“对象匹配模型训练流程”包括:S101-S102。
S101、电子设备获取多个第一训练样本。
具体的,在训练对象匹配模型时,电子设备可以获取多个第一训练样本,并将获取到的多个第一训练样本作为训练样本,用于训练得到对象匹配模型。
其中,多个第一训练样本包括正样本和负样本。多个第一训练样本中的正样本包括第一文本以及、与第一文本相匹配的第一对象所构成的样本文本对。多个第一训练样本中的负样本包括第二文本以及、与第二文本不匹配的第二对象所构成的样本文本对。
可选的,上述第一对象和第二对象可以是某个品牌、人物、游戏等对象。第一文本和第二文本可以是针对于上述对象对应的多媒体资源的评论内容。该多媒体资源可以是短视频、长视频、文章等内容。
作者用户在发布关于某个特定对象的多媒体资源后,观众用户可以在该多媒体资源对应的评论区发表评论内容。
在观众用户发表针对于某个特定对象对应的多媒体资源的评论内容后,服务器可以获取该评论内容。终端也可以在显示该评论内容前获取到该评论内容。在这种情况下,电子设备可以通过服务器或者终端获取有关于各类对象的文本。
示例性的,当电子设备从短视频服务器获取关于某个特定对象的评论文本时,可以向短视频应用服务器发送用于获取关于某个特定对象的评论文本的数据请求。短视频应用服务器在接收到数据请求后,从数据库中读取关于某个特定对象的评论文本,并向电子设备发送关于某个特定对象的评论文本。相应的,电子设备接收短视频应用服务器发送的关于某个特定对象的评论文本。
当电子设备从终端获取关于某个特定对象的评论文本时,可以向终端发送用于获取关于某个特定对象的评论文本的数据请求。终端在接收到数据请求后,从数据库中读取关于某个特定对象的评论文本,并向电子设备发送关于某个特定对象的评论文本。相应的,电子设备接收终端发送的关于某个特定对象的评论文本。
在获取关于特定对象的评论文本后,工作人员可以通过电子设备的输出端查看关于特定对象的评论文本,并为每一条评论文本标注匹配度,以用于表征每一条评论文本是否和该特定对象相匹配。相应的,电子设备记录每一条评论文本的匹配度。
当一条评论文本与特定对象相匹配时,则电子设备可以将由该评论文本以及、与该评论文本相匹配的特定对象构成的样本文本对确定为多个第一训练样本中的正样本。
当一条评论文本与特定对象不匹配时,则电子设备可以将由该评论文本以及、与该评论文本不匹配的特定对象构成的样本文本对确定为多个第一训练样本中的负样本。
由于每一条评论文本以及、每一条评论文本相匹配或者不匹配的特定对象构成的样本文本对均被确定为一个第一训练样本,因此,本公开能够细粒度识别和特定对象相关的评论文本。
可选的,匹配度可以用于表征评论文本与特定对象有关,也可以用于表征评论文本与特定对象无关。当评论文本与特定对象有关时,匹配度可以具体包括:评论文本针对于特定对象是正向情感、评论文本针对于特定对象是中性情感、评论文本针对于特定对象是负向情感等。
其中,正向情感代表与特定对象的正面评价相关的正向情感,负向代表与特定对象的负面评价相关的负向情感,中性情感代表和特定对象相关但未明确情感倾向。
这样一来,本公开便可以识别出评论文本中关于特定对象的评论文本和与特定对象无关的评论文本。
为了让多个第一训练样本中的负样本更加多样性,并增加训练难度,可以采样其他对象的评论文本和该特定对象构成的样本文本对作为多个第一训练样本中的负样本。
需要说明的是,一个评论文本可以是关于一个对象的评论内容,也可以是关于至少两个对象的评论内容。例如,A还不错,为关于一个对象A的评论内容,而A比B要更好,则是关于A和B两个对象的评论内容。当一个文本为关于至少两个对象的评论内容时,则电子设备根据该文本和至少两个对象,确定至少两个第一训练样本。这样一来,本公开可以识别同一个评论文本中的多个对象,以及多个对象的对比情感。
示例性的,如表1所示,预设获取关于对象A的评论内容时,获取到3条评论文本,其中1条还涉及到对象B,则电子设备可以根据文本“B还是比A要好”,确定序号为1和3的两个第一训练样本。此时,序号为1、2和3的三个第一训练样本为正样本,序号为4的第一训练样本为负样本。并且,序号为2的正样本中的评论文本“看起来是A”,也可以与对象B组成多个第一训练样本中的负样本,即序号为5的第一训练样本中的负样本。
表1
序号 评论样本 品牌 结果
1 B还是比A要好 B 正向情感
2 看起来是A A 中性情感
3 B还是比A要好 A 负向情感
4 主播666 A 无关
5 看起来是A B 无关
S102、电子设备基于多个第一训练样本对初始对象匹配模型进行训练,训练得到对象匹配模型。
具体的,在获取多个第一训练样本后,电子设备可以基于多个第一训练样本对初始对象匹配模型进行训练,训练得到对象匹配模型。
其中,对象匹配模型用于确定每个候选对象与待处理文本的匹配度。
可选的,电子设备在基于多个第一训练样本对初始对象匹配模型进行训练,训练得到对象匹配模型时,可以采用基于转换器的双向编码表征(bidirectional encoderrepresentations from transformers,BERT)的语言表示模型进行训练,也可以是本领域现有的其他模型(例如GPT(generative pre-training)模型),本实施例对此不作限定。
可选的,当所选取的模型不同时,多个第一训练样本的输入格式也不同。
需要说明的是,对象匹配模型为一个二分类模型,可以将每个候选对象与待处理文本的匹配度进行二分类,以确定每个候选对象与待处理文本是否匹配。
可选的,为了便于从多个匹配度中筛选出满足条件的匹配度,电子设备可以将对象匹配模型输出的匹配度进行数值化映射。例如,候选对象与待处理文本不匹配时,匹配度对应分值0。候选对象与待处理文本相匹配、且为中性情感时,匹配度对应分值1。候选对象与待处理文本相匹配、且为负向情感时,匹配度对应分值2。候选对象与待处理文本相匹配、且为正向情感时,匹配度对应分值3。
上述实施例提供的技术方案至少带来以下有益效果:由S101-S102可知,在获取多个第一训练样本后,由于多个第一训练样本中的正样本包括第一文本以及、与第一文本相匹配的第一对象所构成的样本文本对,且多个第一训练样本中的负样本包括第二文本以及、与第二文本不匹配的第二对象所构成的样本文本对,因此,基于多个第一训练样本,可以训练得到用于确定每个候选对象与待处理文本的匹配度的对象匹配模型。这样一来,本公开可以在获取待处理文本和候选对象后,将获取到的待处理文本和对象输入至对象匹配模型中,从而可以快速、准确的确定出待处理文本和候选对象的匹配度,提高了确定待处理文本与候选对象是否匹配的准确性。
下面再对“情感分类模型训练流程”进行描述。
如图2所示,“情感分类模型训练流程”包括:S201-S202。
S201、电子设备获取多个第二训练样本。
具体的,在训练情感分类模型时,电子设备可以获取多个第二训练样本,并将获取到的多个第二训练样本作为训练样本,用于训练得到分类模型。
其中,多个第二训练样本包括正样本、中性样本和负样本。多个第二训练样本中的正样本包括:第三对象、针对于第三对象的情感倾向为正向情感倾向的第三文本、第三对象的对象关联信息。多个第二训练样本中的中性样本包括:第四对象、针对于第四对象的情感倾向为中性情感倾向的第四文本、第四对象的对象关联信息。多个第二训练样本中的负样本包括:第五对象、针对于第五对象的情感倾向为负向情感倾向的第五文本、第五对象的对象关联信息。
可选的,电子设备获取多个第二训练样本的方法可以参考S101中,电子设备获取多个第一训练样本的方法,在此不再赘述。
S202、电子设备基于多个第二训练样本对初始情感分类模型进行训练,训练得到情感分类模型。
具体的,在获取多个第二训练数据后,电子设备可以基于多个第二训练样本对初始情感分类模型进行训练,训练得到情感分类模型。
其中,情感分类模型用于确定分类结果。分类结果用于表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息。
可选的,电子设备在基于多个第二训练样本,训练情感分类模型时,可以采用基于转换器的双向编码表征(bidirectional encoder representations from transformers,BERT)的语言表示模型进行训练,也可以是本领域现有的其他模型(例如GPT(generativepre-training)模型),本实施例对此不作限定。
可选的,当所选取的模型不同时,多个第二训练样本的输入格式也不同。
需要说明的是,情感分类模型为一个三分类模型,可以将待处理文本针对于目标对象的情感倾向进行三分类,以确定待处理文本针对于目标对象的情感倾向是否为:正向情感、负向情感或者中性情感中的一种。
上述实施例提供的技术方案至少带来以下有益效果:由S201-S202可知,在获取多个第二训练样本后,由于多个第二训练样本中的正样本包括:第三对象、针对于第三对象的情感倾向为正向情感倾向的第三文本、第三对象的对象关联信息。多个第二训练样本中的中性样本包括:第四对象、针对于第四对象的情感倾向为中性情感倾向的第四文本、第四对象的对象关联信息。多个第二训练样本中的负样本包括:第五对象、针对于第五对象的情感倾向为负向情感倾向的第五文本、第五对象的对象关联信息。因此,基于多个第二训练样本,可以训练得到用于确定分类结果的情感分类模型。这样一来,本公开可以在获取目标账户发布的待处理文本、与该待处理文本匹配的目标对象和目标对象的对象关联信息后,将获取到的待处理文本、与待处理文本匹配的目标对象和目标对象的对象关联信息输入至情感分类模型中,从而可以快速、准确的确定出待处理文本针对于目标对象的情感倾向信息,提高了确定目标账户针对于目标对象的情感倾向的准确性。
下面在对“情感倾向信息确定流程”进行描述。
如图3A所示,“情感倾向信息确定流程”包括S301-S303。
S301、电子设备获取目标账户发布的待处理文本。
具体的,当需要对目标账户发布的评论内容进行分类时,可以由服务器将目标账户发布的评论内容存储为待处理文本。相应的,电子设备可以获取目标账户发布的待处理文本。
可选的,目标账户发布的评论内容可以是针对于特定对象的评论。特定对象可以是某个品牌、人物、游戏等对象。目标账户发布的针对于特定对象的评论内容,可以是针对于上述特定对象对应的多媒体资源的评论内容。该多媒体资源可以是短视频、长视频、文章等内容。
作者用户在发布关于特定对象的多媒体资源后,目标账户可以在该多媒体资源对应的评论区发布评论内容。
在目标账户发布针对于特定对象对应的多媒体资源的评论内容后,服务器可以获取该评论内容并存储为待处理文本。终端也可以在显示该评论内容前获取到该评论内容,并存储为待处理文本。在这种情况下,电子设备可以通过服务器或者终端获取目标账户发布的待处理文本。
可选的,电子设备获取待处理文本的方法可以参考S101中,电子设备获取多个第一训练样本的方法,在此不再赘述。
S302、电子设备从预设对象集合中,确定与待处理文本匹配的至少一个目标对象。
具体的,在获取目标账户发布的待处理文本后,电子设备可以获取预设对象集合,并根据对象匹配模型从预设对象集合中,确定与待处理文本匹配的至少一个目标对象。其中,预设对象集合包括多个候选对象。
可选的,服务器中可以预先存储有预设对象集合。在获取目标账户发布的待处理文本后,电子设备可以先从服务器获取预设对象集合,再将预设对象集合中与目标账户发布的待处理文本相匹配的至少一个对象确定为至少一个目标对象。
可选的,电子设备从服务器获取预设对象集合的方法可以参考S101中,电子设备获取多个第一训练样本的方法,在此不再赘述。
示例性的,预设电子设备获取到的目标账户发布的待处理文本为“A确实不错”,则与该待处理文本相匹配的目标对象为“A”。
S303、电子设备基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果。
具体的,在确定与待处理文本匹配的至少一个目标对象后,电子设备可以将待处理文本与各目标对象构建为至少一个文本对,并将该至少一个文本对输入情感分类模型中,以分别对待处理文本与各目标对象所构建的至少一个文本对进行处理。相应的,电子设备获得待处理文本对应的分类结果。
其中,情感分类模型用于确定待处理文本与目标对象的分类结果。分类结果用于表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息。
示例性的,预设有“现在的A也挺好”和“看起来不错”两条目标账户发布的待处理文本,与待处理文本“现在的A也挺好”相匹配的目标对象为A,待处理文本“看起来不错”没有匹配的目标对象。则电子设备将待处理文本“现在的A也挺好”和目标对象为A构建为一个文本对后,可以基于情感分类模型,对待处理文本“现在的A也挺好”和目标对象为A构建的一个文本对进行处理,并获得目标账户对与待处理文本“现在的A也挺好”对应的目标对象为A的分类结果为“A;正向情感”。
上述实施例提供的技术方案至少带来以下有益效果:由S301-S303可知,在获取目标账户发布的待处理文本,以及从预设对象集合中,确定与待处理文本匹配的至少一个目标对象后,可以基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,以获得待处理文本对应的分类结果。这样一来,由于至少一个目标对象为与目标账户发布的待处理文本匹配的对象,因此,本公开中情感分类模型输出的分类结果,可以准确地表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息,提高了确定目标账户针对于目标对象的情感倾向的准确性。
在一种实施例中,结合图3A,如图4所示,上述S303中,电子设备基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果的方法具体包括:S401-S402。
S401、电子设备获取至少一个目标对象的对象关联信息。
可以理解的是,当确定到与待处理文本匹配的一个目标对象时,电子设备可以获取该目标对象的至少一个对象关联信息。当确定到与待处理文本匹配的多个目标对象时,电子设备可以获取该多个目标对象中的每个目标对象的至少一个对象关联信息。其中,对象关联信息用于表征与目标对象关联的特征信息。
示例性的,预设与待处理文本匹配的目标对象为A,则A的品牌、行业、产地和别称等均可以是与目标对象A关联的特征信息。
可选的,服务器中可以预先存储有多个对象的至少一个对象关联信息。在确定与待处理文本匹配的一个目标对象后,电子设备可以从服务器获取该目标对象的至少一个对象关联信息。
可选的,电子设备获取目标对象的对象关联信息的方法可以参考S101中,电子设备获取多个第一训练样本的方法,在此不再赘述。
可选的,在获取目标对象的对象关联信息后,电子设备还可以通过知识图谱来补充目标对象的对象关联信息,以增强目标对象的含义。例如,对于目标对象“A”,电子设备可以通过知识图谱判断其品牌为“A1”。
S402、电子设备基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,获得待处理文本对应的分类结果。
具体的,在获取至少一个目标对象的对象关联信息后,电子设备可以将待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息输入情感分类模型中,以分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,从而获得待处理文本对应的分类结果。
示例性的,如下表2所示,预设有“现在的A也挺好”和“看起来不错”两条目标账户发布的待处理文本,与待处理文本“现在的A也挺好”相匹配的目标对象为A。目标对象A的对象关联信息为A1行业和A2品牌,待处理文本“看起来不错”没有匹配的目标对象。则电子设备将待处理文本“现在的A也挺好”和目标对象为A构建为一个文本对后,可以基于情感分类模型,对待处理文本“现在的A也挺好”和目标对象为A构建的一个文本对进行处理,并获得目标账户对与待处理文本“现在的A也挺好”对应的目标对象为A的分类结果为“A;正向情感”。
表2
待处理文本 目标对象 对象关联信息 分类结果
现在的A也挺好 A A:{‘行业’:‘A1’,‘品牌’:‘A2’} A;正向情感
看起来不错
上述实施例提供的技术方案至少带来以下有益效果:由S401-S402可知,在获取至少一个目标对象的对象关联信息后,可以基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,以获得待处理文本对应的分类结果。由于,分类结果是情感分类模型根据对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息确定的,因此,本公开可以细粒度的确定目标账户针对于目标对象的情感倾向。
在一种实施例中,结合图4,如图5所示,上述S402中,电子设备基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,获得待处理文本对应的分类结果的方法具体包括:S501-S502。
S501、电子设备分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对。
具体的,在获取至少一个目标对象的对象关联信息后,电子设备可以分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对。
可选的,电子设备可以先通过间隔符号“SEP”将待处理文本和与待处理文本匹配的目标对象进行分词,再利用槽位的方法将目标对象和目标对象的对象关联信息拼接起来,并通过标签“#”令对象关联信息按照一定顺序分词,从而将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息构建为至少一个目标文本对,再将至少一个目标文本对输入到情感分类模型中。
电子设备输入到情感分类模型中的至少一个目标文本对如图3B所示,在待处理文本和与待处理文本匹配的目标对象中间用特殊符号“SEP”进行间隔,在目标对象和目标对象的对象关联信息中间用“#”进行间隔。
示例性的,如图3B所示。预设情感分类模型为:BERT模型。待处理文本为“B还是比A好”,与待处理文本“B还是比A好”相匹配的目标对象为“A”,目标对象“A”的对象关联信息为“A1”和“A2”。则电子设备通过间隔符号“SEP”、“#”将上述待处理文本、目标对象和对象关联信息进行分词处理后的数据为“CLSB还是比A好SEPA#A1#A2SEP”。后续,电子设备可以将分词处理后的数据输入到BERT模型中,以得到分类结果为“负向情感”。
S502、电子设备将至少一个目标文本对输入到情感分类模型,对目标文本对进行处理,以得到待处理文本的分类结果。
具体的,在分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对后,电子设备可以将至少一个目标文本对输入到情感分类模型,对目标文本对进行处理,以得到待处理文本的分类结果。
上述实施例提供的技术方案至少带来以下有益效果:由S501-S502可知,在分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对后,可以将至少一个目标文本对输入到情感分类模型,对目标文本对进行处理,以得到待处理文本的分类结果。给出了一种将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息输入到情感分类模型中的具体实现方式。
这样一来,可以准确地将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息对应输入到情感分类模型中,因此,本公开可以准确地确定目标账户针对于目标对象的情感倾向。
在一种实施例中,结合图4,如图6所示,上述S401中,电子设备获取至少一个目标对象的对象关联信息的方法具体包括:S601。
S601、电子设备调用知识增强模块,获取目标对象的对象关联信息。
具体的,在确定与待处理文本匹配的目标对象后,电子设备可以调用知识增强模块,以获取目标对象的对象关联信息。
其中,知识增强模块中存储有包括目标对象在内的多个对象的对象关联信息。
可选的,电子设备可以预先配置有知识增强模块。知识增强模块中可以将对象和该对象的对象关联信息对应存储。当需要获取目标对象的对象关联信息时,电子设备可以将调用知识增强模块,获取与目标对象对应的对象关联信息。
示例性的,预设电子设备确定与待处理文本匹配的目标对象为A,则可以调用知识增强模块,获取到如下表3所示的与目标对象A关联的特征信息A1、A2、A3和A4,从而获取到A的关联信息。
表3
待处理对象 行业 品牌 产地 颜色
A A1 A2 A3 A4
上述实施例提供的技术方案至少带来以下有益效果:由S601可知,电子设备获取目标对象的对象关联信息时,可以调用知识增强模块,获取目标对象的对象关联信息。给出了一种获取目标对象的对象关联信息的具体实现方式。
通过调用知识增强模块,可以快速、准确的获取目标对象的对象关联信息,以使得电子设备可以将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对,并基于情感分类模型准确的确定出目标账户对于目标对象的情感倾向信息,提高了确定目标账户针对于目标对象的情感倾向的准确性。
在一种实施例中,结合图3A,如图7所示,上述S302中,电子设备从预设对象集合中,确定与待处理文本匹配的目标对象的方法具体包括:S701-S703。
S701、电子设备获取预设对象集合。
具体的,在获取目标账户发布的待处理文本后,电子设备可以获取预设对象集合。
S702、电子设备确定预设对象集合中的每个候选对象与待处理文本的匹配度。
具体的,在获取预设对象集合后,电子设备可以分别将待处理文本和预设对象集合中的每个候选对象输入到对象匹配模型中,以确定预设对象集合中的每个候选对象与待处理文本的匹配度。
可选的,电子设备可以将待处理文本和多个初始对象中的每一个对象都组成一个对,通过匹配度模型对每一个对进行匹配度打分,输出匹配度分数大于阈值的子集,如果子集为空,将会判断待处理文本和所有初始对象无关。
示例性的,预设在获取待处理文本A后,电子设备获取到的预设对象集合中的候选对象分别为a、b和c。则电子设备可以分别确定待处理文本A和候选对象a,待处理文本A和候选对象b,以及待处理文本A和候选对象c的匹配度。
S703、电子设备从所述预设对象集合中,选取匹配度大于预设阈值的候选对象作为目标对象。
具体的,在确定预设对象集合中的每个候选对象与待处理文本的匹配度后,电子设备可以从所述预设对象集合中,选取匹配度大于预设阈值的候选对象作为目标对象。
可选的,预设阈值可以依据人工经验设定,以用于去除掉与待处理文本不匹配的候选对象。
示例性的,预设在获取待处理文本A后,电子设备获取到的预设对象集合中的候选对象分别为a、b和c,预设阈值为0。若电子设备分别确定到待处理文本A和候选对象a的匹配度为0,待处理文本A和候选对象b的匹配度为0,以及待处理文本A和候选对象c的匹配度为1。此时,待处理文本A和候选对象c的匹配度为1大于预设阈值0,则电子设备选取候选对象c作为待处理文本对应的目标对象。
上述实施例提供的技术方案至少带来以下有益效果:由S701-S703可知,电子设备可以在获取目标账户发布的待处理文本后,先获取预设对象集合,再确定预设对象集合中的每个候选对象与待处理文本的匹配度,进而可以从所述预设对象集合中,选取匹配度大于预设阈值的候选对象作为目标对象,给出了一种获取与待处理文本匹配的目标对象的具体实现方式。
由于可以选取出匹配度大于预设阈值的目标对象,因此,通过确定预设对象集合中的每个候选对象与待处理文本的匹配度,电子设备可以准确的确定与目标账户发布的待处理文本对应的目标对象,提高了确定目标账户针对于目标对象的情感倾向的准确性。
在一种实施例中,结合图7,如图8A所示,上述S702中,电子设备确定预设对象集合中的每个候选对象与待处理文本的匹配度的方法具体包括:
S801、电子设备确定与多个候选对象一一对应的多个待匹配集合。
具体的,在获取预设对象集合后,电子设备可以确定与多个候选对象一一对应的多个待匹配集合。
其中,每个待匹配集合包括一个初始对象和待处理文本。
示例性的,预设待处理文本为A,预设对象集合中的候选集合对象分别为A1、A2和A3,则电子设备可以确定候选对象A1对应的待匹配集合为集合1(A,A1)、候选对象A2对应的待匹配集合为集合2(A,A2),以及候选对象A3对应的待匹配集合为集合3(A,A3)。
S802、电子设备将多个待匹配集合输入到对象匹配模型中,以得到每个候选对象与待处理文本的匹配度。
具体的,在确定与多个候选对象一一对应的多个待匹配集合后,电子设备可以将多个待匹配集合输入到对象匹配模型中,以得到每个候选对象与待处理文本的匹配度。
可选的,电子设备将待匹配集合输入到对象匹配模型中时,可以先通过间隔符号“SEP”将待匹配集合中待处理文本与候选对象进行分词,再将待匹配集合输入到对象匹配模型中。
输入的待匹配集合和模型框架可以如图8B所示,在待处理文本与候选对象中间用特殊符号“SEP”进行间隔。
示例性的,如图8B所示。预设对象匹配模型为:BERT模型。待处理文本为“B还是比A好”,候选对象为“A”。通过间隔符号“SEP”将上述待处理文本和候选对象进行分词处理后的待匹配集合为“CLSB还是比A好SEPASEP”。后续,电子设备可以将待匹配集合输入到BERT模型中,以得到每个候选对象与待处理文本的匹配度。
上述实施例提供的技术方案至少带来以下有益效果:由S801-S802可知,电子设备确定预设对象集合中的每个候选对象与待处理文本的匹配度时,可以先确定与多个候选对象一一对应的多个待匹配集合。接着,电子设备可以将多个待匹配集合输入到对象匹配模型中,以得到每个候选对象与待处理文本的匹配度,给出了一种确定预设对象集合中的每个候选对象与待处理文本的匹配度的具体实现方式。
由于对象匹配模型用于确定每个候选对象与待处理文本的匹配度,因此,通过将每个候选对象与待处理文本输入到对象匹配模型中,可以快速、准确的确定出多个候选对象中的每个候选对象与待处理文本的匹配度,以确定与待处理文本匹配的候选对象,提高了确定目标账户针对于目标对象的情感倾向的准确性。
可以理解的,在实际实施时,本公开实施例所述的终端/服务器可以包含有用于实现前述对应数据处理方法的一个或多个硬件结构和/或软件模块,这些执行硬件结构和/或软件模块可以构成一个电子设备。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
基于这样的理解,本公开实施例还对应提供一种数据处理装置,可以应用于电子设备。图9示出了本公开实施例提供的数据处理装置的结构示意图。如图9所示,该数据处理装置可以包括:获取单元901、确定单元902和处理单元903。
获取单元901,用于获取目标账户发布的待处理文本。例如,结合图3A,获取单元901可以用于执行S301。
确定单元902,用于从预设对象集合中,确定与待处理文本匹配的至少一个目标对象。例如,结合图3A,确定单元902可以用于执行S302。
处理单元903,用于基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对进行处理,获得待处理文本对应的分类结果。分类结果用于表征目标账户对待处理文本对应的至少一个目标对象的情感倾向信息。例如,结合图3A,处理单元903可以用于执行S303。
可选的,处理单元903,具体用于:
获取至少一个目标对象的对象关联信息。对象关联信息用于表征与目标对象关联的特征信息。例如,结合图4,处理单元903可以用于执行S401。
基于情感分类模型,分别对待处理文本与各目标对象所构建的至少一个文本对、以及各目标对象的对象关联信息进行处理,获得待处理文本对应的分类结果。例如,结合图4,处理单元903可以用于执行S402。
可选的,处理单元903,具体用于:
分别将待处理文本,与待处理文本匹配的目标对象以及对应的对象关联信息进行拼接处理,构建至少一个目标文本对。例如,结合图5,处理单元903可以用于执行S501。
将至少一个目标文本对输入到情感分类模型,对目标文本对进行处理,以得到待处理文本的分类结果。例如,结合图5,处理单元903可以用于执行S502。
可选的,处理单元903,具体用于:
调用知识增强模块,获取目标对象的对象关联信息。知识增强模块中存储有包括目标对象在内的多个对象的对象关联信息。例如,结合图6,处理单元903可以用于执行S601。
可选的,确定单元902,具体用于:
获取预设对象集合。预设对象集合包括多个候选对象。例如,结合图7,确定单元902可以用于执行S701。
确定预设对象集合中的每个候选对象与待处理文本的匹配度。例如,结合图7,确定单元902可以用于执行S702。
从预设对象集合中,选取匹配度大于预设阈值的候选对象作为目标对象。例如,结合图7,确定单元902可以用于执行S703。
可选的,确定单元902,具体用于:
确定与多个候选对象一一对应的多个待匹配集合。每个待匹配集合包括一个初始对象和待处理文本。例如,结合图8A,确定单元902可以用于执行S801。
将多个待匹配集合输入到对象匹配模型中,以得到每个候选对象与待处理文本的匹配度。对象匹配模型用于确定每个候选对象与待处理文本的匹配度。例如,结合图8A,确定单元902可以用于执行S802。
可选的,该数据处理装置还包括:第一训练单元904。
获取单元901,还用于获取多个第一训练样本。多个第一训练样本包括正样本和负样本。多个第一训练样本中的正样本包括第一文本以及、与第一文本相匹配的第一对象所构成的样本文本对。多个第一训练样本中的负样本包括第二文本以及、与第二文本不匹配的第二对象所构成的样本文本对。例如,结合图1,获取单元901可以用于执行S101。
第一训练单元904,用于基于多个第一训练样本对初始对象匹配模型进行训练,训练得到对象匹配模型。例如,结合图1,第一训练单元904可以用于执行S102。
可选的,该数据处理装置还包括:第二训练单元905。
获取单元901,还用于获取多个第二训练样本。多个第二训练样本包括正样本、中性样本和负样本。多个第二训练样本中的正样本包括:第三对象、针对于第三对象的情感倾向为正向情感倾向的第三文本、第三对象的对象关联信息。多个第二训练样本中的中性样本包括:第四对象、针对于第四对象的情感倾向为中性情感倾向的第四文本、第四对象的对象关联信息。多个第二训练样本中的负样本包括:第五对象、针对于第五对象的情感倾向为负向情感倾向的第五文本、第五对象的对象关联信息。例如,结合图2,获取单元901可以用于执行S201。
第二训练单元905,用于基于多个第二训练样本对初始情感分类模型进行训练,训练得到情感分类模型。例如,结合图2,第二训练单元905可以用于执行S202。
如上所述,本公开实施例可以根据上述方法示例对电子设备进行功能模块的划分。其中,上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。另外,还需要说明的是,本公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。
关于上述实施例中的数据处理装置,其中各个模块执行操作的具体方式、以及具备的有益效果,均已经在前述方法实施例中进行了详细描述,此处不再赘述。
本公开实施例还提供一种终端,终端可以是手机、电脑等用户终端。图10示出了本公开实施例提供的终端的结构示意图。该终端可以是数据处理装置,可以包括至少一个处理器61,通信总线62,存储器63以及至少一个通信接口64。
处理器61可以是一个处理器(central processing units,CPU),微处理单元,ASIC,或一个或多个用于控制本公开方案程序执行的集成电路。作为一个示例,结合图9,电子设备中的处理单元903实现的功能与图10中的处理器61实现的功能相同。
通信总线62可包括一通路,在上述组件之间传送信息。
通信接口64,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如服务器、以太网,无线接入网(radio access network,RAN),无线局域网(wireless localarea networks,WLAN)等。作为一个示例,结合图9,电子设备中的获取单元901实现的功能与图10中的通信接口64实现的功能相同。
存储器63可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理单元相连接。存储器也可以和处理单元集成在一起。
其中,存储器63用于存储执行本公开方案的应用程序代码,并由处理器61来控制执行。处理器61用于执行存储器63中存储的应用程序代码,从而实现本公开方法中的功能。
在具体实现中,作为一种实施例,处理器61可以包括一个或多个CPU,例如图10中的CPU0和CPU1。
在具体实现中,作为一种实施例,终端可以包括多个处理器,例如图10中的处理器61和处理器65。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,终端还可以包括输入设备66和输出设备67。输入设备66和输出设备67通信,可以以多种方式接受用户的输入。例如,输入设备66可以是鼠标、键盘、触摸屏设备或传感设备等。输出设备67和处理器61通信,可以以多种方式来显示信息。例如,输出设备61可以是液晶显示器(liquid crystal display,LCD),发光二级管(light emitting diode,LED)显示设备等。
本领域技术人员可以理解,图10中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本公开实施例还提供一种服务器。图11示出了本公开实施例提供的服务器的结构示意图。该服务器可以是数据处理装置。该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器71和一个或一个以上的存储器72。其中,存储器72中存储有至少一条指令,至少一条指令由处理器71加载并执行以实现上述各个方法实施例提供的数据处理方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本公开还提供了一种包括指令的计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述计算机可读存储介质中的指令由计算机设备的处理器执行时,使得计算机能够执行上述所示实施例提供的数据处理方法。例如,计算机可读存储介质可以为包括指令的存储器63,上述指令可由终端的处理器61执行以完成上述方法。又例如,计算机可读存储介质可以为包括指令的存储器72,上述指令可由服务器的处理器71执行以完成上述方法。可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘和光数据存储设备等。
本公开还提供了一种计算机程序产品,该计算机程序产品包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行上述图1至图8B任一附图所示的数据处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取目标账户发布的待处理文本;
从预设对象集合中,确定与所述待处理文本匹配的至少一个目标对象;
基于情感分类模型,分别对所述待处理文本与各目标对象所构建的至少一个文本对进行处理,获得所述待处理文本对应的分类结果;所述分类结果用于表征所述目标账户对所述待处理文本对应的至少一个目标对象的情感倾向信息。
2.根据权利要求1所述的数据处理方法,其特征在于,所述基于情感分类模型,分别对所述待处理文本与各目标对象所构建的至少一个文本对进行处理,获得所述待处理文本对应的分类结果,包括:
获取至少一个所述目标对象的对象关联信息;所述对象关联信息用于表征与所述目标对象关联的特征信息;
基于所述情感分类模型,分别对所述待处理文本与各目标对象所构建的至少一个文本对、以及各所述目标对象的对象关联信息进行处理,获得所述待处理文本对应的分类结果。
3.根据权利要求2所述的数据处理方法,其特征在于,所述基于所述情感分类模型,分别对所述待处理文本与各目标对象所构建的至少一个文本对、以及各所述目标对象的对象关联信息进行处理,获得所述待处理文本对应的分类结果,包括:
分别将所述待处理文本,与所述待处理文本匹配的目标对象以及对应的所述对象关联信息进行拼接处理,构建至少一个目标文本对;
将至少一个所述目标文本对输入到所述情感分类模型,对所述目标文本对进行处理,以得到所述待处理文本的分类结果。
4.根据权利要求2所述的数据处理方法,其特征在于,所述获取至少一个所述目标对象的对象关联信息,包括:
调用知识增强模块,获取所述目标对象的对象关联信息;所述知识增强模块中存储有包括所述目标对象在内的多个对象的对象关联信息。
5.根据权利要求1-4任一所述的数据处理方法,其特征在于,所述从预设对象集合中,确定与所述待处理文本匹配的目标对象,包括:
获取所述预设对象集合;所述预设对象集合包括多个候选对象;
确定所述预设对象集合中的每个候选对象与所述待处理文本的匹配度;
从所述预设对象集合中,选取所述匹配度大于预设阈值的候选对象作为所述目标对象。
6.根据权利要求5所述的数据处理方法,其特征在于,所述确定所述预设对象集合中的每个候选对象与所述待处理文本的匹配度,包括:
确定与所述多个候选对象一一对应的多个待匹配集合;每个待匹配集合包括一个初始对象和所述待处理文本;
将所述多个待匹配集合输入到对象匹配模型中,以得到所述每个候选对象与所述待处理文本的匹配度;所述对象匹配模型用于确定所述每个候选对象与所述待处理文本的匹配度。
7.一种数据处理装置,其特征在于,包括:获取单元、确定单元和处理单元;
所述获取单元,用于获取目标账户发布的待处理文本;
所述确定单元,用于从预设对象集合中,确定与所述待处理文本匹配的至少一个目标对象;
所述处理单元,用于基于情感分类模型,分别对所述待处理文本与各目标对象所构建的至少一个文本对进行处理,获得所述待处理文本对应的分类结果;所述分类结果用于表征所述目标账户对所述待处理文本对应的至少一个目标对象的情感倾向信息。
8.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-6中任一项所述的数据处理方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1-6中任一项所述的数据处理方法。
10.一种计算机程序产品,包括指令,其特征在于,当所述指令在电子设备上运行时,使得所述电子设备执行如权利要求1-6中任一项所述的数据处理方法。
CN202111583599.2A 2021-12-22 2021-12-22 一种数据处理方法、装置、设备及存储介质 Pending CN114297380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111583599.2A CN114297380A (zh) 2021-12-22 2021-12-22 一种数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111583599.2A CN114297380A (zh) 2021-12-22 2021-12-22 一种数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114297380A true CN114297380A (zh) 2022-04-08

Family

ID=80969954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111583599.2A Pending CN114297380A (zh) 2021-12-22 2021-12-22 一种数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114297380A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115422362A (zh) * 2022-10-09 2022-12-02 重庆邮电大学 一种基于人工智能的文本匹配方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115422362A (zh) * 2022-10-09 2022-12-02 重庆邮电大学 一种基于人工智能的文本匹配方法
CN115422362B (zh) * 2022-10-09 2023-10-31 郑州数智技术研究院有限公司 一种基于人工智能的文本匹配方法

Similar Documents

Publication Publication Date Title
JP2021089739A (ja) 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体
US20200250378A1 (en) Methods and apparatuses for identifying a user intent of a statement
CN111191428B (zh) 评论信息处理方法、装置、计算机设备和介质
CN108268450B (zh) 用于生成信息的方法和装置
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN113590776A (zh) 基于知识图谱的文本处理方法、装置、电子设备及介质
CN112733042A (zh) 推荐信息的生成方法、相关装置及计算机程序产品
CN107291774B (zh) 错误样本识别方法和装置
CN112966081A (zh) 处理问答信息的方法、装置、设备和存储介质
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN110909768B (zh) 一种标注数据获取方法及装置
CN110008807B (zh) 一种合同内容识别模型的训练方法、装置及设备
CN114297380A (zh) 一种数据处理方法、装置、设备及存储介质
CN110738056A (zh) 用于生成信息的方法和装置
CN111026849B (zh) 数据处理方法和装置
CN110232920B (zh) 语音处理方法和装置
CN114141236B (zh) 语言模型更新方法、装置、电子设备及存储介质
CN115470790A (zh) 一种识别文件中的命名实体的方法和装置
CN113360672B (zh) 用于生成知识图谱的方法、装置、设备、介质和产品
JP2023554210A (ja) インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN113239273B (zh) 用于生成文本的方法、装置、设备以及存储介质
CN112200602A (zh) 用于广告推荐的神经网络模型训练方法及装置
CN111062201A (zh) 用于处理信息的方法和装置
CN110990528A (zh) 一种问答方法、装置及电子设备
CN113722496B (zh) 一种三元组抽取方法、装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination