CN117235264A - 文本处理方法、装置、设备和计算机可读存储介质 - Google Patents
文本处理方法、装置、设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN117235264A CN117235264A CN202311230807.XA CN202311230807A CN117235264A CN 117235264 A CN117235264 A CN 117235264A CN 202311230807 A CN202311230807 A CN 202311230807A CN 117235264 A CN117235264 A CN 117235264A
- Authority
- CN
- China
- Prior art keywords
- service
- target
- text
- period
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000003860 storage Methods 0.000 title claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 348
- 230000008451 emotion Effects 0.000 claims abstract description 275
- 238000012545 processing Methods 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims description 93
- 238000012549 training Methods 0.000 claims description 90
- 230000008569 process Effects 0.000 claims description 48
- 230000015654 memory Effects 0.000 claims description 39
- 238000000605 extraction Methods 0.000 claims description 20
- 230000004927 fusion Effects 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001902 propagating effect Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 31
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 40
- 239000013598 vector Substances 0.000 description 39
- 210000004027 cell Anatomy 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 17
- 238000007726 management method Methods 0.000 description 15
- 238000007781 pre-processing Methods 0.000 description 12
- 238000010606 normalization Methods 0.000 description 11
- 238000004140 cleaning Methods 0.000 description 10
- 230000007935 neutral effect Effects 0.000 description 10
- 238000013136 deep learning model Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000013439 planning Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012384 transportation and delivery Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000011284 combination treatment Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本申请公开了一种文本处理方法、装置、设备和计算机可读存储介质。本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶、地图等各种场景。通过第一目标模型对包含目标对象在第一时段对业务对象的评价内容的文本进行语义分析,以分类出该目标对象在第一时段对业务对象的情感分类结果,然后,基于该情感分类结果来计算目标对象在第一时段对业务对象的满意度评分,最后,通过第二目标模型基于该第一时段的满意度评分、业务对象的业务特征信息以及目标对象的对象特征信息来预测目标对象在第二时段对业务对象的满意度评分。以此,可提高评估用户对业务满意度时的准确性,提高满意度评估时的稳定性和效率,且可预测用户对相关业务的未来满意度。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种文本处理方法、装置、设备和计算机可读存储介质。
背景技术
为了提供更好的业务服务品质,实体产品服务、技术支持服务以及其他服务业的供应商越来越注重用户对其业务服务的使用体验,供应商一般通过用户反馈、回访等途径来获取用户评价内容,该用户评价可以转化为文本形式,通过分析文本中的用户评价内容,以评估用户对其业务服务的满意度。
相关技术在分析文本中的用户评价内容时,一般通过预先设定的词典和规则来分析文本中的用户评价内容的情感倾向,并通过人工方式来结合情感倾向来评估用户对其业务服务的满意度。
在对相关技术的研究和实践过程中,本申请的发明人发现相关技术在分析文本中的用户评价内容时,只能用于分析直接表达的关键词语,无法分析复杂的信息语句,降低了语义分析的准确性,且人工方式评估业务的满意度时,不仅效率低,且具有不稳定性,从而,影响了评估用户满意度时的准确性,此外,相关技术无法预测用户对其服务的未来满意度。
发明内容
本申请实施例提供一种文本处理方法、装置、设备和计算机可读存储介质,可提高评估用户对业务满意度时的准确性,且可预测用户对相关业务的未来满意度。
本申请实施例提供一种文本处理方法,包括:
获取业务评价文本,所述业务评价文本包含目标对象在第一时段针对业务对象的评价内容;
通过第一目标模型对所述业务评价文本中的评价内容进行分类,获取所述业务评价文本对应的情感分类结果;
根据所述业务评价文本对应的情感分类结果,确定所述目标对象在第一时段对所述业务对象的满意度评分;
通过第二目标模型根据所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息,确定所述目标对象在第二时段对所述业务对象的预测满意度评分,所述第二时段位于所述第一时段之后。
相应的,本申请实施例提供一种文本处理装置,包括:
获取单元,用于获取业务评价文本,所述业务评价文本包含目标对象在第一时段针对业务对象的评价内容;
分类单元,用于通过第一目标模型对所述业务评价文本中的评价内容进行分类,获取所述业务评价文本对应的情感分类结果;
确定单元,用于根据所述业务评价文本对应的情感分类结果,确定所述目标对象在第一时段对所述业务对象的满意度评分;
预测单元,用于通过第二目标模型根据所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息,确定所述目标对象在第二时段对所述业务对象的预测满意度评分,所述第二时段位于所述第一时段之后。
在一些实施方式中,所述第二目标模型包括前向特征提取层、特征融合层和分类层;所述预测单元,还用于:
将所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息进行拼接,得到目标文本;
将所述目标文本进行嵌入处理,得到嵌入特征序列;
由所述前向特征提取层对所述嵌入特征序列进行前向传播,得到前向特征序列;
由所述特征融合层将所述嵌入特征序列与所述前向特征序列进行融合,得到融合特征序列;
由所述分类层对融合特征序列进行线性转换,输出所述目标对象在第二时段对所述业务对象的预测满意度评分。
在一些实施方式中,所述文本处理装置还包括第二训练单元,用于:
获取历史数据集,所述历史数据集至少包括样本对象在第一历史时段的样本对象特征信息、样本业务对象在第一历史时段的样本业务特征信息、以及所述样本对象在第一历史时段针对所述样本业务对象的第一满意度评分和在第二历史时段的第二满意度评分;
其中,所述第一满意度评分基于所述样本对象在第一历史时段针对所述样本业务对象的第一业务评价文本确定,所述第二满意度评分基于所述样本对象在第二历史时段针对所述样本业务对象的第二业务评价文本确定,所述第二历史时段位于所述第一历史时段之后;
根据所述样本对象特征信息、样本业务特征信息以及所述第一满意度评分,生成样本目标文本;
将所述样本目标文本输入第二预设模型进行满意度评分预测,得到所述样本对象在第二时段对所述样本业务对象的预测满意度评分;
基于所述预测满意度评分与所述第二满意度评分,确定第二目标损失;
根据所述第二目标损失调整所述第二预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第二目标模型。
在一些实施方式中,所述获取单元,还用于:获取所述样本对象在所述第二历史时段对所述样本业务对象的第二业务评价文本;
所述分类单元,还用于:通过所述第一目标模型对所述第二业务评价文本进行分类,输出所述第二业务评价文本对应的情感分类结果;
所述确定单元,还用于:根据所述第二业务评价文本对应的情感分类结果,确定所述样本对象在所述第二历史时段对所述样本业务对象的第二满意度评分。
在一些实施方式中,所述文本处理装置还包括第一训练单元,用于:
获取样本业务评价文本以及对应的样本情感分类结果,所述样本业务评价文本至少包括样本对象针对样本业务对象的样本评价内容;
将所述样本业务评价文本输入至预训练的第一预设模型,以基于所述样本业务评价文本中的样本评价内容进行分类,得到预测情感分类结果;
基于所述样本情感分类结果与所述预测情感分类结果,确定第一目标损失;
根据所述第一目标损失调整所述预训练的第一预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第一目标模型。
在一些实施方式中,所述情感分类结果包括所述业务评价文本属于目标情感类别标签的标签概率值;所述确定单元,还用于:
根据所述业务评价文本属于目标情感类别标签的标签概率值,确定所述业务评价文本对应的情感类别评分;
根据所述业务评价文本对应的情感类别评分,确定所述目标对象在第一时段对所述业务对象的满意度评分。
在一些实施方式中,所述确定单元,还用于:
获取分值规范系数和权重系数;
以所述业务评价文本对应的情感类别评分与所述分值规范系数之和作为目标分值;
确定所述目标分值与所述权重系数之间的比值,得到所述目标对象在第一时段对所述业务对象的满意度评分。
在一些实施方式中,所述文本处理装置还包括反馈单元,用于:
确定对象集合,所述对象集合包含多个所述目标对象;
根据每个所述目标对象对应的所述满意度评分和所述预测满意度评分,生成针对所述业务对象的反馈提示信息;
向所述业务对象的管理端发送所述反馈提示信息。
在一些实施方式中,所述业务评价文本还包括参考对象在第一时段针对所述业务对象的参考评价内容,所述参考对象为与所述目标对象同属一个对象分组,所述获取单元,还用于:
获取所述目标对象在第一时段针对所述业务对象的业务评价内容;
确定所述目标对象所属的对象分组,并获取所述对象分组中每个参考对象在第一时段针对所述业务对象的候选评价内容;
基于所述对象分组中每个参考对象在第一时段针对所述业务对象的候选评价内容,选取所述参考对象在第一时段针对所述业务对象的参考评价内容。
在一些实施方式中,所述获取单元,还用于:
确定所述对象分组中每个参考对象与所述目标对象之间的亲密度评分;
基于所述每个参考对象针对所述业务对象的候选评价内容,选取所述亲密度评分最高的参考对象的候选评价内容作为所述参考对象在第一时段针对所述业务对象的参考评价内容。
此外,本申请实施例还提供一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序实现本申请实施例提供的任一种文本处理方法中的步骤。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种文本处理方法中的步骤。
此外,本申请实施例还提供一种计算机程序产品,包括计算机指令,所述计算机指被执行时实现本申请实施例所提供的任一种文本处理方法中的步骤。
本申请实施例可针对包含目标对象在第一时段对业务对象的评价内容的文本,通过第一目标模型来进行语义分析,以分类出该目标对象在第一时段对业务对象的情感分类结果,确保语义分析时的准确性,然后,基于该情感分类结果来计算目标对象在第一时段对业务对象的满意度评分,最后,通过第二目标模型基于该第一时段的满意度评分、业务对象的业务特征信息以及目标对象的对象特征信息来预测目标对象在第二时段对业务对象的满意度评分,提高满意度评估时的稳定性和效率。以此,可提高评估用户对业务满意度时的准确性,且可预测用户对相关业务的未来满意度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的文本处理系统的场景示意图;
图2是本申请实施例提供的文本处理方法的步骤流程示意图;
图3是本申请实施例提供的双向编码模型的结构示例图;
图4是本申请实施例提供的长短期记忆网络模型的结构示意图;
图5是本申请实施例提供的文本处理方法的另一步骤流程示意图;
图6是本申请实施例提供的文本处理装置的结构示意图;
图7是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性地,仅用于解释本申请,而不能理解为对本申请的限制。
在说明书、权利要求书和上述附图所描述的一些流程中,包含了按照特定顺序出现的多个步骤,但应该清楚了解,这些步骤可以不按照其在本文中出现的顺序来执行或并行执行,步骤序号仅仅是用于区分开各个不同的步骤,序号本身不代表任何的执行顺序。此外,本文中的“第一”和“第二”等描述,是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种文本处理方法、装置、设备和计算机可读存储介质。具体地,本申请实施例将从文本处理装置的维度进行描述,该文本处理装置具体可以集成在计算机设备中,该计算机设备可以是服务器,也可以是用户终端等设备。其中,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。其中,用户终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能家电、车载终端、智能语音交互设备、飞行器等,但并不局限于此。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息(例如下文中目标对象的对象特征信息)、用户使用记录、用户状况等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
需要说明的是,本申请实施例提供的文本处理方法可适用于各种业务的满意度评估场景,这些场景不限于通过云服务、大数据、人工智能或结合等方式实现,具体通过如下实施例进行说明:
本申请实施例提供的文本识别方法涉及人工智能(Artificial Intelligence,AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
然而,本申请实施例可通过自然语言处理技术中的文本处理和/或语义理解技术来实现文本处理任务,以完成文本的语义分类。具体通过如下实施例进行说明:
需要说明的是,在该文本处理场景中,其主要通过神经网络(Artificial NeuralNetworks,ANNs)模型来实现的,以下简称为“模型”。而该文本识别过程可包括模型的训练阶段(A)和应用阶段(B)。该训练阶段和应用阶段可通过文本处理系统中的一个或多个设备组合来实现。
例如,参见图1,为本申请实施例提供的文本处理系统的场景示意图,该场景系统可以包括服务器和/或终端;当系统仅包括服务器或终端时,服务器或终端上包括目标数据库和文本处理装置,该文本处理装置可以包括模型训练装置和模型应用装置。
其中,该目标数据库可以存储有大量的数据,该数据不限于包括结构化数据、非结构化的文本类数据,这些数据可作为模型训练阶段的样本数据。
示例性的,结合业务场景而言,本申请涉及的业务对象可以是商品(例如实体产品、软件产品)、服务(例如技术支持服务、应用服务等)、规划设计咨询、业务项目的问卷调查以及其他任意形式服务等,而该数据可以是以上业务对应的数据。例如,以实体产品的业务为例,该实体产品可以是任意类型的物品,该目标数据库可以是物品代理方、物品成交平台或供应商的数据库,可以理解的是,用户在成交一个目标物品后,可基于对该目标物品的个人体验给予反馈,比如针对该目标物品撰写评价内容,该内容不限于包括该目标物品的属性信息、个人体验等等,可将包含对业务对象的评价内容的文本定义为“业务评价文本”。而该目标数据库中可存储有任意一个用户对目标物品的历史业务评价文本、针对该历史业务评价文本设定的样本情感分类结果,以及包含成交该目标物品的用户的特征信息、目标物品的属性特征信息等,此外,还可包含每个用户在成交目标物品后的历史满意度等。
为了便于理解,本申请实施例所涉及的模型包括第一目标模型和第二目标模型,按照不同的模型训练场景,可将数据库中数据划分为第一样本数据和第二样本数据。结合以上示例中目标数据库的数据,可将历史业务评价文本和样本情感分类结果归类为第一样本数据;将用户的特征信息、目标物品的属性特征信息以及对应的历史满意度归类为第二样本数据。
(A)模型的训练阶段包括用于情感分类的模型的训练过程以及用于满意度预测的模型训练过程,具体如下:
(A.1)用于情感分类的模型(第一目标模型)的训练过程:
为了能够快速执行文本处理任务,本申请实施例可选用一种预训练的深度学习模型,如选用双向编码模型(Bidirectional Encoder Representation from Transformers,BERT),该模型已经完成预训练,可实现深层的双向语言表征。在本申请实施例中,以该双向编码模型作为第一预设模型的基础模型,可在双向编码模型的输出处叠加一个分类层,该分类层可以是任意类型的激活函数,比如,采用双曲正切激活函数(Tanh)作为分类层,得到第一预设模型。需要说明的是,在模型训练阶段,针对该已完成预训练的第一预设模型,主要是结合下游任务(在本申请实施例中,该下游任务即基于业务评价文本进行分类的任务)相关的数据对该模型进行微调,以实现对文本的语义分析,并基于语义分析结果进行语义情感分类。
在模型的训练阶段中,模型训练装置可在获得样本业务评价文本以及对应的样本情感分类结果后,基于样本业务评价文本和样本情感分类结果对第一预设模型进行训练。具体的,在训练阶段可包括准备训练数据和模型训练。
其中,准备训练数据的过程:从目标数据库中获取第一样本数据,该第一样本数据包括样本业务评价文本和对应的样本情感分类结果,对该样本业务评价文本进行预处理,该预处理过程不限于包括文本清洗(去除停用词、标点符号等)、词语规范化(词干提取、词形还原等)、文本的向量化等过程,经过以上一种或多种预处理流程,可将样本业务评价文本转化为样本文本序列,该样本文本序列符合第一预设模型的输入格式,以利于模型学习和理解数据中语义信息。
其中,模型的训练可以理解为基于输出的预测结果与样本标签之间的差异进行对比学习训练,其主要是基于差异来构建损失函数,通过微调,实现损失最小化。具体的,模型训练的过程为:在获取样本业务评价文本以及对应的样本情感分类结果后,将样本业务评价文本输入至预训练的第一预设模型,以基于样本业务评价文本中的样本评价内容进行分类,得到预测情感分类结果;基于样本情感分类结果与预测情感分类结果,确定第一目标损失,并根据第一目标损失调整第一预设模型的网络参数,具体可以采用梯度下降算法,逐步实现对第一预设模型的微调;按照以上方式,直至达到预设条件,比如,第一预设模型输出的预测情感分类结果与样本情感分类结果相同,或者迭代训练的次数达到一定数量,又或者第一目标损失最小化,等等,得到微调后的第一目标模型。该第一目标模型可以用于参与本申请的文本处理过程。
此外,为了使得第一目标模型输出的情感分类结果包括目标情感类别标签和对应的标签概率值,在训练过程中,可增加设定第一预设模型中分类层的输出,比如添加一个输出位,或者,添加一个用于输出标签概率值的分类函数(softmax);进而,除了针对样本业务评价文本设定样本情感类别标签外,还要设定样本标签概率值,以用于上述的模型训练过程中,以此,使得完成微调的第一目标模型能够同时输出目标情感类别标签和标签概率值。
(A.2)用于满意度预测的模型(第二目标模型)训练过程:
该第二目标模型由第二预设模型基于第二样本数据训练得到,其中,第二预设模型可以是卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(RecurrentNeural Network,RNN)、长短期记忆网络(Long Short-Term Memory,LSTM)、变压器(Transformer)等各种深度学习模型。以采用长短期记忆网络(LSTM)为例,对模型训练过程进行介绍,包括数据准备阶段和模型训练阶段。
其中,在数据准备阶段中,模型训练装置可从目标数据库中获取第二样本数据(历史数据集),该第二样本数据包括样本对象在第一历史时段的样本对象特征信息、样本业务对象在第一历史时段的样本业务特征信息、样本对象在第一历史时段针对样本业务对象的第一满意度评分、样本对象在第二历史时段针对样本业务对象的第二满意度评分。进而,可将获得的样本对象特征信息、样本业务特征信息、第一满意度评分进行预处理,例如,按照特定顺序对以上信息进行拼接,并将拼接后得到的目标文本进行文本清洗(去除停用词、标点符号等)、词语规范化(词干提取、词形还原等)、文本的向量化等过程,经过以上一种或多种预处理流程,得到嵌入特征序列,该嵌入特征序列符合第二预设模型的输入格式。
其中,模型的训练可以理解为基于输出的预测结果(预测的满意度评分)与样本结果(第二满意度评分)之间的差异进行实时更新训练,当出现新的满意度时,以新的满意度作为模型训练的标签数据,当模型训练时输出的预测结果与标签数据存在差异,则基于差异来构建损失函数,以实时调整模型的参数,确保模型得到实时更新。具体的,在模型训练阶段中,模型训练的过程为:将数据准备阶段得到的嵌入特征序列输入第二预设模型,以获得训练阶段样本对象在第二历史时段对样本业务对象的预测满意度评分,将该预测满意度与真实的第二满意度评分进行对比,当两者存在差异时,基于该这两者来构建第二目标损失,并根据第二目标损失来调整第二预设模型的网络参数,并进行迭代训练,直至达到预设的训练结束条件,该预设的训练结束条件可以为:第二预设模型输出的预测满意度评分与第二满意度评分相同或无限接近,或者迭代训练的次数达到一定数量,又或者第二目标损失最小化,等等,至此,训练得到第二目标模型。
(B)模型的应用阶段:
在模型的应用阶段中,模型训练装置可将微调后的第一目标模型上传或安装至模型应用装置中,以及将训练后的第二目标模型上传或安装至模型应用装置中,以使得模型应用装置运行该第一目标模型和第二目标模型,以执行文本处理的相关流程。具体的,模型应用装置在获取业务评价文本后,可通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果,根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分,通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分。
通过以上模型的训练阶段和应用阶段的场景,可以实现本申请的文本处理方法。
例如,假设服务器或终端上包括目标数据库、模型训练装置和模型应用装置,服务器或终端可以基于目标数据库中的样本业务评价文本准备训练数据,并通过模型训练装置根据训练数据对第一预设模型进行微调,并将训练后的第一目标模型传输到模型应用装置上运行。此时,终端或服务器可以实现如下:获取业务评价文本,业务评价文本包含目标对象在第一时段针对业务对象的评价内容;通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果;根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分;通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分,第二时段位于第一时段之后。
又如,以终端和服务器组合的系统为例,终端与服务器之间建立有通信连接。其中,服务器可以是由多个物理服务机构成的分布式服务系统,其至少包含目标数据库、模型训练装置和模型应用装置,可在服务器上完成对模型的训练后,通过服务器分别运行训练后的第一目标模型和第二目标模型。具体的,在模型应用阶段中,可通过终端上的客户端向服务器发送业务评价文本,该业务评价文本包含目标对象在第一时段针对业务对象的评价内容;而服务器获取到业务评价文本后,获取业务评价文本;通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果;根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分;通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分,第二时段位于第一时段之后。此后,服务器可将每个目标对象在第一时段的满意度评分和在第二时段的预测满意度评分进行汇总存储,以用于后续其他用途,比如,用于决策对业务对象的改善、调整等。
示例性的,结合图1所示,以网络购物平台的物品成交服务为例,假设终端上安装有网络购物平台的应用(客户端),用户可在网络购物平台的应用上针对已成交物品作出评价,评价内容可包括个人体验、物品属性等,用户在通过该客户端发布针对物品的评价内容后,客户端会以文本形式将评价内容(业务评价文本)发送至服务器。服务器在获取到针对该物品的业务评价文本后,通过第一目标模型来处理业务评价文本,在将业务评价文本输入第一目标模型之前,可对业务评价文本进行预处理,此处不作限定,第一目标模型输出用户当前(最近一次)对该物品的情感分类结果;进而,根据情感分类结果,确定目标对象对业务对象的满意度评分;最后,通过第二目标模型基于满意度评分、物品的特征信息、用户的特征信息,预测用户在未来时刻对物品的预测满意度评分。此后,可用户此次的满意度评分、未来的满意度评分、以及情感分类结果等信息进行存储,以用于后续的物品的调整策略中,比如,后续可基于存储汇总的信息对物品进行改善。以上仅为示例,不作为实施本申请的具体限定。
需要说明的是,以上仅为示例,还可应用于其他文本处理场景中,此处不做一一赘述。
为了便于理解,以下将分别对文本处理方法的各步骤进行详细说明。需说明的是,以下实施例的顺序不作为对实施例优选顺序的限定。
在本申请实施例中,将从文本处理装置的维度进行描述,以该文本处理装置具体可以集成在计算机设备如终端或服务器中。参见图2,图2为本申请实施例提供的文本处理方法的步骤流程示意图,本申请实施例以文本处理装置具体集成在服务器上为例,服务器上的处理器执行文本处理方法对应的程序指令时,具体流程如下:
101、获取业务评价文本。
在本申请实施例中,为了评估用户对任意类型业务的满意度或认可度,可通过用户反馈的信息来作为评判依据,即将用户反馈的信息作为基础数据,以对该基础数据进行分析,从而基于分析结果来评估该用户对相应类型业务的满意度或认可度。然而,用户对相应类型业务的评价内容属于其中一种用户反馈信息,因此,可获取包含用户对相应类型业务的评价内容的业务评价文本,以用作后续评估满意度或认可度的基础数据。
其中,该业务评价文本可以包含业务相关的内容信息,如,该业务评价文本可至少包含目标对象在第一时段针对业务对象的评价内容,该评价内容不限于包括业务对象的属性特征、目标对象对业务对象的意见或体验等。此外,该业务评价文本还可以包括目标对象在发布、公开评价内容时的时间戳,本申请实施例中,可以筛选时间戳位于第一时段的业务评价文本,即业务评价文本包含目标对象在第一时段针对业务对象的评价内容。
其中,该业务对象可以是任意类型的业务,其可以是商品(例如实体物品、虚拟物品)、电子文档、技术支持服务、咨询规划项目、设计方案服务、应用程序(软件应用)等等,其可泛指可供双方达成一致的任意形式物体或事件,此处不作一一列举。
其中,该目标对象可以是能够对该业务对象进行评价的对象,例如,该目标对象可以是业务对象的使用方,可以理解的是,该业务对象可对目标对象具有关联关系,即业务对象可能会对目标对象产生影响。具体的,该目标对象可以是用户个体、集体(企业、单位、协会等)等,需要说明的是,以上任意类型的目标对象可以通过编号(ID)、注册号、通信地址、账号、昵称、对象自定义标识等形式来表示。
可以理解的是,业务评价文本中的评价内容具有时限特性,其中,第一时段可以是在此之前的任意时间段,如当前时段、过去1小时、过去一天内、过去一周内等等,结合第一时段而言,该业务评价文本为已经发布、公开的业务评价文本。
在一些实施方式中,可以通过任意途径获取到业务评价文本,例如,步骤101可以包括:查询业务对象关联的交互地址;基于业务对象关联的交互地址,获取业务评价文本。
示例性的,以某目标实体产品作为业务对象为例,该目标实体产品可在多个平台上进行发布,以供用户查询、咨询、购买、评价等,用户可以针对咨询该目标实体产品的相关情况,在用户的咨询过程中可能会表述出相关评价意见,如,“这个目标实体产品看起来很好,不知道使用起来体验怎么样”、“这个目标实体产品的形状是多边形,一看就喜欢”、“很期待这个目标实体产品”等等;此外,用户在体验或使用该目标实体产品后,还可针对该目标实体产品的使用情况来发表评价内容,如,“这个目标实体产品的外观很好看,多彩颜色配合多边形外观,且使用的特效特别好,很喜欢”、“这个目标实体产品的效果很一般”、“这个目标实体产品的使用体验不满意,效果不好”等等。以上仅为示例,本申请实施例还可用于虚拟物品、电子文档、技术支持服务、咨询规划项目、设计方案服务、应用程序(软件应用)等业务的咨询或反馈场景中,此处不作一一列举。
需要说明的是,在按照交互地址来获取业务评价文本时,可以通过接口(Application Program Interface,API)、爬虫等数据抓取方式来实现,在抓取数据时,需要确保数据的质量和完整性,可有效避免数据缺失导致后续的识别结果或评估结果不准确的现象。
在一些实施方式中,目标对象具有亲近关系的参考对象,该参考对象对业务对象的评价可能对目标对象针对业务对象的评价产生影响,比如,参考对象的意见、观点等会影响目标对象的意见和观点,从而影响目标对象的评价内容,因此,还可结合参考对象对该业务对象的意见、观点来评估目标对象对该业务对象的满意度,该参考对象对该业务对象的意见、观点不限于通过相关的评价内容来体现。例如,业务评价文本还包括参考对象在第一时段针对业务对象的参考评价内容,参考对象为与目标对象同属一个对象分组,则步骤101可以包括:
(101.1)获取目标对象在第一时段针对业务对象的业务评价内容;
(101.2)确定目标对象所属的对象分组,并获取对象分组中每个参考对象在第一时段针对业务对象的候选评价内容;
(101.3)基于对象分组中每个参考对象在第一时段针对业务对象的候选评价内容,选取参考对象在第一时段针对业务对象的参考评价内容。
其中,该第一时段可以是在此之前的任意时间段,如当前时段、过去1小时、过去一天内、过去一周内等等,结合第一时段而言,该业务评价文本为目标对象最新发布、公开的业务评价文本。
其中,该对象分组可以是目标对象所属的任一个集体分组,如家庭成员分组、公司(企业)分组、协会分组、好友群组、业务对象反馈群组等,以上分组可以通过账号数据形式来体现,即对象分组包含目标对象的账号信息以及参考对象的账号信息,可以理解的是,该参考对象可以是与目标对象同属一个分组中的任一对象。示例性的,以好友群组为例,该参考对象可以是目标对象关联的好友对象,该好友群组中包含有目标对象的账号信息、以及目标对象关联的好友对象(参考对象)的账号信息;又如,假设业务对象为目标类型的车辆,则该对象分组可以是还目标类型车辆的车友群,参考对象为购置有该目标类型车辆的用户,则车友群中可包含目标对象的账号信息以及其他车友用户的账号信息。可以理解的是,参考对象还可以理解为享有对业务对象发布评价内容权益的对象,该对象分组可以理解为针对业务对象具有发布评价内容权益的用户的交流群组;以上仅为示例,不作为实施本申请的限定方式。
为了确保后续在评估目标对象对业务对象的满意度时的准确性,还可结合目标对象关联的参考对象的评价内容,以便后续基于目标对象的评价内容和参考对象的评价内容来评价目标对象对参考对象的满意度。具体的,在获取业务评价文本时,可通过从现有的业务评价文本集合中搜索,例如,该业务评价文本集合中的每个业务评价文本都携带有所属的对象标识和发布时的时间戳,按照时间戳和对象标识,查找目标对象在第一时段针对业务对象发布的评价内容;此外,为了获取参考对象的评价内容,可先确定目标对象的标识所属的对象分组,以确定该对象分组中所包含每个参考对象,进而,按照时间戳,查找每个参考对象在第一时段针对业务对象发布的评价内容,以作为候选评价内容,进而,选取一个或多个候选评价内容作为所有参考对象整体的参考评价内容。需要说明的是,在查询参考对象的候选评价内容时,可不具有时间限制,比如,该候选评价内容可以是第一时段或在第一时段之前发布的评价内容,为了考虑参考对象的意见、观点对目标对象产生影响,该候选评价内容可以是与目标对象的评价内容同步发布或在目标对象的评价内容之前发布,此处不做限定。
示例性的,以目标产品作为业务对象为例,用户A为目标对象,用户B为参考对象,用户A和用户B属于同一个好友分组中的成员,假设用户A和用户B在同一天购买到目标产品,或者用户B比用户A早一天购买到目标产品,用户B和用户A可能会针对目标产品的性能、使用体验、产品特征等展开交流,用户B对目标产品的观点、意见等可能会影响用户A产生影响,进而,影响用户A对目标产品的评价,即用户B对目标产品的评价可与用户A具有关联性,因此,在分析用户A对目标产品的情感时,可以获取用户A对目标产品的直接评价内容,此外,获取用户B对目标产品的评价内容作为参考评价内容,以便后续结合用户A的直接评价内容和用户B的参考评价内容来分析用户A的情感,进而确定用户A对目标产品的满意度。
示例性的,以目标车辆作为业务对象为例,对象分组可以是目标车辆的车友群,用户B属于该车友群中的成员,用户A在新购目标车辆后加入车友群,作为车友群新成员,用户A可向用户B研讨关于目标车辆的车辆性能、使用体验等,从而,以对目标车辆做出评价,此时,目标车辆平台为了分析用户A对目标车辆的情感、满意度等,可结合用户A的评价内容以及用户B的参考评价内容来进行分析,具有可靠性。
在一些实施方式中,亲密度可体现目标对象与群组中其他对象之间的亲近关系,比如,亲密度可以是基于目标对象与参考对象之间的交互或交流时长来确定的,可以理解的是,当目标对象与某个参考对象之间交互(比如聊天)时长越大,两者之间的亲密度越高,针对亲密度越高的参考对象,其对业务对象的言论、观点会影响目标对象的评价内容的可能性越大,因此,在选取参考对象群体的参考评价内容时,可按照亲密度大小方式选取亲密度较高的参考对象的候选评价内容作为参考对象群体的参考评价内容。例如,步骤(101.3)可以包括:确定对象分组中每个参考对象与目标对象之间的亲密度评分;基于每个参考对象针对业务对象的候选评价内容,选取亲密度评分最高的参考对象的候选评价内容作为参考对象在第一时段针对业务对象的参考评价内容。
需要说明的是,该亲密度可反映目标对象与参考对象之间的亲密关系程度,亲密度不仅可通过参考对象与目标对象的之间的交互时长来确定,还可根据目标对象与参考对象之间的特征信息的匹配度情况来确定;例如,目标对象与参考对象的年龄、性别、昵称、社会关系等因素的匹配度情况都可影响亲密度。示例性的,参考对象与目标对象的年龄相同或越相近,则亲密度的加成越高;参考对象与目标对象的性别相同,则亲密度的加成越高;参考对象与目标对象的姓氏相同,则亲密度的加成越高;参考对象与目标对象的社会关系越近,如参考对象为目标对象的家庭成员,则亲密度的加成越高;等等;以上仅为示例,不作为实施本申请的具体限定方式。
通过以上方式,可获取到目标对象相关的业务评价文本,以便后续基于该业务评价文本中的内容来分析目标对象针对业务对象时的意见、观点等情感,从而后续基于分析结果来评估目标对象对业务对象的满意度,具有可靠性。
102、通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果。
在本申请实施例中,为了评估目标对象针对业务对象的满意度,需要先对业务评价文本中的内容进行语义理解,以分析出文本中的语义,从而,基于语义结果进行语义情感分类,得到情感分类结果,以便后续基于情感分类结果来评估目标对象针对业务对象的满意度。
其中,该情感分类结果可以是针对业务评价文本中内容的语义分类结果,在语义分类时,主要是对内容进行语义情感的分类。该情感分类结果可以包括业务评价文本中内容所属的目标情感类别标签,以及该目标情感类别标签对应的标签概率值。示例性的,情感类别标签的种类可以包括正向、中性和负向三种类别的情感类别标签,而标签概率值表示属于该情感类别标签的概率,该概率可反映属于对应的情感类别标签的可能性大小。需要说明的是,情感分类结果可仅包括一个目标情感类别标签和对应的标签概率值,例如,假设在进行语义情感分类时,属于正向情感类别标签的概率为0.7,属于中性情感类别标签的概率为0.29,属于负向情感类别标签的概率为0.01,则情感分类结果可为“正向情感类别标签--0.7”;此外,情感分类结果还可包含包括以上三种标签以及每种标签对应的标签概率值,此处不做限定。
需要说明的是,本申请实施例在对业务评价文本中的内容进行情感分类时,可以通过神经网络模型来对业务评价文本进行处理,以分类出业务评价文本对应的情感类别。其中,该第一目标模型可以是采用深度学习模型,如双向编码模型(BERT),该模型属于预训练的深度学习模型,经过微调后可以用于处理文本,通过各编码层抽取深层语义信息,以便基于深层语义信息来进行语义情感分类,得到情感分类结果。
在一些实施方式中,为了使得模型更好处理文本,可先对业务评价文本进行预处理,以得到符合模型输入格式的数据,并通过第一目标模型来对预处理结果进行语义情感的分类处理,以得到情感分类结果。例如,步骤102可以包括:
(102.1)对业务评价文本进行预处理,得到文本序列;
(102.2)将文本序列输入第一目标模型,以基于文本序列中提取的语义向量进行语义分类,得到情感分类结果。
需要说明的是,该预处理过程可以包括文本清洗、词语规范化、词语向量化等处理方式。其中,该文本清洗处理可以包括去除业务评价文本中的停用词、标点符号等信息,此外,当文本中包含有英文字母时,可将其转化为小写格式,以此,去除文本中的噪声,提高后续情感分类的准确性。其中,该词语规范化处理方式可以包括对业务评价文本中词语的词干提取、词形还原等,以统一规范文本中的词语,提高后续情感分类的准确性。需要说明的是,文本清洗和词语规范化的处理流程为可选流程,可根据实际情况而定。
其中,编码处理方式可以包括词袋模型、词频与逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、词嵌入等。例如,以词频与逆文档频率的编码方式为例,该编码过程可以包括:确定业务评价文本中每个目标词语对应的词频率;针对业务评价文本中的每个目标词语,确定预设语料库(针对业务对象的评价文本数据库)中包含目标词语的目标文档的数量;根据目标文档的数量以及预设语料库包含的文档数量,确定每个目标词语对应的逆文档频率;将每个目标词语对应的词频率与逆文档频率之间的乘积确定为每个目标词语的词向量,以得到文本序列。
在一些实施方式中,在基于文本序列中提取的语义向量信息进行语义分类时,主要是对文本序列进行深层次的语义向量提取,以对每个词语进行增强表示,进而基于增强表示的语义信息进行分类,得到情感分类结果。例如,第一目标模型包括编码处理层和分类层,步骤(102.2)可以包括:将文本序列输入第一目标模型,该第一目标模型中的每个转换编码器进行特征提取,并传递到下一个转换编码器,按照以上方式,直至最后一层转换编器层完成特征提取,基于最后一层转换编码器输出的语义向量信息进行语义情感分类,得到情感分类结果。
示例性的,结合图3所示,该编码处理层可以是双向编码模型(BERT),其在结构上可以由输入层以及多层的转换编码器(Transformer,Trm)组成,输入层的输出与第一层中每个转换编码器“Trm”的输入进行全连接,且第一层中每个转换编码器“Trm”的输出与第二层中的每个转换编码器“Trm”的输入进行全连接,以此类推,直至倒数第二层中每个转换编码器“Trm”的输出与最后一层的转换编码器的输入进行全连接。而该双向编码模型对文本序列的处理过程为:在将文本序列输入至输入层后,将文本序列中的每个字符(或词语)向量传输至第一层中的各个转换编码器进行编码处理;进而,基于第一层中每个转换编码器的输出与第二层中的每个转换编码器的输入之间的全连接关系,将第一层中的每个转换编码器输出的编码向量输入至第二层中的每个转换编码器进行编码处理,以此类推,直至最后一层的每个转换编码器进行编码处理;至此,每个转换编码器基于自注意力机制(Self-Attention)和全连接关系,在对相应的每个字符(或词语)向量进行编码处理时考虑其上下文,以捕捉不同向量之间的长距离依赖关系,得到语义增强表示的语义向量序列,其中,语义向量序列中每个语义向量包含深层语义,其长度大小可以是1*512。最后,以激活函数(Tanh)作为分类层,对语义向量序列进行分类,得到情感分类结果。
其中,该情感分类结果的类别可以包括正向情感类别标签、中性情感类别标签和负向情感类别标签中的一种,具体可以通过“1”、“0”“-1”来分别表示对应的标签,此外,还包括对应的标签概率值,可在编码处理层的输出处增设一个softmax激活函数或sigmoid激活函数作为概率值的分类层,此处不做限定。
在一些实施方式中,第一目标模型可采用预训练的双向编码模型(BERT)作为基础,并基于下游任务来设定模型的输出,以进行微调训练,实现模型快速收敛,以便用于对业务评价文本的语义情感分类。例如,在步骤102之前,还可以包括:获取样本业务评价文本以及对应的样本情感分类结果,样本业务评价文本至少包括样本对象针对样本业务对象的样本评价内容;将样本业务评价文本输入至预训练的第一预设模型,以基于样本业务评价文本中的样本评价内容进行分类,得到预测情感分类结果;基于样本情感分类结果与预测情感分类结果,确定第一目标损失;根据第一目标损失调整预训练的第一预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第一目标模型。
其中,该第一预设模型为预训练的双向编码模型(BERT),在对第一预设模型进行微调训练时,采用的训练数据可以是历史时段的业务评价文本,还可以是专业人员设定的评价文本,将以上文本作为第一预设模型输入的样本输入数据,在输入之前,可对以上样本输入数据进行预处理,如文本清洗、词语规范化、词语向量化等处理流程。此外,针对样本输入数据设定样本结果,即样本标签,以用于指导第一预设模型进行微调训练。
通过以上方式,可对业务评价文本中的内容进行深层次的语义理解,以基于理解的语义信息进行语义情感分类,得到情感分类结果,提高情感分类的准确性;从而,以便后续基于情感分类结果来评估目标对象针对业务对象的满意度,具有可靠性。
103、根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分。
在本申请实施例中,在得到业务评价文本对应的情感分类结果,可以确定该情感分类结果中的具体标签类别,并确定对应的标签概率值,而该标签概率值可以视为一个连续的情感得分,其可反映目标对象针对业务对象的情感倾向,通过结合标签类别和标签概率值,可评估目标对象对业务对象的满意度,具有可靠性。
在一些实施方式中,可结合目标对象针对业务对象的情感倾向和对应的标签概率值来确定情感类别评分,并根据该情感类别评分来计算满意度评分,以表示目标对象在第一时段对业务对象的满意度。例如,情感分类结果包括业务评价文本属于目标情感类别标签的标签概率值,步骤103可以包括:
(103.1)根据业务评价文本属于目标情感类别标签的标签概率值,确定业务评价文本对应的情感类别评分;
(103.2)根据业务评价文本对应的情感类别评分,确定目标对象在第一时段对业务对象的满意度评分。
在一些实施例中,可以预先设定不同情感类别标签的标签概率值与情感类别评分之间的映射关系,之后,基于该映射关系和业务评价文本属于目标情感类别标签的标签概率值,来确定业务评价文本对应的情感类别评分。其中,针对情感类别标签属于正向的类别标签,该情感类别标签的标签概率值可以与情感类别评分呈正相关关系,针对情感类别标签属于负向的类别标签,该情感类别标签的概率值可以与情感类别评分呈负相关关系。情感类别标签属于中性的类别标签对应的情感类别评分小于属于正向的类别标签对应的情感类别评分,而且高于属于负向的类别标签对应的情感类别评分。
在一些实施例中,在确定业务评价文本对应的情感类别评分时,需要结合情感类别标签的类型来确定,而情感类别标签的种类可以包括:正向情感类别标签、中性情感类别标签、负向情感类别标签。具体的,当情感类别标签为正向情感标签时,将正向情感标签对应的标签概率值确定为情感类别评分;当情感类别标签为均衡情感标签时,将均衡情感标签对应的标签概率值确定为情感类别评分;当情感类别标签为负向情感标签时,将负向情感标签对应的标签概率值取反处理,得到目标数值,并将目标数值确定为情感类别评分。
示例性的,假设“1”、“0”“-1”分别表示正向情感类别标签、中性情感类别标签、负向情感类别标签。例如,情感分类结果为“1”,对应概率为“0.7”,则表示目标对象对业务对象的情感倾向为正向,该正向情感类别评分为0.7;又如,情感分类结果为“0”,对应概率为“0.5”,则表示目标对象对业务对象的情感倾向为中性,该中向情感类别评分为0.5;有假设情感分类结果为“-1”,对应概率为“0.7”,则表示目标对象对业务对象的情感倾向为负向,该负向情感类别评分为“-0.7”。以上仅为示例,不作为限定的实施方式。
在一些实施方式中,可以预先构建满意度函数,该函数的构建过程为获取分值规范系数和权重系数,以分值元素与分值规范系数之和作为目标分值,并按照目标分值与权重系数之间的比值计算方式构建满意度评分函数;进而,可将业务评价文本对应的情感类别评分代入满意度评分函数中的分值元素,从而,得到目标对象在第一时段对业务对象的满意度评分。此外,还可直接获取各项系数,并与情感类别评分进行计算得到满意度评分,例如,步骤(103.2)可以包括:获取分值规范系数和权重系数;以业务评价文本对应的情感类别评分与分值规范系数之和作为目标分值;确定目标分值与权重系数之间的比值,得到目标对象在第一时段对业务对象的满意度评分。
示例性的,情感类别评分的范围为[-1,1],-1表示最负面的情感,1表示最正面的情感,0表示中性情感,则满意度评分的计算方式为S=(x+1)/2,其中,S表示满意度评分,x表示情感类别评分,1表示分值规范系数,2表示权重系数。以上仅为示例,关于各系数还可取值其他数值。此外,还可通过Sigmoid函数、softmax函数以及其他函数作为满意度评分函数,实现情感类别评分映射到一个(0,1)的范围,使得满意度评分具有较好解释性,以准确反映目标对象对业务对象的满意度。
通过以上方式,可结合目标对象针对业务对象的情感倾向和对应的标签概率值来确定情感类别评分,以根据该情感类别评分来计算满意度评分,实现评估目标对象对业务对象的满意度,至此,实现基于业务评价文本来评估目标对象对业务对象的满意度,具有可靠性。
104、通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分。
在本申请实施例中,为了预测目标对象在未来时段对业务对象的满意度,还可结合当前的满意度评分、业务对象的特征、目标对象的特征等多维度特征来预测目标对象在未来时刻对业务对象的满意度评分,该评估过程可以通过模型来实现,其主要是利用模型的非线性处理能力,基于多维特征信息来进行预测,以获取目标对象在未来时段对业务对象的预测满意度评分。
需要说明的是,该第二时段位于第一时段之后,其可以理解为未来时间段,如未来的1小时、未来1天、未来一周、未来一个月等等,此处不做限定。
其中,该业务特征信息可以是对应的业务对象所具有的属性,其可反映业务对象的特点,结合时间特性考虑,该业务特征信息可以是在第一时段时的特征信息。例如,以产品作为业务对象为例,该业务特征信息可以是实体产品的形状、出厂日期、产品种类、性能、功能、成分等等信息,还可包括产品属性,此处不做一一列举。又如,以非产品为例,该业务特征信息可以包括该业务的时间特性、地点位置特性、用途或功能、耗材等,此处不做一一列举。
其中,该对象特征信息可以是表示目标对象在第一时段的特征信息。例如,以用户作为目标对象为例,对象特征信息可以包括用户的静态特征和动态特征,静态特征不限于包括年龄、所在地区、账户的资源状态等,动态特征可以是用户的操作数据,如不限于包括阅读、浏览、筛选、针对业务对象作出决策所占用时长等等,以上仅为示例,还可包括其他静态、动态的特征信息。
在一些实施方式中,第二目标模型可以采用时序相关的模型,其具有时序上的特征处理能力,通过特定方向的特征传播来实现学习和理解相关语义,以预测未来的满意度评分。例如,第二目标模型包括前向特征提取层、特征融合层和分类层,步骤104可以包括:将满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息进行拼接,得到目标文本;将目标文本进行嵌入处理,得到嵌入特征序列;由前向特征提取层对嵌入特征序列进行前向传播,得到前向特征序列;由特征融合层将嵌入特征序列与前向特征序列进行融合,得到融合特征序列;由分类层对融合特征序列进行线性转换,输出目标对象在第二时段对业务对象的预测满意度评分。
其中,前向传播可以是指按照嵌入特征序列的正向顺序对每个特征向量进行处理,具体为按照从前到后的顺序对嵌入特征序列中的每个特征向量进行处理,并将处理得到特征状态传播到下一个时序的特征向量处理过程中,如此,使得在每个特征向量时获得从前向传播过来的上文特征。示例性的,假设经过嵌入(或词语向量化)处理后得到的嵌入特征序列为“E1/E2/E3/E4/E5/E6/E7/E8/E9/E10/E11/E12/E13/E14/E15”,按照前到后传播方式,“E1”处理得到的特征作为“E2”的上文特征,并在处理“E2”时结合处理“E1”时传过来的上文特征进行融合,融合得到的目标特征作为处理“E3”时的上文特征,可以理解的是,“E3”的上文特征包含“E1”和“E2”的全部或部分特征,“E4”的上文特征包含“E1”、“E2”和“E3”的全部或部分特征,以此类推,直至前向特征提取层对结合“E15”的上文特征对“E15”进行处理完毕。需要说明的是,上文特征是相对于每个特征向量而言的,即不同特征向量具有不同的上文特征。
具体的,在获取到目标对象在第一时段对业务对的满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息后,可对满意度评分、业务特征信息以及对象特征信息进行拼接处理,得到目标文本,可对目标文本预处理,如文本清洗、词语向量化等,得到嵌入特征序列;进而,将嵌入特征序列输入至第二目标模型,通过第二目标模型中的前向特征提取层来对嵌入特征序列中的每个特征向量进行传播,具体可以是按照句子文本的从前到后方向对嵌入特征序列中各个特征向量进行传播,以使得嵌入特征序列中每个特征向量都具有不同的前向传播特征,即上文特征;进而,针对嵌入特征序列中每个特征向量,都与其对应的前向传播特征进行融合,得到融合特征;最后,通过分类层对融合特征进行线性分类处理,实现结合嵌入特征序列中与前向传播特征进行语义理解,即针对目标文本中的每个词语,都可结合文本内容从前到后的句式结构、语义关系、词语在句子的位置等信息来理解,提高准确性。
示例性的,该第二目标模型可以是卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等。例如,以长短期记忆网络(LSTM)为例,该长短记忆网络具有遗忘、记忆、更新等能力,这主要通过长短记忆网络内部的各个门(Gate)结构来实现,一个门结构通常包含σ(Sigmod)神经元。具体的,结合图4所示,该长短记忆网络至少包括遗忘门Ft、记忆门It、输出门Ot;此外,涉及的参数包括上一时序的隐藏输出ht-1和细胞状态Ct-1,以及当前时序的输入Xt和细胞状态Ct,输入Xt表示当前时序下输入的特征向量,细胞状态Ct-1则记录有前向传播的上文特征,隐藏输出ht-1也可视为上文特征。
其中,遗忘门Ft包含有σ(Sigmod)单元,遗忘门可基于该时序下输入的特征向量Xt和上一时序的隐藏输出ht-1进行权重计算,并经过Sigmod神经元进行归一化处理,得到值为(0,1)之间的结果Ft,通过将结果Ft与上一时序的细胞状态Ct-1相乘,以进行融合,实现遗忘不需要的部分信息。其中,基于该时序下输入的特征向量Xt和上一时序的隐藏输出ht-1进行权重计算,该计算过程如下:Ft=σ(Wf·[ht-1,Xt]+bf),其中,Wf表示遗忘门的权重矩阵参数,bf表示遗忘门的偏置参数。
其中,记忆门包含σ(Sigmod)单元和tanh单元,用于确定当前时序输入的特征向量有多少特征需要被存放到当前时序下的细胞状态Ct中。具体的,记忆门可基于该时序下输入的特征向量Xt和上一时序的隐藏输出ht-1进行权重计算,并经过的σ单元进行归一化处理得到值处于(0,1)之间的结果It,以表示需要记忆更新使用的特征信息,该计算过程表示如下:It=σ(Wi·[ht-1,Xt]+bi),其中,Wi表示权重矩阵参数,bi表示偏置参数。
其中,记忆门还基于该时序下输入的特征向量Xt和上一时序的隐藏输出ht-1进行权重计算,并经过的tanh单元进行归一化处理得到值处于(-1,1)之间的结果表示候选的记忆信息,可以理解为临时细胞状态。其中,该权重计算过程为:WC表示记忆门的权重矩阵参数,bC表示记忆门的偏置参数。
进一步的,将候选的记忆信息与需要记忆更新使用的特征信息It进行相乘,以实现两者之间的融合,得到当前时序下记忆门需要记忆的最终信息,进而,基于该需要记忆的最终信息、上一时序的细胞状态Ct-1以及遗忘信息Ft,确定当前时序下细胞状态Ct。具体计算过程如下:
需要说明的是,该遗忘门输出的Ft与上一时序的细胞状态Ct-1相乘,表示上一时序传进来的上文特征中需要遗忘部分特征信息。记忆门输出的It与当前候选的记忆信息相乘,表示当前当前时序下记忆门需要记忆到细胞状态中的特征信息,至此,通过细胞状态中信息遗忘和记忆新的信息,使得对后续时刻计算中将有用的信息进行传递,而无用信息被丢弃,得到对应时序下的细胞状态Ct。
具体的,输出门包括σ(Sigmod)单元、tanh单元和融合单元,用于确定当前时序下的隐藏输出结果。其中,输出门可基于该时序下输入的特征向量Xt和上一时序的隐藏输出ht-1进行权重计算,并经过的σ单元进行归一化处理得到值处于(0,1)之间的结果Ot,结果Ot表示当前时序下需要输出的细胞状态特征,该计算过程如下:Ot=σ(WO·[ht-1,Xt]+bO),WO表示输出门的权重矩阵参数,bO表示输出门的偏置参数。
其中,输出门还基于tanh函数对当前时序下细胞状态Ct进行非线性变换,并将非线性变换处理结果与当前时序下输出的细胞状态特征Ot相乘,以进行融合,得到当前时序下的隐藏输出结果ht,其属于细胞状态Ct衰减之后的特征向量,此外,ht还属于下一时序的隐藏状态的输入。具体计算过程为:ht=Ot·tanh(Ct)。
基于以上过程,可得到融合特征(即多个隐藏输出结果ht对应的特征序列),此后,可通过分类层对融合特征进行线性转换,以进行语义分类,得到预测满意度评分。示例性的,第二目标模型中的分类层可以采用条件随机场分类器(conditional random field,CRF),该条件随机场分类器可基于融合特征的序列构建候选标签路径,并按照候选标签路径的评分大小,选取评分最高的作为目标标签路径,以指示第二目标模型输出对应的标签序列,该标签序列至少包括预测满意度评分。
在一些实施方式中,可基于历史数据来训练得到第二目标模型,例如,步骤104之前,还可以包括:获取历史数据集,历史数据集至少包括样本对象在第一历史时段的样本对象特征信息、样本业务对象在第一历史时段的样本业务特征信息、以及样本对象在第一历史时段针对样本业务对象的第一满意度评分和在第二历史时段的第二满意度评分;其中,第一满意度评分基于样本对象在第一历史时段针对样本业务对象的第一业务评价文本确定,第二满意度评分基于样本对象在第二历史时段针对样本业务对象的第二业务评价文本确定,第二历史时段位于第一历史时段之后;根据样本对象特征信息、样本业务特征信息以及第一满意度评分,生成样本目标文本;将样本目标文本输入第二预设模型进行满意度评分预测,得到样本对象在第二时段对样本业务对象的预测满意度评分;基于预测满意度评分与第二满意度评分,确定第二目标损失;根据第二目标损失调整第二预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第二目标模型。
需要说明的是,由于第二目标模型用于预测任意目标对象对业务对象的未来满意度,其训练数据也具有时限要求,为了提高模型在预测时的准确性,需要选用特定的训练数据。具体的,以一个样本对象在上一时序中对业务对象的满意度评分、上一时序中业务对象的业务特征信息、上一时序中样本对象的对象特征信息作为样本输入数据,并以样本对象在当前时序的真实的满意度评分作为样本输出标签,以此,实现以具有时限性的真实数据作为训练数据,以用于模型进行训练,使得训练后得到的第二目标模型具有较好的预测性能,从而,模型在预测目标对象对业务对象的未来满意度评分时更说服力,具有可靠性。
在一些实施方式中,在训练第二目标模型的样本输出标签(即第二满意度评分)时,该标签为真实的满意度数据,具体根据相应的业务评价文本进行情感分类并进行计算得到。例如,该第二满意度评分的获取方式可以包括:获取样本对象在第二历史时段对样本业务对象的第二业务评价文本;通过第一目标模型对第二业务评价文本进行分类,输出第二业务评价文本对应的情感分类结果;根据第二业务评价文本对应的情感分类结果,确定样本对象在第二历史时段对样本业务对象的第二满意度评分。
需要说明的是,关于第二满意度评分的获取方式的描述与前面步骤101~103的相关描述相似,具体可参考前面步骤101~103的相关描述,此处不作赘述。
通过以上方式,可结合目标对象当前的对象特征信息、当前业务对象的业务特征信息以及当前目标对象的满意度评分等多维特征信息,预测目标对象在未来时段对业务对象的满意度评分,以表示目标对象针对业务对象的未来满意度,以便后续结合目标对象的当前满意度和未来的预测满意度情感来决策调整业务对象,具有可靠性。
在本申请实施例中,当获悉目标对象对业务对象当前的满意度和预测到未来的满意度后,可将每个目标对象对业务对象的当前满意度评分、未来的预测满意度评分反馈给业务对象的管理平台,以使得业务对象的管理平台基于收到的反馈数据决策是否调整业务对象,使得业务对象更符合多数目标对象的需求,具有可靠性。
在一些实施方式中,可按照特定关注的对象群体来收集满意度反馈数据。例如,步骤104之后,还可以包括:确定对象集合,对象集合包含多个目标对象;根据每个目标对象对应的满意度评分和预测满意度评分,生成针对业务对象的反馈提示信息;向业务对象的管理端发送反馈提示信息。
其中,该对象集合可以是业务对象的管理平台特别关注的目标对象群体,如会员(VIP)群体,与业务对象的管理平台交互密切的群体等,此处不做限定。
示例性的,以车辆作为业务对象为例,该对象群体可以是购车用户所属的群组,获取每个购车用户当前对个人车辆的满意度评分以及未来的预测满意度评分,并基于多个购车用户当前的满意度评分和未来的预测满意度评分来生成在该时间段的反馈提示信息,该反馈提示信息可以是列表形式,列表中包含每个用户对应的标识、车辆类型、购车时间、满意度数据等,如,其格式可以为“用户标识-购车时间-车辆类型-评价的时间-当前满意度评分-预测满意度评分”。进而,将以上反馈提示信息发送给业务对象的管理端,以供查阅。以上仅为示例,作不作为限定的实施方式。
由上可知,本申请实施例可针对包含目标对象在第一时段对业务对象的评价内容的文本,通过第一目标模型来进行语义分析,以分类出该目标对象在第一时段对业务对象的情感分类结果,确保语义分析时的准确性,然后,基于该情感分类结果来计算目标对象在第一时段对业务对象的满意度评分,最后,通过第二目标模型基于该第一时段的满意度评分、业务对象的业务特征信息以及目标对象的对象特征信息来预测目标对象在第二时段对业务对象的满意度评分,提高满意度评估时的稳定性和效率。以此,可提高评估用户对业务满意度时的准确性,且可预测用户对相关业务的未来满意度。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
本申请实施例以文本处理为例,对本申请实施例提供的文本处理方法作进一步叙述。
图5是本申请实施例提供的文本处理方法的另一步骤流程示意图。为了便于理解,本申请实施例结合图5进行描述。
在本申请实施例中,将从文本处理装置的维度进行描述,该文本处理装置具体可以集成在计算机设备如服务器中。例如,该计算机设备上的处理器执行文本处理方法对应的程序时,该文本处理方法的具体流程如下:
201、获取每个目标对象在第一时段针对业务对象的业务评价文本。
本申请实施例为了评估用户对业务对象的满意度或认可度,将用户反馈的信息作为基础数据,例如,将用户对业务对象的业务评价文本作为基础数据,以对该基础数据进行分析,从而基于分析结果来评估该用户对业务对象的满意度或认可度。
其中,该业务评价文本可以是包含业务对象的属性特征、目标对象对业务对象的意见或体验等。该业务评价文本具有对应的时间戳,表示目标对象在发布、公开评价内容时的时间。
其中,该业务对象可以是实体物品、虚拟物品、电子文档、技术支持服务、咨询规划项目、设计方案服务、应用程序(软件应用)等等,也可以泛指供双方达成一致的任意形式物体或事件,此处不作一一列举。
具体的,在获取业务评价文本时,可通过接口地址、爬虫等方式来获取相关的目标对象在第一时段针对业务对象的业务评价文本。
202、针对每个业务评价文本,对业务评价文本进行预处理,得到文本序列。
在本申请实施例中,为了评估目标对象针对业务对象的满意度,需要先对业务评价文本中的内容进行语义理解,以分析其目标对象针对业务对象的情感类别,以便后续基于情感分类结果来评估目标对象针对业务对象的满意度。
需要说明的是,可通过模型来对每个业务评价文本进行语义理解,为了提高后续情感分类的准确性,可对每个业务评价文本进行预处理,该预处理过程不限于包括文本清洗、词语规范化、词语向量化等。
其中,该文本清洗过程为:去除业务评价文本中的停用词、标点符号等信息,此外,当文本中包含有英文字母时,可将其转化为小写格式,以此,去除文本中的噪声。
其中,该词语规范化过程为:对业务评价文本中的词语进行词干提取、词形还原等,以统一规范文本中的词语。
其中,词语向量化可以理解为将文本编码成向量,具体的,可通过词频与逆文档频率来进行编码,该编码过程为:针对每个业务评价文本,确定每个目标词语对应的词频率;确定所有(可以理解为当前第一时段)的业务评价文本中包含目标词语的文档数量,以确定每个目标词语对应的逆文档频率;将每个目标词语对应的词频率与逆文档频率之间的乘积确定为每个目标词语的词向量,以得到每个业务评价文本对应的文本序列。
203、通过第一目标模型来对每个文本序列进行分类处理,得到每个目标对象对业务对象的目标情感类别标签,以及目标情感类别标签对应的标签概率值。
需要说明的是,第一目标模型包括编码处理层和分类层。其中,编码处理层在基于文本序列中提取的语义向量信息进行语义分类时,主要是对文本序列进行深层次的语义向量提取,以对每个词语进行增强表示;具体的,该编码处理层中包含多层转换编码器,每层转换编码器都会结合自注意力机制进行编码,以实现特征提取,经过多层转换编码器的特征提取,得到深层语义向量。其中,分类层可以对增强表示的语义信息进行情感分类,得到情感分类结果。
其中,该情感分类结果的类别可以包括正向情感类别标签、中性情感类别标签或负向情感类别标签中的一种,具体可以通过“1”、“0”“-1”来分别表示对应的标签,此外,还包括情感类别标签对应的标签概率值。
204、根据每个目标情感类别标签的标签概率值,确定每个目标对象对业务对象的情感类别评分。
在本申请实施例中,在确定业务评价文本对应的情感类别评分时,需要结合情感类别标签的类型来确定。具体的,当情感类别标签为正向情感标签时,将正向情感标签对应的标签概率值确定为情感类别评分;当情感类别标签为均衡情感标签时,将均衡情感标签对应的标签概率值确定为情感类别评分;当情感类别标签为负向情感标签时,将负向情感标签对应的标签概率值取反处理,得到目标数值,并将目标数值确定为情感类别评分。
205、根据每个目标对象对业务对象的情感类别评分,确定每个目标对象在第一时段对业务对象的满意度评分。
在本申请实施例中,预先构建满意度评分函数,该函数的构建过程为获取分值规范系数和权重系数,以分值元素与分值规范系数之和作为目标分值,并按照目标分值与权重系数之间的比值计算方式构建满意度评分函数。
进而,在得到每个目标对象对业务对象的情感类别评分后,可将业务评价文本对应的情感类别评分代入满意度评分函数中的分值元素,以业务评价文本对应的情感类别评分与分值规范系数之和作为目标分值,进而,确定目标分值与权重系数之间的比值,得到目标对象在第一时段对业务对象的满意度评分。
206、通过第二目标模型根据每个满意度评分、业务对象的业务特征信息、以及每个目标对象的对象特征信息,确定每个目标对象在第二时段对业务对象的预测满意度评分。
在本申请实施例中,可利用模型的非线性处理能力,结合当前的满意度评分、业务对象的静态特征和动态特征、对象特征信息等多维度特征来预测每个目标对象在未来时刻对业务对象的满意度评分。
其中,该业务特征信息可以是对应的业务对象所具有的属性,其可反映业务对象的特点。例如,以车辆作为业务对象为例,该业务特征信息可以是车辆的形状、出厂日期、车辆性能、车内功能、材料成分等。又如,以工程项目作为业务对象为例,该业务特征信息可以包括该工程项目的施工起始时间和结束时间、工程项目地点位置、耗材等。
其中,该对象特征信息可以是表示对应用户在第一时段的特征信息。例如,可以包括用户的静态特征和动态特征,静态特征不限于包括年龄、身高、体重、账户的资源状态等,动态特征可以是用户的操作数据,如不限于包括阅读、浏览、筛选、针对业务对象作出决策所占用时长等等。以上仅为示例。
具体的,将满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息进行拼接,得到目标文本;将目标文本进行嵌入处理,得到嵌入特征序列;由前向特征提取层对嵌入特征序列进行前向传播,得到前向特征序列;由特征融合层将嵌入特征序列与前向特征序列进行融合,得到融合特征序列;由分类层对融合特征序列进行线性转换,输出目标对象在第二时段对业务对象的预测满意度评分。
207、根据多个目标对象的满意度评分和预测满意度评分生成反馈提示信息,并将反馈提示信息发送至业务对象的管理端。
在本申请实施例中,当获悉目标对象对业务对象当前的满意度和预测到未来的满意度后,可将每个目标对象对业务对象的当前满意度评分、未来的预测满意度评分反馈给业务对象的管理平台,以使得业务对象的管理平台基于收到的满意度反馈数据决策是否调整业务对象,使得业务对象更符合多数目标对象的需求,具有可靠性。
为了便于对本申请实施例的理解,将以具体的应用场景实例对本申请实施例进行描述。具体的,通过执行以上步骤201-207,对该应用场景实例进行描述。
需要说明的是,该文本处理方法主要用于用户对某一业务的实时情感分类和满意度的识别场景,该场景实例的具体如下:
一、该场景实例的相关术语介绍:
(1)实时情感分析(Real-time Sentiment Analysis):使用自然语言处理、文本分析和计算语言学方法来识别和提取文本中的主观信息,如情绪、情感、观点等。具体的,
(2)深度学习(Deep Learning):一种机器学习方法,通过模拟人脑神经网络的工作方式,让计算机自我学习和理解数据中的模式。
(3)用户满意度量化评估(Quantitative User Satisfaction Evaluation):通过定量的方法评估用户对产品或服务的满意度。
(4)预测方法(Prediction Method):使用统计技术和机器学习算法,根据历史数据预测未来的趋势或结果。
结合以上术语进行理解,本场景实例包括:通过实时情感分析和深度学习方法,可以即时捕捉和理解用户的情绪和观点,有效地处理大量的用户反馈数据,自动学习和理解数据中的模式,提高情感分析的准确性。此外,通过量化的方法评估用户满意度,并使用深度学习方法预测未来的用户满意度,可以帮助企业提前预知可能出现的问题,及时调整策略,提高用户满意度。
二、该场景实例的实施过程具体如下:
(1)收集用户的反馈数据。具体的,可以通过社交媒体、评论网站、用户调查等数据源来收集用户反馈数据,每个单位数据包含了用户的文本评论以及相关的元数据,如用户ID、时间戳等;通过抓取可以通过API、爬虫等方式从以上数据源中抓取数据;将抓取到的数据存储起来,具体使用数据库、文件系统等方式进行数据存储。
(2)数据预处理:将收集到的原始数据转化为适合深度学习模型处理的格式。
(2.1)通过文本清洗,以去除停用词、标点符号等,bing将文本转化为小写,以此,实现去除文本中的噪声。
(2.2)通过文本标准化处理,具体可以是词干提取、词形还原,以此,统一文本中的词语。
(2.3)文本编码,文本编码可以将文本转化为数值向量,使其可以被深度学习模型处理。编码方式可以包括词袋模型、TF-IDF、词嵌入等。具体的,以TF-IDF的编码方式为例,具体过程如下:
(2.3.1)计算词频(Term Frequency,TF):词频是指一个词在文档中出现的频率。它的计算公式为:
其中,ft,d是词t在文档d中的出现次数,∑t'∈dft',d是文档d中所有词的出现次数之和。
(2.3.2)计算逆文档频率(Inverse Document Frequency,IDF):逆文档频率是指一个词在文档集合中的重要性。它的计算公式为:
其中,|D|是文档集合D的大小(如,所有用户的评价文本的文档总数),|d∈D:t∈d|是包含词t的文档数量。
(2.3.3)计算TF-IDF:TF-IDF是词频和逆文档频率的乘积。它的计算公式为:
TFIDF(t,d,D)=TF(t,d)×IDF(t,D)
至此,可实现对每个文本进行编码,得到文本序列。
(3)实时情感分析:在数据预处理之后,使用微调后的深度学习模型(即上文中的第一目标模型)进行实时情感分析。例如,使用一种预训练的深度学习模型(BidirectionalEncoder Representations from Transformers,BERT),它可以理解文本中的上下文,从而提高情感分析的准确性。以下是使用BERT模型进行实时情感分析的具体步骤:
(3.1)预训练的BERT模型是在大量的文本数据上训练的,它可以理解文本中的上下文,捕捉词语之间的关系。在本场景实例中,BERT模型的预测目标是一个文本的情感倾向是否正向,其中,输出“1”表示正向,“0”表示中性,“-1”表示负向。
(3.2)对预训练的BERT模型进行微调,具体的,结合特定的情感分析任务训练BERT模型,使其能够更好地进行情感分析。微调的过程可以通过以上损失函数来表示:
其中,L是损失函数,N是训练样本的数量,yi是第i个样本的真实情感标签,xi是第i个样本的文本,p(yi|xi)是模型预测的情感标签的概率。
需要说明的是,针对每个获取到的反馈数据,都可输入到微调后的BERT模型,以输出一个情感标签以及该标签的概率值。
(4)情感标签的概率值可视为一个连续的情感得分,它反映了文本的情感倾向,以评估用户的满意度。具体的,可定义一个满意度函数,将情感得分映射到一个满意度分数,该满意度函数具体如下:
其中,S是满意度分数,x是情感得分。这个满意度函数可以将情感得分映射到一个[0,1]的范围,满意度分数为0时表示最不满意,满意度分数为1时表示最满意。
(5)使用深度学习模型(即第二目标模型)预测未来的用户满意度,具体如下:
(5.1)将历史数据作为训练数据,该历史数据可以包括用户满意度数据和特征数据,如用户的操作数据和属性数据,以及业务对象的属性数据。
(5.2)可从卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、变压器(Transformer)等中选取任意一种模型进行训练。例如,选取长短期记忆网络(LSTM),在训练过程中,使用随机梯度下降(SGD)、Adam等优化算法,结合训练数据上反复更新模型的参数,以最小化预测误差,实现自动学习和理解用户满意度的历史数据中的模式。
(5.3)在模型训练之后,在验证数据上验证模型的性能,避免模型过拟合或欠拟合。
(5.4)将当前的数据输入到模型中,模型会输出未来的用户满意度预测值。其中,模型的运行模型具体如下:
it=σ(Wiixt+bii+Whiht-1+bhi)
ft=σ(Wifxt+bif+Whfht-1+bhf)
gt=tan h(Wigxt+big+Whght-1+bhg)
ot=σ(Wioxt+bio+Whoht-1+bho)
ct=ft⊙ct-1+it⊙gt
ht=ot⊙tan h(ct)
其中,xt是输入,ht是隐藏状态,ct是单元状态,it、ft、gt和ot分别是输入门、遗忘门、单元和输出门,σ是sigmoid函数,⊙是元素乘法,W和b是模型参数。
(6)将用户满意度的评估结果和预测结果反馈给业务部门(例如上文中业务对象的管理端),帮助业务部门提前预知可能出现的问题,及时调整策略,提高用户满意度。
通过执行以上(1)到(5)的场景步骤,可以实现如下场景:在电商场景中,用户在购买商品或使用服务后,通常会留下评论反馈。这些评论反馈是评估用户满意度的重要数据源,可以实时捕捉和理解用户的情绪和观点,评估用户对商品或服务的满意度,并预测未来的用户满意度。
通过执行以上(1)到(5)的场景步骤,可以实现如下效果:通过实时情感分析,可以在用户与产品或服务交互的过程中,实时获取用户的反馈,及时调整产品或服务,提高用户满意度;通过深度学习方法有效地处理大量的用户反馈数据,自动学习和理解数据中的模式,提高情感分析的准确性;通过量化的方法评估用户满意度,并使用深度学习方法预测未来的用户满意度;有利于评估企业提前预知可能出现的问题,及时调整策略,提高用户满意度。
由以上可知,本申请实施例可针对包含目标对象在第一时段对业务对象的评价内容的文本,通过第一目标模型来进行语义分析,以分类出该目标对象在第一时段对业务对象的情感分类结果,确保语义分析时的准确性,然后,基于该情感分类结果来计算目标对象在第一时段对业务对象的满意度评分,最后,通过第二目标模型基于该第一时段的满意度评分、业务对象的业务特征信息以及目标对象的对象特征信息来预测目标对象在第二时段对业务对象的满意度评分,提高满意度评估时的稳定性和效率。以此,可提高评估用户对业务满意度时的准确性,且可预测用户对相关业务的未来满意度。
为了更好地实施以上方法,本申请实施例还提供一种文本处理装置。例如,如图6所示,该文本处理装置可以包括获取单元401、分类单元402、确定单元403和预测单元404。
获取单元401,用于获取业务评价文本,业务评价文本包含目标对象在第一时段针对业务对象的评价内容;
分类单元402,用于通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果;
确定单元403,用于根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分;
预测单元404,用于通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分,第二时段位于第一时段之后。
在一些实施方式中,第二目标模型包括前向特征提取层、特征融合层和分类层;预测单元404,还用于:将满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息进行拼接,得到目标文本;将目标文本进行嵌入处理,得到嵌入特征序列;由前向特征提取层对嵌入特征序列进行前向传播,得到前向特征序列;由特征融合层将嵌入特征序列与前向特征序列进行融合,得到融合特征序列;由分类层对融合特征序列进行线性转换,输出目标对象在第二时段对业务对象的预测满意度评分。
在一些实施方式中,文本处理装置还包括第二训练单元,用于:获取历史数据集,历史数据集至少包括样本对象在第一历史时段的样本对象特征信息、样本业务对象在第一历史时段的样本业务特征信息、以及样本对象在第一历史时段针对样本业务对象的第一满意度评分和在第二历史时段的第二满意度评分;其中,第一满意度评分基于样本对象在第一历史时段针对样本业务对象的第一业务评价文本确定,第二满意度评分基于样本对象在第二历史时段针对样本业务对象的第二业务评价文本确定,第二历史时段位于第一历史时段之后;根据样本对象特征信息、样本业务特征信息以及第一满意度评分,生成样本目标文本;将样本目标文本输入第二预设模型进行满意度评分预测,得到样本对象在第二时段对样本业务对象的预测满意度评分;基于预测满意度评分与第二满意度评分,确定第二目标损失;根据第二目标损失调整第二预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第二目标模型。
在一些实施方式中,获取单元401,还用于:获取样本对象在第二历史时段对样本业务对象的第二业务评价文本;
分类单元402,还用于:通过第一目标模型对第二业务评价文本进行分类,输出第二业务评价文本对应的情感分类结果;
确定单元403,还用于:根据第二业务评价文本对应的情感分类结果,确定样本对象在第二历史时段对样本业务对象的第二满意度评分。
在一些实施方式中,文本处理装置还包括第一训练单元,用于:获取样本业务评价文本以及对应的样本情感分类结果,样本业务评价文本至少包括样本对象针对样本业务对象的样本评价内容;将样本业务评价文本输入至预训练的第一预设模型,以基于样本业务评价文本中的样本评价内容进行分类,得到预测情感分类结果;基于样本情感分类结果与预测情感分类结果,确定第一目标损失;根据第一目标损失调整预训练的第一预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第一目标模型。
在一些实施方式中,情感分类结果包括业务评价文本属于目标情感类别标签的标签概率值;确定单元403,还用于:根据业务评价文本属于目标情感类别标签的标签概率值,确定业务评价文本对应的情感类别评分;根据业务评价文本对应的情感类别评分,确定目标对象在第一时段对业务对象的满意度评分。
在一些实施方式中,确定单元403,还用于:获取分值规范系数和权重系数;以业务评价文本对应的情感类别评分与分值规范系数之和作为目标分值;确定目标分值与权重系数之间的比值,得到目标对象在第一时段对业务对象的满意度评分。
在一些实施方式中,文本处理装置还包括反馈单元,用于:确定对象集合,对象集合包含多个目标对象;根据每个目标对象对应的满意度评分和预测满意度评分,生成针对业务对象的反馈提示信息;向业务对象的管理端发送反馈提示信息。
在一些实施方式中,业务评价文本还包括参考对象在第一时段针对业务对象的参考评价内容,参考对象为与目标对象同属一个对象分组,获取单元401,还用于:获取目标对象在第一时段针对业务对象的业务评价内容;确定目标对象所属的对象分组,并获取对象分组中每个参考对象在第一时段针对业务对象的候选评价内容;基于对象分组中每个参考对象在第一时段针对业务对象的候选评价内容,选取参考对象在第一时段针对业务对象的参考评价内容。
在一些实施方式中,获取单元401,还用于:确定对象分组中每个参考对象与目标对象之间的亲密度评分;基于每个参考对象针对业务对象的候选评价内容,选取亲密度评分最高的参考对象的候选评价内容作为参考对象在第一时段针对业务对象的参考评价内容。
由以上可知,本申请实施例可针对包含目标对象在第一时段对业务对象的评价内容的文本,通过第一目标模型来进行语义分析,以分类出该目标对象在第一时段对业务对象的情感分类结果,确保语义分析时的准确性,然后,基于该情感分类结果来计算目标对象在第一时段对业务对象的满意度评分,最后,通过第二目标模型基于该第一时段的满意度评分、业务对象的业务特征信息以及目标对象的对象特征信息来预测目标对象在第二时段对业务对象的满意度评分,提高满意度评估时的稳定性和效率。以此,可提高评估用户对业务满意度时的准确性,且可预测用户对相关业务的未来满意度。
本申请实施例还提供一种计算机设备,如图7所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图7中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及文本处理过程。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本申请实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如下:
获取业务评价文本,业务评价文本包含目标对象在第一时段针对业务对象的评价内容;通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果;根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分;通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分,第二时段位于第一时段之后。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
由此可得,本方案可针对包含目标对象在第一时段对业务对象的评价内容的文本,通过第一目标模型来进行语义分析,以分类出该目标对象在第一时段对业务对象的情感分类结果,确保语义分析时的准确性,然后,基于该情感分类结果来计算目标对象在第一时段对业务对象的满意度评分,最后,通过第二目标模型基于该第一时段的满意度评分、业务对象的业务特征信息以及目标对象的对象特征信息来预测目标对象在第二时段对业务对象的满意度评分,提高满意度评估时的稳定性和效率。以此,可提高评估用户对业务满意度时的准确性,且可预测用户对相关业务的未来满意度。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种文本处理方法中的步骤。例如,该指令可以执行如下步骤:
获取业务评价文本,业务评价文本包含目标对象在第一时段针对业务对象的评价内容;通过第一目标模型对业务评价文本中的评价内容进行分类,获取业务评价文本对应的情感分类结果;根据业务评价文本对应的情感分类结果,确定目标对象在第一时段对业务对象的满意度评分;通过第二目标模型根据满意度评分、业务对象的业务特征信息、以及目标对象的对象特征信息,确定目标对象在第二时段对业务对象的预测满意度评分,第二时段位于第一时段之后。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种文本处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种文本处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种文本处理方法、装置、设备和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (14)
1.一种文本处理方法,其特征在于,包括:
获取业务评价文本,所述业务评价文本包含目标对象在第一时段针对业务对象的评价内容;
通过第一目标模型对所述业务评价文本中的评价内容进行分类,获取所述业务评价文本对应的情感分类结果;
根据所述业务评价文本对应的情感分类结果,确定所述目标对象在第一时段对所述业务对象的满意度评分;
通过第二目标模型根据所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息,确定所述目标对象在第二时段对所述业务对象的预测满意度评分,所述第二时段位于所述第一时段之后。
2.根据权利要求1所述的方法,其特征在于,所述第二目标模型包括前向特征提取层、特征融合层和分类层;
所述通过第二目标模型根据所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息,确定所述目标对象在第二时段对所述业务对象的预测满意度评分,包括:
将所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息进行拼接,得到目标文本;
将所述目标文本进行嵌入处理,得到嵌入特征序列;
由所述前向特征提取层对所述嵌入特征序列进行前向传播,得到前向特征序列;
由所述特征融合层将所述嵌入特征序列与所述前向特征序列进行融合,得到融合特征序列;
由所述分类层对融合特征序列进行线性转换,输出所述目标对象在第二时段对所述业务对象的预测满意度评分。
3.根据权利要求1或2所述的方法,其特征在于,所述第二目标模型的训练过程包括:
获取历史数据集,所述历史数据集至少包括样本对象在第一历史时段的样本对象特征信息、样本业务对象在第一历史时段的样本业务特征信息、以及所述样本对象在第一历史时段针对所述样本业务对象的第一满意度评分和在第二历史时段的第二满意度评分;
其中,所述第一满意度评分基于所述样本对象在第一历史时段针对所述样本业务对象的第一业务评价文本确定,所述第二满意度评分基于所述样本对象在第二历史时段针对所述样本业务对象的第二业务评价文本确定,所述第二历史时段位于所述第一历史时段之后;
根据所述样本对象特征信息、样本业务特征信息以及所述第一满意度评分,生成样本目标文本;
将所述样本目标文本输入第二预设模型进行满意度评分预测,得到所述样本对象在第二时段对所述样本业务对象的预测满意度评分;
基于所述预测满意度评分与所述第二满意度评分,确定第二目标损失;
根据所述第二目标损失调整所述第二预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第二目标模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述样本对象在所述第二历史时段对所述样本业务对象的第二业务评价文本;
通过所述第一目标模型对所述第二业务评价文本进行分类,输出所述第二业务评价文本对应的情感分类结果;
根据所述第二业务评价文本对应的情感分类结果,确定所述样本对象在所述第二历史时段对所述样本业务对象的第二满意度评分。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述通过第一目标模型对所述业务评价文本中的评价内容进行分类,获取所述业务评价文本对应的情感分类结果之前,所述方法还包括:
获取样本业务评价文本以及对应的样本情感分类结果,所述样本业务评价文本至少包括样本对象针对样本业务对象的样本评价内容;
将所述样本业务评价文本输入至预训练的第一预设模型,以基于所述样本业务评价文本中的样本评价内容进行分类,得到预测情感分类结果;
基于所述样本情感分类结果与所述预测情感分类结果,确定第一目标损失;
根据所述第一目标损失调整所述预训练的第一预设模型的参数,并进行迭代训练,直至达到训练结束条件,得到第一目标模型。
6.根据权利要求1所述的方法,其特征在于,所述情感分类结果包括所述业务评价文本属于目标情感类别标签的标签概率值;所述根据所述业务评价文本对应的情感分类结果,确定所述目标对象在第一时段对所述业务对象的满意度评分,包括:
根据所述业务评价文本属于目标情感类别标签的标签概率值,确定所述业务评价文本对应的情感类别评分;
根据所述业务评价文本对应的情感类别评分,确定所述目标对象在第一时段对所述业务对象的满意度评分。
7.根据权利要求6所述的方法,其特征在于,所述根据所述业务评价文本对应的情感类别评分,确定所述目标对象在第一时段对所述业务对象的满意度评分,包括:
获取分值规范系数和权重系数;
以所述业务评价文本对应的情感类别评分与所述分值规范系数之和作为目标分值;
确定所述目标分值与所述权重系数之间的比值,得到所述目标对象在第一时段对所述业务对象的满意度评分。
8.根据权利要求1所述的方法,其特征在于,所述通过第二目标模型根据所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息,确定所述目标对象在第二时段对所述业务对象的预测满意度评分之后,所述方法还包括:
确定对象集合,所述对象集合包含多个所述目标对象;
根据每个所述目标对象对应的所述满意度评分和所述预测满意度评分,生成针对所述业务对象的反馈提示信息;
向所述业务对象的管理端发送所述反馈提示信息。
9.根据权利要求1所述的方法,其特征在于,所述业务评价文本还包括参考对象在第一时段针对所述业务对象的参考评价内容,所述参考对象为与所述目标对象同属一个对象分组,所述获取业务评价文本,包括:
获取所述目标对象在第一时段针对所述业务对象的业务评价内容;
确定所述目标对象所属的对象分组,并获取所述对象分组中每个参考对象在第一时段针对所述业务对象的候选评价内容;
基于所述对象分组中每个参考对象在第一时段针对所述业务对象的候选评价内容,选取所述参考对象在第一时段针对所述业务对象的参考评价内容。
10.根据权利要求9所述的方法,其特征在于,所述基于所述对象分组中每个参考对象在第一时段针对所述业务对象的候选评价内容,选取所述参考对象在第一时段针对所述业务对象的参考评价内容,包括:
确定所述对象分组中每个参考对象与所述目标对象之间的亲密度评分;
基于所述每个参考对象针对所述业务对象的候选评价内容,选取所述亲密度评分最高的参考对象的候选评价内容作为所述参考对象在第一时段针对所述业务对象的参考评价内容。
11.一种文本处理装置,其特征在于,包括:
获取单元,用于获取业务评价文本,所述业务评价文本包含目标对象在第一时段针对业务对象的评价内容;
分类单元,用于通过第一目标模型对所述业务评价文本中的评价内容进行分类,获取所述业务评价文本对应的情感分类结果;
确定单元,用于根据所述业务评价文本对应的情感分类结果,确定所述目标对象在第一时段对所述业务对象的满意度评分;
预测单元,用于通过第二目标模型根据所述满意度评分、所述业务对象的业务特征信息、以及所述目标对象的对象特征信息,确定所述目标对象在第二时段对所述业务对象的预测满意度评分,所述第二时段位于所述第一时段之后。
12.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序实现权利要求1至10任一项所述的文本处理方法中的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至10任一项所述的文本处理方法中的步骤。
14.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指被执行时实现权利要求1至10任一项所述的文本处理方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311230807.XA CN117235264A (zh) | 2023-09-21 | 2023-09-21 | 文本处理方法、装置、设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311230807.XA CN117235264A (zh) | 2023-09-21 | 2023-09-21 | 文本处理方法、装置、设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117235264A true CN117235264A (zh) | 2023-12-15 |
Family
ID=89090763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311230807.XA Pending CN117235264A (zh) | 2023-09-21 | 2023-09-21 | 文本处理方法、装置、设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117235264A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117828030A (zh) * | 2024-03-01 | 2024-04-05 | 微网优联科技(成都)有限公司 | 基于大数据的用户分析方法及电子设备 |
-
2023
- 2023-09-21 CN CN202311230807.XA patent/CN117235264A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117828030A (zh) * | 2024-03-01 | 2024-04-05 | 微网优联科技(成都)有限公司 | 基于大数据的用户分析方法及电子设备 |
CN117828030B (zh) * | 2024-03-01 | 2024-05-07 | 微网优联科技(成都)有限公司 | 基于大数据的用户分析方法及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Convolutional matrix factorization for document context-aware recommendation | |
Bhuvaneshwari et al. | Sentiment analysis for user reviews using Bi-LSTM self-attention based CNN model | |
US20210272040A1 (en) | Systems and methods for language and speech processing with artificial intelligence | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
US20180218432A1 (en) | Recommendation integrated online digital sales service chat system | |
US20220237386A1 (en) | Aspect-aware sentiment analysis of user reviews | |
CN114547475B (zh) | 一种资源推荐方法、装置及系统 | |
CN112633690A (zh) | 服务人员信息分配方法、装置、计算机设备和存储介质 | |
CN117235264A (zh) | 文本处理方法、装置、设备和计算机可读存储介质 | |
CN113672797A (zh) | 一种内容推荐方法及装置 | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
Xu et al. | [Retracted] Research on the Construction of Crossborder e‐Commerce Logistics Service System Based on Machine Learning Algorithms | |
Bharti et al. | How confident was your reviewer? estimating reviewer confidence from peer review texts | |
Arava et al. | Sentiment Analysis using deep learning for use in recommendation systems of various public media applications | |
CN114491255A (zh) | 推荐方法、系统、电子设备和介质 | |
CN115329207B (zh) | 智能销售信息推荐方法及系统 | |
CN111382232A (zh) | 问答信息处理方法、装置及计算机设备 | |
Wei et al. | Sequential recommendation based on long-term and short-term user behavior with self-attention | |
Ermakova et al. | A comparison of commercial sentiment analysis services | |
Wang et al. | Construction of a novel production develop decision model based on text mined | |
CN114169418A (zh) | 标签推荐模型训练方法及装置、标签获取方法及装置 | |
Maqsood et al. | Customer data extraction techniques based on natural language processing for e-commerce business analytics | |
Haidn | Flight recommender system using implicit feedback | |
Devi et al. | An innovative word embedded and optimization based hybrid artificial intelligence approach for aspect-based sentiment analysis of app and cellphone reviews | |
Shanthi et al. | A satin optimized dynamic learning model (SODLM) for sentiment analysis using opinion mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |