CN116029492B - 派单方法和装置 - Google Patents
派单方法和装置 Download PDFInfo
- Publication number
- CN116029492B CN116029492B CN202211531182.6A CN202211531182A CN116029492B CN 116029492 B CN116029492 B CN 116029492B CN 202211531182 A CN202211531182 A CN 202211531182A CN 116029492 B CN116029492 B CN 116029492B
- Authority
- CN
- China
- Prior art keywords
- service
- worksheets
- historical
- target
- training sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 347
- 238000012545 processing Methods 0.000 claims abstract description 92
- 238000013145 classification model Methods 0.000 claims abstract description 76
- 239000013598 vector Substances 0.000 claims description 74
- 230000000873 masking effect Effects 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000000586 desensitisation Methods 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 238000003860 storage Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种派单方法和装置。该派单方法包括获取待服务工单;根据待服务工单,确定待服务工单的工单类型,工单类型包括产品类型和服务类型;根据待服务工单的工单类型,确定第一历史工单的数量;在第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单;根据多个第二历史工单,生成第一训练样本集合;对第一训练样本集合进行增强处理,得到第二训练样本集合;利用第二训练样本集合中的训练样本的服务内容文本和训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型;将待服务工单的服务内容文本输入至目标分类模型中,通过目标分类模型确定目标服务班组。
Description
技术领域
本申请实施例涉及智能派单技术领域,更具体地,涉及一种派单方法和装置。
背景技术
派单是指在多个候选主体中选出执行待处理请求的目标主体,并将待处理请求派发给目标主体的过程。在客服中心,每天都有大量的工单需要被分配到各个相应的接单班组进行处理,这些繁琐的工作占据了大量的人力与时间,并导致派单不及时、不合理等问题。
为提高分配效率,RPA(自动化机器人技术)被广泛应用于智能派单流程中。RPA是一种通过模拟人工对键盘与鼠标操作、处理大量重复工作的软件机器人。RPA可自动从工单系统中获取工单数据,并根据信息的内容进行分类,将工单派发到不同的班组,从而实现自动派单。
然而,面对复杂的业务场景及不断增加的工单类型,使用现有的RPA进行派单时派单时间较长,且派单准确率低,服务质量与用户满意度较差。
发明内容
本申请实施例的一个目的是提供一种派单方法和装置的新的技术方案。
根据本申请的第一方面,提供了一种派单方法,所述派单方法包括:
获取待服务工单;
根据所述待服务工单,确定所述待服务工单的工单类型,所述工单类型包括产品类型和服务类型;
根据所述待服务工单的工单类型,确定第一历史工单的数量,其中,所述第一历史工单为历史工单中工单类型与所述待服务工单的工单类型相同的历史工单;
在所述第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,其中,所述第二历史工单为历史工单中服务班组正确,且工单类型与所述待服务工单的工单类型相同的历史工单;
根据多个所述第二历史工单,生成第一训练样本集合,其中,所述第一训练样本集合包括多个第一训练样本,所述第一训练样本包括第二历史工单的工单类型、第二历史工单的服务班组和第二历史工单的服务内容文本;
对所述第一训练样本集合进行增强处理,得到第二训练样本集合,其中,所述第二训练样本集合中的训练样本包括多个所述第一训练样本和多个第二训练样本;
利用所述第二训练样本集合中的训练样本的服务内容文本和所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型;
将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组。
可选地,所述方法还包括:在所述第一历史工单的数量小于预设数量的情况下,根据所述待服务工单的工单类型,确定特征数据库中的目标特征信息集合;
根据所述待服务工单的服务内容文本,确定所述目标特征信息集合中与所述待服务工单的服务内容文本对应的目标特征值;
通过所述目标特征值确定目标服务班组。
可选地,所述方法还包括:基于所述目标服务班组,将所述待服务工单分配给所述目标服务班组。
可选地,所述根据多个所述第二历史工单,生成第一训练样本集合,包括:
针对每个所述第二历史工单,对所述第二历史工单的工单类型、服务班组和服务内容文本分别进行规范化处理,得到处理后的第二历史工单;
根据多个所述处理后的第二历史工单,生成第一训练样本集合;其中,所述第一训练样本为所述处理后的第二历史工单。
可选地,所述对所述第一训练样本集合进行增强处理,得到第二训练样本集合,包括:
获取每个所述第一训练样本的服务班组;
统计每个所述服务班组包括的所述第一训练样本的数量,其中,每个所述服务班组包括至少一个所述第一训练样本;
根据第一服务班组中的所述第一训练样本的数量,确定每个所述服务班组中的训练样本的目标数量;
根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,其中,所述第二服务班组中的第一训练样本的数量和第二训练样本的数量之和与所述训练样本的目标数量之间的差值小于第一预设值;
根据所述第一训练样本和所述第二训练样本,得到第二训练样本集合;
其中,所述训练样本的目标数量与所述第一服务班组中的所述第一训练样本的数量相等;
所述第一服务班组为多个所述服务班组中所述第一训练样本的数量最多的服务班组;
所述第二服务班组为多个所述服务班组中除所述第一服务班组之外的服务班组。
可选地,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,包括:
对所述第二服务班组中的第一训练样本的服务内容文本进行随机遮蔽,生成带有遮蔽标记的服务内容文本;
对所述带有遮蔽标记的服务内容文本进行处理,得到所述带有遮蔽标记的服务内容文本的独热编码;
根据所述独热编码,生成所述带有遮蔽标记的服务内容文本的位置编码;
将所述独热编码和所述位置编码输入至预训练语言模型的编码器中,预测所述带有遮蔽标记的服务内容文本的遮蔽标记位置处的至少一个候选词向量和每个所述候选词向量对应的概率,并生成词向量矩阵;
对所述带有遮蔽标记的服务内容文本的独热编码和所述词向量矩阵进行处理,得到文本向量;
根据所述文本向量,确定目标服务内容文本;
根据所述目标服务内容文本,得到所述第二训练样本。
可选地,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,还包括:
对所述第二服务班组中的多个第一服务内容文本分别进行脱敏处理和分割处理,得到句子集合,其中,所述句子集合包括多个所述第一句子;
对所述句子集合中的多个所述第一句子进行随机打乱处理和召回处理,得到多个第二句子;
对所述第二服务班组中的第二服务内容文本进行处理,得到第三句子;
计算多个所述第二句子中每个所述第二句子与所述第三句子的相似度,并按照相似度由高到低的顺序对多个所述第二句子进行排序;
选取相似度大于第二预设值的第二句子,作为第四句子;
对所述第四句子与所述第三句子进行随机拼接处理,得到目标句子;
根据所述目标句子,确定目标服务内容文本;
根据所述目标服务内容文本,得到所述第二训练样本;
其中,所述第二服务内容文本为所述第二服务班组中任意一个第一训练样本的服务内容文本;
所述第一服务内容文本为所述第二服务班组中除所述任意一个第一训练样本之外的第一训练样本的服务内容文本。
可选地,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,还包括:
对所述第二服务班组中的第一训练样本的服务内容文本进行分词处理,得到候选词集合,其中,所述候选词集合包括多个候选词;
计算多个所述候选词中每个所述候选词与所述第一训练样本的服务内容文本的相似度,并按照相似度由高到低的顺序对多个所述候选词进行排序;
选取相似度大于第三预设值的候选词,作为文本特征词;
获取所述文本特征词的混淆词;
将所述第一训练样本的服务内容文本中的文本特征词替换为所述文本特征词对应的所述混淆词,得到目标服务内容文本;
根据所述目标服务内容文本,得到所述第二训练样本。
可选地,所述将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组,包括:
将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型输出至少一个第三服务班组,以及每个所述第三服务班组对应的准确率;
根据所述第三服务班组对应的准确率,确定准确率最高的第三服务班组为目标服务班组。
根据本申请的第二方面,还提供了一种派单装置,所述派单装置包括:
第一获取模块,用于获取待服务工单;
第一确定模块,用于根据所述待服务工单,确定所述待服务工单的工单类型,所述工单类型包括产品类型和服务类型;
第二确定模块,用于根据所述待服务工单的工单类型,确定第一历史工单的数量,其中,所述第一历史工单为历史工单中工单类型与所述待服务工单的工单类型相同的历史工单;
第二获取模块,用于在所述第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,其中,所述第二历史工单为历史工单中服务班组正确,且工单类型与所述待服务工单的工单类型相同的历史工单;
生成模块,用于根据多个所述第二历史工单,生成第一训练样本集合,其中,所述第一训练样本集合包括多个第一训练样本,所述第一训练样本包括第二历史工单的工单类型、第二历史工单的服务班组和第二历史工单的服务内容文本;
处理模块,用于对所述第一训练样本集合进行增强处理,得到第二训练样本集合,其中,所述第二训练样本集合中的训练样本包括多个所述第一训练样本和多个第二训练样本;
训练模块,用于利用所述第二训练样本集合中的训练样本的服务内容文本和所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型;
第三确定模块,用于将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组。
根据本申请的第三方面,还提供了一种电子设备,包括存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序,以实现根据本申请第一方面所述的方法。
根据本申请的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序在被处理器执行时实现根据本申请的第一方面所述的方法。
本申请实施例的一个有益效果在于,在获取到待服务工单情况下,首先,确定待服务工单的工单类型;其次,根据待服务工单的工单类型,确定工单类型与待服务工单的工单类型相同的第一历史工单的数量;最后,在第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,并根据多个第二历史工单,生成第一训练样本集合,再对第一训练样本集合进行增强处理,得到第二训练样本集合,利用第二训练样本集合中的训练样本的服务内容文本和训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型,将待服务工单的服务内容文本输入至目标分类模型中,通过目标分类模型即可确定待服务工单的目标服务班组;其中,不同的工单类型对应不同的分类模型,以便于通过不同的分类模型快速、准确的确定待服务工单对应的目标服务班组,能够在保证派单准确率的同时,节省派单时间,有效提高服务质量和用户满意度。
通过以下参照附图对本申请的示例性实施例的详细描述,本申请实施例的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且连同其说明一起用于解释本申请实施例的原理。
图1是根据本公开实施例的派单方法的流程示意图;
图2是根据本公开实施例的派单装置的原理框图;
图3是根据本公开实施例的电子设备的原理框图。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<方法实施例>
本申请实施例公开了一种派单方法,如图1所示,该方法包括步骤101-步骤108。
步骤101、获取待服务工单。
在本实施例中,可以通过派单装置自动获取待服务工单,也可以通过人工来获取待服务工单。
步骤102、根据所述待服务工单,确定所述待服务工单的工单类型,所述工单类型包括产品类型和服务类型。
在本实施例中,待服务工单的工单类型包括待服务工单的产品类型和待服务工单的服务类型。
例如,待服务工单的服务内容文本为“IPTV(交互式网络电视)业务-IPTV增值业务-在线教育及客户管理”,其中,待服务工单的产品类型为“在线教育”,待服务工单的服务类型为“客户管理”,即待服务工单的工单类型为“在线教育-客户管理”。
步骤103、根据所述待服务工单的工单类型,确定第一历史工单的数量,其中,所述第一历史工单为历史工单中工单类型与所述待服务工单的工单类型相同的历史工单。
在本实施例中,在获取到待服务工单,且已知待服务工单的工单类型的情况下,确定历史工单中第一历史工单的数量,以便于后续根据第一历史工单的数量具体选择使用哪种方式来确定待服务工单对应的目标服务班组。
在本实施例中,第一历史工单的工单类型与待服务工单的工单类型相同。例如,在待服务工单的工单类型为“在线教育-客户管理”的情况下,第一历史工单的工单类型也为“在线教育-客户管理”。
步骤104、在所述第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,其中,所述第二历史工单为历史工单中服务班组正确,且工单类型与所述待服务工单的工单类型相同的历史工单。
在本实施例中,预设数量可以由用户自行设定,本实施例对此不做具体限定。例如,预设数量可以为100。
在本实施例中,在第一历史工单的数量大于或等于预设数量的情况下,说明待服务工单的工单类型所包括的细化类型较多,若只根据待服务工单的工单类型就直接确定待服务工单的目标服务班组,极有可能造成目标服务班组与待服务工单的工单类型不匹配;因此,在第一历史工单的数量大于或等于预设数量的情况下,需要将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组,以提高待服务工单的派单准确率。
在本实施例中,分类模型的数量为多个,每个工单类型对应一个分类模型。其中,目标分类模型是指待服务工单的工单类型对应的分类模型。
在本实施例中,分类模型的名称可以与工单类型的名称相对应。例如,工单类型为“在线教育-客户管理”的分类模型的名称也可以为“在线教育-客户管理”。
例如,在待服务工单的工单类型为“在线教育-客户管理”,且第一历史工单的数量为150个的情况下,由于第一历史工单的数量大于100,则根据待服务工单的工单类型“在线教育-客户管理”,确定名称为“在线教育-客户管理”的分类模型为目标分类模型。
步骤105、根据多个所述第二历史工单,生成第一训练样本集合,其中,所述第一训练样本集合包括多个第一训练样本,所述第一训练样本包括第二历史工单的工单类型、第二历史工单的服务班组和第二历史工单的服务内容文本。
在本实施例中,需要说明的是,在第一历史工单的数量大于或等于预设数量的情况下,将待服务工单的服务内容文本输入至所述目标分类模型中,即可通过目标分类模型输出待服务工单对应的目标服务班组。
步骤106、对所述第一训练样本集合进行增强处理,得到第二训练样本集合,其中,所述第二训练样本集合中的训练样本包括多个所述第一训练样本和多个第二训练样本。
在本实施例中,根据所述第一训练样本集合中的第一训练样本,进行增强处理,得到第二训练样本;并根据第一训练样本和第二训练样本,得到第二训练样本集合;在第二训练样本集合中,每个服务班组所对应的训练样本的数量相近,能够避免因不同服务班组的训练样本数量差距较大而导致分类模型训练过程中数据不均衡的问题,便于保证分类模型的训练效果。
步骤107、利用所述第二训练样本集合中的训练样本的服务内容文本和所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型。
在本实施例中第二训练样本集合中的训练样本为第二训练样本集合中的第一训练样本或第二训练样本集合中的第二训练样本。
在本实施例中,在基于深度学习的文本分类任务中,Recurrent Neural Network(RNN)和Convolutional Neural Network(CNN)的使用更为广泛。传统的RNN通过隐藏层存储生成的序列信息,能够更好地捕获上下文信息;但是,RNN采取线性序列结构,不断从前往后收集输入信息,在时间维度上有先后顺序,即在一个序列中,后输入的单词比先输入的单词更重要。因此,如果决定全句语义的单词位于句首或句中,将严重影响分类结果。而CNN对每个单词的处理不存在词序上的差异,能够通过最大池化获取文本中最重要的特征,但是CNN的卷积滑动窗口大小是固定的,设置合适的窗口大小是一个难点:滑动窗口过小,会造成重要信息丢失;滑动窗口过大,会导致参数过多,增加计算复杂度。RecurrentConvolutional Neural Networks(RCNN)融合了RNN和CNN的优点:首先,用双向循环结构获取上下文信息,在学习文本表示时可以保留更大范围的词序,相较于传统的基于窗口的神经网络,能够减少噪声;其次,使用最大池化层,用于自动判断哪些特征在文本分类中更加重要。在实际业务场景中会出现80%左右的标签都是属于长尾信息,样本分布严重不均衡,不做相关处理就直接进行文本分类的话,容易影响上线效果。同时,也会出现一些标签下的样本表现形式不易区分,导致模型在预测使用容易混淆。如果直接采用任何一种文本分类模型对数据做暴力训练,都会直接导致不良效果。因此,本申请使用RCNN模型训练得到分类模型,能够更好地识别待服务工单的服务内容文本中的重要信息,从而正确地预测待服务工单的目标服务班组,缩短工单的处理时长,提升工单处理效率,提高派单准确度,最终提升服务质量与用户满意度。
在本实施例中,利用每个所述训练样本的服务内容文本和每个所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型,具体包括:针对每个训练样本,对服务内容文本和服务班组进行文本数值化处理,并通过预训练词向量模型对服务内容文本进行处理,获得服务内容文本对应的词向量矩阵;统计每个训练样本的服务班组的类别,将服务班组的每个类别转换为一个整数;使用TextRCNN模型对词向量矩阵进行训练,得到分类模型,并根据分类模型对应的工单类型将分类模型储存到相应的目录下。
在本实施例中,通过预训练词向量模型对服务内容文本进行处理,获得服务内容文本对应的词向量矩阵,具体包括:根据服务内容构建词典,对经过分词的句子进行去重统计,仅保留服务内容中出现频次大于1的词组,将词组加入词典中;在词典中加入<pad>和<unk>,<pad>用于补全句子,<unk>用于替换未出现过的词组;构建词组到编码的映射和编码到词组的映射,获取<pad>和<unk>的编码,将句子转换为编码,如果句子中存在未在词典中出现的词组,用<unk>的编码填充;设置服务内容中每个句子的标准长度为256,对于长度超过256的句子进行截断,对于长度不足256的句子使用<pad>的编码进行补全;加载预训练词向量模型,创建词向量索引词典,获取所有词与向量,并按行加入词向量索引词典;初始化词向量矩阵,设置向量维度为300;在词向量索引词典中查询词组对应的词向量,填充词向量矩阵,如果没有对应的词向量,则用随机数填充;将生成的词向量矩阵转换为w2v格式,储存在相应的目录下。
在本实施例中,需要说明的是,使用TextRCNN模型对词向量矩阵进行训练,具体包括:使用TextRCNN模型对词向量矩阵进行训练。TextRCNN是一个用于捕捉文本语义的深度神经网络,由双向RNN和池化层构成,具体结构如下:
将词向量矩阵输入模型,矩阵中的每一行代表一个单词所对应的维度为300的词向量,记为w1,w2,...,wn;
将单词的上文(left context)、下文(right context)和单词本身结合起来作为单词的特征表示,使用双向RNN分别提取句子的上下文信息,公式如下:
cl(wi)=f(W(l)cl(wi-1)+W(sl)e(wi-1))
cr(wi)=f(W(r)cr(wi+1)+W(sr)e(wi+1))
其中,cl(wi)和cr(wi)是长度为|c|的稠密向量。
cl(wi)是单词wi的上文特征表示,由当前位置的上一个单词的上文cl(wi-1)和词向量e(wi-1)计算得到。所有句子的第一个单词使用共享参数cl(w1)。W(l)和W(sl)将上一个单词的上文和词向量结合到单词wi的上文表示中。
cr(wi)是单词wi的下文特征表示,由当前位置的下一个单词的下文cl(wi+1)和词向量e(wi+1)计算得到。所有句子的最后一个单词使用共享参数cr(Wn)。W(r)和W(sr)将下一个单词的下文和词向量结合到单词wi的下文表示中。
将单词wi的上文特征表示cl(wi)、词向量e(wi)和下文特征表示cr(wi)拼接到一起,得到单词wj及其上下文信息的表征,公式如下:
xi=[cl(wi);e(wi);cr(wi)]
将单词wi的词向量xi输入到激活函数tanh中,得到wi的潜在语义向量公式如下:
yi (2)=tanh(W(2)xi+b(2))
进入池化层,进行最大池化操作。池化层将不同长度的序列转换为固定长度的向量,自动筛选出最重要的特征,得到y(3),公式如下:
经过全连接层得到文本表示y(4),通过Softmax层得到类别的概率分布pi,公式如下:
y(4)=W(4)y(3)+b(4)
步骤108、将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组。
在本申请实施例中,在获取到待服务工单情况下,首先,确定待服务工单的工单类型;其次,根据待服务工单的工单类型,确定工单类型与待服务工单的工单类型相同的第一历史工单的数量;最后,在第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,并根据多个第二历史工单,生成第一训练样本集合,再对第一训练样本集合进行增强处理,得到第二训练样本集合,利用第二训练样本集合中的训练样本的服务内容文本和训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型,将待服务工单的服务内容文本输入至目标分类模型中,通过目标分类模型即可确定待服务工单的目标服务班组;其中,不同的工单类型对应不同的分类模型,以便于通过不同的分类模型快速、准确的确定待服务工单对应的目标服务班组,能够在保证派单准确率的同时,节省派单时间,有效提高服务质量与用户满意度。
在一个实施例中,该方法还包括:在所述第一历史工单的数量小于预设数量的情况下,根据所述待服务工单的工单类型,确定特征数据库中的目标特征信息集合;根据所述待服务工单的服务内容文本,确定所述目标特征信息集合中与所述待服务工单的服务内容文本对应的目标特征值;通过所述目标特征值确定目标服务班组。
在本实施例中,特征数据库的数量为一个,特征数据库包括多个特征信息集合,每个特征信息集合对应一个工单类型,且每个特征信息集合包括至少一个特征值,每个特征值对应一个服务班组。其中,目标特征信息集合是指待服务工单的工单类型对应的特征信息集合,目标特征值是指待服务工单对应的特征值。
在本实施例中,特征信息集合的名称可以与工单类型的名称相对应。例如,工单类型为“在线教育-客户管理”的特征信息集合的名称也可以为“在线教育-客户管理”。
在本实施例中,在所述第一历史工单的数量小于预设数量的情况下,说明第一历史工单对应的工单类型的派单倾向性更强,即派单准确率较高;因此,在第一历史工单的数量小于预设数量的情况下,首先,根据待服务工单的工单类型,确定特征数据库中的目标特征信息集合;其次,再根据所述待服务工单的服务内容文本,确定所述目标特征信息集合中与所述待服务工单的服务内容文本对应的目标特征值;最后,根据目标特征值对应的服务班组,直接确定待服务工单的目标服务班组,无需将所述待服务工单的服务内容文本输入至分类模型中,再通过所述目标分类模型确定目标服务班组,节省时间,且派单准确率高。
例如,待服务工单的服务内容文本为“IPTV(交互式网络电视)业务-IPTV增值业务-在线教育及客户管理”,待服务工单的工单类型为“在线教育-客户管理”,工单类型为“在线教育-客户管理”的第一历史工单的数量为40个,名称为“在线教育-客户管理”的特征信息集合包括以下特征值“IPTV增值业务”、“手机增值业务”和“电脑增值业务”;其中,由于第一历史工单的数量小于100,则将特征数据库中名称为“在线教育-客户管理”的特征信息集合确定为目标特征信息集合;再对比待服务工单的服务内容文本“IPTV(交互式网络电视)业务-IPTV增值业务-在线教育及客户管理”和目标特征信息集合所包括的特征值,由于待服务工单的服务内容文本中包括IPTV增值业务,则将目标特征信息集合中的特征值“IPTV增值业务”确定为目标特征值,最后,将“IPTV增值业务”对应的服务班组确定为待服务工单的目标服务班组。
在一个实施例中,该方法还包括:基于目标服务班组,将待服务工单分配给目标服务班组。
在本实施例中,在已确定待服务工单对应的目标服务班组的情况下,直接将待服务工单分配给目标服务班组,由目标服务班组对待服务工单进行处理。
在一个实施例中,根据多个第二历史工单,生成第一训练样本集合,包括:针对每个第二历史工单,对第二历史工单的工单类型、服务班组和服务内容文本分别进行规范化处理,得到处理后的第二历史工单;根据多个处理后的第二历史工单,生成第一训练样本集合;其中,第一训练样本为处理后的第二历史工单。
在本实施例中,对第二历史工单的工单类型进行规范化处理,包括对产品类型和服务类型进行处理,以统一工单类型的格式。在对工单类型进行规范化处理后,每个工单类型单独生成的目录,用于储存同一工单类型下的服务班组和服务内容文本。具体的,如使用连字符(-)替换相关信息中非连字符的特殊字符,例如正斜杠(/)、顿号(、)、左右括号等。例如,将工单类型“在线教育/客户管理”替换为“在线教育-客户管理”。
在本实施例中,对第二历史工单的服务班组进行规范化处理,包括对每个工单类型下的服务班组的单位名称中的分公司下一级单位进行剔除,例如,将“广州-XX分公司-YY营服”处理为“广州-XX分公司”。
在本实施例中,对服务内容文本进行规范化处理,包括根据换行符将文本分割为句子,并剔除具有派单通用模板属性且与派单服务班组无关的句子,例如可以剔除“【订单编号】”、“【发生时间】”、“客户编号:”、“处理人员姓名、工号”等具有派单通用模板属性的句子。还可以使用分词工具对句子进行分词处理,剔除英文字符、数字字符、标点符号、换行符(\n)与其他特殊字符等与派单无关的词。
在本实施例中,在对每一个工单类型下的服务班组和服务内容文本组合后进行去重处理,统一转换为纯文本格式,并存储在同一目录下,方便使用时进行调取。
在一个实施例中,对第一训练样本集合进行增强处理,得到第二训练样本集合,包括:获取每个第一训练样本的服务班组;统计每个服务班组包括的第一训练样本的数量,其中,每个服务班组包括至少一个第一训练样本;根据第一服务班组中的第一训练样本的数量,确定每个服务班组中的训练样本的目标数量;根据训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,其中,第二服务班组中的第一训练样本的数量和第二训练样本的数量之和与训练样本的目标数量之间的差值小于第一预设值;根据第一训练样本和第二训练样本,得到第二训练样本集合;其中,训练样本的目标数量与第一服务班组中的第一训练样本的数量相等;第一服务班组为多个服务班组中第一训练样本的数量最多的服务班组;第二服务班组为多个服务班组中除第一服务班组之外的服务班组。
在本实施例中,每个第一训练样本都对应唯一的服务班组,不同第一训练样本对应的服务班组可能相同,也可能不同。
在本实施例中,获取每个第一训练样本的服务班组,并对第一训练样本集合中所有的第一训练样本根据服务班组进行分类,统计每个服务班组包括的所述第一训练样本的数量,并将第一服务班组所包括的第一训练样本的数量,作为每个服务班组中训练样本的目标数量,并针对每个第二服务班组,根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,使得第二服务班组中的第一训练样本的数量和第二训练样本的数量之和与所述训练样本的目标数量之间的差值小于第一预设值,进而使每个服务班组所对应的训练样本的数量相近,避免因不同服务班组的训练样本数量差距较大而导致分类模型训练过程中数据不均衡的问题,便于保证分类模型的训练效果。
在本实施例中,预设值可以由用户自行设定,本实施例对此不作具体限定,例如,第一预设值可以为3。
例如,第一训练样本集合包括50个第一训练样本,其中,15个第一训练样本对应的服务班组为“A服务班组”,10个对应“B服务班组”,10个对应“C服务班组”,8个对应“D服务班组”,7个对应“E服务班组”,即A服务班组包括15个第一训练样本,B服务班组包括10个第一训练样本,C服务班组包括10个第一训练样本,D服务班组包括8个第一训练样本,E服务班组包括7个第一训练样本,则A服务班组为第一服务班组,B服务班组、C服务班组、D服务班组和E服务班组均为第二服务班组,且第一服务班组和第二服务班组中训练样本的目标数量均为15个。在每个服务班组的训练样本的目标数量确定之后,根据训练样本的目标数量对每个第二服务班组中的第一训练样本进行增强,得到第二训练样本,并使数据增强处理后的第二服务班组中第一训练样本和第二训练样本的数量之和为13~17,从而完成第二服务班组中第一训练样本的数据增强处理。
在本实施例中,在对第一训练样本进行数据增强处理,得到第二训练样本时,可以采用以下三种数据增强方式对第一训练样本进行数据增强处理,以得到第二训练样本;对同一第一训练样本采用不同增强方式,可以得到不同的第二训练样本,进而可以快速得到不同的第二训练样本。
在一个实施例中,根据训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,包括:第二服务班组中的第一训练样本的服务内容文本进行随机遮蔽,生成带有遮蔽标记的服务内容文本;对带有遮蔽标记的服务内容文本进行处理,得到带有遮蔽标记的服务内容文本的独热编码;根据独热编码,生成带有遮蔽标记的服务内容文本的位置编码;将独热编码和位置编码输入至预训练语言模型的编码器中,预测带有遮蔽标记的服务内容文本的遮蔽标记位置处的至少一个候选词向量和每个候选词向量对应的概率,并生成词向量矩阵;对带有遮蔽标记的服务内容文本的独热编码和词向量矩阵进行处理,得到文本向量;根据文本向量,确定目标服务内容文本;根据目标服务内容文本,得到第二训练样本。
在本实施例中,提供了第一种数据增强方式,对第二服务班组中的第一训练样本的服务内容文本采取随机遮蔽策略生成含有遮蔽标记的服务内容文本,将含有遮蔽标记的服务内容文本和遮蔽标记分别转换为独热表示,生成含有遮蔽标记的服务内容文本的位置编码,将含有遮蔽标记的服务内容文本的独热表示、位置编码和遮蔽标记的独热表示输入预训练语言模型的编码器中,预训练语言模型编码器预测遮蔽标记位置的候选词向量及其对应概率,生成词向量矩阵ei,对独热表示ek和词向量矩阵ei进行加权处理,得到新的文本向量实现数据插值增强。
加权处理公式为:
其中,ek代表独热表示,α为超参数,其取值为0.2。
在本实施例中,对于位置编码还可以随机打乱位置编码中的位置信息,将含有遮蔽标记的服务内容文本的独热表示与打乱后的位置编码输入预训练语言模型的编码中,经过相同步骤,也可以得到新的文本向量。
在本实施例中,预训练语言模型可选BERT模型。
在本实施例中,独热表示,即one-Hot表示,独热表示是一种最简单最直接的词的向量化表示方式。
例如,第二服务班组中的第一训练样本的服务内容文本为“xxaavvggttuuiisuoghdfyssvy”,遮蔽标记为“Z”,对服务内容文本“xxaavvggttuuiisuoghdfyssvy”进行随机遮蔽,生成带有遮蔽标记的服务内容文本“xxZavvggttZuiisuoghdfZssvy”,并将带有遮蔽标记的服务内容文本“xxZavvggttZuiisuoghdfZssvy”中的服务内容文本和遮蔽标记分别转换为独热编码的独热表示,并得到独热表示的带有遮蔽标记的服务内容文本的位置编码;将带有遮蔽标记的服务内容文本和带有遮蔽标记的服务内容文本的位置编码均输入BERT预训练语言模型的编码器中,预测到带有遮蔽标记的服务内容文本“xxZavvggttZuiisuoghdfZssvy”中第一遮蔽标记位置处的候选词向量可以为“c”,“f”;第二遮蔽标记位置处的候选词向量可以为“y”,“d”;第三遮蔽标记位置处的候选词向量可以为“h”,“o”;且第一遮蔽标记位置处的候选词向量为“c”的概率为85%,第一遮蔽标记位置处的候选词向量为“f”的概率为70%,第二遮蔽标记位置处的候选词向量为“y”的概率为82%,第二遮蔽标记位置处的候选词向量为“d”的概率为68%,第三遮蔽标记位置处的候选词向量为“h”的概率为79%,第三遮蔽标记位置处的候选词向量为“o”的概率为50%,生成词向量矩阵,并对所述词向量矩阵进行加权处理,得到一个文本向量;根据该文本向量,即可确定目标服务内容文本;根据目标服务内容文本,即可得到所述第二训练样本,实现对第一训练样本进行数据增强处理得到第二训练样本。
在一个实施例中,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,还包括:所述第二服务班组中的多个第一服务内容文本分别进行脱敏处理和分割处理,得到句子集合,其中,所述句子集合包括多个所述第一句子;对所述句子集合中的多个所述第一句子进行随机打乱处理和召回处理,得到多个第二句子;对所述第二服务班组中的第二服务内容文本进行处理,得到第三句子;计算多个所述第二句子中每个所述第二句子与所述第三句子的相似度,并按照相似度由高到低的顺序对多个所述第二句子进行排序;选取相似度大于第二预设值的第二句子,作为第四句子;对所述第四句子与所述第三句子进行随机拼接处理,得到目标句子;根据所述目标句子,确定目标服务内容文本;根据所述目标服务内容文本,得到所述第二训练样本;其中,所述第二服务内容文本为所述第二服务班组中任意一个第一训练样本的服务内容文本;所述第一服务内容文本为所述第二服务班组中除所述任意一个第一训练样本之外的第一训练样本的服务内容文本。
在本实施例中,对所述第二服务班组中的多个第一服务内容文本分别进行脱敏处理和分割处理,具体为:对第二服务班组中的第一服务内容文本中的敏感信息(如人名、电话、地址等)和业务专有名词进行脱敏处理,统一替换为特殊符号&,对文本以句号和换行符作为分隔符进行分割,得到句子集合。
在本实施例中,对所述句子集合中的多个所述第一句子进行随机打乱处理和召回处理,得到多个第二句子,具体为:对句子集合中的多个所述第一句子进行随机打乱处理,通过倒排索引对输入的第一服务内容文本与句子集合进行召回处理,得到第二句子。
在本实施例中,第二预设值可以由用户自行设定。例如,第二预设值可以为30%。
在一个实施例中,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,还包括:对所述第二服务班组中的第一训练样本的服务内容文本进行分词处理,得到候选词集合,其中,所述候选词集合包括多个候选词;计算多个所述候选词中每个所述候选词与所述第一训练样本的服务内容文本的相似度,并按照相似度由高到低的顺序对多个所述候选词进行排序;选取相似度大于第三预设值的候选词,作为文本特征词;获取所述文本特征词的混淆词;将所述第一训练样本的服务内容文本中的文本特征词替换为所述文本特征词对应的所述混淆词,得到目标服务内容文本;根据所述目标服务内容文本,得到所述第二训练样本。
在本实施例中,第三预设值可以由用户自行设定。例如,第三预设值可以为30%。
在一个实施例中,所述将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组,包括:将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型输出至少一个第三服务班组,以及每个所述第三服务班组对应的准确率;根据所述第三服务班组对应的准确率,确定准确率最高的第三服务班组为目标服务班组。
在本实施例中,将所述待服务工单的服务内容文本输入至所述目标分类模型中,目标分类模型会输出至少一个第三服务班组,以及至少一个第三服务班组对应的准确率,选取至少一个第三服务班组中准确率最高的第三服务班组为目标服务班组,能够有效提高派单准确率。
<装置实施例>
本申请实施例还提供一种派单装置200,如图2所示,该派单装置200包括第一获取模块201、第一确定模块202、第二确定模块203、第二获取模块204、生成模块205、处理模块206、训练模块207和第三确定模块208。
第一获取模块201,用于获取待服务工单;第一确定模块202,用于根据所述待服务工单,确定所述待服务工单的工单类型,所述工单类型包括产品类型和服务类型;第二确定模块203,用于根据所述待服务工单的工单类型,确定第一历史工单的数量,其中,所述第一历史工单为历史工单中工单类型与所述待服务工单的工单类型相同的历史工单;第二获取模块204,用于在所述第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,其中,所述第二历史工单为历史工单中服务班组正确,且工单类型与所述待服务工单的工单类型相同的历史工单;生成模块205,用于根据多个所述第二历史工单,生成第一训练样本集合,其中,所述第一训练样本集合包括多个第一训练样本,所述第一训练样本包括第二历史工单的工单类型、第二历史工单的服务班组和第二历史工单的服务内容文本;处理模块206,用于对所述第一训练样本集合进行增强处理,得到第二训练样本集合,其中,所述第二训练样本集合中的训练样本包括多个所述第一训练样本和多个第二训练样本;训练模块207,用于利用所述第二训练样本集合中的训练样本的服务内容文本和所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型;第三确定模块208,用于将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组。
在一个实施例中,该派单装置200还包括第四确定模块、第五确定模块和第六确定模块。
所述第四确定模块,用于在所述第一历史工单的数量小于预设数量的情况下,根据所述待服务工单的工单类型,确定特征数据库中的目标特征信息集合;所述第五确定模块,用于根据所述待服务工单的服务内容文本,确定所述目标特征信息集合中与所述待服务工单的服务内容文本对应的目标特征值;所述第六确定模块,用于通过所述目标特征值确定目标服务班组。
在一个实施例中,该派单装置200还包括分配模块,所述分配模块用于基于所述目标服务班组,将所述待服务工单分配给所述目标服务班组。
在一个实施例中,所述生成模块205,具体用于:针对每个所述第二历史工单,对所述第二历史工单的工单类型、服务班组和服务内容文本分别进行规范化处理,得到处理后的第二历史工单;根据多个所述处理后的第二历史工单,生成第一训练样本集合;其中,所述第一训练样本为所述处理后的第二历史工单。
在一个实施例中,所述处理模块206,具体用于:获取每个所述第一训练样本的服务班组;统计每个所述服务班组包括的所述第一训练样本的数量,其中,每个所述服务班组包括至少一个所述第一训练样本;根据第一服务班组中的所述第一训练样本的数量,确定每个所述服务班组中的训练样本的目标数量;根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,其中,所述第二服务班组中的第一训练样本的数量和第二训练样本的数量之和与所述训练样本的目标数量之间的差值小于第一预设值;根据所述第一训练样本和所述第二训练样本,得到第二训练样本集合;其中,所述训练样本的目标数量与所述第一服务班组中的所述第一训练样本的数量相等;所述第一服务班组为多个所述服务班组中所述第一训练样本的数量最多的服务班组;所述第二服务班组为多个所述服务班组中除所述第一服务班组之外的服务班组。
在一个实施例中,所述处理模块206,具体用于:对所述第二服务班组中的第一训练样本的服务内容文本进行随机遮蔽,生成带有遮蔽标记的服务内容文本;对所述带有遮蔽标记的服务内容文本进行处理,得到所述带有遮蔽标记的服务内容文本的独热编码;根据所述独热编码,生成所述带有遮蔽标记的服务内容文本的位置编码;将所述独热编码和所述位置编码输入至预训练语言模型的编码器中,预测所述带有遮蔽标记的服务内容文本的遮蔽标记位置处的至少一个候选词向量和每个所述候选词向量对应的概率,并生成词向量矩阵;对所述带有遮蔽标记的服务内容文本的独热编码和所述词向量矩阵进行处理,得到文本向量;根据所述文本向量,确定目标服务内容文本;根据所述目标服务内容文本,得到所述第二训练样本。
在一个实施例中,所述处理模块206,具体用于:对所述第二服务班组中的多个第一服务内容文本分别进行脱敏处理和分割处理,得到句子集合,其中,所述句子集合包括多个所述第一句子;对所述句子集合中的多个所述第一句子进行随机打乱处理和召回处理,得到多个第二句子;对所述第二服务班组中的第二服务内容文本进行处理,得到第三句子;计算多个所述第二句子中每个所述第二句子与所述第三句子的相似度,并按照相似度由高到低的顺序对多个所述第二句子进行排序;选取相似度大于第二预设值的第二句子,作为第四句子;对所述第四句子与所述第三句子进行随机拼接处理,得到目标句子;根据所述目标句子,确定目标服务内容文本;根据所述目标服务内容文本,得到所述第二训练样本;其中,所述第二服务内容文本为所述第二服务班组中任意一个第一训练样本的服务内容文本;所述第一服务内容文本为所述第二服务班组中除所述任意一个第一训练样本之外的第一训练样本的服务内容文本。
在一个实施例中,所述处理模块206,具体用于:对所述第二服务班组中的第一训练样本的服务内容文本进行分词处理,得到候选词集合,其中,所述候选词集合包括多个候选词;计算多个所述候选词中每个所述候选词与所述第一训练样本的服务内容文本的相似度,并按照相似度由高到低的顺序对多个所述候选词进行排序;选取相似度大于第三预设值的候选词,作为文本特征词;获取所述文本特征词的混淆词;将所述第一训练样本的服务内容文本中的文本特征词替换为所述文本特征词对应的所述混淆词,得到目标服务内容文本;根据所述目标服务内容文本,得到所述第二训练样本。
在一个实施例中,所述第三确定模块208,具体用于:将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型输出至少一个第三服务班组,以及每个所述第三服务班组对应的准确率。
在本申请实施例中,在第一获取模块获取到待服务工单情况下,首先,通过第一确定模块确定待服务工单的工单类型;其次,通过第二确定模块根据待服务工单的工单类型,确定工单类型与待服务工单的工单类型相同的第一历史工单的数量;最后,通过第二获取模块在第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,并通过生成模块根据多个第二历史工单,生成第一训练样本集合,再通过处理模块对第一训练样本集合进行增强处理,得到第二训练样本集合,训练模块利用第二训练样本集合中的训练样本的服务内容文本和训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型,第三确定模块将待服务工单的服务内容文本输入至目标分类模型中,通过目标分类模型即可确定待服务工单的目标服务班组;其中,不同的工单类型对应不同的分类模型,以便于通过不同的分类模型快速、准确的确定待服务工单对应的目标服务班组,能够在保证派单准确率的同时,节省派单时间,有效提高服务质量与用户满意度。
<设备实施例>
本公开实施例提供了一种电子设备300,该电子设备300可以是服务器,也可以是终端设备。其中,服务器可以是整体式服务器或是跨多计算机或计算机数据中心的分散式服务器。终端设备可以是手机、平板电脑、笔记本电脑等。
如图3所示,电子设备300包括处理器310和存储器320,该存储器320用于存储可执行的指令;该处理器310用于根据指令的控制运行电子设备300执行根据本发明任意实施例的派单方法。
该电子设备可以是具有处理器和存储器的电子产品。例如可以是智能手机、便携式电脑、台式计算机、平板电脑等。
<介质实施例>
本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现前述任一实施例提供的派单方法。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种派单方法,其特征在于,所述方法包括:
获取待服务工单;
根据所述待服务工单,确定所述待服务工单的工单类型,所述工单类型包括产品类型和服务类型;
根据所述待服务工单的工单类型,确定第一历史工单的数量,其中,所述第一历史工单为历史工单中工单类型与所述待服务工单的工单类型相同的历史工单;
在所述第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,其中,所述第二历史工单为历史工单中服务班组正确,且工单类型与所述待服务工单的工单类型相同的历史工单;
根据多个所述第二历史工单,生成第一训练样本集合,其中,所述第一训练样本集合包括多个第一训练样本,所述第一训练样本包括第二历史工单的工单类型、第二历史工单的服务班组和第二历史工单的服务内容文本;
对所述第一训练样本集合进行增强处理,得到第二训练样本集合,其中,所述第二训练样本集合中的训练样本包括多个所述第一训练样本和多个第二训练样本;
利用所述第二训练样本集合中的训练样本的服务内容文本和所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型;
将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组。
2.根据权利要求1所述的派单方法,其特征在于,所述方法还包括:
在所述第一历史工单的数量小于预设数量的情况下,根据所述待服务工单的工单类型,确定特征数据库中的目标特征信息集合;
根据所述待服务工单的服务内容文本,确定所述目标特征信息集合中与所述待服务工单的服务内容文本对应的目标特征值;
通过所述目标特征值确定目标服务班组。
3.根据权利要求1-2任一项所述的派单方法,其中,所述方法还包括:
基于所述目标服务班组,将所述待服务工单分配给所述目标服务班组。
4.根据权利要求1所述的派单方法,其特征在于,所述根据多个所述第二历史工单,生成第一训练样本集合,包括:
针对每个所述第二历史工单,对所述第二历史工单的工单类型、服务班组和服务内容文本分别进行规范化处理,得到处理后的第二历史工单;
根据多个所述处理后的第二历史工单,生成第一训练样本集合;其中,所述第一训练样本为所述处理后的第二历史工单。
5.根据权利要求1所述的派单方法,其特征在于,所述对所述第一训练样本集合进行增强处理,得到第二训练样本集合,包括:
获取每个所述第一训练样本的服务班组;
统计每个所述服务班组包括的所述第一训练样本的数量,其中,每个所述服务班组包括至少一个所述第一训练样本;
根据第一服务班组中的所述第一训练样本的数量,确定每个所述服务班组中的训练样本的目标数量;
根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,其中,所述第二服务班组中的第一训练样本的数量和第二训练样本的数量之和与所述训练样本的目标数量之间的差值小于第一预设值;
根据所述第一训练样本和所述第二训练样本,得到第二训练样本集合;
其中,所述训练样本的目标数量与所述第一服务班组中的所述第一训练样本的数量相等;
所述第一服务班组为多个所述服务班组中所述第一训练样本的数量最多的服务班组;
所述第二服务班组为多个所述服务班组中除所述第一服务班组之外的服务班组。
6.根据权利要求5所述的派单方法,其特征在于,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,包括:
对所述第二服务班组中的第一训练样本的服务内容文本进行随机遮蔽,生成带有遮蔽标记的服务内容文本;
对所述带有遮蔽标记的服务内容文本进行处理,得到所述带有遮蔽标记的服务内容文本的独热编码;
根据所述独热编码,生成所述带有遮蔽标记的服务内容文本的位置编码;
将所述独热编码和所述位置编码输入至预训练语言模型的编码器中,预测所述带有遮蔽标记的服务内容文本的遮蔽标记位置处的至少一个候选词向量和每个所述候选词向量对应的概率,并生成词向量矩阵;
对所述带有遮蔽标记的服务内容文本的独热编码和所述词向量矩阵进行处理,得到文本向量;
根据所述文本向量,确定目标服务内容文本;
根据所述目标服务内容文本,得到所述第二训练样本。
7.根据权利要求5所述的派单方法,其特征在于,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,还包括:
对所述第二服务班组中的多个第一服务内容文本分别进行脱敏处理和分割处理,得到句子集合,其中,所述句子集合包括多个第一句子;
对所述句子集合中的多个所述第一句子进行随机打乱处理和召回处理,得到多个第二句子;
对所述第二服务班组中的第二服务内容文本进行处理,得到第三句子;
计算多个所述第二句子中每个所述第二句子与所述第三句子的相似度,并按照相似度由高到低的顺序对多个所述第二句子进行排序;
选取相似度大于第二预设值的第二句子,作为第四句子;
对所述第四句子与所述第三句子进行随机拼接处理,得到目标句子;
根据所述目标句子,确定目标服务内容文本;
根据所述目标服务内容文本,得到所述第二训练样本;
其中,所述第二服务内容文本为所述第二服务班组中任意一个第一训练样本的服务内容文本;
所述第一服务内容文本为所述第二服务班组中除所述任意一个第一训练样本之外的第一训练样本的服务内容文本。
8.根据权利要求5所述的派单方法,其特征在于,所述根据所述训练样本的目标数量,对第二服务班组中的第一训练样本进行数据增强处理,得到第二训练样本,还包括:
对所述第二服务班组中的第一训练样本的服务内容文本进行分词处理,得到候选词集合,其中,所述候选词集合包括多个候选词;
计算多个所述候选词中每个所述候选词与所述第一训练样本的服务内容文本的相似度,并按照相似度由高到低的顺序对多个所述候选词进行排序;
选取相似度大于第三预设值的候选词,作为文本特征词;
获取所述文本特征词的混淆词;
将所述第一训练样本的服务内容文本中的文本特征词替换为所述文本特征词对应的所述混淆词,得到目标服务内容文本;
根据所述目标服务内容文本,得到所述第二训练样本。
9.根据权利要求1所述的派单方法,其特征在于,所述将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组,包括:
将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型输出至少一个第三服务班组,以及每个所述第三服务班组对应的准确率;
根据所述第三服务班组对应的准确率,确定准确率最高的第三服务班组为目标服务班组。
10.一种派单装置,其特征在于,所述装置包括:
第一获取模块,用于获取待服务工单;
第一确定模块,用于根据所述待服务工单,确定所述待服务工单的工单类型,所述工单类型包括产品类型和服务类型;
第二确定模块,用于根据所述待服务工单的工单类型,确定第一历史工单的数量,其中,所述第一历史工单为历史工单中工单类型与所述待服务工单的工单类型相同的历史工单;
第二获取模块,用于在所述第一历史工单的数量大于或等于预设数量的情况下,获取多个第二历史工单,其中,所述第二历史工单为历史工单中服务班组正确,且工单类型与所述待服务工单的工单类型相同的历史工单;
生成模块,用于根据多个所述第二历史工单,生成第一训练样本集合,其中,所述第一训练样本集合包括多个第一训练样本,所述第一训练样本包括第二历史工单的工单类型、第二历史工单的服务班组和第二历史工单的服务内容文本;
处理模块,用于对所述第一训练样本集合进行增强处理,得到第二训练样本集合,其中,所述第二训练样本集合中的训练样本包括多个所述第一训练样本和多个第二训练样本;
训练模块,用于利用所述第二训练样本集合中的训练样本的服务内容文本和所述训练样本的服务班组,对TextRCNN模型进行训练,得到目标分类模型;
第三确定模块,用于将所述待服务工单的服务内容文本输入至所述目标分类模型中,通过所述目标分类模型确定目标服务班组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211531182.6A CN116029492B (zh) | 2022-12-01 | 2022-12-01 | 派单方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211531182.6A CN116029492B (zh) | 2022-12-01 | 2022-12-01 | 派单方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116029492A CN116029492A (zh) | 2023-04-28 |
CN116029492B true CN116029492B (zh) | 2023-12-01 |
Family
ID=86071585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211531182.6A Active CN116029492B (zh) | 2022-12-01 | 2022-12-01 | 派单方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116029492B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001572A (zh) * | 2020-10-27 | 2020-11-27 | 绿漫科技有限公司 | 一种工单智能分派方法 |
CN113836898A (zh) * | 2021-09-23 | 2021-12-24 | 国网江苏省电力有限公司淮安供电分公司 | 一种电力系统自动派单方法 |
CN114218958A (zh) * | 2021-11-19 | 2022-03-22 | 阿里巴巴(中国)有限公司 | 工单处理方法、装置、设备和存储介质 |
CN114510570A (zh) * | 2022-01-21 | 2022-05-17 | 平安科技(深圳)有限公司 | 基于小样本语料的意图分类方法、装置及计算机设备 |
CN114742366A (zh) * | 2022-03-18 | 2022-07-12 | 南京视察者智能科技有限公司 | 一种基于大数据算法的工单智能派发方法 |
WO2022206091A1 (zh) * | 2021-03-30 | 2022-10-06 | 京东科技控股股份有限公司 | 用于生成数据的方法和装置 |
-
2022
- 2022-12-01 CN CN202211531182.6A patent/CN116029492B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001572A (zh) * | 2020-10-27 | 2020-11-27 | 绿漫科技有限公司 | 一种工单智能分派方法 |
WO2022206091A1 (zh) * | 2021-03-30 | 2022-10-06 | 京东科技控股股份有限公司 | 用于生成数据的方法和装置 |
CN113836898A (zh) * | 2021-09-23 | 2021-12-24 | 国网江苏省电力有限公司淮安供电分公司 | 一种电力系统自动派单方法 |
CN114218958A (zh) * | 2021-11-19 | 2022-03-22 | 阿里巴巴(中国)有限公司 | 工单处理方法、装置、设备和存储介质 |
CN114510570A (zh) * | 2022-01-21 | 2022-05-17 | 平安科技(深圳)有限公司 | 基于小样本语料的意图分类方法、装置及计算机设备 |
CN114742366A (zh) * | 2022-03-18 | 2022-07-12 | 南京视察者智能科技有限公司 | 一种基于大数据算法的工单智能派发方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116029492A (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111222305B (zh) | 一种信息结构化方法和装置 | |
CN113361578B (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
CN112380853B (zh) | 业务场景交互方法、装置、终端设备及存储介质 | |
US11429810B2 (en) | Question answering method, terminal, and non-transitory computer readable storage medium | |
CN112418320B (zh) | 一种企业关联关系识别方法、装置及存储介质 | |
EP3620982A1 (en) | Sample processing method and device | |
CN107341143A (zh) | 一种句子连贯性判断方法及装置和电子设备 | |
CN113407677B (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN112101042A (zh) | 文本情绪识别方法、装置、终端设备和存储介质 | |
CN111026840A (zh) | 文本处理方法、装置、服务器和存储介质 | |
Estevez-Velarde et al. | AutoML strategy based on grammatical evolution: A case study about knowledge discovery from text | |
CN110909768A (zh) | 一种标注数据获取方法及装置 | |
CN114445826A (zh) | 视觉问答方法、装置、电子设备以及存储介质 | |
CN113934848A (zh) | 一种数据分类方法、装置和电子设备 | |
CN113297355A (zh) | 基于对抗插值序列标注数据增强方法、装置、设备及介质 | |
CN115357720B (zh) | 基于bert的多任务新闻分类方法及装置 | |
CN115186738B (zh) | 模型训练方法、装置和存储介质 | |
CN116029492B (zh) | 派单方法和装置 | |
CN116797195A (zh) | 工单处理方法、装置、计算机设备和计算机可读存储介质 | |
CN116167382A (zh) | 意图事件提取方法及装置、电子设备、存储介质 | |
CN114398482A (zh) | 一种词典构造方法、装置、电子设备及存储介质 | |
CN113095073B (zh) | 语料标签生成方法、装置、计算机设备和存储介质 | |
CN115017906A (zh) | 一种针对文本中实体的识别方法、装置及存储介质 | |
CN111382247B (zh) | 一种内容推送优化方法、内容推送优化装置及电子设备 | |
CN112115229A (zh) | 文本意图识别方法、装置、系统以及文本分类系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |