CN113254644A - 模型训练方法及非投诉工单处理方法及系统及装置及介质 - Google Patents

模型训练方法及非投诉工单处理方法及系统及装置及介质 Download PDF

Info

Publication number
CN113254644A
CN113254644A CN202110630284.2A CN202110630284A CN113254644A CN 113254644 A CN113254644 A CN 113254644A CN 202110630284 A CN202110630284 A CN 202110630284A CN 113254644 A CN113254644 A CN 113254644A
Authority
CN
China
Prior art keywords
data
work order
complaint work
complaint
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110630284.2A
Other languages
English (en)
Other versions
CN113254644B (zh
Inventor
李雨桐
其他发明人请求不公开姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shuzhilian Technology Co Ltd
Original Assignee
Chengdu Shuzhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shuzhilian Technology Co Ltd filed Critical Chengdu Shuzhilian Technology Co Ltd
Priority to CN202110630284.2A priority Critical patent/CN113254644B/zh
Publication of CN113254644A publication Critical patent/CN113254644A/zh
Application granted granted Critical
Publication of CN113254644B publication Critical patent/CN113254644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了模型训练方法及非投诉工单处理方法及系统及装置及介质,包括:获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;对与所述A类数据关联的B类数据进行标记为第一标记数据;对与所述A类数据未关联的B类数据进行标记为第二标记数据;对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;利用所述特征数据建立分类模型并训练;通过本方法可以训练的分类模型能够获得可以获得B类数据转为A类数据的概率。

Description

模型训练方法及非投诉工单处理方法及系统及装置及介质
技术领域
本发明涉及人工智能领域,具体地,涉及模型训练方法及非投诉工单处理方法及系统及装置及介质。
背景技术
数据分类是数据处理中的常用手段,现有技术中主要手段是对数据进行分类,但少有预测分类后的数据转换为其他类别的技术方案,如现有技术中没有预测非投诉工单转为投诉工单概率的技术方案,为了保障服务质量,投诉工单处理一直是售后服务的重点工作,但是现有的投诉工单处理均是在投诉工单发生后即用户投诉后进行处理,无法提前进行干预或处理,导致售后处理被动,影响用户满意度。
发明内容
现有的分类方法是对数据进行分类,未有方法预测分类后的数据转换为其他分类类别概率的技术方案。
为预测分类的数据转换为其他类别数据的概率,本发明提供了模型训练方法,通过本方法可以训练出第一分类模型,通过所述第一分类模型能够获得可以获得B类数据转为A类数据的概率。
为实现上述发明目的,本发明提供了模型训练方法,所述方法包括:
获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;
对与所述A类数据关联的B类数据进行标记为第一标记数据;
对与所述A类数据未关联的B类数据进行标记为第二标记数据;
对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;
利用所述特征数据建立分类模型并训练。
其中,本方法首先获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;对与所述A类数据关联的B类数据进行标记为第一标记数据;对与所述A类数据未关联的B类数据进行标记为第二标记数据;对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据抽取以特征的分类贡献是否满足预设要求为判断;利用所述特征数据建立分类模型并训练。
在信息增益中,重要性的衡量标准就是看特征可以为分类系统带来多少信息,带来的信息越多,则该特征越重要。信息增益是针对一个一个的特征而言的,针对一个特征t,分类系统有它和没它的时候信息量各是多少,两者的差值就是这个特征给分类系统带来的信息量,即增益。每个特征都会产生增益,只是产生的增益量的大小有差别,即特征对文档的分类贡献度上有区别,需要挑出贡献度较大满足预设需求的特征。
通过上述方式选取的特征数据是以特征的分类贡献是否满足预设要求为判断,即是数据中分类贡献较大的特征数据,然后通过上述特征数据构建训练集,利用训练集训练分类模型,通过分类模型能够获得输入数据所属分类类别的概率分布,进而能够获得B类数据转为A类数据的概率。
其中,本发明中的所述历史数据为工单历史数据,所述A类数据为投诉工单数据,所述B类数据为非投诉工单数据。
目前已有方法是用于预测基于时间序列的投诉工单产生数量,少有分析非投诉工单转换为投诉工单的概率。为了预测非投诉工单转换投诉工单的概率,本发明提供了工单分类模型训练方法,通过本方法可以训练出第一工单数据分类模型,通过所述第一工单数据分类模型能够获得非投诉工单的分类概率,即可以获得非投诉工单转为投诉工单的概率。
本发明提供了工单分类模型训练方法,所述方法包括:
获取预设时间段内的工单数据,所述工单数据包括若干单投诉工单数据和若干单非投诉工单数据;
判断每单所述投诉工单数据是否存在关联的所述非投诉工单数据,若存在,则将与所述投诉工单数据关联的所述非投诉工单数据标记为第二非投诉工单数据,并将已标记的所述非投诉工单数据从所述工单数据中剔除,获得剩余工单数据;
将所述剩余工单数据中的每单所述非投诉工单数据均标记为第一非投诉工单数据;
获得基础数据,所述基础数据包括若干单所述第一非投诉工单数据和若干单所述第二非投诉工单数据;
从所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集,其中,所述特征数据为第一工单数据中对所述第一工单数据所属分类类别产生的增益大于阈值的数据;
构建工单分类模型,所述工单分类模型的输出为输入工单数据所属分类类别的概率分布;
基于所述特征数据集获得训练集,利用所述训练集训练所述工单分类模型,获得第一工单数据分类模型。
其中,本方法首先从历史工单数据中找到投诉工单数据,然后对这些投诉工单数据进行追溯,判断其是否是由非投诉工单转为投诉工单,并将这类非投诉工单数据标记为第二非投诉工单数据;然后将工单数据中未转换为投诉工单数据的非投诉工单数据标记为第一非投诉工单数据,完成工单数据标记后,基于标记后的数据获得基础数据,然后从基础数据中抽取出特征数据,其中,特征数据为第一工单数据中对所述第一工单数据所属分类类别产生的增益大于阈值的数据,通过上述方式选取的特征数据是对其所属工单数据的分类产生增益大于阈值的数据,即是工单数据中分类贡献较大的特征数据,然后通过上述特征数据构建训练集,利用训练集训练工单分类模型,通过工单分类模型能够获得输入工单数据所属分类类别的概率分布,进而能够获得非投诉工单转为投诉工单的概率。
优选的,所述方法还包括:对所述基础数据进行预处理,从预处理后的所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集;所述预处理方式包括以下处理方式中的一种或几种:填补所述基础数据中的缺失值,光滑处理所述基础数据中的噪声数据,平滑或删除所述基础数据中的离群点。
其中,本方法预处理基础数据是为了提高数据质量和使数据更好地适应模型。其中填补缺失值为把缺失的数据补齐,光滑噪声数据为修正变量中的随机误差或偏差,平滑或删除离群点为用平均值代替异常值或者删除异常值。
优选的,本方法中从所述特征数据集中抽取第一预设比例的数据获得所述训练集;从所述特征数据集中抽取第二预设比例的数据获得测试集;利用所述训练集训练所述分类模型获得所述第一分类模型,利用所述测试集测试所述第一分类模型。其中,利用测试集和测试和验证模式是否准确。
优选的,所述方法还包括:对所述基础数据进行哑编码处理,从哑编码处理后的所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集。哑编码处理目的是将文本变量转化为数字变量进行模型训练。当变量不是定量特征的时候是无法拿去进行训练模型,哑编码主要是针对定性的特征进行处理然后得到可以用来训练的特征。
优选的,本方法中所述特征的分类贡献为特征数据t的增益,所述特征数据t的增益的计算方式为:
Figure 216446DEST_PATH_IMAGE001
其中,
Figure 627835DEST_PATH_IMAGE002
为特征数据t的增益,t为特征数据,表示一个词条在文档中出现;
Figure 65770DEST_PATH_IMAGE003
表示一个词条在文档中不出现;
Figure 220808DEST_PATH_IMAGE004
表示第i个类别;m表示词的总数;
Figure 427798DEST_PATH_IMAGE005
表示事件
Figure 275669DEST_PATH_IMAGE004
发生的概率,
Figure 686052DEST_PATH_IMAGE006
表示事件t发生的概率,
Figure 644781DEST_PATH_IMAGE007
表示t发生后
Figure 706278DEST_PATH_IMAGE004
发生的概率,
Figure 990629DEST_PATH_IMAGE008
表示事件
Figure 137576DEST_PATH_IMAGE003
发生的概率,
Figure 634417DEST_PATH_IMAGE009
表示
Figure 550420DEST_PATH_IMAGE003
发生后
Figure 5672DEST_PATH_IMAGE010
发生的概率。
优选的,本方法中所述分类模型为朴素贝叶斯模型。
优选的,本方法中所述分类模型对应的输入空间
Figure 639916DEST_PATH_IMAGE011
为n维向量的集合,所述分类模型对应的输出空间为
Figure 940447DEST_PATH_IMAGE012
;所述分类模型的输入为特征向量x∈X, 所述分类模型的输出为分类标记y∈Y,所述特征向量x为定义在所述输入空间X上的随机向量,所述分类标记y为定义在所述输出空间Y上的随机变量,X为一个m*n的矩阵,用于计算任一样本
Figure 976536DEST_PATH_IMAGE013
属于类别
Figure 586378DEST_PATH_IMAGE014
的概率的公式为:
Figure 707918DEST_PATH_IMAGE015
其中,
Figure 546561DEST_PATH_IMAGE016
为n维向量空间;
Figure 437157DEST_PATH_IMAGE017
表示某一个特征;
Figure 968632DEST_PATH_IMAGE018
表示特征值。
本发明还提供了一种非投诉工单处理方法,所述方法包括:
得到非投诉工单a;
采用所述的工单分类模型训练方法训练获得所述第一分类模型;
将所述非投诉工单a输入所述第一分类模型,输出所述非投诉工单a的预测分类概率分布结果,包括:所述非投诉工单a属于投诉工单的概率P;
若所述概率P小于第一设定值,则对所述非投诉工单a不进行任何处理;
若所述概率P大于或等于第一设定值,则将所述非投诉工单a转为待处理工单,并将所述待处理工单发送至投诉工单处理部门。
其中,利用本发明中的非投诉工单处理方法可以计算非投诉工单转成投诉工单的概率,进而预测一个非投诉工单后期是否会转换成投诉工单,若其转为投诉工单得概率高于阈值,则提前对其进行干预或处理,如提前联系客户进行处理,或将工单发送至售后部门进行重新处理或检查,避免被动处理,保障用户满意度。
本发明还提供了模型训练系统,所述系统包括:
数据获取单元,用于获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;
第一标记单元,用于对与所述A类数据关联的B类数据进行标记为第一标记数据;
第二标记单元,用于对与所述A类数据未关联的B类数据进行标记为第二标记数据;
基础数据获得及特征抽取单元,用于对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;
模型建立及训练单元,用于利用所述特征数据建立分类模型并训练。
本发明还提供了一种非投诉工单处理系统,所述系统包括:
得到单元,用于得到非投诉工单a;
训练单元,用于采用所述的工单分类模型训练方法训练获得所述第一工单数据分类模型;
分类单元,用于将所述非投诉工单a输入所述第一工单数据分类模型,输出所述非投诉工单a的预测分类概率分布结果,包括:所述非投诉工单a属于投诉工单的概率P;
处理单元,用于若所述概率P小于第一设定值,则对所述非投诉工单a不进行任何处理;若所述概率P大于或等于第一设定值,则将所述非投诉工单a转为待处理工单,并将所述待处理工单发送至投诉工单处理部门。
本发明还提供了分类模型训练装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述模型训练方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述模型训练方法的步骤。
本发明还提供了一种非投诉工单处理装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述非投诉工单处理方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述非投诉工单处理方法的步骤。
为本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提供了模型训练方法,通过本方法可以训练出第一分类模型,通过所述第一分类模型能够获得可以获得分类后B类数据转为A类数据的概率。
本发明提供了模型训练方法,通过本方法可以训练出第一分类模型,通过所述第一分类模型能够获得非投诉工单的分类概率,即可以获得非投诉工单转为投诉工单的概率。
本发明为解决非投诉工单转投诉工单的风险问题,提出了将投诉工单溯源,并基于溯源结果对所有非投诉工单打标,对打标后的基础数据进行数据预处理并提取特征数据,基于特征数据构建训练集训练模型。本发明中的非投诉工单处理方法可以计算非投诉工单转成投诉工单的概率,进而预测一个非投诉工单后期是否会转换成投诉工单,若其转为投诉工单得概率高于阈值,可以提前发现具有投诉风险的非投诉工单,则提前对其进行干预或处理,如提前联系客户进行处理,或将工单发送至售后部门进行重新处理或检查,避免被动处理,提高用户满意度。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1为模型训练方法的流程示意图;
图2为模型训练系统的组成示意图;
图3为非投诉工单处理系统的组成示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
实施例一
本实施例一中历史数据可以为任何可以分为两种类型的数据,且这两种类型之间能够转换,转换的两种类型数据之间具有关联关系,如历史数据可以为工单数据,也可以为其他类型的数据,本发明实施例不对历史数据的形式和领域进行限制。下面本发明实施例以历史数据为工单数据为例进行介绍。
请参考图1,图1为模型训练方法的流程示意图,本发明创新发明工单分类模型训练方法:对已完成存档的投诉工单进行标记,将繁杂的文版信息分类后建模。模型训练完成后,通过向训练后的模型输入现有未完成非投诉工单的特征即可返回此工单转换为投诉工单的概率,通过上述概率的高低自动采取相应的处理措施。
本发明实施例一提供了一种工单分类模型训练方法,通过本方法可以训练出第一工单数据分类模型,通过所述第一工单数据分类模型能够获得非投诉工单的分类概率,即可以获得非投诉工单转为投诉工单的概率。
本发明实施例一提供了工单分类模型训练方法,通过本方法可以训练出第一工单数据分类模型,通过所述第一工单数据分类模型能够获得非投诉工单的分类概率,即可以获得非投诉工单转为投诉工单的概率。
本发明提供了工单分类模型训练方法,所述方法包括:
获取预设时间段内的工单数据,所述工单数据包括若干单投诉工单数据和若干单非投诉工单数据;
判断每单所述投诉工单数据是否存在关联的所述非投诉工单数据,若存在,则将与所述投诉工单数据关联的所述非投诉工单数据标记为第二非投诉工单数据,并将已标记的所述非投诉工单数据从所述工单数据中剔除,获得剩余工单数据;
将所述剩余工单数据中的每单所述非投诉工单数据均标记为第一非投诉工单数据;如通过投诉工单的关联工单号追溯到该投诉工单所关联的前一个非投诉工单,将追溯到的非投诉工单标记为1,并将一年内已经处理完成并归档的其他未转为投诉工单的非投诉工单标记为0,具体标记的标识类型或数字号码或编码可以根据实际需要进行灵活调整,能够进行区分类别即可,本发明不进行具体的限定。其中,预设时间段可以为1月,也可以为半年,也可以为1年,本发明对预设时间段的时间长短不进行具体的限定,其中,工单有工单号,工单号可以为一串数字或字母组成的符号,非投诉工单的工单号为XXXXXXXX1F,当其转换为投诉工单后,工单号变为XXXXXXXX1T,此时关联工单号为XXXXXXXX1,关联工单号为关联的投诉工单与非投诉工单之间的联系信息,可以为编码,编号,身份信息等等,即能够通过该关联工单号寻找到唯一的关联工单。
获得基础数据,所述基础数据包括若干单所述第一非投诉工单数据和若干单所述第二非投诉工单数据;
从所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集,其中,所述特征数据为第一工单数据中对所述第一工单数据所属分类类别产生的增益大于阈值的数据;
构建工单分类模型,所述工单分类模型的输出为输入工单数据所属分类类别的概率分布;
基于所述特征数据集获得训练集,利用所述训练集训练所述工单分类模型,获得第一工单数据分类模型。
其中,本方法首先从历史工单数据中找到投诉工单数据,然后对这些投诉工单数据进行追溯,判断其是否是由非投诉工单转为投诉工单,并将这类非投诉工单数据标记为第二非投诉工单数据;然后将工单数据中未转换为投诉工单数据的非投诉工单数据标记为第一非投诉工单数据,完成工单数据标记后,基于标记后的数据获得基础数据,然后从基础数据中抽取出特征数据,其中,特征数据为第一工单数据中对所述第一工单数据所属分类类别产生的增益大于阈值的数据,通过上述方式选取的特征数据是对其所属工单数据的分类产生增益大于阈值的数据,即是工单数据中分类贡献较大的特征数据,然后通过上述特征数据构建训练集,利用训练集训练工单分类模型,通过工单分类模型能够获得输入工单数据所属分类类别的概率分布,进而能够获得非投诉工单转为投诉工单的概率。
其中,在本发明实施例中,所述方法还包括:对所述基础数据进行预处理,从预处理后的所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集;所述预处理方式包括以下处理方式中的一种或几种:填补所述基础数据中的缺失值,光滑处理所述基础数据中的噪声数据,平滑或删除所述基础数据中的离群点。
其中,在本发明实施例中,本方法预处理基础数据是为了提高数据质量和使数据更好地适应模型。其中填补缺失值为把缺失的数据补齐,光滑噪声数据为修正变量中的随机误差或偏差,平滑或删除离群点为用平均值代替异常值或者删除异常值。
其中,在本发明实施例中,本方法中从所述特征数据集中抽取第一预设比例的数据获得所述训练集;从所述特征数据集中抽取第二预设比例的数据获得测试集;利用所述训练集训练所述工单分类模型获得所述第一工单数据分类模型,利用所述测试集测试所述第一工单数据分类模型。其中,利用测试集和测试和验证模式是否准确。
其中,在本发明实施例中,所述方法还包括:对所述基础数据进行哑编码处理,从哑编码处理后的所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集。哑编码处理目的是将文本变量转化为数字变量进行模型训练。当变量不是定量特征的时候是无法拿去进行训练模型,哑编码主要是针对定性的特征进行处理然后得到可以用来训练的特征。
优选的,本方法中所述特征的分类贡献为特征数据t的增益,所述特征数据t的增益的计算方式为:
Figure 311889DEST_PATH_IMAGE001
其中,
Figure 219802DEST_PATH_IMAGE002
为特征数据t的增益,t为特征数据,表示一个词条在文档中出现;
Figure 964904DEST_PATH_IMAGE003
表示一个词条在文档中不出现;
Figure 932860DEST_PATH_IMAGE004
表示第i个类别;m表示词的总数;
Figure 511216DEST_PATH_IMAGE005
表示事件
Figure 691661DEST_PATH_IMAGE004
发生的概率,
Figure 556849DEST_PATH_IMAGE006
表示事件t发生的概率,
Figure 430127DEST_PATH_IMAGE007
表示t发生后
Figure 747976DEST_PATH_IMAGE004
发生的概率,
Figure 997692DEST_PATH_IMAGE008
表示事件
Figure 717386DEST_PATH_IMAGE003
发生的概率,
Figure 761565DEST_PATH_IMAGE009
表示
Figure 566710DEST_PATH_IMAGE003
发生后
Figure 620117DEST_PATH_IMAGE004
发生的概率。
其中,所述特征数据为第一工单数据中对所述第一工单数据所属分类类别产生的增益大于阈值的数据,具体的阈值大小可以根据实际需要进行灵活调整,本发明对阈值的大小不进行具体的限定。
其中,在本发明实施例中,本方法中所述工单分类模型为朴素贝叶斯模型。
其中,在本发明实施例中,本方法中所述工单分类模型对应的输入空间
Figure 443585DEST_PATH_IMAGE011
为n维向量的集合,所述工单分类模型对应的输出空间为
Figure 658666DEST_PATH_IMAGE012
;所述工单分类模型的输入为特征向量x∈X, 所述工单分类模型的输出为分类标记y∈Y,所述特征向量x为定义在所述输入空间X上的随机向量,所述分类标记y为定义在所述输出空间Y上的随机变量,X为一个m*n的矩阵,用于计算任一样本
Figure 685528DEST_PATH_IMAGE013
属于类别
Figure 542625DEST_PATH_IMAGE014
的概率的公式为:
Figure 971333DEST_PATH_IMAGE015
其中,
Figure 357315DEST_PATH_IMAGE016
为n维向量空间;
Figure 137052DEST_PATH_IMAGE017
表示某一个特征;
Figure 266682DEST_PATH_IMAGE018
表示特征值。
实施例二
本发明实施例二提供了一种非投诉工单处理方法,所述方法包括:
得到非投诉工单a;
采用实施例一中所述的工单分类模型训练方法训练获得所述第一工单数据分类模型;
将所述非投诉工单a输入所述第一工单数据分类模型,输出所述非投诉工单a的预测分类概率分布结果,包括:所述非投诉工单a属于投诉工单的概率P;
若所述概率P小于第一设定值,则对所述非投诉工单a不进行任何处理;
若所述概率P大于或等于第一设定值,则将所述非投诉工单a转为待处理工单,并将所述待处理工单发送至投诉工单处理部门。
其中,在实际应用过程中概率P的大小可以根据实际需要进行灵活调整,本发明不进行具体的限定,如0.5或0.6或0.8等等。
其中,利用本发明中的非投诉工单处理方法可以计算非投诉工单转成投诉工单的概率,进而预测一个非投诉工单后期是否会转换成投诉工单,若其转为投诉工单得概率高于阈值,则提前对其进行干预或处理,如提前联系客户进行处理,或将工单发送至售后部门进行重新处理或检查,避免被动处理,保障用户满意度。
实施例三
请参考图2,图2为模型训练系统的组成示意图,本发明实施例三提供了工单分类模型训练系统,所述系统包括:
数据获取单元,用于获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;
第一标记单元,用于对与所述A类数据关联的B类数据进行标记为第一标记数据;
第二标记单元,用于对与所述A类数据未关联的B类数据进行标记为第二标记数据;
基础数据获得及特征抽取单元,用于对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据抽取以特征的分类贡献是否满足预设要求为判断;
模型建立及训练单元,用于利用所述特征数据建立分类模型并训练。
实施例四
请参考图3,图3为非投诉工单处理系统的组成示意图,本发明实施例四提供了一种非投诉工单处理系统,所述系统包括:
得到单元,用于得到非投诉工单a;
训练单元,用于采用实施例一中所述的工单分类模型训练方法训练获得所述第一工单数据分类模型;
分类单元,用于将所述非投诉工单a输入所述第一工单数据分类模型,输出所述非投诉工单a的预测分类概率分布结果,包括:所述非投诉工单a属于投诉工单的概率A和所述非投诉工单a属于非投诉工单的概率B;
处理单元,用于若所述概率A小于第一设定值,则对所述非投诉工单a不进行任何处理;若所述概率A大于或等于第一设定值,则将所述非投诉工单a转为待处理工单,并将所述待处理工单发送至投诉工单处理部门。
实施例五
本发明实施例五提供了工单分类模型训练装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述模型训练方法的步骤。
实施例六
本发明实施例六提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述模型训练方法的步骤。
实施例七
本发明实施例七提供了一种非投诉工单处理装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述非投诉工单处理方法的步骤。
实施例八
本发明实施例八提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述非投诉工单处理方法的步骤。
其中,实施例五和实施例七中所述处理器可以是中央处理器(CPU,CentralProcessing Unit),还可以是其他通用处理器、数字信号处理器(digital signalprocessor)、专用集成电路(Application Specific Integrated Circuit)、现成可编程门阵列(Fieldprogrammable gate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现发明中模型训练装置或非投诉工单处理装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述模型训练装置或非投诉工单处理装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
本发明已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (15)

1.模型训练方法,其特征在于,所述方法包括:
获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;
对与所述A类数据关联的B类数据进行标记为第一标记数据;
对与所述A类数据未关联的B类数据进行标记为第二标记数据;
对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;
利用所述特征数据建立分类模型并训练。
2.根据权利要求1所述的模型训练方法,其特征在于,所述方法还包括:
对所述基础数据进行预处理,从预处理后的所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集;所述预处理方式包括以下处理方式中的一种或几种:填补所述基础数据中的缺失值,光滑处理所述基础数据中的噪声数据,平滑或删除所述基础数据中的离群点。
3.根据权利要求1所述的模型训练方法,其特征在于,从所述特征数据中抽取第一预设比例的数据获得训练集;从所述特征数据中抽取第二预设比例的数据获得测试集;利用所述训练集训练所述分类模型获得第一分类模型,利用所述测试集测试所述第一分类模型。
4.根据权利要求1所述的模型训练方法,其特征在于,所述方法还包括:对所述基础数据进行哑编码处理,从哑编码处理后的所述基础数据中的每单数据中分别抽取特征数据,获得特征数据集。
5.根据权利要求1所述的模型训练方法,其特征在于,所述特征数据t的增益的计算方式为:
Figure 885704DEST_PATH_IMAGE001
其中,
Figure 250432DEST_PATH_IMAGE002
为特征数据t的增益,t为特征数据,表示一个词条在文档中出现;
Figure 806179DEST_PATH_IMAGE003
表示一个词条在文档中不出现;
Figure 748727DEST_PATH_IMAGE004
表示第i个类别;m表示词的总数;
Figure 452241DEST_PATH_IMAGE005
表示事件
Figure 76120DEST_PATH_IMAGE004
发生的概率,
Figure 814269DEST_PATH_IMAGE006
表示事件t发生的概率,
Figure 130981DEST_PATH_IMAGE007
表示t发生后
Figure 56212DEST_PATH_IMAGE004
发生的概率,
Figure 546099DEST_PATH_IMAGE008
表示事件
Figure 60126DEST_PATH_IMAGE003
发生的概率,
Figure 610056DEST_PATH_IMAGE009
表示
Figure 225845DEST_PATH_IMAGE003
发生后
Figure 253844DEST_PATH_IMAGE010
发生的概率。
6.根据权利要求1所述的模型训练方法,其特征在于,所述分类模型为朴素贝叶斯模型。
7.根据权利要求6所述的模型训练方法,其特征在于,所述分类模型对应的输入空间
Figure 701005DEST_PATH_IMAGE011
为n维向量的集合,所述分类模型对应的输出空间为
Figure 93941DEST_PATH_IMAGE012
;所述分类模型的输入为特征向量x∈X, 所述分类模型的输出为分类标记y∈Y,所述特征向量x为定义在所述输入空间X上的随机向量,所述分类标记y为定义在所述输出空间Y上的随机变量,X为一个m*n的矩阵,用于计算任一样本
Figure 259343DEST_PATH_IMAGE013
属于类别
Figure 825453DEST_PATH_IMAGE014
的概率的公式为:
Figure 330384DEST_PATH_IMAGE015
其中,
Figure 956537DEST_PATH_IMAGE016
为n维向量空间;
Figure 343656DEST_PATH_IMAGE017
表示某一个特征;
Figure 667453DEST_PATH_IMAGE018
表示特征值。
8.根据权利要求1所述的模型训练方法,其特征在于,所述历史数据为工单历史数据,所述A类数据为投诉工单数据,所述B类数据为非投诉工单数据。
9.非投诉工单处理方法,其特征在于,所述方法包括:
得到非投诉工单a;
采用权利要求1-8中任意一个所述的模型训练方法训练获得第一分类模型;
将所述非投诉工单a输入所述第一分类模型,输出所述非投诉工单a的预测分类概率分布结果,包括:所述非投诉工单a属于投诉工单的概率K;
若所述概率K小于第一设定值,则对所述非投诉工单a不进行任何处理;
若所述概率K大于或等于第一设定值,则将所述非投诉工单a转为待处理工单,并将所述待处理工单发送至投诉工单处理部门。
10.模型训练系统,其特征在于,所述系统包括:
数据获取单元,用于获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;
第一标记单元,用于对与所述A类数据关联的B类数据进行标记为第一标记数据;
第二标记单元,用于对与所述A类数据未关联的B类数据进行标记为第二标记数据;
基础数据获得及特征抽取单元,用于对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;
模型建立及训练单元,用于利用所述特征数据建立分类模型并训练。
11.非投诉工单处理系统,其特征在于,所述系统包括:
得到单元,用于得到非投诉工单a;
训练单元,用于采用权利要求1-8中任意一个所述的模型训练方法训练获得第一分类模型;
分类单元,用于将所述非投诉工单a输入所述第一分类模型,输出所述非投诉工单a的预测分类概率分布结果,包括:所述非投诉工单a属于投诉工单的概率K;
处理单元,用于若所述概率K小于第一设定值,则对所述非投诉工单a不进行任何处理;若所述概率K大于或等于第一设定值,则将所述非投诉工单a转为待处理工单,并将所述待处理工单发送至投诉工单处理部门。
12.模型训练装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-8中任意一个所述模型训练方法的步骤。
13.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任意一个所述模型训练方法的步骤。
14.非投诉工单处理装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求9所述非投诉工单处理方法的步骤。
15.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求9所述非投诉工单处理方法的步骤。
CN202110630284.2A 2021-06-07 2021-06-07 模型训练方法及非投诉工单处理方法及系统及装置及介质 Active CN113254644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110630284.2A CN113254644B (zh) 2021-06-07 2021-06-07 模型训练方法及非投诉工单处理方法及系统及装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110630284.2A CN113254644B (zh) 2021-06-07 2021-06-07 模型训练方法及非投诉工单处理方法及系统及装置及介质

Publications (2)

Publication Number Publication Date
CN113254644A true CN113254644A (zh) 2021-08-13
CN113254644B CN113254644B (zh) 2021-09-17

Family

ID=77186743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110630284.2A Active CN113254644B (zh) 2021-06-07 2021-06-07 模型训练方法及非投诉工单处理方法及系统及装置及介质

Country Status (1)

Country Link
CN (1) CN113254644B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050286764A1 (en) * 2002-10-17 2005-12-29 Anurag Mittal Method for scene modeling and change detection
US20060229854A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Computer system architecture for probabilistic modeling
CN101593109A (zh) * 2009-07-06 2009-12-02 北京航空航天大学 一种目标可满足性定性、定量表示及推理方法
US20100070500A1 (en) * 2006-10-31 2010-03-18 Zhan Cui Data processing
CN103246686A (zh) * 2012-02-14 2013-08-14 阿里巴巴集团控股有限公司 文本分类方法和装置及文本分类的特征处理方法和装置
CN106022676A (zh) * 2016-05-09 2016-10-12 华南理工大学 一种对物流客户的投诉意愿评级的方法及装置
CN106204063A (zh) * 2016-06-30 2016-12-07 北京奇艺世纪科技有限公司 一种付费用户挖掘方法及装置
CN107563429A (zh) * 2017-07-27 2018-01-09 国家计算机网络与信息安全管理中心 一种网络用户群体的分类方法及装置
CN108520229A (zh) * 2018-04-04 2018-09-11 北京旷视科技有限公司 图像检测方法、装置、电子设备和计算机可读介质
CN109165763A (zh) * 2018-06-13 2019-01-08 广西电网有限责任公司电力科学研究院 一种95598客服工单的潜在被投诉的评估方法及装置
CN109408574A (zh) * 2018-10-18 2019-03-01 国网山东省电力公司电力科学研究院 基于文本挖掘技术的投诉责任认定系统
CN109872162A (zh) * 2018-11-21 2019-06-11 阿里巴巴集团控股有限公司 一种处理用户投诉信息的风控分类识别方法及系统
CN110428020A (zh) * 2019-08-13 2019-11-08 树根互联技术有限公司 刀具健康评估模型训练方法、装置及电子设备
CN111177389A (zh) * 2019-12-30 2020-05-19 佰聆数据股份有限公司 基于nlp技术的电费通知与催收客户诉求的分类方法、系统及存储介质
CN111325405A (zh) * 2020-03-02 2020-06-23 贵州电网有限责任公司 一种抱怨敏感度建模预测方法
CN112446541A (zh) * 2020-11-26 2021-03-05 上海浦东发展银行股份有限公司 融合分类模型建立方法、营销转化率增益预测方法及系统
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112861662A (zh) * 2021-01-22 2021-05-28 平安科技(深圳)有限公司 基于人脸和交互文本的目标对象行为预测方法及相关设备

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050286764A1 (en) * 2002-10-17 2005-12-29 Anurag Mittal Method for scene modeling and change detection
US20060229854A1 (en) * 2005-04-08 2006-10-12 Caterpillar Inc. Computer system architecture for probabilistic modeling
US20100070500A1 (en) * 2006-10-31 2010-03-18 Zhan Cui Data processing
CN101593109A (zh) * 2009-07-06 2009-12-02 北京航空航天大学 一种目标可满足性定性、定量表示及推理方法
CN103246686A (zh) * 2012-02-14 2013-08-14 阿里巴巴集团控股有限公司 文本分类方法和装置及文本分类的特征处理方法和装置
CN106022676A (zh) * 2016-05-09 2016-10-12 华南理工大学 一种对物流客户的投诉意愿评级的方法及装置
CN106204063A (zh) * 2016-06-30 2016-12-07 北京奇艺世纪科技有限公司 一种付费用户挖掘方法及装置
CN107563429A (zh) * 2017-07-27 2018-01-09 国家计算机网络与信息安全管理中心 一种网络用户群体的分类方法及装置
CN108520229A (zh) * 2018-04-04 2018-09-11 北京旷视科技有限公司 图像检测方法、装置、电子设备和计算机可读介质
CN109165763A (zh) * 2018-06-13 2019-01-08 广西电网有限责任公司电力科学研究院 一种95598客服工单的潜在被投诉的评估方法及装置
CN109408574A (zh) * 2018-10-18 2019-03-01 国网山东省电力公司电力科学研究院 基于文本挖掘技术的投诉责任认定系统
CN109872162A (zh) * 2018-11-21 2019-06-11 阿里巴巴集团控股有限公司 一种处理用户投诉信息的风控分类识别方法及系统
CN110428020A (zh) * 2019-08-13 2019-11-08 树根互联技术有限公司 刀具健康评估模型训练方法、装置及电子设备
CN111177389A (zh) * 2019-12-30 2020-05-19 佰聆数据股份有限公司 基于nlp技术的电费通知与催收客户诉求的分类方法、系统及存储介质
CN111325405A (zh) * 2020-03-02 2020-06-23 贵州电网有限责任公司 一种抱怨敏感度建模预测方法
CN112446541A (zh) * 2020-11-26 2021-03-05 上海浦东发展银行股份有限公司 融合分类模型建立方法、营销转化率增益预测方法及系统
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112861662A (zh) * 2021-01-22 2021-05-28 平安科技(深圳)有限公司 基于人脸和交互文本的目标对象行为预测方法及相关设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
丁麒等: "基于文本数据挖掘技术的95598业务工单主题分析应用", 《电力需求侧管理》 *
裴倩雯: "基于数据挖掘的电力客户投诉分析与预测研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 *

Also Published As

Publication number Publication date
CN113254644B (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN110782349A (zh) 一种模型训练方法和系统
CN111353689B (zh) 一种风险评估方法及装置
CN110019784B (zh) 一种文本分类方法及装置
CN113177700A (zh) 一种风险评估方法、系统、电子设备及存储介质
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN114329711A (zh) 一种基于图形算量平台的预制构件数据处理方法及系统
CN113254644B (zh) 模型训练方法及非投诉工单处理方法及系统及装置及介质
CN113220885A (zh) 一种文本处理方法和系统
CN111651500A (zh) 用户身份识别方法、电子设备及存储介质
CN113343700B (zh) 数据处理方法、装置、设备及存储介质
CN111930730B (zh) 基于人工智能和大数据的数据解析方法及区块链服务平台
CN111160929B (zh) 一种客户类型的确定方法及装置
CN114418207A (zh) 一种时间序列趋势预测方法和装置
CN113159419A (zh) 一种群体特征画像分析方法、装置、设备及可读存储介质
CN115617790A (zh) 数据仓库创建方法、电子设备及存储介质
CN112269974A (zh) 一种数据管控的方法及系统
WO2023275971A1 (ja) 情報処理装置、情報処理方法及び非一時的なコンピュータ可読媒体
CN110955755A (zh) 一种确定目标标准信息的方法和系统
CN111079574B (zh) 一种训练神经网络的方法及系统
CN110727767B (zh) 一种扩展文本样本的方法及系统
CN110991613B (zh) 一种训练神经网络的方法及系统
Vizgunov et al. Methods of Assessing the Potential Impact of Digital Technologies on Business Processes of the Company
CN117634865A (zh) 工作流创建方法、装置、设备及存储介质
CN113901184A (zh) 一种应用于智能客服业务的问题答复方法及系统
CN114792007A (zh) 代码检测方法、装置、设备、存储介质和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 610042 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan

Patentee after: Chengdu shuzhilian Technology Co.,Ltd.

Address before: No.2, floor 4, building 1, Jule road crossing, Section 1, West 1st ring road, Wuhou District, Chengdu City, Sichuan Province 610041

Patentee before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address