CN113051291A - 工单信息的处理方法、装置、设备及存储介质 - Google Patents
工单信息的处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113051291A CN113051291A CN202110408996.XA CN202110408996A CN113051291A CN 113051291 A CN113051291 A CN 113051291A CN 202110408996 A CN202110408996 A CN 202110408996A CN 113051291 A CN113051291 A CN 113051291A
- Authority
- CN
- China
- Prior art keywords
- work order
- data
- field
- target
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 24
- 238000003672 processing method Methods 0.000 title abstract description 7
- 230000010365 information processing Effects 0.000 title abstract description 6
- 238000004458 analytical method Methods 0.000 claims abstract description 119
- 230000002159 abnormal effect Effects 0.000 claims abstract description 109
- 238000000034 method Methods 0.000 claims abstract description 105
- 238000012545 processing Methods 0.000 claims abstract description 85
- 238000003066 decision tree Methods 0.000 claims abstract description 78
- 230000008569 process Effects 0.000 claims abstract description 76
- 238000004140 cleaning Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000000605 extraction Methods 0.000 claims description 36
- 238000010219 correlation analysis Methods 0.000 claims description 30
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000012795 verification Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 15
- 238000012098 association analyses Methods 0.000 claims description 14
- 238000009826 distribution Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000007619 statistical method Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 claims 9
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 24
- 238000012360 testing method Methods 0.000 description 17
- 239000000284 extract Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000013329 compounding Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000013138 pruning Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Abstract
本发明涉及人工智能技术领域,应用于智慧政务领域中,提供一种工单信息的处理方法、装置、设备及存储介质,用于提高异常工单识别及处理的效率。工单信息的处理方法包括:对历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;通过待处理数据对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;通过目标决策树工单识别模型,对待处理工单信息进行目标异常工单字段分析,得到工单分析结果;执行与工单分析结果对应的目标业务流程信息对应的业务流程。此外,本发明还涉及区块链技术,历史工单信息表可存储于区块链中。
Description
技术领域
本发明涉及人工智能的智能决策领域,尤其涉及一种工单信息的处理方法、装置、设备及存储介质。
背景技术
随着信息技术和物联网技术的发展,工单的数据处理也随之增加,而异常工单的数据处理尤为关注。目前,对于异常工单的处理,一般都是采用对异常工单和普通工单进行区分处理,对区分处理的异常工单进行文本分类和分析的方式。
然而,由于异常工单巨大,文本分类的策略固定,以及工单的特征呈动态变化,因而,导致了缺乏灵活的相关性分析,多个属性复合的规律的分析,文本分类的策略难以适应灵活多变的投诉策略,处理效率低下,从而导致了异常工单识别及处理的效率较低。
发明内容
本发明提供一种工单信息的处理方法、装置、设备及存储介质,用于提高异常工单识别及处理的效率。
本发明第一方面提供了一种工单信息的处理方法,包括:
获取历史工单信息表,对所述历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,所述历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;
通过所述待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;
获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;
获取与所述工单分析结果对应的目标业务流程信息,并执行与所述目标业务流程信息对应的业务流程。
可选的,在本发明第一方面的第一种实现方式中,所述获取历史工单信息表,对所述历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,包括:
获取历史工单信息表,对所述历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段;
对所述关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据。
可选的,在本发明第一方面的第二种实现方式中,所述获取历史工单信息表,对所述历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段,包括:
获取历史工单信息表,将所述历史工单信息表进行表关联,得到全量字段数据库;
对所述全量字段数据库进行基于预设类型工单字段的匹配,得到历史预设类型工单数据;
读取所述历史预设类型工单数据中的历史字段数据,对所述历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段。
可选的,在本发明第一方面的第三种实现方式中,所述读取所述历史预设类型工单数据中的历史字段数据,对所述历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段,包括:
读取所述历史预设类型工单数据中的历史字段数据,以及所述全量字段数据库中的异常负向样本清单数据;
通过预置的经验规则,对所述历史字段数据进行验证,得到验证字段数据;
通过预置的关联性规则和所述异常负向样本清单数据,对所述验证字段数据进行变量关联性分析和特征字段提取,得到关联特征字段。
可选的,在本发明第一方面的第四种实现方式中,所述对所述关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据,包括:
通过预置的异常工单因变量,对所述关联特征字段进行关联性分析,得到关联性分析结果;
判断所述关联性分析结果是否为随机分布,若所述关联性分析结果不为随机分布,则将对应的关联特征字段确定为待清洗字段数据;
按照预置的数据入库策略,对所述待清洗字段数据进行去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理数据。
可选的,在本发明第一方面的第五种实现方式中,所述获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果,包括:
获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行预设类型工单字段匹配、字段含义转换和归一化处理,得到待处理预设类型工单数据;
对所述待处理预设类型工单数据进行关联特征字段提取和统计分析,得到关联分析统计数据和待处理工单关联字段;
通过所述关联分析统计数据,对所述待处理工单关联字段进行基于随机分发布的判断分析,得到目标特征字段;
将所述目标特征字段与预设类型工单字段的异常工单字段进行匹配,得到工单分析结果。
可选的,在本发明第一方面的第六种实现方式中,所述获取与所述工单分析结果对应的目标业务流程信息,并执行与所述目标业务流程信息对应的业务流程,包括:
接收业务执行请求,对所述业务执行请求进行解析和关键信息提取,得到与所述工单分析结果对应的目标业务流程信息;
根据所述目标业务流程信息,对预置的业务执行机器人决策树进行遍历,得到目标业务执行机器人;
调用所述目标业务执行机器人,执行与所述目标业务流程信息对应的业务流程。
本发明第二方面提供了一种工单信息的处理装置,包括:
获取清洗模块,用于获取历史工单信息表,对所述历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,所述历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;
训练模块,用于通过所述待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;
分析模块,用于获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;
执行模块,用于获取与所述工单分析结果对应的目标业务流程信息,并执行与所述目标业务流程信息对应的业务流程。
可选的,在本发明第二方面的第一种实现方式中,所述获取清洗模块包括:
创建提取子模块,用于获取历史工单信息表,对所述历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段;
清洗子模块,用于对所述关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据。
可选的,在本发明第二方面的第二种实现方式中,所述创建提取子模块包括:
关联单元,用于获取历史工单信息表,将所述历史工单信息表进行表关联,得到全量字段数据库;
匹配单元,用于对所述全量字段数据库进行基于预设类型工单字段的匹配,得到历史预设类型工单数据;
读取分析单元,用于读取所述历史预设类型工单数据中的历史字段数据,对所述历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段。
可选的,在本发明第二方面的第三种实现方式中,所述读取分析单元具体用于:
读取所述历史预设类型工单数据中的历史字段数据,以及所述全量字段数据库中的异常负向样本清单数据;
通过预置的经验规则,对所述历史字段数据进行验证,得到验证字段数据;
通过预置的关联性规则和所述异常负向样本清单数据,对所述验证字段数据进行变量关联性分析和特征字段提取,得到关联特征字段。
可选的,在本发明第二方面的第四种实现方式中,所述清洗子模块具体用于:
通过预置的异常工单因变量,对所述关联特征字段进行关联性分析,得到关联性分析结果;
判断所述关联性分析结果是否为随机分布,若所述关联性分析结果不为随机分布,则将对应的关联特征字段确定为待清洗字段数据;
按照预置的数据入库策略,对所述待清洗字段数据进行去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理数据。
可选的,在本发明第二方面的第五种实现方式中,所述分析模块具体用于:
获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行预设类型工单字段匹配、字段含义转换和归一化处理,得到待处理预设类型工单数据;
对所述待处理预设类型工单数据进行关联特征字段提取和统计分析,得到关联分析统计数据和待处理工单关联字段;
通过所述关联分析统计数据,对所述待处理工单关联字段进行基于随机分发布的判断分析,得到目标特征字段;
将所述目标特征字段与预设类型工单字段的异常工单字段进行匹配,得到工单分析结果。
可选的,在本发明第二方面的第六种实现方式中,所述执行模块具体用于:
接收业务执行请求,对所述业务执行请求进行解析和关键信息提取,得到与所述工单分析结果对应的目标业务流程信息;
根据所述目标业务流程信息,对预置的业务执行机器人决策树进行遍历,得到目标业务执行机器人;
调用所述目标业务执行机器人,执行与所述目标业务流程信息对应的业务流程。
本发明第三方面提供了一种工单信息的处理设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述工单信息的处理设备执行上述的工单信息的处理方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的工单信息的处理方法。
本发明提供的技术方案中,获取历史工单信息表,对历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;通过待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;获取与工单分析结果对应的目标业务流程信息,并执行与目标业务流程信息对应的业务流程。本发明实施例中,通过对历史工单信息表进行目标异常工单字段选取和数据清洗,以训练得到目标决策树工单识别模型,通过目标决策树工单识别模型,对待处理工单信息进行目标异常工单字段分析,并执行与目标业务流程信息对应的业务流程,能够灵活地对待处理工单信息进行相关性分析和多个属性复合的规律的分析,适应灵活多变的工单投诉举报策略,提高了目标决策树工单识别模型的普适性和准确性,从而提高了异常工单识别及处理的效率。
附图说明
图1为本发明实施例中工单信息的处理方法的一个实施例示意图;
图2为本发明实施例中工单信息的处理方法的另一个实施例示意图;
图3为本发明实施例中工单信息的处理装置的一个实施例示意图;
图4为本发明实施例中工单信息的处理装置的另一个实施例示意图;
图5为本发明实施例中工单信息的处理设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种工单信息的处理方法、装置、设备及存储介质,提高了异常工单识别及处理的效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中工单信息的处理方法的一个实施例包括:
101、获取历史工单信息表,对历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表。
可以理解的是,本发明的执行主体可以为工单信息的处理装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
其中,历史工单信息表为历史工单的信息表,历史工单包括但不限于商标类工单、广告类工单、质量类工单和/或不正当竞争类工单等,本实施例中,历史工单优选为广告类工单。历史工单信息表为由历史工单的关键要素构成,包括基于历史工单中的主体信息、客体信息和行为信息。信息提供方表包括信息提供方的个人信息,例如:以历史工单为投诉举报工单为例说明,信息提供方表包括信息提供方的姓名和联系方式;涉及主体表包括被投诉举报市场主体的信息,例如:以历史工单为投诉举报工单为例说明,被投诉举报市场主体是XX有限公司,主体类型是内资企业;涉及客体表包括历史工单中涉及到的产品和商品信息,例如:商品名称按摩椅,产品类别医疗器械和金额数据。
服务器从目标城市历史数据库中提取历史工单信息表,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表,信息件表为存储信息件的信息字段的表。服务器创建信息提供方表的信息提供方主键、涉及主体表的涉及主体主键和涉及客体表的涉及客体主键,以及信息件表中的信息提供方外键、涉及主体外键和涉及客体外键,通过将信息提供方主键和信息提供方外键进行关联、将涉及主体主键与涉及主体外键进行关联以及将涉及客体主键和涉及客体外键进行关联,以生成一张总表,即全量字段数据库,该总表包括历史工单的主体特征、客体特征和行为特征,例如:张三于2020年12月12日9:00向负责的单位投诉了XX有限公司,认为该公司提供的产品按摩椅存在质量瑕疵,要求赔偿XX元。
通过将历史工单信息表进行关联,实现了对属于不同表里面的字段进行交叉关联分析,主体表中的主体类型与客体表中的产品类型在现有业务系统中相互独立毫无关联,但是在“关联”后的表格中可以进行关联分析和数据挖掘。服务器创建全量字段数据库后,计算全量字段数据库中的工单数据与预置工单数据模板(如:广告类投诉举报工单)之间的相似度,判断该相似度是否大于预设阈值,若是,则将该工单数据确定为历史预设类型工单数据(如:历史广告类投诉举报工单数据),将历史预设类型工单数据导出至字符分隔值(comma-separated values,CSV)文件中,并将该CSV文件导入值可视化工具PowerBI中,以便于对历史预设类型工单数据的可视化展示和数据探查。
服务器通过预置的经验规则,对历史预设类型工单数据进行验证,得到验证字段,提取历史预设类型工单数据中验证字段对应的字段,从而得到关联特征字段,其中,经验规则包括对历史预设类型工单数据进行识别的工单特征,例如:以历史预设类型工单数据为历史广告投诉举报工单数据例说明,基层执法人员根据日常工作经验所沉淀下来的关于历史广告投诉举报工单数据中为职业打假人和职业打假工单的一些人为总结的工单特征,该工单特征包括短时间内进行多次投诉、熟悉法律法规、投诉内容援引广告法等法律条款和行文格式化等。
服务器获取历史预设类型工单数据中的变量,通过预置的皮尔森相关系数算法,计算关联特征字段与变量之间的相关度,判断相关度是否为大于预设相关度,若是,则将关联特征字段中对应的字段确定为目标异常工单字段,并提取该目标异常工单字段,从而得到待清洗字段数据,若否,则返回空值。服务器按照预置的数据入库策略,对待清洗字段数据进行空值填充,得到空值填充后的数据,通过预置的批量归一化算法(batchnormalization,BN),对空值填充后的数据进行归一化处理,得到待处理数据,其中,待处理数据包括字段属性。
102、通过待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型。
具体地,服务器将所述待处理数据进行随机分配,得到训练数据集和测试数据集,通过所述训练数据集对预置的初始决策树工单识别模型进行训练,得到训练决策树工单识别模型,例如,服务器按照7:3的比例,将待处理数据进行随机分配为训练数据集和测试数据集,通过预置的初始决策树工单识别模型对训练数据集进行识别,得到识别结果,通过预置的损失函数计算识别结果的损失函数值,并通过梯度下降法算法,基于损失函数值,对初始决策树工单识别模型中的学习速率和超参数进行调整,从而得到训练决策树工单识别模型;
通过所述训练决策树工单识别模型,对所述测试数据集进行基于预置异常类型工单的判断分析,得到测试结果,并计算所述测试结果的目标损失函数值,所述目标损失函数值包括向量损失函数值和分类损失函数值,即服务器通过训练决策树工单识别模型,判断分析测试数据集中的各工单是否为预置异常类型工单(如广告类职业打假投诉举报工单),其中,判断分析的执行过程如下:训练决策树工单识别模型从树根出发,不断地选取信息增益最大的属性作为判别条件,将测试数据集分开后再分而治之的选取剩下属性中信息增益最大的属性作为判别条件,如此递归下去,直到叶子结点的纯度达到最大,得到测试结果,该测试结果包括“是”或“否”分别对应的字段和字段值。服务器通过预置的中心向量公式,计算测试数据集中所有数据的测试综合中心向量,以及测试数据集中每个数据的单个中心向量,并计算单个中心向量和测试综合中心向量之间的差值绝对值,得到向量损失函数值,通过预置的回归损失函数,计算测试结果的分类损失函数值,并对向量损失函数值和分类损失函数值进行加权求和,得到目标损失函数值;
判断所述目标损失函数值是否小于预设阈值,若所述目标损失函数值小于预设阈值,则将所述训练决策树工单识别模型确定为候选决策树工单识别模型,即服务器判断目标损失函数值是否小于预设阈值,若是,则将训练决策树工单识别模型确定为候选决策树工单识别模型,若否,则获取训练决策树工单识别模型的权重,对该权重进行迭代调整,直至目标损失函数值小于预设阈值,且收敛,以及获取测试结果中的错误结果,通过预置的残差网络ResNet算法和多个集成学习弱分类器,基于错误结果,对训练决策树工单识别模型中作为判别条件的信息增益最大的属性的分支和层级关系进行调整,从而得到候选决策树工单识别模型,提高了候选决策树工单识别模型的准确性;
获取项目沉淀历史数据,根据所述项目沉淀历史数据,对所述候选决策树工单识别模型依次进行训练、调优和剪枝,得到目标决策树工单识别模型,即服务器通过预置的搜索引擎,基于落地城市和投诉举报工单的信息,对预置的落地城市数据库进行检索,得到对应的落地城市的项目沉淀历史数据,将项目沉淀历史数据划分为训练数据和测试数据,通过该训练数据,对候选决策树工单识别模型进行训练,得到训练后的候选决策树工单识别模型,通过训练后的候选决策树工单识别模型,对测试数据进行基于预置异常类型工单(如广告类职业打假投诉举报工单)的预测,得到预测结果,并获取基于预测结果的对比结果,该对比结果可由落地城市业务人员对预测结果进行判断和审核所得,并获取训练后的候选决策树工单识别模型的权重,根据对比结果对权重进行调整,并通过预置的剪枝算法,对训练后的候选决策树工单识别模型进行剪枝优化,从而得到目标决策树工单识别模型。
103、获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果。
服务器通过目标决策树工单识别模型,对待处理工单信息依次进行预设类型工单字段匹配、去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理预设类型工单数据,对待处理预设类型工单数据进行关联性分析和关联特征字段提取,得到待处理工单关联字段,并对待处理预设类型工单数据进行统计,得到关联分析统计数据,判断关联分析统计数据是否为随机分布,若是,则停止执行,若否,则将对应的待处理工单关联字段确定为目标特征字段,调用目标决策树工单识别模型,对目标特征字段进行基于预置异常类型工单(异常工单字段)的判断分析,得到工单分析结果。
104、获取与工单分析结果对应的目标业务流程信息,并执行与目标业务流程信息对应的业务流程。
服务器得到工单分析结果,该工单分析结果包括预置异常类型工单和基于预置异常类型工单的判断分析结果,工单分析结果例如:广告类职业打假投诉举报工单和基于广告类职业打假投诉举报工单的判断分析结果,根据工单分析结果匹配对应的目标人员,该目标人员例如:对广告类职业打假投诉举报工单的处理具有更专业和经验更丰富的市监人员,并将工单分析结果发送至目标人员对应的终端,以使得目标人员对工单分析结果进行依据相应的法规的专项管理(即目标业务流程信息),以实现根据工单分析结果对应的目标业务流程信息执行对应的业务流程,避免了预置异常类型工单挤占与普通工单所享有的公共资源。
或者,服务器获取与工单分析结果对应的目标业务流程信息,并调用与目标业务流程信息对应的接口,执行与目标业务流程信息对应的业务流程。提高了优化决策树工单识别模型的识别准确度,以及业务执行的自动化和效率,进而提高了异常工单识别及处理的效率。
本发明实施例中,通过对历史工单信息表进行目标异常工单字段选取和数据清洗,以训练得到目标决策树工单识别模型,通过目标决策树工单识别模型,对待处理工单信息进行目标异常工单字段分析,并执行与目标业务流程信息对应的业务流程,能够灵活地对待处理工单信息进行相关性分析和多个属性复合的规律的分析,适应灵活多变的工单投诉举报策略,提高了目标决策树工单识别模型的普适性和准确性,从而提高了异常工单识别及处理的效率。本方案可应用于智慧政务领域中,从而推动智慧城市的建设。
请参阅图2,本发明实施例中工单信息的处理方法的另一个实施例包括:
201、获取历史工单信息表,对历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段。
具体地,服务器获取历史工单信息表,将历史工单信息表进行表关联,得到全量字段数据库;对全量字段数据库进行基于预设类型工单字段的匹配,得到历史预设类型工单数据;读取历史预设类型工单数据中的历史字段数据,对历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段。
服务器从目标城市历史数据库中提取历史工单信息表,该历史工单信息表为历史工单的工单信息表,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表,服务器通过预置的内关联算法,计算信息件表分别与信息提供方表、涉及主体表和涉及客体表之间的迪卡尔积,根据该笛卡尔积,将信息提供方表、涉及主体表和涉及客体表合并至信息件表,从而得到全量字段数据库,其中,目标城市历史数据库可包括一个或一个以上城市的历史工单数据,目标城市历史数据库为训练初始决策树工单识别模型所选取的城市历史数据库。
服务器可根据预置的工单字段特征类型和分类器(分类网络),对全量字段数据库中的字段数据进行划分归类,得到历史预设类型工单数据,如:历史预设类型工单数据为历史广告投诉举报工单数据,即历史广告类职业打假投诉举报工单。预置的工单字段特征类型例如:食品类的工单字段特征类型包括生产日期特征、食品添加剂信息特征和其他特征,广告类的工单字段特征类型包括虚假宣传特征、引用广告法特征和其他特征。服务器读取历史预设类型工单数据中的历史字段数据,通过预置的经验规则对历史字段数据进行关联性分析,从而得到对应的有价值的关联字段,将历史字段数据中的有价值的关联字段提取出来,从而得到关联特征字段,其中,该预置的经验规则为预置异常类型工单数据的识别处理的策略,该预置异常类型工单数据包括但不限于数据异常工单数据、职业投诉工单数据和/或其他类型的异常工单数据,本实施例中,优选预置异常类型工单数据为预设类型的职业投诉工单数据(如广告类职业打假投诉举报工单数据),例如:以预置异常类型工单数据为广告类职业打假投诉举报工单数据为例说明,该预置的经验规则为广告类职业打假投诉举报工单数据的判断条件。
具体地,服务器读取历史预设类型工单数据中的历史字段数据,以及全量字段数据库中的异常负向样本清单数据;通过预置的经验规则,对历史字段数据进行验证,得到验证字段数据;通过预置的关联性规则和异常负向样本清单数据,对验证字段数据进行变量关联性分析和特征字段提取,得到关联特征字段。
服务器读取历史预设类型工单数据中的历史字段数据,并获取全量字段数据库中基于历史预设类型工单数据的异常负向样本清单数据,异常负向样本清单数据如:广告类职业打假工单数据的历史负向样本清单数据;通过预置的经验规则,对历史字段数据进行验证,得到验证字段数据,该预置的经验规则为预置异常类型工单数据的识别处理的策略,例如:以预置异常类型工单数据为广告类职业打假投诉举报工单数据为例说明,经验规则为投诉举报次数较多的人大概率是职业投诉人(对应热点工单),通过预置的可视化工具PowerBI,对历史字段数据进行申请人平均投诉举报次数的统计分析,得到热点工单和普通工单,则将热点工单对应的字段数据确定为验证字段数据。
其中,预置的关联性规则包括预置异常类型工单数据的逐条分析规则和组合探究规则。逐条分析规则为单一变量下的关联性分析,例如:以预置异常类型工单数据为广告类职业打假投诉举报工单数据为例说明,逐条分析规则为对纯粹的被投诉企业类型与被职业投诉的次数间的概率分布(为单一变量)进行关联性分析。组合探究规则为多变量的关联性分析,例如:以预置异常类型工单数据为广告类职业打假投诉举报工单数据为例说明,在10月份的广告类职业打假投诉举报工单数据中,职业投诉工单的比例,相对9月份的广告类职业打假投诉举报工单数据的职业投诉工单比例,较高,组合探究规则即为多变量即月份(9月份和10月份)和职业投诉工单比例的关联性分析。
服务器通过预置的关联性规则和异常负向样本清单数据,将验证字段数据中每一个字段与预置异常类型工单(如广告类职业打假投诉举报工单)的分布情况进行相关性分析,即判断验证字段数据中每一个字段与预置异常类型工单的对应关系和相关性,从而得到对应的可提取的特征字段,将验证字段数据中可提取的特征字段提取出来,得到关联特征字段,关联特征字段例如:IS H0T NFORM-是否热点举报人,NFOWARED-信息件D,PERSNAME-申请人姓名,MOBLE-移动电话,LANDTEL-固定电话,EMAIL-邮箱,ADDR-地址,NVNAME-涉及客体名称,NFTYPE-信息件类型,NVOAM-涉及金额/消费金额,APPLBASQUE-基本问题代码,TRADETYPE-行业类型,REMSHOTYPE-远程购物类型,NVOBJTYPE-涉及客体类型,REGTME-登记时间,QUANTITY-数量,EBUSINESS-是否涉及电子商务/是否非现场购物,DIVISION-涉及主体辖区,NCFORM-接收方式编码,CONTENT/CONTEN-互联网原文。
202、对关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据。
具体地,服务器通过预置的异常工单因变量,对关联特征字段进行关联性分析,得到关联性分析结果;判断关联性分析结果是否为随机分布,若关联性分析结果不为随机分布,则将对应的关联特征字段确定为待清洗字段数据;按照预置的数据入库策略,对待清洗字段数据进行去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理数据。
服务器对关联特征字段进行统计计数,得到字段计数数据,通过预置的肯德尔Kendall秩相关系数算法,将关联特征字段与预置的异常工单因变量进行关联性分析和统计分析,得到关联性分析结果,该关联性分析结果为关联性分析的数据的统计分析显示结果,判断关联性分析结果是否为随机分布,若是,则停止执行,若否,则将对应的关联特征字段确定为待清洗字段数据。服务器按照预置的数据入库策略,将待清洗字段数据中的重复数据项进行融合或删除,得到去重数据,将去重数据的字段含义进行数据标准化,得到标准化数据,将标准化数据中的非结构化数据解析为结构化数据,得到转换数据,通过预置的atan函数或log函数,将转换数据进行函数转换,得到待处理数据,通过对待清洗字段数据进行去重处理、字段含义转换、数据格式转换和归一化处理,消除多个变量的取值区间的跨度影响预置的初始决策树工单识别模型的权重的影响,进而提高预置的初始决策树工单识别模型的训练的准确性。
203、通过待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型。
该步骤203与上述步骤102的执行过程类似,在此不再赘述。
204、获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果。
具体地,服务器获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行预设类型工单字段匹配、字段含义转换和归一化处理,得到待处理预设类型工单数据;对待处理预设类型工单数据进行关联特征字段提取和统计分析,得到关联分析统计数据和待处理工单关联字段;通过关联分析统计数据,对待处理工单关联字段进行基于随机分发布的判断分析,得到目标特征字段;将目标特征字段与预设类型工单字段的异常工单字段进行匹配,得到工单分析结果。
例如,服务器获取落地城市的待处理工单信息,通过预置的预设类型工单字段决策树(该预设类型工单如广告类投诉举报工单),目标决策树工单识别模型包括预置的预设类型工单字段决策树,预设类型工单字段决策树包括预设类型工单字段,对待处理工单信息进行匹配,得到初始预设类型工单数据,对初始预设类型工单数据进行去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理预设类型工单数据,根据预置的因变量,对待处理预设类型工单数据进行关联性分析和统计,得到关联分析统计数据,并提取关联性分析所得的关联特征字段,得到待处理工单关联字段,判断关联分析统计数据是否为随机分布,若是,则停止执行,若否,则将对应的待处理工单关联字段确定为目标特征字段(如广告字段),根据目标特征字段,对目标决策树工单识别模型中的预设类型工单字段决策树进行遍历匹配,得到匹配字段,判断匹配字段是否存在异常工单字段,若是,则返回表示异常工单的返回值,若否,则返回表示正常工单的返回值,从而得到工单分析结果,该预设类型工单字段决策树包括预设类型工单字段和预设类型工单字段对应的异常工单字段,目标决策树工单识别模型包括预设类型工单字段决策树。
205、获取与工单分析结果对应的目标业务流程信息,并执行与目标业务流程信息对应的业务流程。
具体地,服务器接收业务执行请求,对业务执行请求进行解析和关键信息提取,得到与工单分析结果对应的目标业务流程信息;根据目标业务流程信息,对预置的业务执行机器人决策树进行遍历,得到目标业务执行机器人;调用目标业务执行机器人,执行与目标业务流程信息对应的业务流程。
服务器接收业务执行请求,对业务执行请求进行解析得到业务执行信息,该业务执行信息包括工单分析结果为异常工单对应的业务执行需求,以及工单分析结果不为异常工单对应的业务执行需求,根据工单分析结果匹配对应的目标业务执行需求,根据目标业务执行需求,基于索引,调用预置的搜索引擎对预置的业务流程模块库进行检索,得到对应的多个初始业务流程模块,并按照目标业务执行需求将多个初始业务流程模块进行拼接,得到与工单分析结果对应的目标业务流程信息,根据目标业务流程信息和预设类型字段数据,遍历预置的业务执行机器人决策树,得到对应的目标业务执行机器人和目标业务执行机器人的目标机器人服务地址,通过目标机器人服务地址调用目标业务执行机器人,执行与目标业务流程信息对应的业务流程,例如:以预设类型字段数据为广告字段数据为例说明,若该工单分析结果为异常工单,则广告字段数据对应的广告投诉举报工单为:张三于2020年12月12日9:00向负责的单位投诉了XX有限公司,认为该公司提供的产品按摩椅存在质量瑕疵,要求赔偿XX元,服务器获得目标业务流程信息后,根据目标业务流程信息和预设类型字段数据,获得目标业务执行机器人(该目标机器人的类型为任务型)和目标业务执行机器人的目标机器人服务地址,服务器根据目标服务地址调用目标机器人从目标业务流程信息中获取对应的业务流程节点,并将当前的操作页面跳转到业务流程节点对应的操作页面。
提高了优化决策树工单识别模型的识别准确度,以及业务执行的自动化和效率,进而提高了异常工单识别及处理的效率。
本发明实施例中,通过对历史工单信息表进行目标异常工单字段选取和数据清洗,以训练得到目标决策树工单识别模型,通过目标决策树工单识别模型,对待处理工单信息进行目标异常工单字段分析,并执行与目标业务流程信息对应的业务流程,能够灵活地对待处理工单信息进行相关性分析和多个属性复合的规律的分析,适应灵活多变的工单投诉举报策略,提高了目标决策树工单识别模型的普适性和准确性,从而提高了异常工单识别及处理的效率。本方案可应用于智慧政务领域中,从而推动智慧城市的建设。
上面对本发明实施例中工单信息的处理方法进行了描述,下面对本发明实施例中工单信息的处理装置进行描述,请参阅图3,本发明实施例中工单信息的处理装置一个实施例包括:
获取清洗模块301,用于获取历史工单信息表,对历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;
训练模块302,用于通过待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;
分析模块303,用于获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;
执行模块304,用于获取与工单分析结果对应的目标业务流程信息,并执行与目标业务流程信息对应的业务流程。
上述工单信息的处理装置中各个模块的功能实现与上述工单信息的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过对历史工单信息表进行目标异常工单字段选取和数据清洗,以训练得到目标决策树工单识别模型,通过目标决策树工单识别模型,对待处理工单信息进行目标异常工单字段分析,并执行与目标业务流程信息对应的业务流程,能够灵活地对待处理工单信息进行相关性分析和多个属性复合的规律的分析,适应灵活多变的工单投诉举报策略,提高了目标决策树工单识别模型的普适性和准确性,从而提高了异常工单识别及处理的效率。本方案可应用于智慧政务领域中,从而推动智慧城市的建设。
请参阅图4,本发明实施例中工单信息的处理装置的另一个实施例包括:
获取清洗模块301,用于获取历史工单信息表,对历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;
其中,获取清洗模块301具体包括:
创建提取子模块3011,用于获取历史工单信息表,对历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段;
清洗子模块3012,用于对关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据;
训练模块302,用于通过待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;
分析模块303,用于获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;
执行模块304,用于获取与工单分析结果对应的目标业务流程信息,并执行与目标业务流程信息对应的业务流程。
可选的,创建提取子模块3011包括:
关联单元30111,用于获取历史工单信息表,将历史工单信息表进行表关联,得到全量字段数据库;
匹配单元30112,用于对全量字段数据库进行基于预设类型工单字段的匹配,得到历史预设类型工单数据;
读取分析单元30113,用于读取历史预设类型工单数据中的历史字段数据,对历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段。
可选的,读取分析单元30113还可以具体用于:
读取历史预设类型工单数据中的历史字段数据,以及全量字段数据库中的异常负向样本清单数据;
通过预置的经验规则,对历史字段数据进行验证,得到验证字段数据;
通过预置的关联性规则和异常负向样本清单数据,对验证字段数据进行变量关联性分析和特征字段提取,得到关联特征字段。
可选的,清洗子模块3012还可以具体用于:
通过预置的异常工单因变量,对关联特征字段进行关联性分析,得到关联性分析结果;
判断关联性分析结果是否为随机分布,若关联性分析结果不为随机分布,则将对应的关联特征字段确定为待清洗字段数据;
按照预置的数据入库策略,对待清洗字段数据进行去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理数据。
可选的,分析模块303还可以具体用于:
获取待处理工单信息,通过目标决策树工单识别模型,对待处理工单信息依次进行预设类型工单字段匹配、字段含义转换和归一化处理,得到待处理预设类型工单数据;
对待处理预设类型工单数据进行关联特征字段提取和统计分析,得到关联分析统计数据和待处理工单关联字段;
通过关联分析统计数据,对待处理工单关联字段进行基于随机分发布的判断分析,得到目标特征字段;
将目标特征字段与预设类型工单字段的异常工单字段进行匹配,得到工单分析结果。
可选的,执行模块304还可以具体用于:
接收业务执行请求,对业务执行请求进行解析和关键信息提取,得到与工单分析结果对应的目标业务流程信息;
根据目标业务流程信息,对预置的业务执行机器人决策树进行遍历,得到目标业务执行机器人;
调用目标业务执行机器人,执行与目标业务流程信息对应的业务流程。
上述工单信息的处理装置中各模块和各单元的功能实现与上述工单信息的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过对历史工单信息表进行目标异常工单字段选取和数据清洗,以训练得到目标决策树工单识别模型,通过目标决策树工单识别模型,对待处理工单信息进行目标异常工单字段分析,并执行与目标业务流程信息对应的业务流程,能够灵活地对待处理工单信息进行相关性分析和多个属性复合的规律的分析,适应灵活多变的工单投诉举报策略,提高了目标决策树工单识别模型的普适性和准确性,从而提高了异常工单识别及处理的效率。本方案可应用于智慧政务领域中,从而推动智慧城市的建设。
上面图3和图4从模块化功能实体的角度对本发明实施例中的工单信息的处理装置进行详细描述,下面从硬件处理的角度对本发明实施例中工单信息的处理设备进行详细描述。
图5是本发明实施例提供的一种工单信息的处理设备的结构示意图,该工单信息的处理设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对工单信息的处理设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在工单信息的处理设备500上执行存储介质530中的一系列指令操作。
工单信息的处理设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的工单信息的处理设备结构并不构成对工单信息的处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行工单信息的处理方法的步骤。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种工单信息的处理方法,其特征在于,所述工单信息的处理方法包括:
获取历史工单信息表,对所述历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,所述历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;
通过所述待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;
获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;
获取与所述工单分析结果对应的目标业务流程信息,并执行与所述目标业务流程信息对应的业务流程。
2.根据权利要求1所述的工单信息的处理方法,其特征在于,所述获取历史工单信息表,对所述历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,包括:
获取历史工单信息表,对所述历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段;
对所述关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据。
3.根据权利要求2所述的工单信息的处理方法,其特征在于,所述获取历史工单信息表,对所述历史工单信息表进行全量字段数据库创建、预设类型工单识别和特征字段提取,得到关联特征字段,包括:
获取历史工单信息表,将所述历史工单信息表进行表关联,得到全量字段数据库;
对所述全量字段数据库进行基于预设类型工单字段的匹配,得到历史预设类型工单数据;
读取所述历史预设类型工单数据中的历史字段数据,对所述历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段。
4.根据权利要求3所述的工单信息的处理方法,其特征在于,所述读取所述历史预设类型工单数据中的历史字段数据,对所述历史字段数据依次进行关联性分析和特征字段提取,得到关联特征字段,包括:
读取所述历史预设类型工单数据中的历史字段数据,以及所述全量字段数据库中的异常负向样本清单数据;
通过预置的经验规则,对所述历史字段数据进行验证,得到验证字段数据;
通过预置的关联性规则和所述异常负向样本清单数据,对所述验证字段数据进行变量关联性分析和特征字段提取,得到关联特征字段。
5.根据权利要求2所述的工单信息的处理方法,其特征在于,所述对所述关联特征字段进行目标异常工单字段选取和基于预设数据入库策略的数据清洗,得到待处理数据,包括:
通过预置的异常工单因变量,对所述关联特征字段进行关联性分析,得到关联性分析结果;
判断所述关联性分析结果是否为随机分布,若所述关联性分析结果不为随机分布,则将对应的关联特征字段确定为待清洗字段数据;
按照预置的数据入库策略,对所述待清洗字段数据进行去重处理、字段含义转换、数据格式转换和归一化处理,得到待处理数据。
6.根据权利要求1所述的工单信息的处理方法,其特征在于,所述获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果,包括:
获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行预设类型工单字段匹配、字段含义转换和归一化处理,得到待处理预设类型工单数据;
对所述待处理预设类型工单数据进行关联特征字段提取和统计分析,得到关联分析统计数据和待处理工单关联字段;
通过所述关联分析统计数据,对所述待处理工单关联字段进行基于随机分发布的判断分析,得到目标特征字段;
将所述目标特征字段与预设类型工单字段的异常工单字段进行匹配,得到工单分析结果。
7.根据权利要求1-6中任一项所述的工单信息的处理方法,其特征在于,所述获取与所述工单分析结果对应的目标业务流程信息,并执行与所述目标业务流程信息对应的业务流程,包括:
接收业务执行请求,对所述业务执行请求进行解析和关键信息提取,得到与所述工单分析结果对应的目标业务流程信息;
根据所述目标业务流程信息,对预置的业务执行机器人决策树进行遍历,得到目标业务执行机器人;
调用所述目标业务执行机器人,执行与所述目标业务流程信息对应的业务流程。
8.一种工单信息的处理装置,其特征在于,所述工单信息的处理装置包括:
获取清洗模块,用于获取历史工单信息表,对所述历史工单信息表进行目标异常工单字段选取和数据清洗,得到待处理数据,所述历史工单信息表包括信息件表、信息提供方表、涉及主体表和涉及客体表;
训练模块,用于通过所述待处理数据,对预置的初始决策树工单识别模型进行训练,得到目标决策树工单识别模型;
分析模块,用于获取待处理工单信息,通过所述目标决策树工单识别模型,对所述待处理工单信息依次进行基于预设类型工单字段的数据预处理、基于关联分析统计的目标特征字段提取以及基于目标特征字段的异常工单字段判断分析,得到工单分析结果;
执行模块,用于获取与所述工单分析结果对应的目标业务流程信息,并执行与所述目标业务流程信息对应的业务流程。
9.一种工单信息的处理设备,其特征在于,所述工单信息的处理设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述工单信息的处理设备执行如权利要求1-7中任意一项所述的工单信息的处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述工单信息的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110408996.XA CN113051291A (zh) | 2021-04-16 | 2021-04-16 | 工单信息的处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110408996.XA CN113051291A (zh) | 2021-04-16 | 2021-04-16 | 工单信息的处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113051291A true CN113051291A (zh) | 2021-06-29 |
Family
ID=76520333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110408996.XA Pending CN113051291A (zh) | 2021-04-16 | 2021-04-16 | 工单信息的处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113051291A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761031A (zh) * | 2021-09-08 | 2021-12-07 | 平安国际智慧城市科技股份有限公司 | 目标投诉方的识别方法、装置、设备及存储介质 |
CN114091914A (zh) * | 2021-11-19 | 2022-02-25 | 中国建设银行股份有限公司 | 工单处理方法及装置 |
CN115017270A (zh) * | 2022-08-08 | 2022-09-06 | 广东电网有限责任公司佛山供电局 | 一种基于工作票识别的机房布控方法及系统 |
CN116433339A (zh) * | 2023-06-15 | 2023-07-14 | 全屋优品科技(深圳)有限公司 | 订单数据的处理方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414688A (zh) * | 2019-07-29 | 2019-11-05 | 卓尔智联(武汉)研究院有限公司 | 信息分析方法、装置、服务器及存储介质 |
CN111507814A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 业务数据处理方法、装置、计算机设备和存储介质 |
CN111813593A (zh) * | 2020-07-23 | 2020-10-23 | 平安银行股份有限公司 | 一种数据处理方法、设备、服务器及存储介质 |
CN112037026A (zh) * | 2020-09-01 | 2020-12-04 | 中国银行股份有限公司 | 自动化异常交易工单处理方法、装置和系统 |
CN112069197A (zh) * | 2019-06-10 | 2020-12-11 | 中国移动通信集团湖南有限公司 | 异常工单的方法及装置 |
CN112102049A (zh) * | 2020-09-23 | 2020-12-18 | 中国建设银行股份有限公司 | 一种模型训练方法、业务处理方法、装置及设备 |
WO2021012382A1 (zh) * | 2019-07-25 | 2021-01-28 | 深圳壹账通智能科技有限公司 | 配置聊天机器人的方法、装置、计算机设备和存储介质 |
CN112560465A (zh) * | 2020-12-18 | 2021-03-26 | 平安银行股份有限公司 | 批量异常事件的监控方法、装置、电子设备及存储介质 |
CN112632292A (zh) * | 2020-12-23 | 2021-04-09 | 深圳壹账通智能科技有限公司 | 业务关键词的提取方法、装置、设备及存储介质 |
-
2021
- 2021-04-16 CN CN202110408996.XA patent/CN113051291A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069197A (zh) * | 2019-06-10 | 2020-12-11 | 中国移动通信集团湖南有限公司 | 异常工单的方法及装置 |
WO2021012382A1 (zh) * | 2019-07-25 | 2021-01-28 | 深圳壹账通智能科技有限公司 | 配置聊天机器人的方法、装置、计算机设备和存储介质 |
CN110414688A (zh) * | 2019-07-29 | 2019-11-05 | 卓尔智联(武汉)研究院有限公司 | 信息分析方法、装置、服务器及存储介质 |
CN111507814A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 业务数据处理方法、装置、计算机设备和存储介质 |
CN111813593A (zh) * | 2020-07-23 | 2020-10-23 | 平安银行股份有限公司 | 一种数据处理方法、设备、服务器及存储介质 |
CN112037026A (zh) * | 2020-09-01 | 2020-12-04 | 中国银行股份有限公司 | 自动化异常交易工单处理方法、装置和系统 |
CN112102049A (zh) * | 2020-09-23 | 2020-12-18 | 中国建设银行股份有限公司 | 一种模型训练方法、业务处理方法、装置及设备 |
CN112560465A (zh) * | 2020-12-18 | 2021-03-26 | 平安银行股份有限公司 | 批量异常事件的监控方法、装置、电子设备及存储介质 |
CN112632292A (zh) * | 2020-12-23 | 2021-04-09 | 深圳壹账通智能科技有限公司 | 业务关键词的提取方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张兆芝;陈翔;高敏;卢燕燊;张钟杰;: "基于自然语言的国网投诉工单智能分类模型构建", 微型电脑应用, no. 07, 20 July 2020 (2020-07-20) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761031A (zh) * | 2021-09-08 | 2021-12-07 | 平安国际智慧城市科技股份有限公司 | 目标投诉方的识别方法、装置、设备及存储介质 |
CN114091914A (zh) * | 2021-11-19 | 2022-02-25 | 中国建设银行股份有限公司 | 工单处理方法及装置 |
CN115017270A (zh) * | 2022-08-08 | 2022-09-06 | 广东电网有限责任公司佛山供电局 | 一种基于工作票识别的机房布控方法及系统 |
CN116433339A (zh) * | 2023-06-15 | 2023-07-14 | 全屋优品科技(深圳)有限公司 | 订单数据的处理方法、装置、设备及存储介质 |
CN116433339B (zh) * | 2023-06-15 | 2023-08-18 | 全屋优品科技(深圳)有限公司 | 订单数据的处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113051291A (zh) | 工单信息的处理方法、装置、设备及存储介质 | |
WO2019214248A1 (zh) | 一种风险评估方法、装置、终端设备及存储介质 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN109583966B (zh) | 一种高价值客户识别方法、系统、设备及存储介质 | |
CN109711424B (zh) | 一种基于决策树的行为规则获取方法、装置及设备 | |
CN112668859A (zh) | 基于大数据的客户风险评级方法、装置、设备及存储介质 | |
CN112990386B (zh) | 用户价值聚类方法、装置、计算机设备和存储介质 | |
CN111724238A (zh) | 产品推荐准确度评价方法、装置、设备及存储介质 | |
CN115098650B (zh) | 基于历史数据模型的评论信息分析方法及相关装置 | |
US11790380B2 (en) | Systems and methods for finding an interaction subset within a set of interactions | |
US20230153845A1 (en) | System and method for generating custom data models for predictive forecasting | |
Jain et al. | NFT Appraisal Prediction: Utilizing Search Trends, Public Market Data, Linear Regression and Recurrent Neural Networks | |
CN111428142A (zh) | 一种基于随机森林分类器的代码评审人推荐系统及方法 | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
CN113554310A (zh) | 基于智能合约的企业信用动态评估模型 | |
CN111815173A (zh) | 一种基于关联规则的企业画像评估方法 | |
CN112506930B (zh) | 一种基于机器学习技术的数据洞察系统 | |
EP3493082A1 (en) | A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends | |
CN112818215A (zh) | 产品数据的处理方法、装置、设备及存储介质 | |
CN113849618A (zh) | 基于知识图谱的策略确定方法、装置、电子设备及介质 | |
CN113420018A (zh) | 用户行为数据分析方法、装置、设备及存储介质 | |
CN113326254A (zh) | 一种调研数据清洗方法及系统 | |
CN112529319A (zh) | 基于多维特征的评分方法、装置、计算机设备及存储介质 | |
CN1403984A (zh) | 用于帮助赢利组织评估和改善来自客户的利润的方法和系统 | |
CN113689299B (zh) | 新闻信息指数模型的构建方法及新闻信息分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |