CN114529090A - 解决途径预测模型的训练方法、系统、设备及介质 - Google Patents

解决途径预测模型的训练方法、系统、设备及介质 Download PDF

Info

Publication number
CN114529090A
CN114529090A CN202210160062.3A CN202210160062A CN114529090A CN 114529090 A CN114529090 A CN 114529090A CN 202210160062 A CN202210160062 A CN 202210160062A CN 114529090 A CN114529090 A CN 114529090A
Authority
CN
China
Prior art keywords
solution
prediction model
preset threshold
threshold range
solution path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210160062.3A
Other languages
English (en)
Inventor
顾春峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Network Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Network Technology Shanghai Co Ltd filed Critical Ctrip Travel Network Technology Shanghai Co Ltd
Priority to CN202210160062.3A priority Critical patent/CN114529090A/zh
Publication of CN114529090A publication Critical patent/CN114529090A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种解决途径预测模型的训练方法、系统、设备及介质,该训练方法包括获取验证数据集,将验证数据集输入初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径;筛选预测解决途径与实际解决途径不相符的异常事件;基于N个标准解决途径和异常事件的预测解决途径计算异常事件的置信度;筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。本发明提高了验证数据集的数据准确性,实现了对解决途径预测模型的优化,提高了预测解决途径的准确度,减少了人工修正验证数据集的工作量,提高了工作效率。

Description

解决途径预测模型的训练方法、系统、设备及介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种解决途径预测模型的训练方法、系统、设备及介质。
背景技术
在许多大中型企业中,随着公司业务的开展,运营时间的延续,产生了越来越多的历史运营数据,通过机器学习对历史运营数据的训练,可以实现某些IT(InformationTechnology,信息技术)环节的策略自动化。机器学习模型最重要的是输入样本数据的准确性和一致性。但是实际在运营过程中会存在各种各样的异常场景和人为因素,导致运营系统中存档的输入样本数据存在错误。
在传统的机器学习模型中,输入样本集中的数据需要由人工逐条检查校对,对其中错误和特殊数据进行剔除和修正。但是由于历史数据量巨大,全部由人工标注,将会消耗大量的人力。而且在运营迭代的过程中,系统将持续不断的产生新数据,这将会导致一个长期的大量人力消耗,增加了员工的工作量,不利于提升工作效率。
发明内容
本发明要解决的技术问题是为了克服现有技术中传统机器学习模型中,模型的输入样本数据不准确,需要人工对输入样本数据中的数据进行逐条检查、校对、剔除和修正,人工检查数据工作量巨大、不利于提升工作效率的缺陷,提出一种解决途径预测模型的训练方法、系统、设备及介质。
本发明是通过下述技术方案来解决上述技术问题:
第一方面,提供一种解决途径预测模型的训练方法,所述训练方法包括:
获取验证数据集,所述验证数据集包括多个事件、N个标准解决途径及与各个所述事件对应的实际解决途径;所述实际解决途径为所述N个标准解决途径中的其中一个;
将所述验证数据集输入初始解决途径预测模型进行训练以得到各个所述事件对应的预测解决途径;所述初始解决途径预测模型以所述事件为输入,以所述事件对应的预测解决途径为输出;
筛选预测解决途径与实际解决途径不相符的异常事件;
基于所述N个标准解决途径和所述异常事件的预测解决途径计算所述异常事件的置信度;
筛选所述置信度满足预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
本发明的解决途径预测模型的训练方法,通过获取验证数据集,将验证数据集输入初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径;筛选预测解决途径与实际解决途径不相符的异常事件;基于N个标准解决途径和异常事件的预测解决途径计算异常事件的置信度;筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;提高了验证数据集的数据准确性,实现了对解决途径预测模型的优化,提高了预测解决途径的准确度,减少了人工修正验证数据集的工作量,提高了工作效率。
较佳地,所述基于所述N个标准解决途径和所述异常事件的预测解决途径计算所述异常事件的置信度的步骤具体包括:
分别计算所述预测解决途径对应的预测解决途径向量与所述N个标准解决途径对应的N个标准解决途径向量之间的距离值;基于所述距离值计算所述置信度。
较佳地,所述距离值包括最小距离Dmin和除去所述最小距离Dmin的N-1个剩余距离Drest;
计算所述N-1个剩余距离Drest的平均距离Dave;
所述基于所述距离值计算所述置信度的步骤具体包括:
根据公式
Figure BDA0003514168250000031
计算所述置信度,其中,T为所述置信度。
较佳地,所述预设阈值范围包括第一预设阈值范围和第二预设阈值范围;所述第二预设阈值范围的上限值大于所述第一预设阈值范围的上限值;
所述筛选所述置信度满足预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正的步骤具体包括:
筛选所述置信度满足所述第一预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;
返回所述筛选预测解决途径与实际解决途径不相符的异常事件的步骤,直至所述置信度满足所述第二预设阈值范围。
本发明的解决途径预测模型的训练方法,预设阈值范围包括第一预设阈值范围和第二预设阈值范围,通过筛选置信度满足第一预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;返回筛选预测解决途径与实际解决途径不相符的异常事件的步骤,直至置信度满足第二预设阈值范围。实现了对解决途径预测模型的持续优化,提高预测解决途径的准确率。
第二方面,提供一种解决途径预测系统,所述解决途径预测系统包括:验证数据集获取模块,用于获取验证数据集,所述验证数据集包括多个
事件、N个标准解决途径及与各个所述事件对应的实际解决途径;所述实际解决途径为所述N个标准解决途径中的其中一个;
预测解决途径训练模块,用于将所述验证数据集输入初始解决途径预测模型进行训练以得到各个所述事件对应的预测解决途径;所述初始解决途径预测模型以所述事件为输入,以所述事件对应的预测解决途径为输出;
第一筛选模块,用于筛选预测解决途径与实际解决途径不相符的异常事件;
置信度计算模块,用于基于所述N个标准解决途径和所述异常事件的预测解决途径计算所述异常事件的置信度;
第二筛选模块,用于筛选所述置信度满足预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
模型训练模块,用于基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
较佳地,所述置信度计算模块包括:
距离值计算单元,用于分别计算所述预测解决途径对应的预测解决途径向量与所述N个标准解决途径对应的N个标准解决途径向量之间的距离值;基于所述距离值计算所述置信度。
较佳地,所述距离值包括最小距离Dmin和除去所述最小距离Dmin的N-1个剩余距离Drest;
所述距离值计算单元具体用于计算所述N-1个剩余距离Drest的平均距离Dave;并根据公式
Figure BDA0003514168250000041
计算所述置信度,其中,T为所述置信度。
较佳地,所述预设阈值范围包括第一预设阈值范围和第二预设阈值范围;所述第二预设阈值范围的上限值大于所述第一预设阈值范围的上限值;
所述第二筛选模块具体用于筛选所述置信度满足所述第一预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
所述模型训练模块具体用于基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;
再次调用所述第一筛选模块,筛选预测解决途径与实际解决途径不相符的异常事件的步骤,直至所述置信度满足所述第二预设阈值范围。
本发明的解决途径预测系统,包括验证数据集获取模块、预测解决途径训练模块、第一筛选模块、置信度计算模块、第二筛选模块及模型训练模块,通过各个模块的相互配合,提高了解决途径预测系统中验证数据集的数据准确性,实现了对解决途径预测模型的优化,提高了预测解决途径的准确度,减少了人工修正验证数据集的工作量,提高了工作效率。
第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时实现上述任一所述的解决途径预测模型的训练方法。
第四方面,提供一种计算机可读介质,其上存储有计算机指令,所述计算机指令在由处理器执行时实现上述任一所述的解决途径预测模型的训练方法。
本发明的积极进步效果在于:
本发明的解决途径预测模型的训练方法,通过获取验证数据集,验证数据集包括多个事件、N个标准解决途径及与各个事件对应的实际解决途径;实际解决途径为N个标准解决途径中的其中一个;将验证数据集输入初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径;初始解决途径预测模型以事件为输入,以事件对应的预测解决途径为输出;筛选预测解决途径与实际解决途径不相符的异常事件;基于N个标准解决途径和异常事件的预测解决途径计算异常事件的置信度;筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。本发明提高了验证数据集的数据准确性,实现了对解决途径预测模型的优化,提高了预测解决途径的准确度,减少了人工修正验证数据集的工作量,提高了工作效率。
附图说明
图1为本发明实施例1提供的一种解决途径预测模型的训练方法的流程示意图;
图2为本发明实施例1提供的另一种解决途径预测模型的训练方法的流程示意图;
图3为本发明实施例2提供的一种解决途径预测系统的示意图;
图4为本发明实施例3示出的一种电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种解决途径预测模型的训练方法,图1为本实施例提供的一种解决途径预测模型的训练方法的流程示意图,如图1所示,解决途径预测模型的训练方法包括:
步骤101、获取验证数据集。
其中,验证数据集包括多个事件、N个标准解决途径及与各个事件对应的实际解决途径;实际解决途径为N个标准解决途径中的其中一个。
在本步骤中,每个事件对应有实际解决途径,实际解决途径为样本集中验证数据集中N个标准解决途径中的其中一个,其中,N可以为大于或等于2的整数。
步骤102、将验证数据集输入初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径。
其中,初始解决途径预测模型以事件为输入,以事件对应的预测解决途径为输出。
在本步骤中,基于解决途径预测模型对验证数据集中的事件的解决途径进行预测以得到预测解决途径,验证数据集即初始解决途径预测模型的输入样本集。
步骤103、筛选预测解决途径与实际解决途径不相符的异常事件。
在本步骤中,对各个事件的预测解决途径与实际解决途径进行标注,以筛选出预测解决途径与实际解决途径不相符的异常事件。
步骤104、基于N个标准解决途径和异常事件的预测解决途径计算异常事件的置信度。
其中,置信度用于表征某个事件的预测解决途径与实际解决途径的接近程度,用于表征解决途径预测模型对预测解决途径准确度的把握程度。
步骤105、筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正。
在本步骤中,对各个事件对应的置信度进行排序,筛选出置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正,即对验证数据集进行了修正,以确保该若干异常事件的实际解决途径的准确性。
步骤106、基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
在本步骤中,使用修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
本实施例的解决途径预测模型的训练方法,通过获取验证数据集,将验证数据集输入初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径;筛选预测解决途径与实际解决途径不相符的异常事件;基于N个标准解决途径和异常事件的预测解决途径计算异常事件的置信度;筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;提高了验证数据集的数据准确性,实现了对解决途径预测模型的优化,提高了预测解决途径的准确度,减少了人工修正验证数据集的工作量,提高了工作效率。
在一可选的实施方式中,上述步骤104具体包括:分别计算预测解决途径对应的预测解决途径向量与N个标准解决途径对应的N个标准解决途径向量之间的距离值;基于距离值计算置信度。
在本实施方式中,预测解决途径对应有预测解决途径向量,标准解决途径对应有标准解决途径向量,计算预测解决途径向量与N个标准解决途径向量之间的距离值,基于距离值计算置信度。
在一可选的实施方式中,上述距离值包括最小距离Dmin和除去最小距离Dmin的N-1个剩余距离Drest;上述基于距离值计算置信度的步骤具体包括:计算N-1个剩余距离Drest的平均距离值Dave;根据公式
Figure BDA0003514168250000081
计算置信度,其中,T为置信度。
在一可选的实施方式中,图2为本实施方式提供的一种解决途径预测模型的训练方法的流程示意图,预设阈值范围包括第一预设阈值范围和第二预设阈值范围;第二预设阈值范围的上限值大于第一预设阈值范围的上限值;如图2所示,上述步骤104后还包括:
步骤107、判断置信度是否满足第二预设阈值范围。
若否,则执行步骤105,直至置信度满足第二预设阈值范围。上述步骤105具体包括:筛选置信度满足第一预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正。
若是,则结束训练。
在本实施方式中,第二预设阈值范围的上限值大于第一预设阈值范围的上限值,首选修正异常事件中置信度满足第一预设阈值范围的若干异常事件实际解决途径,得到修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型,反复多次进行筛选,以确保异常事件的置信度满足预设第二阈值范围,从而持续优化解决途径预测模型,以提高预测解决途径的准确率。
本实施方式的解决途径预测模型的训练方法,预设阈值范围包括第一预设阈值范围和第二预设阈值范围,第二预设阈值范围的上限值大于第一预设阈值范围的上限值,通过筛选置信度满足第一预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;返回筛选预测解决途径与实际解决途径不相符的异常事件的步骤,直至置信度满足第二预设阈值范围。实现了对解决途径预测模型的持续优化,提高预测解决途径的准确率。
在一可选的实施方式中,对验证数据集进行文本编码及提取特征值,并将特征值输入到初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径。
下面结合具体应用场景,对本发明的解决途径预测模型的训练方法进行详细说明。
从公司的事件管理系统中批量导出最近一年的所有事件报表,例如选取2000条事件,在这2000条事件中选择100条事件作为训练数据集,则剩余的1900条事件为验证数据集,逐条校核训练数据集中的各个事件对应的实际解决途径,确保每个事件对应的实际解决途径正确。例如事件为电脑故障、网络故障、电话故障等,电脑故障对应的实际解决途径为桌面团队,网络故障对应的解决途径为网络团队,电话故障对应的实际解决途径为电话团队。
例如事件电脑故障对应的标题是电脑故障,症状是电脑蓝屏。使用生成的初始解决途径预测模型,对验证数据集中的1900条事件进行编码预测,生成预测解决途径。由于验证数据集中的各个事件的实际解决途径并未进行逐条校核,因此会存在实际解决途径错误的情况,筛选验证数据集中预测解决途径与实际解决途径不相符的异常事件;验证数据集中存在N个标准解决途径,例如存在3个标注解决途径,则基于该3个标准解决途径和异常事件的预测解决途径计算异常事件的置信度;筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
例如异常事件的数量为100条,则对应有100个置信度输出,对所得的置信度按照置信度数值由高到低进行排序得到置信度排序表,设置第一预设阈值范围为0.50至0.80,设置第二预设阈值范围为0.90至0.95,其中第二预设阈值范围的上限值0.95大于第一预设阈值范围的上限值0.80,异常事件的置信度小于1并无限接近1,判断100条异常事件的置信度是否满足第二预设阈值范围,若满足,则结束训练,若不满足,则筛选置信度满足第一预设阈值范围0.50至0.80的若干异常事件,并对其对应的实际解决途径进行修正。基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;继续筛选预测解决途径与实际解决途径不相符的异常事件,若此时异常事件的数量为40条,判断该40条异常事件的置信度是否满足第二预设阈值范围0.90至0.95,若满足,则结束训练,若不满足,则筛选置信度满足第一预设阈值范围0.50至0.80的若干异常事件,并对其对应的实际解决途径进行修正。基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;继续筛选预测解决途径与实际解决途径不相符的异常事件,若此时异常事件的数量为10条,判断该10条异常事件的置信度是否满足第二预设阈值范围0.90至0.95,若满足,则结束训练,若不满足,则继续对该10条异常事件的实际解决途径进行修正,进行多轮修正和训练,则异常事件的数量会越来越少,直至异常事件的置信度均满足第二预设阈值范围,则停止修正,并得到最终优化后的解决途径预测模型。
本应用场景中设置第一预设阈值范围为0.50至0.80,设置第二预设阈值范围为0.90至0.95,但第一预设阈值范围与第二预设阈值范围并不局限于此,也可以是第一预设阈值范围为0.45至0.85,设置第二预设阈值范围为0.80至0.98,只要保证第二预设阈值范围的上限值如0.98大于第一预设阈值范围的上限值如0.8即可。
可以对训练集中事件的“标题”和“症状”进行One Hot Encoder(独热编码)和TF-IDF(term frequency–inverse document frequency,一种用于信息检索与数据挖掘的常用加权技术)文本编码提取特征值,随后使用PyTorch(一个开源的Python机器学习库,用于自然语言处理等应用程序)框架训练生成初始解决途径预测模型。在分类和聚类运算中我们经常计算两个个体之间的距离,对于连续的数字这一点不成问题,但是对于名词性的类别,计算距离很难。即使将类别与数字对应,例如(A,B,C)与(0,1,2)对应,我们也不能认为A与B距离为0,B与C距离为1,而A与C距离为2。独热编码方法正是为了处理这种距离的度量,该方法认为每个类别之间的距离是一样的。该方法将类别与向量对应,例如(A,B,C)分别与(1,0,0)、(0,1,0)、(0,0,1)对应,注意现在各个类别之间的欧式距离是相同的,向量中的1仅仅代表类别,但使用了数值格式的数据。
例如某一异常事件的预测解决途径对应的预测解决途径向量为(X,Y,Z),3个标注解决途径对应的3个标准解决途径向量为(XN,YN,ZN),其中N为3,即(X1,Y1,Z1)、(X2,Y2,Z2)和(X3,Y3,Z3),则分别计算向量(X,Y,Z)与向量(X1,Y1,Z1)、(X2,Y2,Z2)和(X3,Y3,Z3)的距离值DN,DN=(XN-X)2+(YN-Y)2+(ZN-Z)2,得到距离值D1、D2、D3,若D1的数值最小,即最小距离Dmin为D1,则剩余距离Drest为D2、D3,计算剩余距离Drest的平均距离Dave,即
Figure BDA0003514168250000111
则置信度T为
Figure BDA0003514168250000121
例如,(X1,Y1,Z1)=(0,0,1),(X2,Y2,Z2)=(0,1,0),(X3,Y3,Z3)=(1,0,0),(X,Y,Z)=(0.8,0.2,0.1),则D1==(0-0.8)2+(0-0.2)2+(1-0.1)2=0.89,D2==(0-0.8)2+(1-0.2)2+(0-0.1)2=1.49,D3==(1-0.8)2+(0-0.2)2+(0-0.1)2=1.49,则最小距离Dmin=0.89,剩余距离Drest的平均距离Dave=1.49,则置信度T=0.40。距离值越小,表明预测解决途径与该目标解决途径越接近,即该预测解决途径属于该目标解决途径D1对应的类别。借助置信度排序表和预设阈值范围,对异常事件的实际解决途径进行修正,可以是人工修正,也可以是在置信度满足预设阈值范围的前提下,自动选取对应的目标解决途径以替换实际解决途径。
实施例2
本实施例提供一种解决途径预测系统,图3为本实施例提供的一种解决途径预测系统的示意图,如图3所示,该解决途径预测系统包括:验证数据集获取模块1,用于获取验证数据集,验证数据集包括多个事件、N个标准解决途径及与各个事件对应的实际解决途径;实际解决途径为N个标准解决途径中的其中一个;预测解决途径训练模块2,用于将验证数据集输入初始解决途径预测模型进行训练以得到各个事件对应的预测解决途径;初始解决途径预测模型以事件为输入,以事件对应的预测解决途径为输出;第一筛选模块3,用于筛选预测解决途径与实际解决途径不相符的异常事件;置信度计算模块4,用于基于N个标准解决途径和异常事件的预测解决途径计算异常事件的置信度;第二筛选模块5,用于筛选置信度满足预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;模型训练模块6,用于基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
置信度计算模块4包括距离值计算单元41,用于分别计算预测解决途径对应的预测解决途径向量与N个标准解决途径对应的N个标准解决途径向量之间的距离值;基于距离值计算置信度。
距离值包括最小距离Dmin和除去最小距离Dmin的N-1个剩余距离Drest;距离值计算单元41具体用于计算N-1个剩余距离Drest的平均距离Dave;并根据公式
Figure BDA0003514168250000131
计算置信度,其中,T为置信度。
预设阈值范围包括第一预设阈值范围和第二预设阈值范围,第二预设阈值范围的上限值大于第一预设阈值范围的上限值;第二筛选模块5具体用于筛选置信度满足第一预设阈值范围的若干异常事件,并对若干异常事件的实际解决途径进行修正;模型训练模块6具体用于基于修正后的验证数据集对初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;再次调用第一筛选模块3,筛选预测解决途径与实际解决途径不相符的异常事件,直至置信度满足第二预设阈值范围。
本实施例的解决途径预测系统,包括验证数据集获取模块、预测解决途径训练模块、第一筛选模块、置信度计算模块、第二筛选模块及模型训练模块,通过各个模块的相互配合,提高了解决途径预测系统中验证数据集的数据准确性,实现了对解决途径预测模型的优化,提高了预测解决途径的准确度,减少了人工修正验证数据集的工作量,提高了工作效率。
实施例3
本实施例提供一种电子设备,图4为本实施例示出的一种电子设备的结构示意图,电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例1中的解决途径预测模型的训练方法。图4显示的电子设备50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图4所示,电子设备50可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备50的组件可以包括但不限于:上述至少一个处理器51、上述至少一个存储器52、连接不同系统组件(包括存储器52和处理器51)的总线53。
总线53包括数据总线、地址总线和控制总线。
存储器52可以包括易失性存储器,例如随机存取存储器(RAM)521和/或高速缓存存储器522,还可以进一步包括只读存储器(ROM)523。
存储器52还可以包括具有一组(至少一个)程序模块524的程序工具525(或实用工具),这样的程序模块524包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器51通过运行存储在存储器52中的计算机程序,从而执行各种功能应用以及数据处理,例如上述实施例1中的解决途径预测模型的训练方法。
电子设备50也可以与一个或多个外部设备54通信。这种通信可以通过输入/输出(I/O)接口55进行。并且,模型生成的电子设备50还可以通过网络适配器56与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器56通过总线53与电子设备50的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例1中的解决途径预测模型的训练方法。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现上述实施例1中的解决途径预测模型的训练方法中的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种解决途径预测模型的训练方法,其特征在于,所述训练方法包括:
获取验证数据集,所述验证数据集包括多个事件、N个标准解决途径及与各个所述事件对应的实际解决途径;所述实际解决途径为所述N个标准解决途径中的其中一个;
将所述验证数据集输入初始解决途径预测模型进行训练以得到各个所述事件对应的预测解决途径;所述初始解决途径预测模型以所述事件为输入,以所述事件对应的预测解决途径为输出;
筛选预测解决途径与实际解决途径不相符的异常事件;
基于所述N个标准解决途径和所述异常事件的预测解决途径计算所述异常事件的置信度;
筛选所述置信度满足预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
2.根据权利要求1所述的训练方法,其特征在于,所述基于所述N个标准解决途径和所述异常事件的预测解决途径计算所述异常事件的置信度的步骤具体包括:
分别计算所述预测解决途径对应的预测解决途径向量与所述N个标准解决途径对应的N个标准解决途径向量之间的距离值;基于所述距离值计算所述置信度。
3.根据权利要求2所述的训练方法,其特征在于,所述距离值包括最小距离Dmin和除去所述最小距离Dmin的N-1个剩余距离Drest;
计算所述N-1个剩余距离Drest的平均距离Dave;
所述基于所述距离值计算所述置信度的步骤具体包括:
根据公式
Figure FDA0003514168240000011
计算所述置信度,其中,T为所述置信度。
4.根据权利要求1所述的训练方法,其特征在于,所述预设阈值范围包括第一预设阈值范围和第二预设阈值范围;所述第二预设阈值范围的上限值大于所述第一预设阈值范围的上限值;
所述筛选所述置信度满足预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正的步骤具体包括:
筛选所述置信度满足所述第一预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;
返回所述筛选预测解决途径与实际解决途径不相符的异常事件的步骤,直至所述置信度满足所述第二预设阈值范围。
5.一种解决途径预测系统,其特征在于,所述解决途径预测系统包括:
验证数据集获取模块,用于获取验证数据集,所述验证数据集包括多个事件、N个标准解决途径及与各个所述事件对应的实际解决途径;所述实际解决途径为所述N个标准解决途径中的其中一个;
预测解决途径训练模块,用于将所述验证数据集输入初始解决途径预测模型进行训练以得到各个所述事件对应的预测解决途径;所述初始解决途径预测模型以所述事件为输入,以所述事件对应的预测解决途径为输出;
第一筛选模块,用于筛选预测解决途径与实际解决途径不相符的异常事件;
置信度计算模块,用于基于所述N个标准解决途径和所述异常事件的预测解决途径计算所述异常事件的置信度;
第二筛选模块,用于筛选所述置信度满足预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
模型训练模块,用于基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型。
6.根据权利要求5所述的解决途径预测系统,其特征在于,所述置信度计算模块包括:
距离值计算单元,用于分别计算所述预测解决途径对应的预测解决途径向量与所述N个标准解决途径对应的N个标准解决途径向量之间的距离值;基于所述距离值计算所述置信度。
7.根据权利要求6所述的解决途径预测系统,其特征在于,所述距离值包括最小距离Dmin和除去所述最小距离Dmin的N-1个剩余距离Drest;
所述距离值计算单元具体用于计算所述N-1个剩余距离Drest的平均距离Dave;并根据公式
Figure FDA0003514168240000031
计算所述置信度,其中,T为所述置信度。
8.根据权利要求5所述的解决途径预测系统,其特征在于,所述预设阈值范围包括第一预设阈值范围和第二预设阈值范围;所述第二预设阈值范围的上限值大于所述第一预设阈值范围的上限值;
所述第二筛选模块具体用于筛选所述置信度满足所述第一预设阈值范围的若干异常事件,并对所述若干异常事件的实际解决途径进行修正;
所述模型训练模块具体用于基于修正后的验证数据集对所述初始解决途径预测模型进行训练,得到优化后的解决途径预测模型;
再次调用所述第一筛选模块,筛选预测解决途径与实际解决途径不相符的异常事件,直至所述置信度满足所述第二预设阈值范围。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时实现如权利要求1~4中任意一项所述的解决途径预测模型的训练方法。
10.一种计算机可读介质,其上存储有计算机指令,其特征在于,所述计算机指令在由处理器执行时实现如权利要求1~4中任意一项所述的解决途径预测模型的训练方法。
CN202210160062.3A 2022-02-22 2022-02-22 解决途径预测模型的训练方法、系统、设备及介质 Pending CN114529090A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210160062.3A CN114529090A (zh) 2022-02-22 2022-02-22 解决途径预测模型的训练方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210160062.3A CN114529090A (zh) 2022-02-22 2022-02-22 解决途径预测模型的训练方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN114529090A true CN114529090A (zh) 2022-05-24

Family

ID=81624479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210160062.3A Pending CN114529090A (zh) 2022-02-22 2022-02-22 解决途径预测模型的训练方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN114529090A (zh)

Similar Documents

Publication Publication Date Title
US11562304B2 (en) Preventative diagnosis prediction and solution determination of future event using internet of things and artificial intelligence
US20240095685A1 (en) Automated vehicle repair estimation by voting ensembling of multiple artificial intelligence functions
US10839162B2 (en) Service management control platform
US10083263B2 (en) Automatic modeling farmer
US20220100963A1 (en) Event extraction from documents with co-reference
CN109102157A (zh) 一种基于深度学习的银行工单派单方法及系统
US11379466B2 (en) Data accuracy using natural language processing
WO2020000689A1 (zh) 基于迁移学习的智能投顾策略生成方法及装置、电子设备、存储介质
WO2024022354A1 (zh) 结合rpa及ai实现ia的对象推荐方法、装置及存储介质
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN116340726A (zh) 一种能源经济大数据清洗方法、系统、设备及存储介质
CN111861004B (zh) 日收入产量的自动佣金预测方法、系统、设备及存储介质
CN109583773A (zh) 一种纳税信用积分确定的方法、系统及相关装置
CN114529090A (zh) 解决途径预测模型的训练方法、系统、设备及介质
CN113780675B (zh) 一种消耗预测方法、装置、存储介质及电子设备
CN115130924A (zh) 一种源网荷储背景下微电网电力设备资产评估方法及系统
CN114266414A (zh) 贷款数额的预测方法、装置、电子设备和介质
CN112380321A (zh) 基于票据知识图谱的主次数据库分配方法及相关设备
US11830081B2 (en) Automated return evaluation with anomoly detection
CN117172232B (zh) 审计报告生成方法、装置、设备和存储介质
WO2023045311A1 (zh) 资源的拓扑还原方法、装置、服务器和存储介质
US20230385036A1 (en) Mapping data models to facilitate code generation
WO2024065776A1 (en) Method for data processing, apparatus for data processing, electronic device, and storage medium
Qian et al. Optimization of Management Information System for Enterprise Accounting in the Big Data Era-Taking UFIDA System as an Example
Gunawan et al. Implementation of the Incremental Model in Building a Web-Based Information System for Wealth Reporting of State Civil Apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination