CN116501548A

CN116501548A - 应用于人工智能的互联网数据容灾备份方法及服务器

Info

Publication number: CN116501548A
Application number: CN202310500695.9A
Authority: CN
Inventors: 王国雄; 孙小女
Original assignee: Guangxi Yunshu Information Technology Co ltd
Current assignee: LOLAAGE TECHNOLOGIES Inc
Priority date: 2023-05-06
Filing date: 2023-05-06
Publication date: 2023-07-28
Anticipated expiration: 2043-05-06
Also published as: CN116501548B

Abstract

本申请涉及人工智能、大数据服务、数据库技术领域，提供了一种应用于人工智能的互联网数据容灾备份方法及服务器。本申请通过训练优化得到目标数据表征载体抽取算法，在对数据进行备份的过程中，基于该人工智能算法对待备份数据进行数据特征挖掘，便于据此对待备份数据的优先级进行确定，完成具有针对性地、高效可靠地数据备份，帮助数据治理提供安全基础。进一步而言，该人工智能算法的迭代优化过程中，不用额外的数据示例和标记来进行算法调校，使得算法的优化效率得到提升，以快速进入后续的数据备份，且本申请的容灾备份技术适用性强，可以适用于电子商务、数字虚拟空间、智慧金融等业务服务领域。

Description

应用于人工智能的互联网数据容灾备份方法及服务器

技术领域

本申请涉及人工智能、大数据服务、数据库技术领域，尤其涉及一种应用于人工智能的互联网数据容灾备份方法及服务器。

背景技术

人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

随着大数据时代来临，企业处理数据的能力有了大幅提升，围绕数据的业务创新，价值发掘越来越受到企业的关注和追捧。随着“ABCDT”等各种新技术的应用，人们发现企业的数据环境不是变得越来越简单了，而是变得越来越复杂。复杂的数据环境中，数据治理的重要性不言而喻，而如何进行高效可靠的数据容灾备份，是数据治理的安全基础。

在人工智能的赋能下，数据备份技术也开始走向智能化，如何适应日益变化的数据进行针对性数据备份方式升级是需要解决的技术问题。

发明内容

有鉴于此，本申请实施例至少提供一种应用于人工智能的互联网数据容灾备份方法。

本申请实施例的技术方案是这样实现的：

一方面，本申请实施例提供一种应用于人工智能的互联网数据容灾备份方法，应用于AI决策容灾备份服务器，所述方法包括：获取目标示例互联网数据集，所述目标示例互联网数据集通过在预先设置的示例互联网数据库中选取得到，所述目标示例互联网数据集为文本化的数据；将所述目标示例互联网数据集中的各示例互联网数据分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得所述各示例互联网数据对应的已优化数据表征载体和所述各示例互联网数据对应的待优化数据表征载体，其中，所述原始数据表征载体抽取算法通过将所述已优化的数据表征载体抽取算法的算法参量进行权重设定得到；确定所述各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定所述各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列；确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，所述目标数据表征载体抽取算法Algorithm1用于抽取互联网数据的数据表征载体，依据所述互联网数据的数据表征载体进行数据备份优先级确定，以便依据所述数据备份优先级确定互联网数据的备份顺序，进行互联网数据的按序备份。

在一些实施例中，所述确定所述各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，包括：依据所述各示例互联网数据对应的已优化数据表征载体获得已优化数据载体张量，以及将所述已优化数据载体张量进行正规化，获得已优化正规化张量；确定所述已优化正规化张量对应的维度调换张量，获得已优化维度调换张量；通过所述已优化维度调换张量与所述已优化正规化张量的获得所述已优化关联评分序列；所述确定所述各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列，包括：依据所述各示例互联网数据对应的待优化数据表征载体获得待优化数据载体张量，以及将所述待优化数据载体张量进行正规化，获得待优化正规化张量；确定所述待优化正规化张量对应的维度调换张量，获得待优化维度调换张量；通过所述待优化维度调换张量与所述待优化正规化张量获得所述待优化关联评分序列。

在一些实施例中，所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，包括：确定所述待优化关联评分序列与所述已优化关联评分序列的个体离散系数，获得原始收敛评估系数，将所述原始收敛评估系数确定为所述偏差结果；依据所述偏差结果调节所述原始数据表征载体抽取算法的算法参量，得到调节好的数据表征载体抽取算法；将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复；所述确定所述待优化关联评分序列与所述已优化关联评分序列的个体离散系数，获得所述偏差结果，包括：确定所述待优化关联评分序列与所述已优化关联评分序列的个体离散系数，获得原始收敛评估系数；获取目标示例互联网数据集对应的示例互联网数据的总数，确定所述原始收敛评估系数与所述示例互联网数据的总数的分数值，得到收敛评估平均系数；获取预先设置的权重因子，依据所述权重因子对所述收敛评估平均系数进行加权，获得加权收敛评估系数；获取所述待优化的原始数据表征载体抽取算法对应的数据备份优先级偏差，以及确定所述数据备份优先级偏差和所述加权收敛评估系数的求和结果，获得所述偏差结果。

在一些实施例中，所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，包括：将所述待优化关联评分序列输入原始投影算法进行载体投影，获得目标载体投影序列；确定所述目标载体投影序列与所述已优化关联评分序列之间的个体离散系数，获得目标偏差结果，依据所述目标偏差结果调节所述原始投影算法和所述原始数据表征载体抽取算法，得到调节好的投影算法和调节好的数据表征载体抽取算法；将所述调节好的投影算法确定为原始投影算法，以及将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，依据优化好的原始数据表征载体抽取算法和优化好的原始投影算法获得目标数据表征载体抽取算法Algorithm2；所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，包括：将所述待优化关联评分序列和所述已优化关联评分序列输入原始关联分析算法中进行分析，获得关联评分分析结果；依据所述关联评分分析结果迭代所述原始关联分析算法和所述原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm3。

在一些实施例中，所述目标示例互联网数据集中包括多个多分类数据子集，所述方法还包括：将所述多个多分类数据子集分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得所述多个多分类数据子集对应的已优化子集表征载体和所述多个多分类数据子集对应的待优化子集表征载体；依据所述已优化子集表征载体和所述待优化子集表征载体确定子集偏差结果，获得原始子集偏差结果，依据所述原始子集偏差结果调节所述原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm4。

在一些实施例中，在所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1之后，所述方法还包括：获取互联网数据，将所述互联网数据输入所述目标数据表征载体抽取算法Algorithm1，以执行数据表征载体抽取，获得目标数据表征载体；获取优先级数据库对应的数据优先级表征载体，确定所述目标数据表征载体与所述数据优先级表征载体的关联评分；依据所述关联评分确定所述互联网数据对应的数据备份优先级确定结果。

在一些实施例中，所述方法还包括：获取待处理互联网数据和过往互联网数据集；将所述待处理互联网数据和所述过往互联网数据集输入已优化的数据表征载体抽取算法，以执行数据表征载体抽取，获得所述待处理互联网数据对应的待处理数据表征载体和所述过往互联网数据集对应的过往数据表征载体序列，以及确定所述待处理数据表征载体和所述过往数据表征载体序列的关联评分，获得第一关联评分序列；将所述待处理互联网数据和所述过往互联网数据集输入目标数据表征载体抽取算法，以执行数据表征载体抽取，获得所述待处理互联网数据对应的待处理目标数据表征载体和所述过往互联网数据集对应的过往目标数据表征载体序列，以及确定所述待处理目标数据表征载体与所述过往目标数据表征载体序列的关联评分，获得第二关联评分序列，所述目标数据表征载体抽取算法为基于已优化的数据表征载体抽取算法进行参数克隆优化获得；依据所述第一关联评分序列和所述第二关联评分序列进行判断，获得所述待处理互联网数据对应的判断结果，依据所述待处理互联网数据对应的判断结果确定所述待处理互联网数据对应的验证信息。

在一些实施例中，所述确定所述待处理数据表征载体和所述过往数据表征载体序列的关联评分，获得第一关联评分序列，包括：将所述待处理数据表征载体进行正规化，获得正规化待处理数据表征载体，以及将所述过往数据表征载体序列进行正规化，获得正规化过往数据表征载体序列；将所述正规化过往数据表征载体序列进行维度调换，获得过往维度调换张量，通过所述正规化过往数据表征载体序列与所述过往维度调换张量的相乘结果获得所述第一关联评分序列；所述确定所述待处理目标数据表征载体与所述过往目标数据表征载体序列的关联评分，获得第二关联评分序列，包括：将所述待处理目标数据表征载体进行正规化，获得正规化待处理目标数据表征载体，以及将所述过往目标数据表征载体序列进行正规化，获得正规化过往目标数据表征载体序列；将所述正规化过往目标数据表征载体序列进行维度调换，获得过往目标维度调换张量，通过所述正规化过往目标数据表征载体序列与所述过往目标维度调换张量获得所述第二关联评分序列；所述依据所述第一关联评分序列和所述第二关联评分序列进行判断，获得所述待处理互联网数据对应的判断结果，依据所述待处理互联网数据对应的判断结果确定所述待处理互联网数据对应的验证信息，包括：确定所述第一关联评分序列和所述第二关联评分序列之间的个体离散系数，获得目标收敛评估系数；确定所述待处理互联网数据和所述过往互联网数据集对应的总数，确定所述目标收敛评估系数与所述总数的分数值，依据所述分数值确定所述待处理互联网数据对应的判断结果；若所述判断结果大于预设值，判断所述待处理互联网数据是近似的。

本申请的有益效果至少包括：

本申请的应用于人工智能的互联网数据容灾备份方法及系统中，将目标示例互联网数据集中的各示例互联网数据分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得各示例互联网数据对应的已优化数据表征载体和各示例互联网数据对应的待优化数据表征载体，再确定各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列，再依据确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，通过提取拓展已优化的数据表征载体抽取算法对应的表征载体空间，将得到的表征载体空间转移至原始数据表征载体抽取算法，获得优化好的目标数据表征载体抽取算法Algorithm1，本申请实施例不用额外的数据示例和标记来进行算法的调校，便于增加算法的优化效率，有利于快速挖掘数据备份优先级。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本申请的技术方案。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本申请的实施例，并与说明书一起用于说明本申请的技术方案。

图1为本申请实施例提供的一种应用于人工智能的互联网数据容灾备份方法的实现流程示意图。

图2为本申请实施例提供的一种数据备份装置的组成结构示意图。

图3为本申请实施例提供的一种AI决策容灾备份服务器的硬件实体示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面结合附图和实施例对本申请的技术方案进一步详细阐述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。所涉及的术语“第一/第二/第三”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请的目的，不是旨在限制本申请。

本申请实施例提供一种应用于人工智能的互联网数据容灾备份方法，该方法可以由AI决策容灾备份服务器的处理器执行。

互联网上海量的数据为数据容灾备份带来挑战，其中，重要数据如果没有及时备份，一旦发生丢失，将造成不可挽回的损失。结合上述情况，现有技术中出现了根据互联网数据的优先级进行备份的技术，即挖掘数据的优先级知识，例如从数据的元数据条目中发掘表征优先级的载体信息。为了确保数据备份的效率，高效准确地识别互联网数据的优先级是前提，因此采用人工智能算法挖掘备份优先级载体进行实现，由于互联网数据的快速更新，需要定期对算法进行适应性调整更新，如何提升算法调节的过程，使之能快速适应新一代数据的备份优先级载体挖掘，是需要解决的技术问题。

需要说明的是，上述信息披露，仅为引出本申请实施例的技术背景，其不构成影响本申请创造性的前提。

图1为本申请实施例提供的一种应用于人工智能的互联网数据容灾备份方法的实现流程示意图，如图1所示，该方法包括如下操作110至操作140：

操作110，获取目标示例互联网数据集，目标示例互联网数据集通过在预先设置的示例互联网数据库中选取得到。

本申请中，所述目标示例互联网数据集为文本化的数据，目标示例互联网数据集包括多个目标示例互联网数据，目标示例互联网数据是在当前进行算法优化的过程中选择的互联网数据。本申请实施例中，示例互联网数据库中包含用以调校算法的样本，其例如为任何形式的互联网数据，如互联网平台用户行为事件数据、通过为不同的用户行为事件进行编码（如onehot编码），得到编码数据进行存储，示例互联网数据集中的一个互联网数据可以是一个事件数据，也即示例互联网数据集通过多个事件数据构成。预先设置的示例互联网数据库为预先部署好的优化时调用的示例互联网数据的数据库，目标示例互联网数据集是预先设置的示例互联网数据库的局部数据。进一步地，互联网数据可以是电子商务业务领域、数字虚拟空间业务领域或者智慧金融业务领域的文本化数据。

操作120，将目标示例互联网数据集中的各示例互联网数据分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得各示例互联网数据对应的已优化数据表征载体和各示例互联网数据对应的待优化数据表征载体，其中，原始数据表征载体抽取算法通过将已优化的数据表征载体抽取算法的算法参量进行权重设定得到。

本申请实施例中，数据表征载体用以表征互联网数据的特征矢量信息，其可以是以表征向量、表征矩阵、表征张量等形式存在。已优化的数据表征载体抽取算法是基于过往示例互联网数据依据机器学习算法优化后得到的对数据表征载体进行抽取的人工智能算法。此时，需对完成优化的数据表征载体抽取算法进行迭代更新，待优化的原始数据表征载体抽取算法即要迭代的算法参量初始化的数据表征载体抽取算法，也可以将优化好的数据表征载体抽取算法的算法参量进行权重设定，完成算法参量初始化得到的，算法参量权重设定的方式例如为基于高斯分布实现，通过算法参量权重设定完成算法的初始化操作。

本申请实施例可基于已优化的数据表征载体抽取算法的算法参量对待优化的原始数据表征载体抽取算法的算法参量进行初始化，将已优化的数据表征载体抽取算法的算法参量确定为待优化的原始数据表征载体抽取算法的初始化算法参量。已优化数据表征载体为基于已优化的数据表征载体抽取算法抽取获得的示例互联网数据的数据表征载体，待优化数据表征载体为基于待优化的原始数据表征载体抽取算法进行数据表征载体抽取获得的示例互联网数据的数据表征载体，数据表征载体表征互联网数据的特征信息。

比如，将目标示例互联网数据集中的各示例互联网数据输入已优化的数据表征载体抽取算法，以执行数据表征载体抽取，获得目标示例互联网数据集中每个示例互联网数据对应的已优化数据表征载体，将目标示例互联网数据集中的各示例互联网数据输入待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得目标示例互联网数据集中每个示例互联网数据对应的待优化数据表征载体。可选地，已优化的数据表征载体抽取算法是参数克隆过程（Transfer Learning，或称迁移学习）中的克隆前算法（FA），即教师模型；待优化的原始数据表征载体抽取算法为参数克隆中的克隆后算法（BA），即学生模型。

操作130，确定各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列。

已优化关联评分序列中包括各已优化关联评分，已优化关联评分代表两个不同示例互联网数据的已优化数据表征载体间的近似度，确定目标示例互联网数据集中每两个示例互联网数据对应的已优化数据表征载体之间的关联评分。

待优化关联评分序列包括各个待优化关联评分，待优化关联评分指示两个不同示例互联网数据对应的待优化数据表征载体之间的近似度。对于目标示例互联网数据集中的每一示例互联网数据，确定目标示例互联网数据与目标示例互联网数据集中每一示例互联网数据间的近似度。基于已优化数据表征载体确定获得已优化关联评分获得已优化关联评分序列，已优化关联评分序列代表已优化的数据表征载体抽取算法进行数据表征载体抽取获得的目标示例互联网数据集的数据表征载体空间。

基于待优化数据表征载体确定获得待优化关联评分，获得待优化关联评分序列，待优化关联评分序列表征待优化的原始数据表征载体抽取算法进行数据表征载体抽取获得的目标示例互联网数据集的数据表征载体域。

操作140，确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，以及依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，目标数据表征载体抽取算法Algorithm1用于抽取互联网数据的数据表征载体，依据互联网数据的数据表征载体进行数据备份优先级确定，以便依据数据备份优先级确定互联网数据的备份顺序，进行互联网数据的按序备份。

偏差结果也即待优化关联评分序列与已优化关联评分序列的偏差情况。举例来说，可以确定待优化关联评分序列中每个待优化关联评分与已优化关联评分序列中对应的已优化关联评分间的偏差，对全部偏差结果求和得到偏差结果。然后基于偏差结果依据梯度优化调节待优化的原始数据表征载体抽取算法的算法参量，得到调节好的待优化互联网数据表征载体抽取算法。然后将调节好的待优化互联网数据表征载体抽取算法确定为待优化的原始数据表征载体抽取算法，以及获取下一轮目标示例互联网数据集，迭代执行，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，完成预先设置的示例互联网数据库中全部的示例互联网数据的操作就完成一轮，设定条件可以是优化的次数满足最大次数、偏差结果小于预设值等。

目标数据表征载体抽取算法Algorithm1为将待优化的原始数据表征载体抽取算法优化后获得的算法，目标数据表征载体抽取算法Algorithm1用于抽取互联网数据的数据表征载体，依据互联网数据的数据表征载体进行数据备份优先级确定，数据备份优先级确定的过程可以参照现有技术。目标数据表征载体抽取算法Algorithm1依据互联网数据的数据表征载体可以进行数据备份优先级确定。

本申请实施例提供的应用于人工智能的互联网数据容灾备份方法将目标示例互联网数据集中的各示例互联网数据分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得各示例互联网数据对应的已优化数据表征载体和各示例互联网数据对应的待优化数据表征载体，再确定各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列，再确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，以及依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，通过目标数据表征载体抽取算法Algorithm1进行数据备份优先级确定，拓展已优化的数据表征载体抽取算法对应的表征载体空间，将获得的表征载体空间克隆到原始数据表征载体抽取算法，获得优化好的目标数据表征载体抽取算法Algorithm1，不用额外的数据示例和标记来进行算法的调校，便于增加算法的优化效率，有利于快速挖掘数据备份优先级。

其中，操作130中确定各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列的过程包括：

操作131，依据各示例互联网数据对应的已优化数据表征载体获得已优化数据载体张量，以及将已优化数据载体张量进行正规化，获得已优化正规化张量。

本申请实施例中，已优化数据载体张量是张量，例如二阶张量（矩阵），其包括各已优化数据表征载体的数据表征载体。其中，基于各示例互联网数据对应的已优化数据表征载体生成已优化数据载体张量，然后将已优化数据载体张量进行正规化，将数据表征载体中的每个单元与数据表征载体的欧式范数相除得到已优化正规化张量。

操作132，确定已优化正规化张量对应的维度调换张量，获得已优化维度调换张量，通过已优化维度调换张量与已优化正规化张量的获得已优化关联评分序列。

本申请实施例中，以已优化数据载体张量的阶数至少为2，即至少为矩阵，将已优化正规化张量进行维度调换，完成张量转置，得到已优化维度调换张量，将已优化维度调换张量与已优化正规化张量相乘，获得已优化数据表征载体和其他各已优化数据表征载体的关联评分，使每个已优化数据表征载体进行上述操作，得到已优化关联评分序列。

作为一种实施方式，确定已优化维度调换张量与已优化正规化张量对应的已优化关联评分序列可以是确定已优化维度调换张量与已优化正规化张量对应的距离以得到已优化关联评分序列。

作为一种实施方式，确定各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列，包括：

操作133，依据各示例互联网数据对应的待优化数据表征载体获得待优化数据载体张量，以及将待优化数据载体张量进行正规化，获得待优化正规化张量。

操作134，确定待优化正规化张量对应的维度调换张量，获得待优化维度调换张量，通过待优化维度调换张量与待优化正规化张量获得待优化关联评分序列。

通过维度调换获得维度调换张量，然后确定正规化张量和维度调换张量的矩阵乘以获得关联评分，可以增加获得关联评分的速度。

作为一种实施方式，确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，以及依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，包括：

操作141，确定待优化关联评分序列与已优化关联评分序列的个体离散系数，获得原始收敛评估系数，将原始收敛评估系数确定为偏差结果。

操作142，依据偏差结果调节原始数据表征载体抽取算法的算法参量，得到调节好的数据表征载体抽取算法。

本申请实施例通过偏差结果获取偏导向量，反向传递至原始数据表征载体抽取算法，进行原始数据表征载体抽取算法的算法参量的迭代更新，得到调节好的数据表征载体抽取算法。个体离散系数表征待优化关联评分序列与已优化关联评分序列中个体的离散程度，其可以通过计算标准差得到，收敛评估系数用以表征损失，在其他表达中，还可以称之为代价、误差。

操作143，将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复。

操作141中确定待优化关联评分序列与已优化关联评分序列的个体离散系数，获得偏差结果，包括：

操作1411，确定待优化关联评分序列与已优化关联评分序列的个体离散系数，获得原始收敛评估系数。

在实际应用中，可以确定待优化关联评分序列中待优化关联评分与已优化关联评分序列中已优化关联评分的L2距离来得到原始收敛评估系数。

操作1412，获取目标示例互联网数据集对应的示例互联网数据的总数，确定原始收敛评估系数与示例互联网数据的总数的分数值以获得收敛评估平均系数。

操作1413，获取预先设置的权重因子，依据权重因子对收敛评估平均系数进行加权，获得加权收敛评估系数。

权重因子为预先设置的制衡参数克隆偏差与优先级确定偏差的权重信息的算法参量，基于权重因子对收敛评估平均系数加权，即得到加权收敛评估系数。

操作1414，获取待优化的原始数据表征载体抽取算法对应的数据备份优先级偏差，以及确定数据备份优先级偏差和加权收敛评估系数的求和结果，获得偏差结果。

数据备份优先级偏差是待优化的原始数据表征载体抽取算法在进行数据表征载体抽取后进行数据备份优先级确定的偏差。

具体而言，获得待优化的原始数据表征载体抽取算法对应的数据备份优先级偏差，获取优先级标记和待优化原始数据表征载体抽取算法基于示例互联网数据对应的待优化数据表征载体进行数据备份优先级确定，获得原始确定信息，再确定原始确定信息与优先级标记之间的偏差，获得数据备份优先级偏差。

数据备份优先级偏差是获取交叉熵得到的，再确定数据备份优先级偏差和加权收敛评估系数的求和结果，获得偏差结果。这样，通过确定个体离散系数来获得原始收敛评估系数，在依据权重因子进行调节后，与数据备份优先级偏差确定求和以获得偏差结果，得到准确的偏差结果。

作为一种实施方式，确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，以及依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，包括：

操作210，将待优化关联评分序列输入原始投影算法进行载体投影，获得目标载体投影序列。

原始投影算法为进行算法参量初始化的投影算法，投影算法将待优化关联评分序列执行映射来降低数据指代的偏误，投影算法为神经网络算法，目标载体投影序列为变换映射后获得的序列。例如将待优化关联评分序列中每个待优化关联评分均输入原始投影算法进行载体投影，获得原始投影算法输出的目标载体投影序列。

操作220，确定目标载体投影序列与已优化关联评分序列之间的个体离散系数，获得目标偏差结果，依据目标偏差结果调节原始投影算法和原始数据表征载体抽取算法，得到调节好的投影算法和调节好的数据表征载体抽取算法。

操作230，将调节好的投影算法确定为原始投影算法，以及将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，依据优化好的原始数据表征载体抽取算法和优化好的原始投影算法获得目标数据表征载体抽取算法Algorithm2。

具体而言，依据目标载体投影序列与已优化关联评分确定平均偏差，获得目标偏差结果，然后基于目标偏差结果进行调节原始投影算法的算法参量和原始数据表征载体抽取算法的算法参量，得到调节好的投影算法和调节好的数据表征载体抽取算法，再将调节好的投影算法确定为原始投影算法，将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，依据优化好的原始数据表征载体抽取算法和优化好的原始投影算法获得目标数据表征载体抽取算法Algorithm2。

目标数据表征载体抽取算法Algorithm2包括优化好的原始数据表征载体抽取算法和优化好的投影算法，采取在原始数据表征载体抽取算法嵌入原始投影算法对原始数据表征载体抽取算法和原始投影算法一起进行优化，得到目标数据表征载体抽取算法Algorithm2，基于目标数据表征载体抽取算法Algorithm2可令数据表征载体抽取的准确性更好。

作为一种实施方式，确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，以及依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，包括：将待优化关联评分序列和已优化关联评分序列输入原始关联分析算法中、进行分析，获得关联评分分析结果，依据关联评分分析结果迭代原始关联分析算法和原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm3。

优化原始数据表征载体抽取算法的过程中，采取对抗训练来优化获得数据表征载体抽取算法，原始数据表征载体抽取算法用来产生示例互联网数据的数据表征载体，原始关联分析算法用于分析输入的数据表征载体是已优化互联网数据表征载体抽取算法抽取的数据表征载体，还是原始数据表征载体抽取算法抽取得到的数据表征载体。将已优化互联网数据表征载体抽取算法抽取的数据表征载体认为是真值，将待优化的原始数据表征载体抽取算法抽取的数据表征载体认为是假值，优化原始数据表征载体抽取算法，让已优化互联网数据表征载体抽取算法抽取的数据表征载体和原始数据表征载体抽取算法抽取的数据表征载体更具有一致性，妨碍关联分析算法的分析过程，优化关联分析算法将真值和假值数据表征载体进行对抗。

优化完成的时候，优化得到的原始数据表征载体抽取算法抽取获得的数据表征载体空间和已优化互联网数据表征载体抽取算法抽取获得的数据表征载体空间更具有一致性，关联分析算法能更好进行辨认。

具体而言，将待优化关联评分序列和已优化关联评分序列输入原始关联分析算法中进行分析，获得关联评分分析结果，关联评分分析结果为原始关联分析算法分析获得的输入的关联评分为真值数据表征载体对应的关联评分还是假值数据表征载体对应的关联评分。基于输入的关联评分真实的数据表征载体与关联评分分析结果进行偏差计算，基于偏差依据梯度优化调节原始关联分析算法和原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm3。

通过以上过程，采取增加原始关联分析算法进行对抗，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm3，优化获得的目标数据表征载体抽取算法Algorithm2具有更好的准确性。

作为一种实施方式，目标示例互联网数据集包括多个多分类数据子集，一个多分类数据子集中包含多个示例互联网数据，本申请实施例提供的应用于人工智能的互联网数据容灾备份方法还包括：

操作310，将多个多分类数据子集分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得多个多分类数据子集对应的已优化子集表征载体和多个多分类数据子集对应的待优化子集表征载体。

目标示例互联网数据集中包括多个多分类数据子集，多分类数据子集中包含三个示例互联网数据，其中的两个示例互联网数据是一类互联网数据，剩下的示例互联网数据是另一类的互联网数据，同一类互联网数据组成真值互联网数据对，同一类互联网数据中的一个互联网数据和另一类互联网数据组建得到假值互联网数据对。

子集表征载体为多分类数据子集中每个示例互联网数据进行数据表征载体抽取后获得每个表征载体构建得到的子集表征载体，即将每个示例互联网数据的的数据表征载体进行组合获得子集表征载体，已优化子集表征载体为已优化的数据表征载体抽取算法对多分类数据子集进行数据表征载体抽取获得的表征载体。待优化子集表征载体为待优化的原始数据表征载体抽取算法对多分类数据子集进行数据表征载体抽取获得的表征载体。比如将每个多分类数据子集输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得多个多分类数据子集对应的已优化子集表征载体，将每个多分类数据子集输入待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得多个多分类数据子集对应的待优化子集表征载体。

操作320，依据已优化子集表征载体和待优化子集表征载体确定子集偏差结果，获得原始子集偏差结果，依据原始子集偏差结果调节原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm4。

原始子集偏差结果可体现已优化子集表征载体和待优化子集表征载体对应的偏差，比如基于已优化子集表征载体确定子集偏差结果得到已优化子集偏差结果，基于待优化多分类数据子集确定子集偏差结果，获得待优化子集偏差结果，然后确定已优化子集偏差结果与待优化子集偏差结果间的偏差结果，得到原始子集偏差结果。

然后依据原始子集偏差结果通过梯度优化调节原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm4。

本申请通过将多个多分类数据子集分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得多个多分类数据子集对应的已优化子集表征载体和多个多分类数据子集对应的待优化子集表征载体，依据已优化子集表征载体和待优化子集表征载体确定子集偏差结果，获得原始子集偏差结果，依据原始子集偏差结果调节原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm4，增加获得的数据表征载体抽取算法的准确度。

作为一种实施方式，在确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，以及依据偏差结果优化待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1之后，本申请实施例提供的方法还包括：

操作410，获取互联网数据，将互联网数据输入目标数据表征载体抽取算法Algorithm1，以执行数据表征载体抽取，获得目标数据表征载体。

互联网数据为待进行备份优先级确定的互联网数据，目标数据表征载体为互联网数据对应的数据表征载体。

操作420，获取优先级数据库对应的数据优先级表征载体，确定目标数据表征载体与数据优先级表征载体的关联评分。

操作430，依据关联评分确定互联网数据对应的数据备份优先级确定结果。

优先级数据库中包括已分析互联网数据和对应的数据优先级表征载体，数据优先级表征载体为已分析互联网数据对应的数据优先级表征载体。本申请通过事先部署优先级数据库，优先级数据库包括已分析互联网数据对应的数据优先级表征载体。获取优先级数据库中的数据优先级表征载体，确定目标数据表征载体与数据优先级表征载体的关联评分，若关联评分大于关联评分阈值，则互联网数据中包含对应的目标优先级数据，如重要行为数据，如在固定的多个时间连续多次购买某一类型的商品的记录数据，需要优先备份，以进行及时分析来响应同类产品的同期推送。那么，互联网数据对应的数据备份优先级确定结果为识别到目标备份优先级，本申请实施例中，可以设置不同的关联评分阈值，来进行不同备份优先级地划分，具体数值选择根据实际情况而定。若目标数据表征载体与优先级数据库中每个数据优先级表征载体的关联评分小于关联评分阈值，则互联网数据中没有对应的优先级互联网数据，互联网数据对应的数据备份优先级确定结果为没有确定到对应备份优先级。

采用目标数据表征载体抽取算法Algorithm1对互联网数据进行数据表征载体抽取，获得目标数据表征载体，然后将目标数据表征载体与优先级数据库中的各已分析互联网数据进行关联评分确定，依据关联评分确定互联网数据对应的数据备份优先级确定结果，获得数据备份优先级确定结果的速度更快。

一个实施方案里，对数据表征载体抽取算法的优化，例如是采取参数克隆完成前后算法的参数迁移学习，将示例互联网数据库输入同为数据表征载体抽取算法的FA、BA，经过FA得到每个示例互联网数据的数据表征载体，即得到各FA表征载体，然后获取FA表征载体间的关联评分，获得FA关联评分张量，经过BA得到每个示例互联网数据的数据表征载体，得到各BA表征载体，然后确定BA表征载体间的关联评分，获得BA关联评分张量，基于代价算法确定FA关联评分张量和BA关联评分张量的偏差，基于该偏差迭代BA，将优化好的BA确定为得到的数据表征载体抽取算法。

另一实施方案中，本申请实施例提供的方法还可以包括：

操作510，获取待处理互联网数据和过往互联网数据集。

过往互联网数据集包括多个过往判断过的互联网数据，过往判断过的互联网数据为依据已优化的数据表征载体抽取算法进行判断，待处理互联网数据为待进行判断的互联网数据，可以是过往互联网数据集中的互联网数据，对已优化的数据表征载体抽取算法进行迭代后还要对已判断的互联网数据重新进行判断。

操作520，将待处理互联网数据和过往互联网数据集输入已优化的数据表征载体抽取算法，以执行数据表征载体抽取，获得待处理互联网数据对应的待处理数据表征载体和过往互联网数据集对应的过往数据表征载体序列，以及确定待处理数据表征载体和过往数据表征载体序列的关联评分，获得第一关联评分序列。

已优化的数据表征载体抽取算法为基于过往示例互联网数据优化获得的数据表征载体抽取算法，第一关联评分序列包括多个第一关联评分，第一关联评分表征待处理数据表征载体与过往数据表征载体序列中已分析数据表征载体的关联评分，待处理数据表征载体为待处理互联网数据对应的数据表征载体，过往数据表征载体序列包括多个已分析互联网数据对应的数据表征载体。如基于已优化的数据表征载体抽取算法将待处理互联网数据和过往互联网数据集分别输入已优化的数据表征载体抽取算法，以执行数据表征载体抽取，获得待处理互联网数据对应的待处理数据表征载体和过往互联网数据集对应的过往数据表征载体序列，然后确定待处理数据表征载体与过往数据表征载体序列中的各过往数据表征载体的关联评分，获得第一关联评分序列。

操作530，将待处理互联网数据和过往互联网数据集输入目标数据表征载体抽取算法，以执行数据表征载体抽取，获得待处理互联网数据对应的待处理目标数据表征载体和过往互联网数据集对应的过往目标数据表征载体序列，以及确定待处理目标数据表征载体与过往目标数据表征载体序列的关联评分，获得第二关联评分序列，目标数据表征载体抽取算法为基于已优化的数据表征载体抽取算法进行参数克隆优化获得的。

目标数据表征载体抽取算法是依据已优化的数据表征载体抽取算法进行参数克隆优化获得的，待处理目标数据表征载体为依据目标数据表征载体抽取算法抽取得到的待处理互联网数据对应的数据表征载体，过往目标数据表征载体序列包括各已分析互联网数据依据目标数据表征载体抽取算法抽取获得的数据表征载体，第二关联评分序列包括各第二关联评分，第二关联评分是待处理目标数据表征载体与过往目标数据表征载体序列中已分析目标数据表征载体的关联评分。具体而言，基于目标数据表征载体抽取算法将待处理互联网数据和过往互联网数据集分别输入目标数据表征载体抽取算法，以执行数据表征载体抽取，获得待处理互联网数据对应的待处理目标数据表征载体和过往互联网数据集对应的过往目标数据表征载体序列，然后确定待处理目标数据表征载体与过往目标数据表征载体序列中的各已分析目标表征载体的关联评分，获得第二关联评分序列。

操作540，依据第一关联评分序列和第二关联评分序列进行判断，获得待处理互联网数据对应的判断结果，依据待处理互联网数据对应的判断结果确定待处理互联网数据对应的验证信息。

判断结果是指待处理互联网数据与过往互联网数据集的关联评分，验证信息指示待处理互联网数据的判断结果，例如一致、不一致，比如，依据第一关联评分序列和第二关联评分序列获取偏差信息，通过偏差信息得到判断值，在判断值大于判断阈值时确定待处理互联网数据的判断结果为一致，依据待处理互联网数据对应的待处理目标数据表征载体取代过往互联网数据集内相同互联网数据对应的过往数据表征载体。

本申请实施例采取获取待处理互联网数据和过往互联网数据集，将待处理互联网数据和过往互联网数据集输入已优化的数据表征载体抽取算法和目标数据表征载体抽取算法进行判断，其中目标数据表征载体抽取算法依据已优化的数据表征载体抽取算法进行参数克隆优化得到，则可增加待处理互联网数据的判断效率，依据目标数据表征载体抽取算法和已优化的数据表征载体抽取算法对待处理互联网数据和过往互联网数据集进行数据表征载体抽取，得到第一关联评分序列和第二关联评分序列，然后依据第一关联评分序列和第二关联评分序列进行判断确定待处理互联网数据对应的验证信息，使得验证信息分析的准确性增加。

作为一种实施方式，确定待处理数据表征载体和过往数据表征载体序列的关联评分，获得第一关联评分序列，包括：将待处理数据表征载体进行正规化，获得正规化待处理数据表征载体，以及将过往数据表征载体序列进行正规化，获得正规化过往数据表征载体序列，将正规化过往数据表征载体序列进行维度调换，获得过往维度调换张量，通过正规化过往数据表征载体序列与过往维度调换张量的相乘结果获得第一关联评分序列。

正规化待处理数据表征载体为正规化后的待处理数据表征载体，正规化过往数据表征载体序列为正规化后的过往数据表征载体序列，过往维度调换张量为将正规化过往数据表征载体序列进行维度调换完成转置的维度调换张量。

确定待处理目标数据表征载体与过往目标数据表征载体序列的关联评分，获得第二关联评分序列，包括：将待处理目标数据表征载体进行正规化，获得正规化待处理目标数据表征载体，以及将过往目标数据表征载体序列进行正规化，获得正规化过往目标数据表征载体序列；将正规化过往目标数据表征载体序列进行维度调换，获得过往目标维度调换张量，通过正规化过往目标数据表征载体序列与过往目标维度调换张量获得第二关联评分序列。

作为一种实施方案，依据第一关联评分序列和第二关联评分序列进行判断，获得待处理互联网数据对应的判断结果，依据待处理互联网数据对应的判断结果确定待处理互联网数据对应的验证信息，包括：

操作610，确定第一关联评分序列和第二关联评分序列之间的个体离散系数，获得目标收敛评估系数。

操作620，确定待处理互联网数据和过往互联网数据集对应的总数，确定目标收敛评估系数与总数的分数值，依据分数值确定待处理互联网数据对应的判断结果。

具体而言，依据个体离散系数算法确定第一关联评分序列和第二关联评分序列的偏差，得到目标收敛评估系数，目标收敛评估系数体现了第一关联评分序列和第二关联评分序列之间的关联评分偏差，然后确定待处理互联网数据和过往互联网数据集对应的总数，确定过往互联网数据集中已分析互联网数据的数量，与待处理互联网数据的数量相加得到总数，将目标收敛评估系数与总数进行分数计算得到分数值，依据分数值确定待处理互联网数据对应的判断结果。判断结果体现待处理互联网数据在已优化的数据表征载体抽取算法的数据表征载体空间中，对应目标数据表征载体抽取算法的数据表征载体空间的散步的变化情况。

操作630，若判断结果大于预设值，判断待处理互联网数据是近似的。

判断结果中表示待处理互联网数据的数据表征载体可以取代过往互联网数据集中相同互联网数据，在一个具体的应用中，依据获取待处理互联网数据和参考互联网数据序列，参考互联网数据序列作为待处理互联网数据进行判断的锚，待处理互联网数据为依据数据表征载体抽取FA进行判断过的互联网数据，在优化获得数据表征载体抽取BA时，要对互联网数据然后次进行重新判断，将待处理互联网数据和参考互联网数据序列输入数据表征载体抽取FA进行数据表征载体抽取，获得待处理互联网数据的数据表征载体和参考互联网数据序列的数据表征载体数组，然后确定数据表征载体与数据表征载体数组的关联评分，获得FA关联评分张量，将待处理互联网数据和参考互联网数据序列输入数据表征载体抽取BA进行数据表征载体抽取，获得待处理互联网数据的数据表征载体和参考互联网数据序列的数据表征载体数组，再确定数据表征载体与数据表征载体数组的关联评分，获得BA关联评分张量。

依据FA关联评分张量和BA关联评分张量确定获得待处理互联网数据对应的判断结果，判断结果表明待处理互联网数据在BA数据表征载体空间中对比于FA数据表征载体空间散布的变化情况。若判断结果大于预设判断结果，认为待处理互联网数据是近似的，依据待处理互联网数据去迭代已分析互联网数据集合。

本申请实施例的一个示例中，将有参考性的代表数据保存在互联网数据集合，用于和互联网数据适配，以确定数据备份优先级。数据表征载体抽取FA运行到一定次数后需进行迭代，此时设置原始数据表征载体抽取BA，依据数据表征载体抽取FA和数据表征载体抽取BA进行参数克隆，如获取目标示例互联网数据集，目标示例互联网数据集是在预先设置的示例互联网数据库中获取的，将目标示例互联网数据集中的各示例互联网数据分别输入数据表征载体抽取FA和基础数据表征载体抽取BA，以执行数据表征载体抽取，得到各个示例互联网数据对应的已优化数据表征载体和各示例互联网数据对应的待优化数据表征载体。然后，确定各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定各示例互联网数据对应的待优化数据表征载体间的关联评分，获得待优化关联评分序列。确定待优化关联评分序列与已优化关联评分序列之间的偏差结果，并依据偏差结果优化基础数据表征载体抽取BA，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的基础数据表征载体抽取BA确定为目标数据表征载体抽取BA。最后依据目标数据表征载体抽取BA对备份优先级互联网数据集合中的互联网数据进行过滤，迭代时，将判断结果大于预设值的互联网数据进行保存。

基于前述的实施例，本申请实施例提供一种数据备份装置，该装置所包括的各单元、以及各单元所包括的各模块，可以通过计算机设备中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为中央处理器(Central ProcessingUnit，CPU)、微处理器(Microprocessor Unit，MPU)、数字信号处理器(Digital SignalProcessor，DSP)或现场可编程门阵列(Field Programmable Gate Array，FPGA)等。

图2为本申请实施例提供的一种数据备份装置的组成结构示意图，如图2所示，数据备份装置200包括：

数据获取模块210，用于获取目标示例互联网数据集，所述目标示例互联网数据集通过在预先设置的示例互联网数据库中选取得到；

载体抽取模块220，用于将所述目标示例互联网数据集中的各示例互联网数据分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得所述各示例互联网数据对应的已优化数据表征载体和所述各示例互联网数据对应的待优化数据表征载体，其中，所述原始数据表征载体抽取算法通过将所述已优化的数据表征载体抽取算法的算法参量进行权重设定得到；

评分获取模块230，用于确定所述各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定所述各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列；

算法优化模块240，用于确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，所述目标数据表征载体抽取算法Algorithm1用于抽取互联网数据的数据表征载体，依据所述互联网数据的数据表征载体进行数据备份优先级确定，以便依据所述数据备份优先级确定互联网数据的备份顺序，进行互联网数据的按序备份。

以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。在一些实施例中，本申请实施例提供的装置具有的功能或包含的模块可以用于执行上述方法实施例描述的方法，对于本申请装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

需要说明的是，本申请实施例中，如果以软件功能模块的形式实现上述的应用于人工智能的互联网数据容灾备份方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件、软件或固件，或者硬件、软件、固件三者之间的任意结合。

本申请实施例提供一种AI决策容灾备份服务器，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法中的部分或全部步骤。

本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。所述计算机可读存储介质可以是瞬时性的，也可以是非瞬时性的。

本申请实施例提供一种计算机程序，包括计算机可读代码，在所述计算机可读代码在计算机设备中运行的情况下，所述计算机设备中的处理器执行用于实现上述方法中的部分或全部步骤。

本申请实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序被计算机读取并执行时，实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一些实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

这里需要指出的是：上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考。以上设备、存储介质、计算机程序及计算机程序产品实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请设备、存储介质、计算机程序及计算机程序产品实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

图3为本申请实施例提供的一种AI决策容灾备份服务器的硬件实体示意图，如图3所示，该AI决策容灾备份服务器1000的硬件实体包括：处理器1001和存储器1002，其中，存储器1002存储有可在处理器1001上运行的计算机程序，处理器1001执行程序时实现上述任一实施例的方法中的步骤。

存储器1002存储有可在处理器上运行的计算机程序，存储器1002配置为存储由处理器1001可执行的指令和应用，还可以缓存待处理器1001以及模型训练设备1000中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random Access Memory，RAM)实现。

处理器1001执行程序时实现上述任一项的模型训练方法的步骤。处理器1001通常控制模型训练设备1000的总体操作。

本申请实施例提供一种计算机存储介质，计算机存储介质存储有一个或者多个程序，该一个或者多个程序可被一个或者多个处理器执行，以实现如上任一实施例的模型训练方法的步骤。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各步骤/过程的序号的大小并不意味着执行顺序的先后，各步骤/过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。。

Claims

1.一种应用于人工智能的互联网数据容灾备份方法，其特征在于，应用于AI决策容灾备份服务器，所述方法包括：

获取目标示例互联网数据集，所述目标示例互联网数据集通过在预先设置的示例互联网数据库中选取得到，所述目标示例互联网数据集为文本化的数据；

将所述目标示例互联网数据集中的各示例互联网数据分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得所述各示例互联网数据对应的已优化数据表征载体和所述各示例互联网数据对应的待优化数据表征载体，其中，所述原始数据表征载体抽取算法通过将所述已优化的数据表征载体抽取算法的算法参量进行权重设定得到；

确定所述各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，以及确定所述各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列；

确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，所述目标数据表征载体抽取算法Algorithm1用于抽取互联网数据的数据表征载体，依据所述互联网数据的数据表征载体进行数据备份优先级确定，以便依据所述数据备份优先级确定互联网数据的备份顺序，进行互联网数据的按序备份。

2.如权利要求1所述的方法，其特征在于，所述确定所述各示例互联网数据对应的已优化数据表征载体之间的关联评分，获得已优化关联评分序列，包括：

依据所述各示例互联网数据对应的已优化数据表征载体获得已优化数据载体张量，以及将所述已优化数据载体张量进行正规化，获得已优化正规化张量；

确定所述已优化正规化张量对应的维度调换张量，获得已优化维度调换张量；

通过所述已优化维度调换张量与所述已优化正规化张量的获得所述已优化关联评分序列；

所述确定所述各示例互联网数据对应的待优化数据表征载体之间的关联评分，获得待优化关联评分序列，包括：

依据所述各示例互联网数据对应的待优化数据表征载体获得待优化数据载体张量，以及将所述待优化数据载体张量进行正规化，获得待优化正规化张量；

确定所述待优化正规化张量对应的维度调换张量，获得待优化维度调换张量；

通过所述待优化维度调换张量与所述待优化正规化张量获得所述待优化关联评分序列。

3.如权利要求1所述的方法，其特征在于，所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，包括：

确定所述待优化关联评分序列与所述已优化关联评分序列的个体离散系数，获得原始收敛评估系数，将所述原始收敛评估系数确定为所述偏差结果；

依据所述偏差结果调节所述原始数据表征载体抽取算法的算法参量，得到调节好的数据表征载体抽取算法；

将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复；

所述确定所述待优化关联评分序列与所述已优化关联评分序列的个体离散系数，获得所述偏差结果，包括：

确定所述待优化关联评分序列与所述已优化关联评分序列的个体离散系数，获得原始收敛评估系数；

获取目标示例互联网数据集对应的示例互联网数据的总数，确定所述原始收敛评估系数与所述示例互联网数据的总数的分数值，得到收敛评估平均系数；

获取预先设置的权重因子，依据所述权重因子对所述收敛评估平均系数进行加权，获得加权收敛评估系数；

获取所述待优化的原始数据表征载体抽取算法对应的数据备份优先级偏差，以及确定所述数据备份优先级偏差和所述加权收敛评估系数的求和结果，获得所述偏差结果。

4.如权利要求1所述的方法，其特征在于，所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，包括：

将所述待优化关联评分序列输入原始投影算法进行载体投影，获得目标载体投影序列；

确定所述目标载体投影序列与所述已优化关联评分序列之间的个体离散系数，获得目标偏差结果，依据所述目标偏差结果调节所述原始投影算法和所述原始数据表征载体抽取算法，得到调节好的投影算法和调节好的数据表征载体抽取算法；

将所述调节好的投影算法确定为原始投影算法，以及将调节好的数据表征载体抽取算法确定为原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，依据优化好的原始数据表征载体抽取算法和优化好的原始投影算法获得目标数据表征载体抽取算法Algorithm2；

所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1，包括：

将所述待优化关联评分序列和所述已优化关联评分序列输入原始关联分析算法中进行分析，获得关联评分分析结果；

依据所述关联评分分析结果迭代所述原始关联分析算法和所述原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm3。

5.如权利要求1所述的方法，其特征在于，所述目标示例互联网数据集中包括多个多分类数据子集，所述方法还包括：

将所述多个多分类数据子集分别输入已优化的数据表征载体抽取算法和待优化的原始数据表征载体抽取算法，以执行数据表征载体抽取，获得所述多个多分类数据子集对应的已优化子集表征载体和所述多个多分类数据子集对应的待优化子集表征载体；

依据所述已优化子集表征载体和所述待优化子集表征载体确定子集偏差结果，获得原始子集偏差结果，依据所述原始子集偏差结果调节所述原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm4。

6.如权利要求1所述的方法，其特征在于，在所述确定所述待优化关联评分序列与所述已优化关联评分序列之间的偏差结果，以及依据所述偏差结果优化所述待优化的原始数据表征载体抽取算法，回到获取目标示例互联网数据集的操作进行重复，在满足设定条件时停止，将优化好的原始数据表征载体抽取算法确定为目标数据表征载体抽取算法Algorithm1之后，所述方法还包括：

获取互联网数据，将所述互联网数据输入所述目标数据表征载体抽取算法Algorithm1，以执行数据表征载体抽取，获得目标数据表征载体；

获取优先级数据库对应的数据优先级表征载体，确定所述目标数据表征载体与所述数据优先级表征载体的关联评分；

依据所述关联评分确定所述互联网数据对应的数据备份优先级确定结果。

7.如权利要求1所述的方法，其特征在于，所述方法还包括：

获取待处理互联网数据和过往互联网数据集；

将所述待处理互联网数据和所述过往互联网数据集输入已优化的数据表征载体抽取算法，以执行数据表征载体抽取，获得所述待处理互联网数据对应的待处理数据表征载体和所述过往互联网数据集对应的过往数据表征载体序列，以及确定所述待处理数据表征载体和所述过往数据表征载体序列的关联评分，获得第一关联评分序列；

将所述待处理互联网数据和所述过往互联网数据集输入目标数据表征载体抽取算法，以执行数据表征载体抽取，获得所述待处理互联网数据对应的待处理目标数据表征载体和所述过往互联网数据集对应的过往目标数据表征载体序列，以及确定所述待处理目标数据表征载体与所述过往目标数据表征载体序列的关联评分，获得第二关联评分序列，所述目标数据表征载体抽取算法为基于已优化的数据表征载体抽取算法进行参数克隆优化获得；

依据所述第一关联评分序列和所述第二关联评分序列进行判断，获得所述待处理互联网数据对应的判断结果，依据所述待处理互联网数据对应的判断结果确定所述待处理互联网数据对应的验证信息。

8.如权利要求7所述的方法，其特征在于，所述确定所述待处理数据表征载体和所述过往数据表征载体序列的关联评分，获得第一关联评分序列，包括：

将所述待处理数据表征载体进行正规化，获得正规化待处理数据表征载体，以及将所述过往数据表征载体序列进行正规化，获得正规化过往数据表征载体序列；

将所述正规化过往数据表征载体序列进行维度调换，获得过往维度调换张量，通过所述正规化过往数据表征载体序列与所述过往维度调换张量的相乘结果获得所述第一关联评分序列；

所述确定所述待处理目标数据表征载体与所述过往目标数据表征载体序列的关联评分，获得第二关联评分序列，包括：

将所述待处理目标数据表征载体进行正规化，获得正规化待处理目标数据表征载体，以及将所述过往目标数据表征载体序列进行正规化，获得正规化过往目标数据表征载体序列；

将所述正规化过往目标数据表征载体序列进行维度调换，获得过往目标维度调换张量，通过所述正规化过往目标数据表征载体序列与所述过往目标维度调换张量获得所述第二关联评分序列；

所述依据所述第一关联评分序列和所述第二关联评分序列进行判断，获得所述待处理互联网数据对应的判断结果，依据所述待处理互联网数据对应的判断结果确定所述待处理互联网数据对应的验证信息，包括：

确定所述第一关联评分序列和所述第二关联评分序列之间的个体离散系数，获得目标收敛评估系数；

确定所述待处理互联网数据和所述过往互联网数据集对应的总数，确定所述目标收敛评估系数与所述总数的分数值，依据所述分数值确定所述待处理互联网数据对应的判断结果；

若所述判断结果大于预设值，判断所述待处理互联网数据是近似的。

9.一种AI决策容灾备份服务器，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至8任一项所述方法中的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至8任一项所述方法中的步骤。