CN115374185A - 应用于数据管理仓库的容灾方法及系统 - Google Patents

应用于数据管理仓库的容灾方法及系统 Download PDF

Info

Publication number
CN115374185A
CN115374185A CN202211200445.5A CN202211200445A CN115374185A CN 115374185 A CN115374185 A CN 115374185A CN 202211200445 A CN202211200445 A CN 202211200445A CN 115374185 A CN115374185 A CN 115374185A
Authority
CN
China
Prior art keywords
disaster
digital service
big data
disaster tolerance
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211200445.5A
Other languages
English (en)
Inventor
罗师红
任彦龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202211200445.5A priority Critical patent/CN115374185A/zh
Publication of CN115374185A publication Critical patent/CN115374185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的应用于数据管理仓库的容灾方法及系统,首先利用设定机器学习算法确定待容灾数字化业务大数据的当前联动描述向量,并结合所述当前联动描述向量确定参考数字化业务大数据,然后依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。在确定待容灾数字化业务大数据的当前联动描述向量时,可以结合设定机器学习算法的不同子模型确定不同的特征,进而通过不同的特征得到抗干扰性强和扩展能力佳的当前联动描述向量,这样可快速精准地确定出参考数字化业务大数据,从而依据参考数字化业务大数据的容灾处理记录指导待容灾数字化业务大数据的容灾处理,提高待容灾数字化业务大数据的容灾处理效率和可靠性。

Description

应用于数据管理仓库的容灾方法及系统
技术领域
本发明涉及数据容灾技术领域,特别涉及一种应用于数据管理仓库的容灾方法及系统。
背景技术
当今时代正在跨入信息时代,数据和信息逐渐成为各行各业的业务基础和命脉,实现业务数据的共享并在现有业务数据之上建立新兴的增值应用已经成为了各企业建立信息系统的关键所在。在服务器/数据库遇到一些故障无法正常实现运行的时候,必须将备份数据恢复到生产系统继续生产,这便是数据容灾的意义。随着数据业务规模的不断增加和复杂性的不断升级,如何高效、智能地实现数据容灾处理成为了当下继续克服的一个难题。
发明内容
为改善相关技术中存在的技术问题,本发明提供了一种应用于数据管理仓库的容灾方法及系统。
第一方面,本发明实施例提供了一种应用于数据管理仓库的容灾方法,应用于数据容灾系统,所述方法包括:获得涵盖目标业务数据共享事项的待容灾数字化业务大数据;将所述待容灾数字化业务大数据加载到涵盖要素挖掘子网络和多元回归分析子网络的设定机器学习算法中,得到所述要素挖掘子网络生成的容灾要素字符串以及所述多元回归分析子网络生成的个性化知识标签;其中,所述个性化知识标签用于反映所述目标业务数据共享事项的多元回归分析结果;
对所述个性化知识标签和所述容灾要素字符串进行描述向量层面的联动处理,得到所述待容灾数字化业务大数据对应的当前联动描述向量;结合每一备用数字化业务大数据和所述待容灾数字化业务大数据分别对应的当前联动描述向量,从所述每一备用数字化业务大数据中,确定与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据;
依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。
在一些示例性实施例中,所述对所述个性化知识标签和所述容灾要素字符串进行描述向量层面的联动处理,得到所述待容灾数字化业务大数据对应的当前联动描述向量,包括以下其中一项:
对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,并将所述基础联动描述向量,确定为所述当前联动描述向量;
对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,并获得与所述待容灾数字化业务大数据存在联系的各待联动数字化业务大数据分别对应的基础联动描述向量,以及结合所述待容灾数字化业务大数据对应的基础联动描述向量以及所述各待联动数字化业务大数据分别对应的基础联动描述向量,得到所述当前联动描述向量。
在一些示例性实施例中,所述对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,包括:
遵循设定的向量组合规则,对所述个性化知识标签和所述容灾要素字符串进行组合;
结合所述个性化知识标签和所述容灾要素字符串分别对应的设定可信因子,对组合所得的中间描述向量进行更新,得到所述待容灾数字化业务大数据对应的基础联动描述向量。
在一些示例性实施例中,所述结合所述待容灾数字化业务大数据对应的基础联动描述向量以及所述各待联动数字化业务大数据分别对应的基础联动描述向量,得到所述当前联动描述向量,包括:
结合所述待容灾数字化业务大数据和所述各待联动数字化业务大数据分别对应的可信因子,对所述待容灾数字化业务大数据对应的基础联动描述向量以及所述各待联动数字化业务大数据分别对应的基础联动描述向量进行全局运算;
结合所述各待联动数字化业务大数据的数目,对全局运算后得到的联动描述向量进行均值处理,得到所述当前联动描述向量。
在一些示例性实施例中,所述个性化知识标签中涵盖各回归分析评价值和去量纲数据;
所述对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,包括:结合所述个性化知识标签中涵盖的所述去量纲数据,对所述个性化知识标签中涵盖的各回归分析评价值和所述容灾要素字符串进行去量纲处理,得到满足设定量化条件的各回归分析评价值和容灾要素字符串;对满足设定量化条件的各回归分析评价值和容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量;
其中,所述各回归分析评价值包括各事项主题概率评分和各事项特征概率评分中的至少一项。
在一些示例性实施例中,所述待容灾数字化业务大数据为数字服务运行日志中的数字服务运行记录,所述数字服务运行日志还涵盖剩余数字服务运行记录;
所述获得与所述待容灾数字化业务大数据存在联系的各待联动数字化业务大数据分别对应的基础联动描述向量之前,还包括:
将涵盖所述目标业务数据共享事项,且数字签名先于所述数字服务运行记录的剩余数字服务运行记录,作为与所述待容灾数字化业务大数据存在联系的各待联动数字化业务大数据;
对于所述各待联动数字化业务大数据中的随机一个待联动数字化业务大数据:将所述随机一个待联动数字化业务大数据加载到所述设定机器学习算法中,得到所述随机一个待联动数字化业务大数据对应的容灾要素字符串和个性化知识标签,其中所述随机一个待联动数字化业务大数据的个性化知识标签用于反映所述随机一个待联动数字化业务大数据的多元回归分析结果;结合所述随机一个待联动数字化业务大数据对应的容灾要素字符串和个性化知识标签,得到所述随机一个待联动数字化业务大数据对应的基础联动描述向量。
在一些示例性实施例中,所述结合每一备用数字化业务大数据和所述待容灾数字化业务大数据分别对应的当前联动描述向量,从所述每一备用数字化业务大数据中,确定与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据之前,还包括:
从每一备用数字化业务大数据中,确定出所述每一备用数字化业务大数据各自涵盖的不少于一个待处理数据集,每个待处理数据集中涵盖一种容灾种类的业务数据共享事项;
对于确定出的每一待处理数据集中的随机一个待处理数据集:将所述随机一个待处理数据集加载到所述设定机器学习算法中,得到所述随机一个待处理数据集对应的容灾要素字符串和个性化知识标签,并结合所述随机一个待处理数据集对应的容灾要素字符串和个性化知识标签,获得所述随机一个待处理数据集对应的当前联动描述向量;统计所述随机一个待处理数据集对应的当前联动描述向量与对应的备用数字化业务大数据之间的对应特征。
在一些示例性实施例中,所述结合每一备用数字化业务大数据和所述待容灾数字化业务大数据分别对应的当前联动描述向量,从所述每一备用数字化业务大数据中,确定与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据,包括:
确定所述每一备用数字化业务大数据分别对应的当前联动描述向量,分别与所述待容灾数字化业务大数据对应的当前联动描述向量之间的共性指数;
结合确定出的各共性指数,从与所述待容灾数字化业务大数据之间的共性指数大于设定判定值的备用数字化业务大数据中,确定出与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据。
在一些示例性实施例中,所述依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理,包括:根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的第一先验容灾项描述字段集,以及,与基础容灾项描述知识之间的字段匹配系数达到所述第一设定字段匹配系数要求的第二先验容灾项描述字段集;其中,所述第一先验容灾项描述字段集是由各先验容灾项描述字段中的P个第一先验容灾项描述字段形成;所述基础容灾项描述知识是在先记录的各基础容灾项描述知识中的基础容灾项描述知识,所述第二先验容灾项描述字段集是由各先验容灾项描述字段中的P个第二先验容灾项描述字段形成;分别确定所述第一先验容灾项描述字段集与每个所述第二先验容灾项描述字段集之间的目标匹配系数,获得所述所述待容灾数字化业务大数据的待容灾项描述知识与所述每个基础容灾项描述知识之间的容灾项描述匹配系数;在所述容灾项描述匹配系数达到匹配系数阈值的前提下,依据所述容灾处理记录对应的容灾策略对所述待容灾数字化业务大数据进行容灾处理;
其中,在根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的第一先验容灾项描述字段集之前,还包括:将每个所述基础容灾项描述知识分别拆解成相同个数的多个基础容灾项描述字段,获得每个所述基础容灾项描述知识分别对应的基础容灾项描述字段集;其中,所述基础容灾项描述字段集中的各基础容灾项描述字段遵循各基础容灾项描述字段在对应的基础容灾项描述知识中的定位标签进行整理;基于每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段,确定对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段;
其中,基于每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段,确定对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,包括:将每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段作为一个描述字段关系网,对每个描述字段关系网进行分团操作,获得每个描述字段关系网分别对应的P个先验容灾项描述字段;根据每个所述描述字段关系网分别对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段。
第二方面,本发明还提供了一种数据容灾系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
应用于本发明实施例,首先利用设定机器学习算法确定待容灾数字化业务大数据的当前联动描述向量,并结合所述当前联动描述向量确定参考数字化业务大数据,然后依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。如此设计,在确定待容灾数字化业务大数据的当前联动描述向量时,可以结合设定机器学习算法的不同子模型确定不同的特征,进而通过不同的特征得到抗干扰性强和扩展能力佳的当前联动描述向量,这样可以快速精准地确定出参考数字化业务大数据,从而依据参考数字化业务大数据的容灾处理记录指导待容灾数字化业务大数据的容灾处理,提高待容灾数字化业务大数据的容灾处理效率和可靠性。
进一步地,获得涵盖目标业务数据共享事项的待容灾数字化业务大数据后,将待容灾数字化业务大数据加载到设定机器学习算法中,设定机器学习算法中涵盖要素挖掘子网络和多元回归分析子网络,从要素挖掘子网络获得容灾要素字符串,以及从多元回归分析子网络获得个性化知识标签,继而对个性化知识标签和容灾要素字符串进行描述向量层面的联动处理,得到待容灾数字化业务大数据对应的当前联动描述向量,进而结合当前联动描述向量,从每一备用数字化业务大数据中,确定与待容灾数字化业务大数据满足设定要求的参考数字化业务大数据;依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。鉴于当前联动描述向量中一并涵盖容灾要素字符串和个性化知识标签,而容灾要素字符串具有一定的扩展性,可以对非训练集的容灾要素种类进行匹配和兼容,个性化知识标签的精度和抗干扰性优异,基于此,当前联动描述向量具备优良的抗干扰性和灵活的扩展能力,这样能够确保数字化业务大数据匹配分析的精度和时效性,以便快速准确地确定出参考数字化业务大数据,为待容灾数字化业务大数据的容灾处理提供指导,如此,可以依据参考数字化业务大数据的容灾处理记录准确高效地对待容灾数字化业务大数据进行容灾处理,提高容灾处理的智能化程度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种应用于数据管理仓库的容灾方法的流程示意图。
图2是本发明实施例提供的一种应用于数据管理仓库的容灾方法的应用环境的通信架构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在数据容灾系统、计算机设备或者类似的运算装置中执行。以运行在数据容灾系统上为例,数据容灾系统10可以包括一个或多个处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述数据容灾系统还可以包括用于通信功能的传输装置106。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述数据容灾系统的结构造成限定。例如,数据容灾系统10还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种应用于数据管理仓库的容灾方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至数据容灾系统10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括数据容灾系统10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
本发明实施例的总体设计思路如下:利用设定机器学习算法确定待容灾数字化业务大数据的当前联动描述向量,并结合所述当前联动描述向量确定参考数字化业务大数据;依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。
应用于本发明实施例,首先利用设定机器学习算法确定待容灾数字化业务大数据的当前联动描述向量,并结合所述当前联动描述向量确定参考数字化业务大数据,然后依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。如此设计,在确定待容灾数字化业务大数据的当前联动描述向量时,可以结合设定机器学习算法的不同子模型确定不同的特征,进而通过不同的特征得到抗干扰性强和扩展能力佳的当前联动描述向量,这样可以快速精准地确定出参考数字化业务大数据,从而依据参考数字化业务大数据的容灾处理记录指导待容灾数字化业务大数据的容灾处理,提高待容灾数字化业务大数据的容灾处理效率和可靠性。
基于此,请参阅图1,图1是本发明实施例所提供的一种应用于数据管理仓库的容灾方法中的步骤“利用设定机器学习算法确定待容灾数字化业务大数据的当前联动描述向量,并结合所述当前联动描述向量确定参考数字化业务大数据”的示例性实施方案,该方案进一步可以包括步骤21-步骤24。
步骤21、数据容灾系统获得涵盖目标业务数据共享事项的待容灾数字化业务大数据。
其中,目标业务数据共享事项可以是共享热度较高的事项,相应的,为了保障目标业务数据共享事项的数据安全性和持续可用性,可以对涵盖目标业务数据共享事项的待容灾数字化业务大数据进行针对性的数据容灾处理。进一步地,待容灾数字化业务大数据可以是针对数据管理仓库所记录的,因而目标业务数据共享事项的运行环境可以基于数据管理仓库进行,数据管理仓库可以是现有的关系数据库。
步骤22、数据容灾系统将待容灾数字化业务大数据加载到涵盖要素挖掘子网络和多元回归分析子网络的设定机器学习算法中,得到要素挖掘子网络生成的容灾要素字符串以及多元回归分析子网络生成的个性化知识标签,个性化知识标签用于反映目标业务数据共享事项的多元回归分析结果。
在本发明实施例中,设定机器学习算法可以是分类网络,旗下包括要素挖掘子网络(特征挖掘子网)和多元回归分析子网络(输出子网/分类子网)。
在本发明实施例中,容灾要素字符串包括待容灾数字化业务大数据的多维特征信息,比如关键业务项目特征,重要数据信息特征,数据使用习惯特征等。
进一步地,个性化知识标签(可以理解为分类标签)中可以涵盖各回归分析评价值(可以理解为分类权重),各回归分析评价值包括各事项主题概率评分(可以理解为不同主题类型的可能性),和/或,各事项特征概率评分(可以理解为不同特征类型的可能性)。其中,事项主题包括但不限于办公、游戏、电商等。事项特征包括但不限于数据量、数据场景、数据重要性等。个性化知识标签还可以涵盖去量纲数据(归一化数据),去量纲数据包括横向约束值和纵向约束值。
进一步地,采用描述数组vector_a1表示个性化知识标签,比如,设定机器学习算法生成的个性化知识标签中,事项主题的个数为x1,事项特征的个数为x2,v为横向约束值,u为纵向约束值,则事项主题概率评分、事项特征概率评分、横向约束值、纵向约束值遵循指定规则映射为描述数组vector_a1,描述数组vector_a1可以表示为【事项主题1权重,事项主题2权重,…,事项主题x1权重,事项特征1权重,事项特征2权重,…,事项特征x2权重,v,u】,描述数组vector_a1的维度为sum=x1+x2+2。当然,本领域技术人员可以毫无疑义地根据实际需求灵活确定个性化知识标签的输出形式,在此不作限定。
步骤23、数据容灾系统对个性化知识标签和容灾要素字符串进行描述向量层面的联动处理,得到待容灾数字化业务大数据对应的当前联动描述向量。
就步骤23而言,本发明实施例可以直接对个性化知识标签和容灾要素字符串进行特征拼接/融合/联动,或者可以结合与待容灾数字化业务大数据存在联系的待联动数字化业务大数据,对个性化知识标签和容灾要素字符串进行融合。进一步地,描述向量层面的联动处理两个示例性思路如下。
思路1、数据容灾系统对个性化知识标签和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量,并将基础联动描述向量,确定为当前联动描述向量。
进一步地,数据容灾系统对个性化知识标签和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量的过程中,数据容灾系统可以遵循设定的向量组合规则(比如预设的特征拼接顺序),对个性化知识标签和容灾要素字符串进行组合,然后结合个性化知识标签和容灾要素字符串分别对应的设定可信因子,对组合所得的中间描述向量进行更新,得到待容灾数字化业务大数据对应的基础联动描述向量。
在本发明实施例中,采用描述数组vector_a1表示个性化知识标签,描述数组vector_a2表示容灾要素字符串,采用描述数组vector_a表示基础联动描述向量。设定可信因子用于表示对应向量的中重要程度,设定可信因子灵活调整。
比如,向量组合规则为个性化知识标签和容灾要素字符串首尾连接,则描述数组vector_a可以表示为【q1*vector_a1,q2*vector_a2】,其中,q1表示个性化知识标签对应的可信因子,q2表示容灾要素字符串对应的可信因子,融合后的描述数组vector_a维度为描述数组vector_a1与描述数组vector_a2的总体维度。比如,q1=1/2,q2=1/2。
在一些可能的示例下,如果个性化知识标签中涵盖各回归分析评价值和去量纲数据,则数据容灾系统对个性化知识标签和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量,包括:结合个性化知识标签中涵盖的去量纲数据,对个性化知识标签中涵盖的各回归分析评价值和容灾要素字符串进行去量纲处理,得到满足设定量化条件的各回归分析评价值和容灾要素字符串;对满足设定量化条件的各回归分析评价值和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量。
比如,设定量化条件为[0,1]的区间,数据容灾系统结合个性化知识标签中涵盖的去量纲数据,对个性化知识标签中涵盖的各回归分析评价值和容灾要素字符串进行去量纲处理,去量纲处理后处理的各回归分析评价值和容灾要素字符串中各成员的取值均为[0,1]的区间。
在本发明实施例中,数据容灾系统也可以在要素挖掘子网络中进行去量纲处理,得到满足设定量化条件的各回归分析评价值,相应的,在进行个性化知识标签和容灾要素字符串进行组合的过程中,根据结合个性化知识标签中涵盖的去量纲数据,对容灾要素字符串进行去量纲处理,得到满足设定量化条件的容灾要素字符串。
思路2、数据容灾系统对个性化知识标签和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量,并获得与待容灾数字化业务大数据存在联系的各待联动数字化业务大数据分别对应的基础联动描述向量,以及结合待容灾数字化业务大数据对应的基础联动描述向量以及各待联动数字化业务大数据分别对应的基础联动描述向量,得到当前联动描述向量。
鉴于思路2中数据容灾系统对个性化知识标签和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量的过程,与思路1中数据容灾系统对个性化知识标签和容灾要素字符串进行组合,得到待容灾数字化业务大数据对应的基础联动描述向量的过程类似,可以参考上述相关内容。
本发明实施例中,如果待容灾数字化业务大数据为数字服务运行日志中的一个数字服务运行记录,数字服务运行日志中除该数字服务运行记录外,还涵盖不少于一个剩余数字服务运行记录,则数据容灾系统可以将涵盖目标业务数据共享事项,且数字签名先于该数字服务运行记录的剩余数字服务运行记录,作为与待容灾数字化业务大数据存在联系的各待联动数字化业务大数据(待融合的数字化业务大数据)。换言之,数据容灾系统可以将涵盖目标业务数据共享事项的历史数字服务运行记录,作为与待容灾数字化业务大数据存在联系的各待联动数字化业务大数据。进而数据容灾系统对于各待联动数字化业务大数据中的随机一个待联动数字化业务大数据,实施如下步骤:将随机一个待联动数字化业务大数据加载到设定机器学习算法中,得到随机一个待联动数字化业务大数据对应的容灾要素字符串和个性化知识标签,其中随机一个待联动数字化业务大数据的个性化知识标签用于反映随机一个待联动数字化业务大数据的多元回归分析结果;结合随机一个待联动数字化业务大数据对应的容灾要素字符串和个性化知识标签,得到随机一个待联动数字化业务大数据对应的基础联动描述向量。
在本发明实施例中,待容灾数字化业务大数据为数字服务运行日志中的一个数字服务运行记录可以是指待容灾数字化业务大数据为数字服务运行日志中的某一数字服务运行记录,也可以是指待容灾数字化业务大数据为数字服务运行日志中的某一数字服务运行记录中涵盖的部分数字化业务大数据。鉴于各待联动数字化业务大数据对应的基础联动描述向量的确定思路与待容灾数字化业务大数据对应的基础联动描述向量的确定思路相同,在此不再赘述。
比如,数字服务运行日志中涵盖数字服务运行记录journal1、数字服务运行记录journal2、…、数字服务运行记录journal-i、…、数字服务运行记录journal-m等m个数字服务运行记录,m个数字服务运行记录的数字签名依次为:数字服务运行记录journal1、数字服务运行记录journal2、…、数字服务运行记录journal-i、…、数字服务运行记录journal-m,待容灾数字化业务大数据为数字服务运行记录journal-i。
如果m个数字服务运行记录中,涵盖目标业务数据共享事项的数字服务运行记录有:数字服务运行记录record_k1、数字服务运行记录record_k2、…、数字服务运行记录record_ki、…、数字服务运行记录record_kn等n个数字服务运行记录,涵盖目标业务数据共享事项,且数字签名先于待容灾数字化业务大数据的数字服务运行记录的剩余数字服务运行记录有:数字服务运行记录record_k1、数字服务运行记录record_k2、…、数字服务运行记录record_ki-1,可以理解,待联动数字化业务大数据包括:数字服务运行记录record_k1、数字服务运行记录record_k2、…、数字服务运行记录record_ki-1。
数据容灾系统分别对于数字服务运行记录record_k1、数字服务运行记录record_k2、…、数字服务运行记录record_ki-1,生成对应的基础联动描述向量,数字服务运行记录record_k1、数字服务运行记录record_k2、…、数字服务运行记录record_ki-1分别对应的基础联动描述向量分别表示为vector_a(record_k1)、vector_a(record_k2)、…、vector_a(record_ki-1),待容灾数字化业务大数据对应的基础联动描述向量表示为vector_a(record_ki)。
又比如,数字服务运行日志中涵盖10个数字服务运行记录,10个数字服务运行记录包括数字服务运行记录journal1、数字服务运行记录journal2、…、数字服务运行记录journal10,比如,待容灾数字化业务大数据为数字服务运行记录journal5,目标业务数据共享事项为数字服务运行记录journal5中的会话请求事件,10个数字服务运行记录中,涵盖目标业务数据共享事项,且数字签名先于数字服务运行记录journal5的剩余数字服务运行记录有:数字服务运行记录journal1、数字服务运行记录journal2、数字服务运行记录journal3和数字服务运行记录journal4,数据容灾系统将数字服务运行记录journal1、数字服务运行记录journal2、数字服务运行记录journal3和数字服务运行记录journal4作为各待联动数字化业务大数据。
进一步地,数据容灾系统分别对于数字服务运行记录journal1、数字服务运行记录journal2、数字服务运行记录journal3和数字服务运行记录journal4,得到数字服务运行记录journal1、数字服务运行记录journal2、数字服务运行记录journal3和数字服务运行记录journal4分别对应的基础联动描述向量,其中,数字服务运行记录journal1对应的基础联动描述向量为vector_a(record_k1),数字服务运行记录journal2对应的基础联动描述向量为vector_a(record_k2),数字服务运行记录journal3对应的基础联动描述向量为vector_a(record_k3),数字服务运行记录journal4对应的基础联动描述向量为vector_a(record_k4),此外,数字服务运行记录journal5对应的基础联动描述向量为vector_a(record_k5)。
举例而言,结合待容灾数字化业务大数据对应的基础联动描述向量以及各待联动数字化业务大数据分别对应的基础联动描述向量,数据容灾系统可以采用如下思路得到当前联动描述向量。
(1)、数据容灾系统结合待容灾数字化业务大数据和各待联动数字化业务大数据分别对应的可信因子,对待容灾数字化业务大数据对应的基础联动描述向量以及各待联动数字化业务大数据分别对应的基础联动描述向量进行全局运算。
在本发明实施例中,待容灾数字化业务大数据和各待联动数字化业务大数据分别对应的可信因子可以根据各待联动数字化业务大数据的数目确定的,在此不做限制。
比如,各待联动数字化业务大数据分别对应的可信因子表示为w1、w2、……、wi-1,待容灾数字化业务大数据对应的可信因子为wi,全局运算后得到的联动描述向量可以表示为w1*vector_a(record_k1)+w2*vector_a(record_k2)+…+wi-1*vector_a(record_ki-1)+wi*vector_a(record_ki)。
进一步地,依然以待容灾数字化业务大数据为数字服务运行记录journal5为例,比如,待容灾数字化业务大数据和各待联动数字化业务大数据分别对应的可信因子均为1,全局运算后得到的联动描述向量为vector_a(record_k1)+vector_a(record_k2)+vector_a(record_k3)+vector_a(record_k4)+vector_a(record_k5)。
(2)、数据容灾系统结合各待联动数字化业务大数据的数目,对全局运算后得到的联动描述向量进行均值处理,得到当前联动描述向量。
比如,待容灾数字化业务大数据和各待联动数字化业务大数据分别对应的可信因子都是为1,表示当前联动描述向量,当前联动描述向量可以通过相关的均值计算公式得到,在此不作赘述。
进一步地,仍以待容灾数字化业务大数据为数字服务运行记录journal5为例,各待联动数字化业务大数据的数目为4,对全局运算后得到的联动描述向量进行均值处理,得到当前联动描述向量,当前联动描述向量表示为【vector_a(record_k1)+vector_a(record_k2)+vector_a(record_k3)+vector_a(record_k4)+vector_a(record_k5)】/5。
在本发明实施例中,待联动数字化业务大数据也可以是数字服务运行日志中目标时段内,涵盖目标业务数据共享事项,且数字签名先于数字服务运行记录的剩余数字服务运行记录。
步骤24、数据容灾系统结合每一备用数字化业务大数据和待容灾数字化业务大数据分别对应的当前联动描述向量,从每一备用数字化业务大数据中,确定与待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据。
进一步地,在实施步骤24时,包括但不限于如下技术方案:数据容灾系统计算每一备用数字化业务大数据分别对应的当前联动描述向量,分别与待容灾数字化业务大数据对应的当前联动描述向量之间的共性指数,然后结合确定出的各共性指数,从与待容灾数字化业务大数据之间的共性指数大于设定判定值的备用数字化业务大数据中,确定出与待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据。
举例而言,可以采用但不限于欧式距离,作为待容灾数字化业务大数据对应的当前联动描述向量与随机一个备用数字化业务大数据对应的当前联动描述向量之间的共性指数。
其中,结合确定出的各共性指数,从与待容灾数字化业务大数据之间的共性指数大于设定判定值的备用数字化业务大数据中,确定出与待容灾数字化业务大数据满足设定要求的参考数字化业务大数据的过程中,数据容灾系统通过设定判定值对备用数字化业务大数据进行清洗,获得共性指数大于设定判定值的备用数字化业务大数据集合,再遵循共性指数取值降序的规则,从备用数字化业务大数据集合,依次选取出设定个数的参考数字化业务大数据。进一步的,数据容灾系统还可以输出所确定的参考数字化业务大数据。
在一些可能的示例下,结合每一备用数字化业务大数据和待容灾数字化业务大数据分别对应的当前联动描述向量,从每一备用数字化业务大数据中,确定与待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据之前,数据容灾系统还可以从每一备用数字化业务大数据中,确定出每一备用数字化业务大数据各自涵盖的不少于一个待处理数据集,其中,每个待处理数据集中涵盖一种容灾种类的业务数据共享事项。
数据容灾系统可以对于确定出的每一待处理数据集中的随机一个待处理数据集,实施如下步骤:将随机一个待处理数据集加载到设定机器学习算法中,得到随机一个待处理数据集对应的容灾要素字符串和个性化知识标签,并结合随机一个待处理数据集对应的容灾要素字符串和个性化知识标签,获得随机一个待处理数据集对应的当前联动描述向量;记录随机一个待处理数据集对应的当前联动描述向量与对应的备用数字化业务大数据之间的对应特征(对应关系或者映射关系)。
鉴于随机一个待处理数据集对应的当前联动描述向量的确定思路,与前述内容中待容灾数字化业务大数据对应的当前联动描述向量的确定思路类似,在此不继续展开介绍。
在本发明实施例中,备用数字化业务大数据可以是数字服务运行日志中某一个数字服务运行记录。比如,备用数字化业务大数据big data1中涵盖一个会话请求事件和一个资源上传事件,数据容灾系统从备用数字化业务大数据big data1中,确定出待处理数据集set1和待处理数据集set2,待处理数据集set1中涵盖一个会话请求事件,待处理数据集set2中涵盖一个资源上传事件,继而对于待处理数据集set1,数据容灾系统将待处理数据集set1加载到设定机器学习算法中,得到待处理数据集set1对应的容灾要素字符串和个性化知识标签,并结合待处理数据集set1对应的容灾要素字符串和个性化知识标签,获得待处理数据集set1对应的当前联动描述向量,以及记录待处理数据集set1对应的当前联动描述向量与备用数字化业务大数据big data1之间的对应特征,相应的,数据容灾系统可以获得待处理数据集set2对应的当前联动描述向量,并记录待处理数据集set1对应的当前联动描述向量与备用数字化业务大数据big data1之间的对应特征。
示例性的,在一些应用环境下,将拟处理数字服务运行日志中的数字服务运行记录journal4作为待容灾数字化业务大数据,待容灾数字化业务大数据中涵盖的目标业务数据共享事项为资源上传事件,数据容灾系统获得到数字服务运行记录journal4之后,获得数字服务运行记录journal4对应的基础联动描述向量,比如,与数字服务运行记录journal4存在联系的待联动数字化业务大数据为数字服务运行记录journal1、数字服务运行记录journal2和数字服务运行记录journal3,数据容灾系统结合数字服务运行记录journal1、数字服务运行记录journal2和数字服务运行记录journal3分别对应的基础联动描述向量,结合数字服务运行记录journal4对应的基础联动描述向量,得到待容灾数字化业务大数据对应的当前联动描述向量。
继而数据容灾系统将待容灾数字化业务大数据对应的当前联动描述向量,与备用数字化业务大数据big data1对应的当前联动描述向量进行匹配,其中,备用数字化业务大数据big data1对应的当前联动描述向量包括待处理数据集set1对应的当前联动描述向量和待处理数据集set2对应的当前联动描述向量,结合备用数字化业务大数据对应的当前联动描述向量和待容灾数字化业务大数据对应的当前联动描述向量,确定备用数字化业务大数据big data1与待容灾数字化业务大数据匹配,示例性的,确定备用数字化业务大数据big data1中的待处理数据集set1与待容灾数字化业务大数据匹配。
在另一些可能的设计思路下,步骤“依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理”,可以通过如下技术方案实现:根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段(基准的容灾项描述子向量),确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数(可以理解为特征相似度)达到第一设定字段匹配系数要求的第一先验容灾项描述字段集,以及,与基础容灾项描述知识(可以理解为历史容灾描述向量)之间的字段匹配系数达到所述第一设定字段匹配系数要求的第二先验容灾项描述字段集;其中,所述第一先验容灾项描述字段集是由各先验容灾项描述字段中的P个第一先验容灾项描述字段形成;所述基础容灾项描述知识是在先记录的各基础容灾项描述知识中的基础容灾项描述知识,所述第二先验容灾项描述字段集是由各先验容灾项描述字段中的P个第二先验容灾项描述字段形成;分别确定所述第一先验容灾项描述字段集与每个所述第二先验容灾项描述字段集之间的目标匹配系数,获得所述所述待容灾数字化业务大数据的待容灾项描述知识与所述每个基础容灾项描述知识之间的容灾项描述匹配系数(可以理解为向量层面的相似度);在所述容灾项描述匹配系数达到匹配系数阈值的前提下,依据所述容灾处理记录对应的容灾策略对所述待容灾数字化业务大数据进行容灾处理。
如此设计,能够基于容灾项描述匹配系数确定容灾处理记录与待容灾数字化业务大数据的匹配度,如果容灾项描述匹配系数达到匹配系数阈值,表明容灾处理记录在很大程度上也适用于待容灾数字化业务大数据,因而可以基于容灾处理记录适应性地对待容灾数字化业务大数据进行容灾处理。如此,能够提高待容灾数字化业务大数据的容灾处理精度和效率。当然,在实际实施时,本领域技术人员可以对容灾处理记录对应的容灾策略进行微调以最大限度适配待容灾数字化业务大数据。关于容灾策略的微调可以参考相关现有技术,在此不作赘述。
在另一些可能的设计思路下,在根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的第一先验容灾项描述字段集之前,还包括:将每个所述基础容灾项描述知识分别拆解成相同个数的多个基础容灾项描述字段,获得每个所述基础容灾项描述知识分别对应的基础容灾项描述字段集;其中,所述基础容灾项描述字段集中的各基础容灾项描述字段遵循各基础容灾项描述字段在对应的基础容灾项描述知识中的定位标签进行整理;基于每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段,确定对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段。
在另一些可能的设计思路下,基于每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段,确定对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,包括:将每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段作为一个描述字段关系网,对每个描述字段关系网进行分团操作,获得每个描述字段关系网分别对应的P个先验容灾项描述字段;根据每个所述描述字段关系网分别对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段。
在另一些可能的设计思路下,在描述字段关系网与描述字段关系网中包括的基础容灾项描述字段在对应的基础容灾项描述知识中的定位标签关联时,根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的第一先验容灾项描述字段集,包括:将所述所述待容灾数字化业务大数据的待容灾项描述知识拆解成多个目标容灾项描述字段,获得所述所述待容灾数字化业务大数据的待容灾项描述知识的目标容灾项描述字段集;其中,所述目标容灾项描述字段集中的各目标容灾项描述字段遵循各目标容灾项描述字段在所述待容灾数字化业务大数据的待容灾项描述知识中的定位标签进行整理;确定所述描述字段关系网对应的P个先验容灾项描述字段中,与所述目标容灾项描述字段之间的字段匹配系数达到第二设定字段匹配系数要求的第一先验容灾项描述字段;其中,所述目标容灾项描述字段在所述目标容灾项描述字段集中的定位标签,与所述描述字段关系网的关联定位标签相同;在每个所述目标容灾项描述字段均存在一个对应的所述第一先验容灾项描述字段时,确定由各所述第一先验容灾项描述字段形成的所述第一先验容灾项描述字段集,与所述所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求,获得所述所述待容灾数字化业务大数据的待容灾项描述知识对应的所述第一先验容灾项描述字段集。
在另一些可能的设计思路下,在所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段分别具有字段注解,所述字段注解用于区分每个先验容灾项描述字段时,获得所述所述待容灾数字化业务大数据的待容灾项描述知识对应的第一先验容灾项描述字段集,包括:根据各所述第一先验容灾项描述字段的字段注解,获得所述所述待容灾数字化业务大数据的待容灾项描述知识对应的第一先验容灾项描述字段集。
在另一些可能的设计思路下,在描述字段关系网与描述字段关系网中包括的基础容灾项描述字段在对应的基础容灾项描述知识中的定位标签关联时,根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定分别与各在先记录的基础容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的各第二先验容灾项描述字段集,包括:在所述描述字段关系网对应的P个先验容灾项描述字段中,确定与所述基础容灾项描述字段之间的字段匹配系数达到第二设定字段匹配系数要求的第二先验容灾项描述字段;其中,所述基础容灾项描述字段在所述基础容灾项描述字段集中的定位标签,与所述描述字段关系网的关联定位标签相同;在每个所述基础容灾项描述字段均存在一个对应的所述第二先验容灾项描述字段时,确定由各所述第二先验容灾项描述字段形成的所述第二先验容灾项描述字段集,与所述基础容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求,获得所述基础容灾项描述知识对应的所述第二先验容灾项描述字段集。
在另一些可能的设计思路下,在所述第一先验容灾项描述字段集中第一先验容灾项描述字段的个数与所述第二先验容灾项描述字段集中第二先验容灾项描述字段的个数相同时,分别确定所述第一先验容灾项描述字段集与每个所述第二先验容灾项描述字段集之间的目标匹配系数,包括:分别确定所述第一先验容灾项描述字段集中每个第一先验容灾项描述字段,与所述第二先验容灾项描述字段集中对应定位标签的第二先验容灾项描述字段之间的描述字段字段匹配系数;对获得的描述字段字段匹配系数进行加权运算,获得所述第一先验容灾项描述字段集与所述第二先验容灾项描述字段集之间的目标匹配系数。
基于上述相同或相似的发明构思,请结合参阅图2,还提供了一种应用于数据管理仓库的容灾方法的应用环境30的架构示意图,包括互相之间通信的数据容灾系统10和关系型数据库20,数据容灾系统10和关系型数据库20在运行时实现或者部分实现上述方法实施例所描述的技术方案。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种应用于数据管理仓库的容灾方法,其特征在于,应用于数据容灾系统,所述方法包括:
获得所述涵盖目标业务数据共享事项的待容灾数字化业务大数据;将所述待容灾数字化业务大数据加载到涵盖要素挖掘子网络和多元回归分析子网络的设定机器学习算法中,得到所述要素挖掘子网络生成的容灾要素字符串以及所述多元回归分析子网络生成的个性化知识标签;其中,所述个性化知识标签用于反映所述目标业务数据共享事项的多元回归分析结果;
对所述个性化知识标签和所述容灾要素字符串进行描述向量层面的联动处理,得到所述待容灾数字化业务大数据对应的当前联动描述向量;结合每一备用数字化业务大数据和所述待容灾数字化业务大数据分别对应的当前联动描述向量,从所述每一备用数字化业务大数据中,确定与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据;
依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理。
2.根据权利要求1所述的方法,其特征在于,所述对所述个性化知识标签和所述容灾要素字符串进行描述向量层面的联动处理,得到所述待容灾数字化业务大数据对应的当前联动描述向量,包括以下其中一项:
对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,并将所述基础联动描述向量,确定为所述当前联动描述向量;
对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,并获得与所述待容灾数字化业务大数据存在联系的各待联动数字化业务大数据分别对应的基础联动描述向量,以及结合所述待容灾数字化业务大数据对应的基础联动描述向量以及所述各待联动数字化业务大数据分别对应的基础联动描述向量,得到所述当前联动描述向量。
3.根据权利要求2所述的方法,其特征在于,所述对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,包括:
遵循设定的向量组合规则,对所述个性化知识标签和所述容灾要素字符串进行组合;
结合所述个性化知识标签和所述容灾要素字符串分别对应的设定可信因子,对组合所得的中间描述向量进行更新,得到所述待容灾数字化业务大数据对应的基础联动描述向量。
4.根据权利要求2所述的方法,其特征在于,所述结合所述待容灾数字化业务大数据对应的基础联动描述向量以及所述各待联动数字化业务大数据分别对应的基础联动描述向量,得到所述当前联动描述向量,包括:
结合所述待容灾数字化业务大数据和所述各待联动数字化业务大数据分别对应的可信因子,对所述待容灾数字化业务大数据对应的基础联动描述向量以及所述各待联动数字化业务大数据分别对应的基础联动描述向量进行全局运算;
结合所述各待联动数字化业务大数据的数目,对全局运算后得到的联动描述向量进行均值处理,得到所述当前联动描述向量。
5.根据权利要求2所述的方法,其特征在于,所述个性化知识标签中涵盖各回归分析评价值和去量纲数据;
所述对所述个性化知识标签和所述容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量,包括:结合所述个性化知识标签中涵盖的所述去量纲数据,对所述个性化知识标签中涵盖的各回归分析评价值和所述容灾要素字符串进行去量纲处理,得到满足设定量化条件的各回归分析评价值和容灾要素字符串;对满足设定量化条件的各回归分析评价值和容灾要素字符串进行组合,得到所述待容灾数字化业务大数据对应的基础联动描述向量;
其中,所述各回归分析评价值包括各事项主题概率评分和各事项特征概率评分中的至少一项。
6.根据权利要求2所述的方法,其特征在于,所述待容灾数字化业务大数据为数字服务运行日志中的数字服务运行记录,所述数字服务运行日志还涵盖剩余数字服务运行记录;
所述获得与所述待容灾数字化业务大数据存在联系的各待联动数字化业务大数据分别对应的基础联动描述向量之前,还包括:
将涵盖所述目标业务数据共享事项,且数字签名先于所述数字服务运行记录的剩余数字服务运行记录,作为与所述待容灾数字化业务大数据存在联系的各待联动数字化业务大数据;
对于所述各待联动数字化业务大数据中的随机一个待联动数字化业务大数据:将所述随机一个待联动数字化业务大数据加载到所述设定机器学习算法中,得到所述随机一个待联动数字化业务大数据对应的容灾要素字符串和个性化知识标签,其中所述随机一个待联动数字化业务大数据的个性化知识标签用于反映所述随机一个待联动数字化业务大数据的多元回归分析结果;结合所述随机一个待联动数字化业务大数据对应的容灾要素字符串和个性化知识标签,得到所述随机一个待联动数字化业务大数据对应的基础联动描述向量。
7.根据权利要求6所述的方法,其特征在于,所述结合每一备用数字化业务大数据和所述待容灾数字化业务大数据分别对应的当前联动描述向量,从所述每一备用数字化业务大数据中,确定与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据之前,还包括:
从每一备用数字化业务大数据中,确定出所述每一备用数字化业务大数据各自涵盖的不少于一个待处理数据集,每个待处理数据集中涵盖一种容灾种类的业务数据共享事项;
对于确定出的每一待处理数据集中的随机一个待处理数据集:将所述随机一个待处理数据集加载到所述设定机器学习算法中,得到所述随机一个待处理数据集对应的容灾要素字符串和个性化知识标签,并结合所述随机一个待处理数据集对应的容灾要素字符串和个性化知识标签,获得所述随机一个待处理数据集对应的当前联动描述向量;统计所述随机一个待处理数据集对应的当前联动描述向量与对应的备用数字化业务大数据之间的对应特征。
8.根据权利要求6所述的方法,其特征在于,所述结合每一备用数字化业务大数据和所述待容灾数字化业务大数据分别对应的当前联动描述向量,从所述每一备用数字化业务大数据中,确定与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据,包括:
确定所述每一备用数字化业务大数据分别对应的当前联动描述向量,分别与所述待容灾数字化业务大数据对应的当前联动描述向量之间的共性指数;
结合确定出的各共性指数,从与所述待容灾数字化业务大数据之间的共性指数大于设定判定值的备用数字化业务大数据中,确定出与所述待容灾数字化业务大数据满足设定要求的不少于一个参考数字化业务大数据。
9.根据权利要求1所述的方法,其特征在于,所述依据所述参考数字化业务大数据的容灾处理记录,对所述待容灾数字化业务大数据进行容灾处理,包括:根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的第一先验容灾项描述字段集,以及,与基础容灾项描述知识之间的字段匹配系数达到所述第一设定字段匹配系数要求的第二先验容灾项描述字段集;其中,所述第一先验容灾项描述字段集是由各先验容灾项描述字段中的P个第一先验容灾项描述字段形成;所述基础容灾项描述知识是在先记录的各基础容灾项描述知识中的基础容灾项描述知识,所述第二先验容灾项描述字段集是由各先验容灾项描述字段中的P个第二先验容灾项描述字段形成;分别确定所述第一先验容灾项描述字段集与每个所述第二先验容灾项描述字段集之间的目标匹配系数,获得所述所述待容灾数字化业务大数据的待容灾项描述知识与所述每个基础容灾项描述知识之间的容灾项描述匹配系数;在所述容灾项描述匹配系数达到匹配系数阈值的前提下,依据所述容灾处理记录对应的容灾策略对所述待容灾数字化业务大数据进行容灾处理。
10.根据权利要求9所述的方法,其特征在于,在根据所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,确定与所述待容灾数字化业务大数据的待容灾项描述知识之间的字段匹配系数达到第一设定字段匹配系数要求的第一先验容灾项描述字段集之前,还包括:将每个所述基础容灾项描述知识分别拆解成相同个数的多个基础容灾项描述字段,获得每个所述基础容灾项描述知识分别对应的基础容灾项描述字段集;其中,所述基础容灾项描述字段集中的各基础容灾项描述字段遵循各基础容灾项描述字段在对应的基础容灾项描述知识中的定位标签进行整理;基于每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段,确定对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段;
其中,基于每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段,确定对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段,包括:将每个所述基础容灾项描述字段集中,相同定位标签对应的基础容灾项描述字段作为一个描述字段关系网,对每个描述字段关系网进行分团操作,获得每个描述字段关系网分别对应的P个先验容灾项描述字段;根据每个所述描述字段关系网分别对应的P个先验容灾项描述字段,获得所述容灾处理记录确定所述参考数字化业务大数据的各先验容灾项描述字段。
11.一种数据容灾系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
CN202211200445.5A 2022-09-29 2022-09-29 应用于数据管理仓库的容灾方法及系统 Pending CN115374185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211200445.5A CN115374185A (zh) 2022-09-29 2022-09-29 应用于数据管理仓库的容灾方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211200445.5A CN115374185A (zh) 2022-09-29 2022-09-29 应用于数据管理仓库的容灾方法及系统

Publications (1)

Publication Number Publication Date
CN115374185A true CN115374185A (zh) 2022-11-22

Family

ID=84073862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211200445.5A Pending CN115374185A (zh) 2022-09-29 2022-09-29 应用于数据管理仓库的容灾方法及系统

Country Status (1)

Country Link
CN (1) CN115374185A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689391A (zh) * 2022-12-02 2023-02-03 国涛(菏泽牡丹区)网络科技有限责任公司 一种基于电子商务的数据容灾方法、系统及云平台
CN115904810A (zh) * 2022-12-02 2023-04-04 菏泽盛哲网络科技有限公司 基于人工智能的数据复制容灾方法及容灾系统
CN116048883A (zh) * 2023-02-20 2023-05-02 李红亮 一种采用人工智能的大数据容灾分析方法及服务器

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689391A (zh) * 2022-12-02 2023-02-03 国涛(菏泽牡丹区)网络科技有限责任公司 一种基于电子商务的数据容灾方法、系统及云平台
CN115904810A (zh) * 2022-12-02 2023-04-04 菏泽盛哲网络科技有限公司 基于人工智能的数据复制容灾方法及容灾系统
CN115904810B (zh) * 2022-12-02 2024-02-06 四川星环纪元科技发展有限公司 基于人工智能的数据复制容灾方法及容灾系统
CN115689391B (zh) * 2022-12-02 2024-03-08 国涛(菏泽牡丹区)网络科技有限责任公司 一种基于电子商务的数据容灾方法、系统及云平台
CN116048883A (zh) * 2023-02-20 2023-05-02 李红亮 一种采用人工智能的大数据容灾分析方法及服务器
CN116048883B (zh) * 2023-02-20 2024-08-06 江苏万润数字技术有限公司 一种采用人工智能的大数据容灾分析方法及服务器

Similar Documents

Publication Publication Date Title
CN115374185A (zh) 应用于数据管理仓库的容灾方法及系统
CN111488426B (zh) 一种查询意图确定方法、装置及处理设备
US10860663B2 (en) Online learning of click-through rates on federated search results
US8499049B2 (en) System and method for accumulating social relation information for social network services
CN108363811A (zh) 设备识别方法及装置、电子设备、存储介质
US8554738B2 (en) Mitigation of obsolescence for archival services
CA3036664A1 (en) Method for data structure relationship detection
CN114930318A (zh) 使用来自多个分类模块的聚合信息对数据进行分类
US20130132481A1 (en) Method, apparatus and system for providing social network service using social activities
US20140052674A1 (en) System, method and computer program product for classification of social streams
CN102682017B (zh) 一种信息检索方法和系统
CN111241850B (zh) 提供业务模型的方法及装置
CN112650858A (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN115760216A (zh) 基于人工智能的订单数据分析方法及系统
Loynes et al. The detection and location estimation of disasters using Twitter and the identification of Non-Governmental Organisations using crowdsourcing
CN107295086A (zh) 集群会话防丢失方法及系统
US20220167034A1 (en) Device topological signatures for identifying and classifying mobile device users based on mobile browsing patterns
US20220167051A1 (en) Automatic classification of households based on content consumption
US20120023489A1 (en) Updating computer files
CN112417874A (zh) 命名实体的识别方法和装置、存储介质、电子装置
CN113656466B (zh) 保单数据查询方法、装置、设备及存储介质
CN114580734A (zh) 结合大数据的数字化社交网络信息优化方法及服务器
Katsarou et al. WhatsNextApp: LSTM-based next-app prediction with app usage sequences
Meurisch et al. Enhanced detection of crisis-related microblogs by spatiotemporal feedback loops
CN114638308A (zh) 一种获取对象关系的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20221122