CN115357410A - 一种基于大数据的数据跨进程压缩存储方法及系统 - Google Patents

一种基于大数据的数据跨进程压缩存储方法及系统 Download PDF

Info

Publication number
CN115357410A
CN115357410A CN202211018311.1A CN202211018311A CN115357410A CN 115357410 A CN115357410 A CN 115357410A CN 202211018311 A CN202211018311 A CN 202211018311A CN 115357410 A CN115357410 A CN 115357410A
Authority
CN
China
Prior art keywords
data
compression
processed
priority
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211018311.1A
Other languages
English (en)
Other versions
CN115357410B (zh
Inventor
郭晨璐
金建华
李进
施晓桐
石丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruishi Fangda Talent Technology Group Co ltd
Original Assignee
Beijing Keyun Times Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Keyun Times Information Technology Co ltd filed Critical Beijing Keyun Times Information Technology Co ltd
Priority to CN202211018311.1A priority Critical patent/CN115357410B/zh
Publication of CN115357410A publication Critical patent/CN115357410A/zh
Application granted granted Critical
Publication of CN115357410B publication Critical patent/CN115357410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/484Precedence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于数据处理技术领域,提供了一种基于大数据的数据跨进程压缩存储方法及系统,解决了现有跨进程数据传输方法无法对对象数据进行优先级确定,并基于优先级先后进行压缩传输,增加了跨进程数据传输方法负载的问题;所述方法包括:获取待压缩任务集,加载目标压缩任务集,确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集;本发明实施例通过优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,基于不同数据采集终端的优先级来处理数据,提高了数据压缩和存储的效率。

Description

一种基于大数据的数据跨进程压缩存储方法及系统
技术领域
本发明属于数据处理技术领域,尤其涉及一种基于大数据的数据跨进程压缩存储方法及系统。
背景技术
跨进程通信的目的在于实现进程间数据的分享以及交互,而典型的跨进程通信的应用场景是剪切板上数据的复制与粘贴,但这种跨进程通信的方式仅限于一些String类数据的传送,如果需要传送一个对象的话,而这个对象可能包含有多种形式的数据类型,数据占用较大空间,且数据的优先处理需要明确,因此需要将类进行序列化。
中国专利CN112764946A公开了一种跨进程数据传输方法、装置及电子设备、存储介质,该方法应用于安卓操作系统中的数据传输层,所述方法包括:通过第一进程中实现的数据传输接口,接收第一进程的传输数据;将传输数据写入到内存空间中;通过第二进程中实现的数据传输接口,接收第二进程对传输数据的获取请求;根据获取请求,从内存空间中提取传输数据并发送给第二进程;但是现有跨进程数据传输方法无法对对象数据进行优先级确定,并基于优先级先后进行压缩传输,增加了跨进程数据传输方法的负载,为了解决上述问题,我们提出了一种基于大数据的数据跨进程压缩存储方法及系统。
发明内容
本发明提供一种基于大数据的数据跨进程压缩存储方法及系统,旨在解决现有跨进程数据传输方法无法对对象数据进行优先级确定,并基于优先级先后进行压缩传输,增加了跨进程数据传输方法负载的问题。
本发明是这样实现的,一种基于大数据的数据跨进程压缩存储方法,所述基于大数据的数据跨进程压缩存储方法包括:
获取待压缩任务集,其中,所述待压缩任务集中包括不同数据采集终端收集到的待处理数据,待处理数据对应至少一组服务进程;
加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列;
获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集。
优选地,所述获取待压缩任务集的方法,具体包括:
响应数据采集终端跨进程指令;
基于Zabbix框架与不同数据采集终端建立联系,创建不同数据采集终端的Zabbix组织架构图;
实时获取数据采集终端采集到的待处理数据,获取待处理数据后,对待处理数据预处理。
优选地,所述获取待处理数据后,对待处理数据预处理的方法,具体包括:
加载待处理数据;
针对任一数据采集终端环境下数据传输端口,获取数据传输端口所在存储位置;
基于数据传输端口所在存储位置,将待处理数据暂存在云数据存储空间内,并建立数据传输端口与云数据存储空间之间的索引关系。
优选地,所述获取待处理数据后,对待处理数据预处理的方法,具体还包括:
加载数据传输端口与云数据存储空间之间的索引关系;
基于数据传输端口与云数据存储空间之间的索引关系,获取待处理数据;
对待处理数据进行滤波处理,消除干扰数据,随机采用一致性算法,对滤波处理后的待处理数据剔除,得到剔除后的待处理数据。
优选地,所述创建不同响应数据采集终端的Zabbix组织架构图的方法,具体包括:
识别数据采集终端所位置,对数据采集终端的位置简化处理,得到关键组织架构点;
根据数据采集终端之间的内在关联组织以及关联组织架构点构建组织架构图。
优选地,所述通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列的方法,具体包括:
加载压缩队列;
遍历压缩队列中目标压缩任务集,识别目标压缩任务集中待处理数据;
获取基于重要性和相关性分析,调取数据采集终端的Zabbix组织架构图,基于随机森林监督模型确定数据采集终端的Zabbix组织架构图中数据采集终端的优先级。
优选地,所述通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列的方法,具体还包括:
获取待处理数据,通过随机森林监督模型确定待处理数据所对应的数据采集终端的优先级,形成排序压缩队列。
一种基于所述基于大数据的数据跨进程压缩存储方法的一种基于大数据的数据跨进程压缩存储系统,所述基于大数据的数据跨进程压缩存储系统包括:
终端服务器,用于获取待压缩任务集,其中,所述待压缩任务集中包括不同数据采集终端收集到的待处理数据,待处理数据对应至少一组服务进程;
前端处理器,用于加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列;
压缩存储云平台,用于获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集。
优选地,所述终端服务器包括:
指令响应端,用于响应数据采集终端跨进程指令;
组织架构建立单元,基于Zabbix框架与不同数据采集终端建立联系,创建不同数据采集终端的Zabbix组织架构图;
数据预处理单元,实时获取数据采集终端采集到的待处理数据,获取待处理数据后,对待处理数据预处理。
优选地,所述数据预处理单元包括:
待处理数据接收端,用于加载待处理数据;
存储位置获取模块,针对任一数据采集终端环境下数据传输端口,获取数据传输端口所在存储位置;
索引关系创建模块,基于数据传输端口所在存储位置,将待处理数据暂存在云数据存储空间内,并建立数据传输端口与云数据存储空间之间的索引关系。
与现有技术相比,本申请实施例主要有以下有益效果:
本发明实施例通过优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,基于不同数据采集终端的优先级来处理数据,解决了现有跨进程数据传输方法无法对对象数据进行优先级确定的问题,提高了数据压缩和存储的效率。
附图说明
图1是本发明提供的一种基于大数据的数据跨进程压缩存储方法的结构示意图。
图2是本发明提供的获取待压缩任务集方法的实现流程示意图。
图3是本发明提供的获取待处理数据后,对待处理数据预处理方法的实现流程示意图。
图4是本发明提供的创建不同响应数据采集终端的Zabbix组织架构图方法的实现流程示意图。
图5是本发明提供的通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列方法的实现流程示意图。
图6是本发明提供的基于大数据的数据跨进程压缩存储系统的框架示意图。
图7是本发明提供的终端服务器的结构示意图。
图8是本发明提供的数据预处理单元的示意图。
图中:100-终端服务器、110-指令响应端、120-组织架构建立单元、130-数据预处理单元、131-待处理数据接收端、132-存储位置获取模块、133-索引关系创建模块、134-待处理数据获取模块、135-数据剔除模块、200-前端处理器、300-压缩存储云平台、400-数据采集终端、410-数据传输端口。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
现有跨进程数据传输方法无法对对象数据进行优先级确定,并基于优先级先后进行压缩传输,增加了跨进程数据传输方法的负载,为了解决上述问题,我们提出了一种基于大数据的数据跨进程压缩存储方法,基于大数据的数据跨进程压缩存储方法的执行流程,包括:
获取待压缩任务集,然后加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,最终获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集;本发明实施例通过优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,基于不同数据采集终端400的优先级来处理数据,解决了现有跨进程数据传输方法无法对对象数据进行优先级确定的问题,提高了数据压缩和存储的效率。
本发明实施例提供了一种基于大数据的数据跨进程压缩存储方法,如图1所示,示出了基于大数据的数据跨进程压缩存储方法的实现流程示意图,所述基于大数据的数据跨进程压缩存储方法,具体包括:
步骤S10,获取待压缩任务集,其中,所述待压缩任务集中包括不同数据采集终端400收集到的待处理数据,待处理数据对应至少一组服务进程。
步骤S20,加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列。
步骤S30,获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集。
在本实施例中,数据采集终端400包括但不限于机房机柜、交换机、物理机、移动终端,通过数据采集终端400的外接接口或数据采集终端400自身运行获取待处理数据,同时,由于不同数据采集终端400的优先级是不同的,若不能及时处理优先级高的数据采集终端400获取的数据,会影响整个方法流程的数据处理效率,基于此,需要对数据采集终端400采集到的数据进行优先级排序是十分有必要的。
示例性的,数据采集终端400收集到的待压缩任务集由多个(property,value)二元组构成,采集待压缩任务集后,需要对待压缩任务集进行加密处理,加密流程为,数据采集终端400采集完成后,产生一个QEMU加密进程,产生QEMU加密进程的同时,配合产生一个XDC加密进程,数据采集终端400开启QEMU加密进程与XDC加密进程之间的N个通道,通过N个通道可以实现加密传输数据。
本发明实施例通过优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,基于不同数据采集终端400的优先级来处理数据,解决了现有跨进程数据传输方法无法对对象数据进行优先级确定的问题,提高了数据压缩和存储的效率。
本发明实施例提供了获取待压缩任务集的方法,如图2所示,示出了获取待压缩任务集方法的实现流程示意图,所述获取待压缩任务集的方法,具体包括:
步骤S101,响应数据采集终端400跨进程指令。
步骤S102,基于Zabbix框架与不同数据采集终端400建立联系,创建不同数据采集终端400的Zabbix组织架构图。
步骤S103,实时获取数据采集终端400采集到的待处理数据,获取待处理数据后,对待处理数据预处理。
示例性的,Zabbix框架不但能够实现响应数据采集终端400设备的组网,还能基于通信协议对响应数据采集终端400进行监控和统一管理,需要说明的是,Zabbix组织架构图创建时,对应产生数据采集终端400对应的拓扑架构树,通过拓扑架构树结合随机森林算法对数据采集终端400进行权重赋值,且权重赋值是通过主成分分析法计算得到,其中,权重赋值的计算公式如下:
Zj=Lj1*X1+Lj2*X2+…+Ljp*Xp(j≤p) (1)
Figure BDA0003813129300000071
公式(1)中,其中,Zj为第j个主权重因素的线性组合;X1,X2,…,Xp为原始的p个数据采集终端400;Ljp为第p个数据采集终端400在主权重因素Zj中的分配系数。
公式(2)中,Fp分别表示每个数据采集终端400在拓扑架构树上的权重值,Aj表示第j种主权重因素的占比,B为常数比例因子。
本发明实施例提供了获取待处理数据后,对待处理数据预处理的方法,如图3所示,示出了获取待处理数据后,对待处理数据预处理方法的实现流程示意图,所述获取待处理数据后,对待处理数据预处理的方法,具体包括:
步骤S1031,加载待处理数据。
步骤S1032,针对任一数据采集终端400环境下数据传输端口410,获取数据传输端口410所在存储位置。
步骤S1033,基于数据传输端口410所在存储位置,将待处理数据暂存在云数据存储空间内,并建立数据传输端口410与云数据存储空间之间的索引关系。
步骤S1034,加载数据传输端口410与云数据存储空间之间的索引关系。
步骤S1035,基于数据传输端口410与云数据存储空间之间的索引关系,获取待处理数据。
步骤S1036,对待处理数据进行滤波处理,消除干扰数据,基于随机采用一致性算法,对滤波处理后的待处理数据剔除,得到剔除后的待处理数据。
示例性的,从所述待处理数据中查找到关于数据传输端口410的m个点云数据存储空间特征向量,并利用随机采用一致性算法对所述每个点云数据存储空间特征向量分别进行特征计算,从而得到待处理数据的m个云特征,构建云特征构建k-dtree结构,基于k-dtree结构对待处理数据剔除。
根据m个VFH点云特征的时相不变性,利用机器学习的方法对所述m个VFH点云特征进行特征提取和匹配,得到匹配成功的快递包裹的VFH点云特征,并删除匹配失败的VFH点云特征。
示例性的,任一数据采集终端400对应多组数据传输端口410,且数据传输端口410支持USB或COM端口,数据传输端口410型号为RS485端口,同时,数据采集终端400还带有模拟量输入口:MS-N-590,MS-N-590可存储多达20组的压缩任务集,由数据采集终端400控制压缩任务集的选择。
示例性的,数据采集终端400自带5G的GPRS功能,无需连接网线即可实现远程WEB直接访问设备,具备通过网络更改设备参数,实时查看数据变化,远程下载校准的功能。
本发明实施例提供了创建不同响应数据采集终端400的Zabbix组织架构图的方法,如图4所示,示出了创建不同响应数据采集终端400的Zabbix组织架构图方法的实现流程示意图,所述创建不同响应数据采集终端400的Zabbix组织架构图的方法,具体包括:
步骤S1021,识别数据采集终端400所位置,对数据采集终端400的位置简化处理,得到关键组织架构点。
步骤S1022,根据数据采集终端400之间的内在关联组织以及关联组织架构点构建组织架构图。
本发明实施例提供了通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列的方法,如图5所示,示出了通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列方法的实现流程示意图,所述通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列的方法,具体包括:
步骤S201,加载压缩队列;
步骤S202,遍历压缩队列中目标压缩任务集,识别目标压缩任务集中待处理数据;
步骤S203,获取基于重要性和相关性分析,调取数据采集终端400的Zabbix组织架构图,基于随机森林监督模型确定数据采集终端400的Zabbix组织架构图中数据采集终端400的优先级。
步骤S204,获取待处理数据,通过随机森林监督模型确定待处理数据所对应的数据采集终端400的优先级,形成排序压缩队列。
示例性的,通过随机森林监督模型分别计算所述n个目标压缩任务集中每一个影响特征为每一个特征值时所述目标压缩任务集的第一基尼系数,获取所有所述第一基尼系数,然后从所有影响特征中筛选出第一基尼系数最小的第一影响特征;
然后将所述第一影响特征作为所述随机森林监督决策树模型的根节点,并将所述第一特征值作为所述根节点的切分点,然后分别计算所述切分点对应训练数据集中每一个影响特征为每一个特征值时所述目标压缩任务集的第二基尼系数,通过第二基尼系数计算第二影响特征,以所述第二影响特征作为每个分支的分裂节点,并将所述第二特征值作为分裂节点的切分点。
判断当前的决策树模型是否满足预设的停止建树条件,若当前的决策树模型满足所述停止建树条件,将当前的决策树模型作为最优的随机森林监督模型。
另一方面,本发明实施例还提供了一种基于大数据的数据跨进程压缩存储系统,如图6所示,示出了基于大数据的数据跨进程压缩存储系统的框架示意图,所述基于大数据的数据跨进程压缩存储系统,具体包括:
终端服务器100,用于获取待压缩任务集,其中,所述待压缩任务集中包括不同数据采集终端400收集到的待处理数据,待处理数据对应至少一组服务进程;
前端处理器200,用于加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列;
压缩存储云平台300,用于获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集。
在本实施例中,数据采集终端400包括但不限于机房机柜、交换机、物理机、移动终端,通过数据采集终端400的外接接口或数据采集终端400自身运行获取待处理数据,同时,由于不同数据采集终端400的优先级是不同的,若不能及时处理优先级高的数据采集终端400获取的数据,会影响整个方法流程的数据处理效率,基于此,需要对数据采集终端400采集到的数据进行优先级排序是十分有必要的。
示例性的,数据采集终端400收集到的待压缩任务集由多个(property,value)二元组构成,采集待压缩任务集后,需要对待压缩任务集进行加密处理,加密流程为,数据采集终端400采集完成后,产生一个QEMU加密进程,产生QEMU加密进程的同时,配合产生一个XDC加密进程,数据采集终端400开启QEMU加密进程与XDC加密进程之间的N个通道,通过N个通道可以实现加密传输数据。
本发明实施例通过优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,基于不同数据采集终端400的优先级来处理数据,解决了现有跨进程数据传输方法无法对对象数据进行优先级确定的问题,提高了数据压缩和存储的效率。
本发明实施例提供了终端服务器100,如图7所示,示出了终端服务器100的结构示意图,所述终端服务器100,具体包括:
指令响应端110,用于响应数据采集终端400跨进程指令;
组织架构建立单元120,基于Zabbix框架与不同数据采集终端400建立联系,创建不同数据采集终端400的Zabbix组织架构图;
数据预处理单元130,实时获取数据采集终端400采集到的待处理数据,获取待处理数据后,对待处理数据预处理。
本发明实施例提供了数据预处理单元130,如图8所示,示出了数据预处理单元130的示意图,所述数据预处理单元130,具体包括:
待处理数据接收端131,用于加载待处理数据;
存储位置获取模块132,针对任一数据采集终端400环境下数据传输端口410,获取数据传输端口410所在存储位置;
索引关系创建模块133,基于数据传输端口410所在存储位置,将待处理数据暂存在云数据存储空间内,并建立数据传输端口410与云数据存储空间之间的索引关系;
待处理数据获取模块134,基于数据传输端口410与云数据存储空间之间的索引关系,获取待处理数据。
数据剔除模块135,用于对待处理数据进行滤波处理,消除干扰数据,随机采用一致性算法,对滤波处理后的待处理数据剔除,得到剔除后的待处理数据。
示例性的,待处理数据接收端131为螺旋天线,且天线的防护等级为IP67,适应于绝大多数恶劣环境,所有天线均为本安型防爆,所有天线电磁兼容性都符合欧盟EMC标准。
综上所述,本发明实施例通过优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列,基于不同数据采集终端400的优先级来处理数据,解决了现有跨进程数据传输方法无法对对象数据进行优先级确定的问题,提高了数据压缩和存储的效率。
需要说明的是,对于前述的各实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,涉及的动作和模块并不一定是本发明所必须的。
本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或通信连接可以是通过一些接口,装置或单元之间的间接耦合或通信连接,可以是电信或者其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对发明的保护范围进行限制。显然,所描述的实施例仅仅是本发明部分实施例,而不是全部实施例。基于这些实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明所要保护的范围。尽管参照上述实施例对本发明进行了详细的说明,本领域普通技术人员依然可以在不冲突的情况下,不作出创造性劳动对本发明各实施例中的特征根据情况相互组合、增删或作其他调整,从而得到不同的、本质未脱离本发明的构思的其他技术方案,这些技术方案也同样属于本发明所要保护的范围。

Claims (10)

1.一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述基于大数据的数据跨进程压缩存储方法包括:
获取待压缩任务集,其中,所述待压缩任务集中包括不同数据采集终端收集到的待处理数据,待处理数据对应至少一组服务进程;
加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列;
获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集。
2.如权利要求1所述的一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述获取待压缩任务集的方法,具体包括:
响应数据采集终端跨进程指令;
基于Zabbix框架与不同数据采集终端建立联系,创建不同数据采集终端的Zabbix组织架构图;
实时获取数据采集终端采集到的待处理数据,获取待处理数据后,对待处理数据预处理。
3.如权利要求2所述的一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述获取待处理数据后,对待处理数据预处理的方法,具体包括:
加载待处理数据;
针对任一数据采集终端环境下数据传输端口,获取数据传输端口所在存储位置;
基于数据传输端口所在存储位置,将待处理数据暂存在云数据存储空间内,并建立数据传输端口与云数据存储空间之间的索引关系。
4.如权利要求3所述的一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述获取待处理数据后,对待处理数据预处理的方法,具体还包括:
加载数据传输端口与云数据存储空间之间的索引关系;
基于数据传输端口与云数据存储空间之间的索引关系,获取待处理数据;
对待处理数据进行滤波处理,消除干扰数据,随机采用一致性算法,对滤波处理后的待处理数据剔除,得到剔除后的待处理数据。
5.如权利要求4所述的一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述创建不同响应数据采集终端的Zabbix组织架构图的方法,具体包括:
识别数据采集终端所位置,对数据采集终端的位置简化处理,得到关键组织架构点;
根据数据采集终端之间的内在关联组织以及关联组织架构点构建组织架构图。
6.如权利要求5所述的一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列的方法,具体包括:
加载压缩队列;
遍历压缩队列中目标压缩任务集,识别目标压缩任务集中待处理数据;
获取基于重要性和相关性分析,调取数据采集终端的Zabbix组织架构图,基于随机森林监督模型确定数据采集终端的Zabbix组织架构图中数据采集终端的优先级。
7.如权利要求6所述的一种基于大数据的数据跨进程压缩存储方法,其特征在于,所述通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列的方法,具体还包括:
获取待处理数据,通过随机森林监督模型确定待处理数据所对应的数据采集终端的优先级,形成排序压缩队列。
8.一种基于权利要求1-7任一所述的基于大数据的数据跨进程压缩存储方法的一种基于大数据的数据跨进程压缩存储系统,其特征在于,所述基于大数据的数据跨进程压缩存储系统包括:
终端服务器,用于获取待压缩任务集,其中,所述待压缩任务集中包括不同数据采集终端收集到的待处理数据,待处理数据对应至少一组服务进程;
前端处理器,用于加载目标压缩任务集,基于目标压缩任务集创建压缩队列,逐一遍历创建的压缩队列,通过预训练的优先级确定模型对压缩队列中的目标压缩任务集的优先顺序,形成排序压缩队列;
压缩存储云平台,用于获取优先级排序后的排序压缩队列,排序压缩队列导入服务进程中,通过至少一组服务进程对排序压缩队列进行压缩处理,得到压缩存储后的数据集。
9.如权利要求8所述的一种基于大数据的数据跨进程压缩存储系统,其特征在于,所述终端服务器包括:
指令响应端,用于响应数据采集终端跨进程指令;
组织架构建立单元,基于Zabbix框架与不同数据采集终端建立联系,创建不同数据采集终端的Zabbix组织架构图;
数据预处理单元,实时获取数据采集终端采集到的待处理数据,获取待处理数据后,对待处理数据预处理。
10.如权利要求9所述的一种基于大数据的数据跨进程压缩存储系统,其特征在于,所述数据预处理单元包括:
待处理数据接收端,用于加载待处理数据;
存储位置获取模块,针对任一数据采集终端环境下数据传输端口,获取数据传输端口所在存储位置;
索引关系创建模块,基于数据传输端口所在存储位置,将待处理数据暂存在云数据存储空间内,并建立数据传输端口与云数据存储空间之间的索引关系。
CN202211018311.1A 2022-08-24 2022-08-24 一种基于大数据的数据跨进程压缩存储方法及系统 Active CN115357410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211018311.1A CN115357410B (zh) 2022-08-24 2022-08-24 一种基于大数据的数据跨进程压缩存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211018311.1A CN115357410B (zh) 2022-08-24 2022-08-24 一种基于大数据的数据跨进程压缩存储方法及系统

Publications (2)

Publication Number Publication Date
CN115357410A true CN115357410A (zh) 2022-11-18
CN115357410B CN115357410B (zh) 2024-03-29

Family

ID=84005419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211018311.1A Active CN115357410B (zh) 2022-08-24 2022-08-24 一种基于大数据的数据跨进程压缩存储方法及系统

Country Status (1)

Country Link
CN (1) CN115357410B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117478617A (zh) * 2023-11-03 2024-01-30 石家庄常宏智能科技有限公司 一种多功能物联网关数据快速传输方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0784804A (ja) * 1993-09-20 1995-03-31 Fujitsu Ltd プロセス間通信方式
CN103269320A (zh) * 2013-04-25 2013-08-28 中国人民解放军国防科学技术大学 数据转发方法和接入路由器
CN111400005A (zh) * 2020-03-13 2020-07-10 北京搜狐新媒体信息技术有限公司 一种数据处理方法、装置及电子设备
CN113760578A (zh) * 2021-08-28 2021-12-07 特斯联科技集团有限公司 跨进程快速传输大数据的方法、装置、设备及计算机程序

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0784804A (ja) * 1993-09-20 1995-03-31 Fujitsu Ltd プロセス間通信方式
CN103269320A (zh) * 2013-04-25 2013-08-28 中国人民解放军国防科学技术大学 数据转发方法和接入路由器
CN111400005A (zh) * 2020-03-13 2020-07-10 北京搜狐新媒体信息技术有限公司 一种数据处理方法、装置及电子设备
CN113760578A (zh) * 2021-08-28 2021-12-07 特斯联科技集团有限公司 跨进程快速传输大数据的方法、装置、设备及计算机程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王宝云 等: "基于Zabbix的新一代天气雷达ROSE系统监控平台", 《气象科技》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117478617A (zh) * 2023-11-03 2024-01-30 石家庄常宏智能科技有限公司 一种多功能物联网关数据快速传输方法
CN117478617B (zh) * 2023-11-03 2024-04-19 石家庄常宏智能科技有限公司 一种多功能物联网关数据快速传输方法

Also Published As

Publication number Publication date
CN115357410B (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
CN107888716A (zh) 一种域名解析服务器的排序方法、终端设备及存储介质
CN102724219A (zh) 网络数据的计算机处理方法及系统
CN106844397A (zh) 基于分库分表的任务传输方法、装置及系统
CN115357410A (zh) 一种基于大数据的数据跨进程压缩存储方法及系统
CN110201393A (zh) 一种配置数据的存储方法、装置及电子设备
CN110198292A (zh) 域名识别方法和装置、存储介质及电子装置
CN103955436A (zh) 一种数据处理装置和终端
CN105721612B (zh) 数据传输方法和装置
CN110414865A (zh) 一种审核任务的分配方法、装置、计算机设备和存储介质
CN208940010U (zh) 一种内外网同步系统
CN108829526A (zh) 一种进程间通信方法、电子设备及可读存储介质
CN117539619A (zh) 基于云边融合的算力调度方法、系统、设备和存储介质
CN204425400U (zh) 应用服务器系统
CN113947851B (zh) 智能柜的组序方法、装置及电子设备
CN116431826A (zh) 知识图谱的更新方法、装置、设备及存储介质
CN114217875B (zh) 处理订单的方法、装置、设备及存储介质
CN110555138A (zh) 一种云计算架构下的混合云存储方法
CN115509749A (zh) 任务执行方法和装置、存储介质和电子设备
CN108873781A (zh) 一种全自动数字化设备
CN111258821B (zh) 一种基于云计算的备份数据快速提取方法
CN112668912A (zh) 人工神经网络的训练方法、动态计算切分调度方法、存储介质及系统
CN117762632B (zh) 一种基于算力操作系统的算力管理方法
CN110532113A (zh) 信息处理方法、装置、计算机可读存储介质及电子设备
CN108874564A (zh) 一种进程间通信方法、电子设备及可读存储介质
CN113342991B (zh) 一种基于人工智能的知识图谱融合系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240304

Address after: 100124 3003, floor 26, building 3, No. 82, Middle East Fourth Ring Road, Chaoyang District, Beijing

Applicant after: Ruishi Fangda talent Technology Group Co.,Ltd.

Country or region after: China

Address before: 100124 273, Floor 05, Room 101, Floor 1 to 14, Building 4, Yard 59, Huahua Road, Chaoyang District, Beijing

Applicant before: Beijing Keyun Times Information Technology Co.,Ltd.

Country or region before: China

GR01 Patent grant
GR01 Patent grant