CN115297183A - 一种数据处理方法、装置、电子设备和存储介质 - Google Patents
一种数据处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN115297183A CN115297183A CN202210902315.XA CN202210902315A CN115297183A CN 115297183 A CN115297183 A CN 115297183A CN 202210902315 A CN202210902315 A CN 202210902315A CN 115297183 A CN115297183 A CN 115297183A
- Authority
- CN
- China
- Prior art keywords
- message
- data
- message data
- piece
- identification information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 25
- 238000013507 mapping Methods 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000015654 memory Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 35
- 238000012546 transfer Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 230000008676 import Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/04—Protocols for data compression, e.g. ROHC
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/14—Relay systems
- H04B7/15—Active relay systems
- H04B7/185—Space-based or airborne stations; Stations for satellite systems
- H04B7/18502—Airborne stations
- H04B7/18506—Communications with or from aircraft, i.e. aeronautical mobile service
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- Astronomy & Astrophysics (AREA)
- Aviation & Aerospace Engineering (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据库技术领域,尤其涉及一种数据处理方法、装置、电子设备和存储介质,用以提高数据处理效率。其中,方法包括:获取多条报文数据以及各报文数据的标识信息,报文数据的格式为层级数据格式HDF5;基于各报文数据的标识信息,将各报文数据划分为多个报文集合;基于预设映射规则,分别对多个报文集合中的报文数据进行映射,获得各报文集合的报文记录,并将各报文记录存储在云原生多模数据库中。由于本申请通过预先将HDF5报文数据按照发送方和发送时间划分为多个报文集合,并基于预设映射规则,将报文集合压缩为一条报文记录,直接存储在云原生多模数据库即可,能够有效提高数据处理效率。
Description
技术领域
本申请涉及电信技术领域,尤其涉及一种数据处理方法、装置、电子设备和存储介质。
背景技术
层级数据格式(Hierarchical Data Format,HDF)是设计用来存储和组织大量数据的一组文件格式。从二十世纪九十年代开始,HDF格式成为存储和发布地球观测系统(Earth Observation System,EOS)数据的标准格式,当前版本是HDF5。基于这个历史原因,国内外航空业普遍采用HDF5作为航空报文的存储格式。由于云原生多模数据库能够提供宽表、文件、搜索等多种数据模型,支持毫秒级在线数据处理、海量数据低成本存储和分析,目前,主要是通过云原生多模数据库对HDF5航空报文数据进行存储。
相关技术中,在将HDF5航空报文数据导入云原生多模数据库的过程中,通过云原生多模数据库的写入模块将HDF5航空报文数据转化为二进制数据,并写入队列,然后批量提交给存储模块,存储模块对接收的数据进行保存和管理。但是,由于HDF5航空报文数据量大,存储模块的性能受机器性能影响,容易成为数据导入过程的瓶颈,基于上述方式进行数据导入,导入速度缓慢。效率低。
发明内容
本申请实施例提供一种数据处理方法、装置、电子设备和存储介质,用以提高数据处理效率。
本申请实施例提供的一种数据处理方法,包括:
获取多条报文数据以及各条所述报文数据的标识信息,所述报文数据的格式为层级数据格式HDF5,所述标识信息用于标识对应的报文数据的发送方和发送时间;
基于各条所述报文数据的标识信息,将各条所述报文数据划分为多个报文集合,每个报文集合中包含的报文数据的发送方相同,且发送时间属于同一时间区间;
基于预设映射规则,分别对所述多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并存储将各个所述报文记录存储在云原生多模数据库中。
在本申请中,基于HDF5报文数据结构清晰明了的特性,预先将报文数据按照发送方和发送时间划分为多个报文集合,在将报文数据导入云原生多模数据库过程中,基于预设映射规则,将报文集合压缩为一条报文记录,能够大幅减少报文所需占用的存储空间,最后直接将报文记录存储在云原生多模数据库即可,能够有效提高数据处理效率。
在一种可选的实施方式中,所述基于预设映射规则,分别对所述多个报文集合中的报文数据进行压缩,获得各个报文集合各自的报文记录,包括:
针对任意一个报文集合,基于所述任意一个报文集合中的各条报文数据的标识信息的相同字段,对所述各条报文进行合并得到合并报文;
基于预设映射规则对所述合并报文进行映射,获得所述报文集合对应的报文记录。
基于上述方式,通过按照报文数据的相同字段合并报文数据,能够减少报文数据中的重复数据,减少报文数据所需占用的存储空间,进而在将报文数据导入云原生多模数据库过程中,提高数据处理效率。
在一种可选的实施方式中,在所述基于各条报文数据各自的标识信息,将所述各条报文数据划分为多个报文集合之前,还包括;
分别对多条所述报文数据进行解析,获得各条标准格式的报文数据,所述标准格式为符合超文本传输协议http的压缩格式。
在一种可选的实施方式中,所述基于预设映射规则对所述合并报文进行映射,获得所述报文集合对应的报文记录包括:
基于预设映射规则,对所述合并报文包含的字节进行映射,获得所述报文集合对应的二进制格式的所述报文记录。
基于上述方式,基于预设映射规则,对合并报文进行映射,能够进一步减少合并报文所需占用的存储空间,同时映射得到的报文记录可以直接存储在云原生多模数据库中,提高了数据处理效率。
在一种可选的实施方式中,所述基于各条所述报文数据的标识信息,将各条所述报文数据划分为多个报文集合,包括:
基于各条所述报文数据的标识信息,确定各条所述报文数据的发送方,并基于各条所述报文数据的发送方,将各条所述报文数据划分为多个中间集合,同一中间集合中的报文数据的发送方相同;
针对任意一个中间集合,基于所述任意一个中间集合中包含的各条报文数据的标识信息,确定各条所述报文数据的发送时间,并基于各条所述报文数据的发送时间,将各条所述报文数据划分为多个报文集合,同一报文集合中的报文数据的发送时间属于同一预设时间区间。
基于上述方式,通过按照报文数据的标识信息将报文数据划分为多个报文集合,在云原生多模数据库存储报文数据时,无需进行分组操作,节省云原生多模数据库的计算资源,提高数据处理效率。
在一种可选的实施方式中,所述报文数据中包含用于表征所述报文数据的发送方当前的运行状态的信息。
本申请实施例提供的一种数据处理装置,包括:
获取单元,用于获取多条报文数据以及各条所述报文数据的标识信息,所述报文数据的格式为层级数据格式HDF5,所述标识信息用于标识对应的报文数据的发送方和发送时间;
划分单元,用于基于各条所述报文数据的标识信息,将各条所述报文数据划分为多个报文集合,每个报文集合中包含的报文数据的发送方相同,且发送时间属于同一时间区间;
映射单元,用于基于预设映射规则,分别对所述多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并将各个所述报文记录存储在云原生多模数据库中。
可选的,所述映射单元具体用于:
针对任意一个报文集合,基于所述任意一个报文集合中的各条报文数据的标识信息的相同字段,对所述各条报文进行合并得到合并报文;
基于预设映射规则对所述合并报文进行映射,获得所述报文集合对应的报文记录。
可选的,所述装置还包括解析单元,用于;
分别对多条所述报文数据进行解析,获得各条标准格式的报文数据,所述标准格式为符合超文本传输协议http的压缩格式。
可选的,所述映射单元具体用于:
基于预设映射规则,对所述合并报文包含的字节进行映射,获得所述报文集合对应的二进制格式的所述报文记录。
可选的,所述划分单元具体用于:
基于各条所述报文数据的标识信息,确定各条所述报文数据的发送方,并基于各条所述报文数据的发送方,将发送方相同的各条所述报文数据划分至同一中间集合中,获得多个中间集合;
针对任意一个中间集合,基于所述任意一个中间集合中包含的报文数据的标识信息,确定所述报文数据的发送时间,并基于所述发送时间,将属于同一时间区间的所述报文数据划分至同一报文集合中,获得多个所述报文集合。
可选的,所述报文数据中包含用于表征所述报文数据的发送方当前的运行状态的信息。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意一种数据处理方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述任意一种数据处理方法的步骤。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述任意一种数据处理方法的步骤。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中的一种应用场景的一个可选的示意图;
图2为本申请实施例中的一种数据处理方法的实施流程图;
图3为本申请实施例中的一种数据划分方法的流程示意图;
图4为本申请实施例中的一种数据处理方法的逻辑示意图;
图5为本申请实施例中的一种数据处理装置的结构示意图;
图6为应用本申请实施例的一种电子设备的一个硬件组成结构示意图;
图7为应用本申请实施例的另一种电子设备的一个硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
航空报文:经历了二进制到结构化(HDF5)的转化,目前正转向知识化和智能化趋势。所谓知识化和智能化趋势即是航空报文大量数据上云,通过云上对航空报文进行统一处理、分析以及训练,将结果反馈至机务人员,机务人员根据结果提升飞机故障检查能力以及服务水平,形成正向循环。
HDF5:采用群组+数据集组织文件格式,天然具有高压缩性。经过测算,50GB的报文数据可以压缩为2GB,能够达到25倍的压缩率。HDF5格式的数据必须经过转换成符合http的压缩格式(标准格式)才能写入云原生多模数据库,这里就导致HDF5格式的数据必须解压成单笔或是批量标准格式数据才能提交至云原生多模数据库。
云原生多模数据库:提供宽表、文件、搜索等多种数据模型,支持毫秒级在线数据处理、海量数据低成本存储和分析。提供统一SQL能力,进行实时查询、检索和分析,内置分析计算引擎满足计算需求。满足航空、物联网、车联网、工业互联网等多业务场景需求。云原生多模数据库内部可分为写入实例和存储底座,写入实例负责将导入数据转化为二进制数据,并写入队列。然后批量提交给存储底座。存储底座负责实际的数据保存和管理。其中,写入实例可以横向无限扩展,存储底座和机器性能相关。因此HDF5数据导入云原生多模数据库的瓶颈在于存储底座的性能。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示,其为本申请实施例的应用场景示意图。该应用场景图中包括两个终端设备110和一个服务器120。
在本申请实施例中,终端设备110包括但不限于手机、平板电脑、笔记本电脑、台式电脑、电子书阅读器、智能语音交互设备、智能家电、车载终端等设备;终端设备上可以安装有数据处理相关的客户端,该客户端可以是软件(例如浏览器、数据导入软件等),也可以是网页、小程序等,服务器120则是与软件或是网页、小程序等相对应的后台服务器,或者是专门用于进行数据处理的服务器,本申请不做具体限定。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要说明的是,本申请实施例中的数据处理方法可以由电子设备执行,该电子设备可以为服务器120或者终端设备110,即,该方法可以由服务器120或者终端设备110单独执行,也可以由服务器120和终端设备110共同执行。比如由服务器120和终端设备110共同执行时,终端设备110获取多条报文数据以及各条报文数据的标识信息,并将报文数据和对应的标识信息发送给服务器120;服务器120基于各条报文数据的标识信息,将各条报文数据划分为多个报文集合;基于预设映射规则,分别对多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并存储将各个报文记录存储在云原生多模数据库中。
在一种可选的实施方式中,终端设备110与服务器120之间可以通过通信网络进行通信。
在一种可选的实施方式中,通信网络是有线网络或无线网络。
需要说明的是,图1所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本申请实施例中不做具体限定。
本申请实施例中,当服务器的数量为多个时,多个服务器可组成为一区块链,而服务器为区块链上的节点;如本申请实施例所公开的数据处理方法,其中所涉及的航空报文可保存于区块链上。
此外,本申请实施例可应用于各种场景,不仅包括数据处理场景,还包括但不限于云技术、人工智能、智慧交通、辅助驾驶等场景。
下面结合上述描述的应用场景,参考附图来描述本申请示例性实施方式提供的数据处理方法,需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
参阅图2所示,为本申请实施例提供的一种数据处理方法的实施流程图,该方法的具体实施流程包括如下步骤S21-S23:
S21:获取多条报文数据以及各条报文数据的标识信息;
其中,报文数据的格式为层级数据格式HDF5,标识信息用于标识对应的报文数据的发送方和发送时间。报文数据可以是航空报文,则报文数据的发送方可以是飞机包含的各种设备,例如,飞机电门、发动机等设备,报文数据还可以是车载报文,则报文数据的发送方可以是汽车包含的各种设备,例如,汽车变速系统、发动机等设备,本申请在此不做具体限定。
在本申请实施例中,主要是以报文数据为航空报文为例进行说明的,下面以100条飞机电门相关的航空报文在HDF5格式下进行具体说明:
报文1:gear flight_no:AC0073,gear_no:no29 1645050457000 1;
报文2:gear flight_no:AC0073,gear_no:no29 1645050457001 0;
报文3:gear flight_no:AC0073,gear_no:no29 1645050457002 1;
报文4:gear flight_no:AC0073,gear_no:no29 1645050457003 1;
...
报文100:gear flight_no:AC0073,gear_no:no29 1645050457099 1。
其中,gear表示电门,flight_no:AC0073表示飞机编号为AC0073,gear_no:no29表示电门编号为29,1645050457000-1645050457099表示报文的发送时间,1、0、1、1…1表示报文中包含的值。以报文1为例,标识信息为:gear flight_no:AC0073,gear_no:no291645050457000,其中,gear flight_no:AC0073,gear_no:no29用于标识航空报文的发送方,1645050457000用于标识航空报文的发送时间。
在一种可选的实施方式中,报文数据中包含用于表征报文数据的发送方当前的运行状态的信息。
具体地,飞机上包含大量设备,每个设备每1秒或每2秒都会记录自身的运行状态,并以航空报文的形式发送出去,以上述列举的报文1为例“1”为报文中包含的值,即为航空报文中包含的用于表征飞机电门当前的运行状态的信息。
S22:基于各条报文数据的标识信息,将各条报文数据划分为多个报文集合;
其中,每个报文集合中包含的报文数据的发送方相同,且发送时间属于同一时间区间。上述所列举的报文1-报文100为发送方相同的报文,可以根据报文数据的标识信息,将发送方相同的报文进一步按照发送时间划分,例如,按照小时分割,将发送时间在0点-1点的报文数据划分为一个报文集合,将发送时间在1点-2点的报文划分为一个报文集合,在此不进行一一列举。
S23:基于预设映射规则,分别对多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并存储将各个报文记录存储在云原生多模数据库中。
具体地,将报文数据按照发送方和发送时间划分后,由于在云原生多模数据库中是将一个小时的数据压缩为一条记录,然后覆盖写入存储的,因此可以基于预设映射规则,将一个报文集合中的报文数据映射为一条报文记录,直接存储在云原生多模数据库中。
在本申请实施例中,基于HDF5报文数据结构清晰明了的特性,预先将报文数据按照发送方和发送时间划分为多个报文集合,在将报文数据导入云原生多模数据库过程中,基于预设映射规则,将报文集合压缩为一条报文记录,能够大幅减少报文所需占用的存储空间,最后直接将报文记录存储在云原生多模数据库即可,能够有效提高数据处理效率。
在一种可选的实施方式中,在步骤S22之前,还可实施步骤S211;
分别对多条报文数据进行解析,获得各条标准格式的报文数据。
其中,标准格式为符合超文本传输协议http的压缩格式。由于HDF5格式的数据必须转换为标准格式后才能写入数据库,因此需要对报文数据进行解析,转换为符合http压缩格式的报文数据。
在一种可选的实施方式中,如图3所示,步骤S22可以实施为以下步骤S31-S34:
S31:基于各条报文数据的标识信息,确定各条报文数据的发送方;
S32:基于各条报文数据的发送方,将各条报文数据划分为多个中间集合,同一中间集合中的报文数据的发送方相同;
S33:针对任意一个中间集合,基于任意一个中间集合中包含的各条报文数据的标识信息,确定各条报文数据的发送时间,
S34:基于各条报文数据的发送时间,将各条报文数据划分为多个报文集合,同一报文集合中的报文数据的发送时间属于同一预设时间区间。
具体地,首先,基于报文数据的标识信息将发送方相同的报文数据划分至同一中间集合中,然后对于每个中间集合,基于报文数据的标识信息将发送时间属于同一时间区间的报文数据划分至同一报文集合中,获得多个报文集合。例如,将发送方相同的报文集合划分至同一中间集合,获得中间集合1和中间集合2,然后将发送时间属于同一时间区间的报文数据划分至同一报文集合中,将中间集合1划分为报文集合1和报文集合2,将中间集合2划分为报文集合3和报文集合4,最终获得4个报文集合。
在本申请实施例中,通过按照报文数据的标识信息将报文数据划分为多个报文集合,在云原生多模数据库存储报文数据时,无需进行分组操作,节省云原生多模数据库的计算资源,提高数据处理效率。
在一种可选的实施方式中,步骤S23可以实施为以下步骤1-2:
步骤1:针对任意一个报文集合,基于任意一个报文集合中的各条报文数据的标识信息的相同字段,对各条报文进行合并得到合并报文;
步骤2:基于预设映射规则对合并报文进行映射,获得报文集合对应的报文记录。
具体地,同一报文集合中的报文数据的发送方相同,相同字段可以是用于标识报文数据的发送方的字段,仍以上述列举的报文1-100为例,相同字段为:gear flight_no:AC0073,gear_no:no29,合并后得到的合并报文为:gear flight_no:AC0073,gear_no:no291645050457000,1645050457001…1645050457099 1,0,1,1…1。最后按照预设映射规则进行映射,获得报文集合对应的报文记录。
在本申请实施例中,通过按照报文数据的相同字段合并报文数据,能够减少报文数据中的重复数据,减少报文数据所需占用的存储空间,进而在将报文数据导入云原生多模数据库过程中,提高数据处理效率。
在一种可选的实施方式中,步骤2可以实施为:
基于预设映射规则,对合并报文包含的字节进行映射,获得报文集合对应的二进制格式的报文记录。
具体地,可以通过字节映射的方式对合并报文进行映射,例如,预设映射规则为:gear=001;flight_no=002;AC0073=003;gear_no=004;no29=005;1645050457000=006,对合并报文进行映射获得的报文记录为:001 002003004005 00600061…00699 1,0,1,1…1,这样的二进制格式的报文记录,可以直接写入云原生多模数据库。
在本申请实施例中,基于预设映射规则,对合并报文进行映射,能够进一步减少合并报文所需占用的存储空间,同时映射得到的报文记录可以直接存储在云原生多模数据库中,提高了数据处理效率。
云原生多模数据库内部可分为写入实例和存储底座,写入实例负责将导入数据转化为二进制数据,然后写入队列。然后批量提交给存储底座。存储底座负责实际的数据保存和管理,存储底座为了更好的压缩率,可以将一个小时的数据压缩成一条记录,然后覆盖写入存储。写入实例可以横向无限扩展,存储底座和机器性能相关。因此HDF5文件导入的瓶颈在于存储底座的性能。
本申请中的数据处理方法可以应用于将HDF5航空报文导入云原生多模数据库中,参阅图4,其为本申请实施例中的一种数据处理方法的逻辑示意图,其中,航空HDF5文件指包含HDF5航空报文的文件。首先,云原生多模数据HDF5专用软件开发工具包(以下简称SDK),负责读取航空HDF5文件,将航空HDF5文件解析成标准格式,然后将标准格式的航空报文按照发送方划分,并按照小时分割,获得报文集合,将多个报文集合批量提交至云原生多模数据库写入实例(以下简称写入实例)。写入实例接收到一个小时的报文集合后,直接将一个报文集合压缩为一笔二进制记录(报文记录),存储底座接收到这一笔二进制记录后,不用经过压缩操作,直接保存,能够有效提高数据导入效率。
在本申请实施例中,利用航空HDF5文件结构清晰明了的特性,通过定制化SDK,批量读取HDF5文件数据,并按小时切分提交,创造性按照一小时批量提交数据。然后通过云原生多模数据库写入实例将一小时数据转化为一笔记录,写入存储底座。解决了数据导入过程中的瓶颈和压缩问题。
另外,在进行数据导入之前,首先下载SDK,开通或安装云原生多模数据库,然后,设置SDK相关配置,保证能够访问云原生多模数据库,最后,设置SDK读取HDF5文件路径,启动SDK程序即可。
常规测试场景下,云原生多模数据库在3主机集群规格下,可提供每秒百万写入能力。利用通用接口读取2GB的HDF5文件,约9.6亿条航空工程值数据,需17小时才能完全导入云原生多模数据库。假如一年产生100TB的HDF5文件,至少需要45天以上才能导入这些数据。这种导入速度过于缓慢,而采用本申请中的数据处理方法,2GB的HDF5文件导入云原生多模数据库从原来17个小时直接缩减为0.5小时,提升了34倍的导入速度,100T数据导入时间从45天缩短至1.5天。
基于相同的发明构思,本申请实施例还提供一种数据处理装置。如图5所示,其为数据处理装置500的结构示意图,可以包括:
获取单元501,用于获取多条报文数据以及各条报文数据的标识信息,报文数据的格式为层级数据格式HDF5,标识信息用于标识对应的报文数据的发送方和发送时间;
划分单元502,用于基于各条报文数据的标识信息,将各条报文数据划分为多个报文集合,每个报文集合中包含的报文数据的发送方相同,且发送时间属于同一时间区间;
映射单元503,用于基于预设映射规则,分别对多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并将各个报文记录存储在云原生多模数据库中。
可选的,映射单元503具体用于:
针对任意一个报文集合,基于任意一个报文集合中的各条报文数据的标识信息的相同字段,对各条报文进行合并得到合并报文;
基于预设映射规则对合并报文进行映射,获得报文集合对应的报文记录。
可选的,装置还包括解析单元504,用于;
分别对多条报文数据进行解析,获得各条标准格式的报文数据,标准格式为符合超文本传输协议http的压缩格式。
可选的,映射单元503具体用于:
基于预设映射规则,对合并报文包含的字节进行映射,获得报文集合对应的二进制格式的报文记录。
可选的,划分单元502具体用于:
基于各条报文数据的标识信息,确定各条报文数据的发送方,并基于各条报文数据的发送方,将发送方相同的各条报文数据划分至同一中间集合中,获得多个中间集合;
针对任意一个中间集合,基于任意一个中间集合中包含的报文数据的标识信息,确定报文数据的发送时间,并基于发送时间,将属于同一时间区间的报文数据划分至同一报文集合中,获得多个报文集合。
可选的,报文数据中包含用于表征报文数据的发送方当前的运行状态的信息。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图6所示,包括存储器601,通讯模块603以及一个或多个处理器602。
存储器601,用于存储处理器602执行的计算机程序。存储器601可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器601可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器601也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器601是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器601可以是上述存储器的组合。
处理器602,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器602,用于调用存储器601中存储的计算机程序时实现上述数据处理方法。
通讯模块603用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器601、通讯模块603和处理器602之间的具体连接介质。本申请实施例在图6中以存储器601和处理器602之间通过总线604连接,总线604在图6中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线604可以分为地址总线、数据总线、控制总线等。为便于描述,图6中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
存储器601中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的数据处理方法。处理器602用于执行上述的数据处理方法,如图2所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图7所示,包括:通信组件710、存储器720、显示单元730、摄像头740、传感器750、音频电路760、蓝牙模块770、处理器780等部件。
通信组件710用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助用户收发信息。
存储器720可用于存储软件程序及数据。处理器780通过运行存储在存储器720的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器720可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器720存储有使得终端设备110能运行的操作系统。本申请中存储器720可以存储操作系统及各种应用程序,还可以存储执行本申请实施例数据处理方法的计算机程序。
显示单元730还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元730可以包括设置在终端设备110正面的显示屏732。其中,显示屏732可以采用液晶显示器、发光二极管等形式来配置。显示单元730可以用于显示本申请实施例中的数据处理用户界面等。
显示单元730还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元730可以包括设置在终端设备110正面的触摸屏731,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触摸屏731可以覆盖在显示屏732之上,也可以将触摸屏731与显示屏732集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元730可以显示应用程序以及对应的操作步骤。
摄像头740可用于捕获静态图像,用户可以将摄像头740拍摄的图像通过应用发布评论。摄像头740可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器780转换成数字图像信号。
终端设备还可以包括至少一种传感器750,比如加速度传感器751、距离传感器752、指纹传感器753、温度传感器754。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路760、扬声器761、传声器762可提供用户与终端设备110之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号,传输到扬声器761,由扬声器761转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器762将收集的声音信号转换为电信号,由音频电路760接收后转换为音频数据,再将音频数据输出至通信组件710以发送给比如另一终端设备110,或者将音频数据输出至存储器720以便进一步处理。
蓝牙模块770用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块770与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器780是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器720内的软件程序,以及调用存储在存储器720内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器780可包括一个或多个处理单元;处理器780还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器780中。本申请中处理器780可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的数据处理方法。另外,处理器780与显示单元730耦接。
在一些可能的实施方式中,本申请提供的数据处理方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行本说明书上述描述的根据本申请各种示例性实施方式的数据处理方法中的步骤,例如,电子设备可以执行如图2中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括计算机程序,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机程序可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序命令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序命令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的命令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序命令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的命令产生包括命令装置的制造品,该命令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序命令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的命令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种数据处理方法,其特征在于,该方法包括:
获取多条报文数据以及各条所述报文数据的标识信息,所述报文数据的格式为层级数据格式HDF5,所述标识信息用于标识对应的报文数据的发送方和发送时间;
基于各条所述报文数据的标识信息,将各条所述报文数据划分为多个报文集合,每个报文集合中包含的报文数据的发送方相同,且发送时间属于同一时间区间;
基于预设映射规则,分别对所述多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并将各个所述报文记录存储在云原生多模数据库中。
2.如权利要求1所述的方法,其特征在于,所述基于预设映射规则,分别对所述多个报文集合中的报文数据进行压缩,获得各个报文集合各自的报文记录,包括:
针对任意一个报文集合,基于所述任意一个报文集合中的各条报文数据的标识信息的相同字段,对所述各条报文进行合并得到合并报文;
基于预设映射规则对所述合并报文进行映射,获得所述报文集合对应的报文记录。
3.如权利要求1所述的方法,其特征在于,在所述基于各条报文数据各自的标识信息,将所述各条报文数据划分为多个报文集合之前,还包括;
分别对多条所述报文数据进行解析,获得各条标准格式的报文数据,所述标准格式为符合超文本传输协议http的压缩格式。
4.如权利要求2所述的方法,其特征在于,所述基于预设映射规则对所述合并报文进行映射,获得所述报文集合对应的报文记录包括:
基于预设映射规则,对所述合并报文包含的字节进行映射,获得所述报文集合对应的二进制格式的所述报文记录。
5.如权利要求1所述的方法,其特征在于,所述基于各条所述报文数据的标识信息,将各条所述报文数据划分为多个报文集合,包括:
基于各条所述报文数据的标识信息,确定各条所述报文数据的发送方,并基于各条所述报文数据的发送方,将各条所述报文数据划分为多个中间集合,同一中间集合中的报文数据的发送方相同;
针对任意一个中间集合,基于所述任意一个中间集合中包含的各条报文数据的标识信息,确定各条所述报文数据的发送时间,并基于各条所述报文数据的发送时间,将各条所述报文数据划分为多个报文集合,同一报文集合中的报文数据的发送时间属于同一预设时间区间。
6.如权利要求1所述的方法,其特征在于,所述报文数据中包含用于表征所述报文数据的发送方当前的运行状态的信息。
7.一种数据处理装置,其特征在于,包括:
获取单元,用于获取多条报文数据以及各条所述报文数据的标识信息,所述报文数据的格式为层级数据格式HDF5,所述标识信息用于标识对应的报文数据的发送方和发送时间;
划分单元,用于基于各条所述报文数据的标识信息,将各条所述报文数据划分为多个报文集合,每个报文集合中包含的报文数据的发送方相同,且发送时间属于同一时间区间;
映射单元,用于基于预设映射规则,分别对所述多个报文集合中的报文数据进行映射,获得各个报文集合各自的报文记录,并将各个所述报文记录存储在云原生多模数据库中。
8.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6中任一所述方法的步骤。
9.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~6中任一所述方法的步骤。
10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行权利要求1~6中任一所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210902315.XA CN115297183B (zh) | 2022-07-29 | 2022-07-29 | 一种数据处理方法、装置、电子设备和存储介质 |
PCT/CN2022/141519 WO2024021476A1 (zh) | 2022-07-29 | 2022-12-23 | 一种数据处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210902315.XA CN115297183B (zh) | 2022-07-29 | 2022-07-29 | 一种数据处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115297183A true CN115297183A (zh) | 2022-11-04 |
CN115297183B CN115297183B (zh) | 2023-11-03 |
Family
ID=83823501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210902315.XA Active CN115297183B (zh) | 2022-07-29 | 2022-07-29 | 一种数据处理方法、装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115297183B (zh) |
WO (1) | WO2024021476A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521063A (zh) * | 2023-03-31 | 2023-08-01 | 北京瑞风协同科技股份有限公司 | 一种hdf5的试验数据高效读写方法及装置 |
WO2024021476A1 (zh) * | 2022-07-29 | 2024-02-01 | 天翼云科技有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188561A (zh) * | 2007-12-20 | 2008-05-28 | 北京大学 | 基于自定义模板的通用业务数据通讯方法与系统 |
US20150309424A1 (en) * | 2011-04-22 | 2015-10-29 | Mapper Lithography Ip B.V. | Network architecture and protocol for cluster of lithography machines |
CN105049357A (zh) * | 2015-06-18 | 2015-11-11 | 华北科技学院 | 基于北斗报文的物联网实时监测远程传输有效性优化方法 |
US20180074729A1 (en) * | 2016-09-14 | 2018-03-15 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Data storage method and apparatus |
CN110928681A (zh) * | 2019-11-11 | 2020-03-27 | 北京明略软件系统有限公司 | 数据的处理方法和装置、存储介质及电子装置 |
CN111897831A (zh) * | 2020-07-31 | 2020-11-06 | 平安普惠企业管理有限公司 | 业务报文的生成方法、装置、电子设备及存储介质 |
CN112468370A (zh) * | 2020-11-30 | 2021-03-09 | 北京锐驰信安技术有限公司 | 一种支持自定义规则的高速网络报文监测分析方法及系统 |
CN112925749A (zh) * | 2021-02-20 | 2021-06-08 | 北京同邦卓益科技有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN113329099A (zh) * | 2021-06-29 | 2021-08-31 | 中国农业银行股份有限公司 | 报文解析方法、装置、介质、设备及程序产品 |
CN114006831A (zh) * | 2021-10-30 | 2022-02-01 | 杭州迪普信息技术有限公司 | 报文数据处理方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1387294A1 (en) * | 2002-07-29 | 2004-02-04 | Deutsche Thomson-Brandt Gmbh | Database model for hierarchical data formats |
US10545950B2 (en) * | 2016-09-26 | 2020-01-28 | Amazon Technologies, Inc. | Atomic application of multiple updates to a hierarchical data structure |
CN109597575B (zh) * | 2018-11-29 | 2021-09-28 | 中国科学院合肥物质科学研究院 | 一种基于hdf5的分块式数据存储及读取方法 |
CN113890902B (zh) * | 2021-09-15 | 2023-12-29 | 奇安信科技集团股份有限公司 | 特征识别库的构建方法及装置、流量识别方法 |
CN115297183B (zh) * | 2022-07-29 | 2023-11-03 | 天翼云科技有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
-
2022
- 2022-07-29 CN CN202210902315.XA patent/CN115297183B/zh active Active
- 2022-12-23 WO PCT/CN2022/141519 patent/WO2024021476A1/zh unknown
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188561A (zh) * | 2007-12-20 | 2008-05-28 | 北京大学 | 基于自定义模板的通用业务数据通讯方法与系统 |
US20150309424A1 (en) * | 2011-04-22 | 2015-10-29 | Mapper Lithography Ip B.V. | Network architecture and protocol for cluster of lithography machines |
CN105049357A (zh) * | 2015-06-18 | 2015-11-11 | 华北科技学院 | 基于北斗报文的物联网实时监测远程传输有效性优化方法 |
US20180074729A1 (en) * | 2016-09-14 | 2018-03-15 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Data storage method and apparatus |
CN110928681A (zh) * | 2019-11-11 | 2020-03-27 | 北京明略软件系统有限公司 | 数据的处理方法和装置、存储介质及电子装置 |
CN111897831A (zh) * | 2020-07-31 | 2020-11-06 | 平安普惠企业管理有限公司 | 业务报文的生成方法、装置、电子设备及存储介质 |
CN112468370A (zh) * | 2020-11-30 | 2021-03-09 | 北京锐驰信安技术有限公司 | 一种支持自定义规则的高速网络报文监测分析方法及系统 |
CN112925749A (zh) * | 2021-02-20 | 2021-06-08 | 北京同邦卓益科技有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN113329099A (zh) * | 2021-06-29 | 2021-08-31 | 中国农业银行股份有限公司 | 报文解析方法、装置、介质、设备及程序产品 |
CN114006831A (zh) * | 2021-10-30 | 2022-02-01 | 杭州迪普信息技术有限公司 | 报文数据处理方法及装置 |
Non-Patent Citations (4)
Title |
---|
JOHN MAINZER: "Sparse Data Management in HDF5", 《IEEE》 * |
周忠;吴威;: "LoI:分布式仿真中数据的相关性评价与过滤方法", 中国科学(F辑:信息科学), no. 01 * |
惊鸿一博: "HDF5快速上手全攻略", 《HTTPS://BLOG.CSDN.NET/SHYJHYP11/ARTICLE/DETAILS/109011262》 * |
李莎: "基于GridFTP的网格流量研究与改进", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024021476A1 (zh) * | 2022-07-29 | 2024-02-01 | 天翼云科技有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
CN116521063A (zh) * | 2023-03-31 | 2023-08-01 | 北京瑞风协同科技股份有限公司 | 一种hdf5的试验数据高效读写方法及装置 |
CN116521063B (zh) * | 2023-03-31 | 2024-03-26 | 北京瑞风协同科技股份有限公司 | 一种hdf5的试验数据高效读写方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2024021476A1 (zh) | 2024-02-01 |
CN115297183B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115297183B (zh) | 一种数据处理方法、装置、电子设备和存储介质 | |
CN110457256A (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
JP2021103506A (ja) | 情報を生成するための方法及び装置 | |
CN111949850B (zh) | 多源数据的采集方法、装置、设备及存储介质 | |
EP3493113B1 (en) | Image processing method, computer device, and computer readable storage medium | |
CN113138771B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN115017140A (zh) | 模型构建及模型数据订阅方法、装置、电子设备和介质 | |
CN115269411A (zh) | 一种业务测试方法、装置、电子设备和存储介质 | |
CN113724398A (zh) | 增强现实方法、装置、设备以及存储介质 | |
EP3449369B1 (en) | Methods for enabling data analytics service at service layer | |
CN112699111A (zh) | 报表生成方法、装置、电子设备和计算机可读介质 | |
CN110505253B (zh) | 一种请求网页信息的方法、装置及存储介质 | |
US20230418470A1 (en) | Data processing method and apparatus, and electronic device | |
CN115203172A (zh) | 模型构建及模型数据订阅方法、装置、电子设备和介质 | |
CN111782549B (zh) | 测试方法、装置和电子设备 | |
KR100969266B1 (ko) | 데이터의 구조화 및 접근을 위한 시스템 및 방법 | |
CN108668306B (zh) | 一种移动操作系统内置的数据采集系统 | |
CN112783512B (zh) | 应用程序包处理方法、装置、设备及存储介质 | |
CN112052026B (zh) | 系统间交互关系确定方法及装置 | |
CN113824625B (zh) | 信息交互的方法和装置 | |
CN113672567B (zh) | 文件构建方法、装置、电子设备和计算机可读介质 | |
US12026167B2 (en) | Methods for enabling data analytics service at service layer | |
CN117130522A (zh) | 电子书的数据处理方法、装置、设备及存储介质 | |
CN115113955A (zh) | 一种展示界面的更新方法、装置、电子设备和存储介质 | |
CN115774731A (zh) | 一种数据查询方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |