CN112258690A - 数据存取方法及装置、数据存储方法及装置 - Google Patents

数据存取方法及装置、数据存储方法及装置 Download PDF

Info

Publication number
CN112258690A
CN112258690A CN202011150208.3A CN202011150208A CN112258690A CN 112258690 A CN112258690 A CN 112258690A CN 202011150208 A CN202011150208 A CN 202011150208A CN 112258690 A CN112258690 A CN 112258690A
Authority
CN
China
Prior art keywords
data
vehicle
screening
screened
mounted data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011150208.3A
Other languages
English (en)
Other versions
CN112258690B (zh
Inventor
孔海朋
高世萍
赵宗见
王斌儒
尚永涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRRC Qingdao Sifang Co Ltd
Original Assignee
CRRC Qingdao Sifang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRRC Qingdao Sifang Co Ltd filed Critical CRRC Qingdao Sifang Co Ltd
Priority to CN202011150208.3A priority Critical patent/CN112258690B/zh
Publication of CN112258690A publication Critical patent/CN112258690A/zh
Application granted granted Critical
Publication of CN112258690B publication Critical patent/CN112258690B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0841Registering performance data
    • G07C5/085Registering performance data using electronic data carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据存取方法及装置、数据存储方法及装置。该方法包括:获取列车系统产生的车载数据;根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;对筛选后的车载数据进行保存,得到存储数据;采用目标数据筛选条件从存储数据提取目标车载数据。通过本申请,解决了相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题。

Description

数据存取方法及装置、数据存储方法及装置
技术领域
本申请涉及数据处理领域,具体而言,涉及一种数据存取方法及装置、数据存储方法及装置。
背景技术
动车组作为重要的交通工具,担负着重要的运输任务,其系统组成复杂,各系统的运行状态关系到列车运行安全,需要采集动车组运行过程中产生的车载数据,从而对关键系统进行状态监控。
但是,在进行车载数据的采集时,由于数据采集点众多,数据采样频率高,导致采集的车载数据量较大,在存储时占用存储资源较大,在数据存取时间长。
针对相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供一种数据存取方法及装置、数据存储方法及装置,以解决相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题。
根据本申请的一个方面,提供了一种数据存取方法。该方法包括:获取列车系统产生的车载数据;根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;对筛选后的车载数据进行保存,得到存储数据;采用目标数据筛选条件从存储数据提取目标车载数据。
可选地,在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,该方法还包括:获取预设设定的多个数据筛选条件;对预设设定的多个数据筛选条件进行去重处理,并基于去重后的数据筛选条件构建预设数据筛选条件集合;对预设数据筛选条件集合进行校验处理,得到数据筛选条件集合,其中,校验处理包括数据处理方式的合理性校验。
可选地,在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,该方法还包括:基于数据处理需求以及多个数据信息集合,确定至少一种数据处理方式,其中,每个数据信息集合用于表征一个维度的数据处理方式,一个维度的数据处理方式包括多个数据处理方式;根据至少一种数据处理方式确定数据筛选条件。
可选地,数据信息集合至少包括以下之一:数据列信息集合,包括车载数据的列采集信息;数据特征信息集合,包括车载数据的特征信息提取信息;数据预处理信息集合,包括多种车载数据的预处理方法信息;数据聚合信息集合,包括车载数据的不同量级数据的聚合信息;工况信息集合,包括车载数据的工况信息。
可选地,根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据包括:确定数据筛选条件集合中的每个数据筛选条件,并基于每个数据筛选条件从车载数据中筛选数据,得到多组数据;将多组数据确定为筛选后的车载数据。
可选地,对筛选后的车载数据进行保存,得到存储数据包括:采用目标格式压缩筛选后的车载数据,得到压缩后的车载数据;将压缩后的车载数据进行保存,得到存储数据。
可选地,采用目标数据筛选条件从存储数据提取目标车载数据包括:将目标数据筛选条件与数据筛选条件集合中的数据筛选条件进行匹配,得到匹配的数据筛选条件;从存储数据中提取匹配的数据筛选条件对应的车载数据,并将匹配的数据筛选条件对应的车载数据确定为目标车载数据。
可选地,获取列车系统产生的车载数据包括:下载列车系统产生的预设格式的车载数据,并按照车载数据解析协议解析预设格式的车载数据,得到车载数据。
根据本申请的另一个方面,提供了一种数据存储方法。该方法包括:获取列车系统产生的车载数据;根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;对筛选后的车载数据进行保存,得到存储数据。
根据本申请的另一方面,提供了一种数据存取装置。该装置包括:第一获取单元,用于获取列车系统产生的车载数据;第一筛选单元,用于根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;第一保存单元,用于对筛选后的车载数据进行保存,得到存储数据;提取单元,用于采用目标数据筛选条件从存储数据提取目标车载数据
根据本申请的另一方面,提供了一种数据存储装置。该装置包括:第二获取单元,用于获取列车系统产生的车载数据;第二筛选单元,用于根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,数据筛选条件包含一个数据处理方式或多个数据处理方式的组合;第二保存单元,用于对筛选后的车载数据进行保存。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种数据存取方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种数据存取方法。
通过本申请,采用以下步骤:获取列车系统产生的车载数据;根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;对筛选后的车载数据进行保存,得到存储数据;采用目标数据筛选条件从存储数据提取目标车载数据,解决了相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题。进而达到了在存储车载数据时,节省存储空间,在提取车载数据时,提高按需求提取数据的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的数据存取方法的流程图;
图2是根据本申请实施例提供的数据存储方法的流程图;
图3是根据本申请实施例提供的另一种数据存储方法的流程图;
图4是根据本申请实施例提供的另一种数据存储方法中数据转化的示意图;
图5是根据本申请实施例提供的数据提取方法的流程图;
图6是根据本申请实施例提供的数据提取方法中数据按需提取的示意图;
图7是根据本申请实施例提供的数据存取装置的示意图;
图8是根据本申请实施例提供的数据存储装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请的实施例,提供了一种数据存取方法。
图1是根据本申请实施例的数据存取方法的流程图。如图1所示,该方法包括以下步骤:
步骤S102,获取列车系统产生的车载数据。
具体地,列车系统可以为动车组系统,动车组各系统的运行状态关系到动车运行安全,因而,需要采用数据系统并分析车载数据,以进行动车状态监控。
可选地,在本申请实施例提供的数据存取方法中,获取列车系统产生的车载数据包括:下载列车系统产生的预设格式的车载数据,并按照车载数据解析协议解析预设格式的车载数据,得到车载数据。
具体地,可以将车载数据以硬盘拷贝或网络传输的方式下载到本地或数据分析处理平台,再按照动车组解析协议,将下载得到的数据进行解析,解析成CSV格式的可读文件。
步骤S104,根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合。
具体地,根据数据筛选条件集合对车载数据进行筛选,即为根据不同用户设定的不同数据筛选条件独立地对车载数据进行,从而得到不同的用户所需的车载数据。
需要说明的是,数据筛选条件集合构成用于配置用户所需的车载数据的配置文件,可以为XML格式的文件,该文件记录并规范了不同用户提供的数据抽取规范信息,也即,根据用户的具体需求设定的多个数据筛选条件,每个数据筛选条件中可以包含一种数据处理方式,也可以包含多种数据处理方式的组合,数据处理方式可以是筛选方式,也可以是数据计算方式,本申请实施例不限定数据处理的方式。
可选地,在本申请实施例提供的数据存取方法中,在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,该方法还包括:获取预设设定的多个数据筛选条件;对预设设定的多个数据筛选条件进行去重处理,并基于去重后的数据筛选条件构建预设数据筛选条件集合;对预设数据筛选条件集合进行校验处理,得到数据筛选条件集合,其中,校验处理包括数据处理方式的合理性校验。
需要说明的是,不同用户所需的车载数据存在重合,也即,不同用户预先设定的数据筛选条件存在重合,为了减少冗余数据,对预先设定的多个数据筛选条件进行去重处理,再根据去重后的数据构建预设数据筛选条件集合。
此外,需要说明的是,用户预先设定的数据筛选条件存在不合理的情况,需要对预设数据筛选条件集合中的数据筛选条件进行校验,删除不满足校验的条件,保留满足校验的条件,从而根据保留的数据筛选条件构建数据筛选条件集合。
例如,构成数据筛选条件的数据处理方式可以包含工况筛选、特征信息计算、数据聚合处理、数据预处理等等,相应的,数据筛选条件的校验可以包含工况数据合理性校验、特征配置合理性校验、数据聚合合理性校验、数据预处理合理性校验等,还可以包含数据类型合理性校验。
例如,进行牵引工况数据合理性校验,即为基于列车速度和牵引制动级位数据,判断是否存在牵引工况。具体地,判断牵引和制动级位,按照时间序列连续判断列车速度,当下一时刻速度大于前一时刻速度绝对值与牵引制动级位匹配时,并持续一段时间,即为牵引工况符合。
可选地,在本申请实施例提供的数据存取方法中,在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,该方法还包括:基于数据处理需求以及多个数据信息集合,确定至少一种数据处理方式,其中,每个数据信息集合用于表征一个维度的数据处理方式,一个维度的数据处理方式包括多个数据处理方式;根据至少一种数据处理方式确定数据筛选条件。
为了便于用户根据需要预先设定数据筛选条件,本申请实施例提供了用于指示数据处理方式的数据信息集合,数据信息集合可以构成数据信息字典,用户可以根据每个数据信息字典选择相应的数据处理方式,并对选择的数据处理方式进行组合,得到数据筛选条件。
数据信息集合的种类可以包括多种,可选地,在本申请实施例提供的数据存取方法中,数据信息集合至少包括以下之一:数据列信息集合,包括车载数据的列采集信息;数据特征信息集合,包括车载数据的特征信息提取信息;数据预处理信息集合,包括多种车载数据的预处理方法信息;数据聚合信息集合,包括车载数据的不同量级数据的聚合信息;工况信息集合,包括车载数据的工况信息。
具体地,数据列信息集合,用来标识动车组采集的车载数据列信息。数据特征信息集合,包含车载数据列信息的特征,例如,最大值、最小值、方差、25%分位数、50%分位数、众数、75%分位数、标准差、均值、偏度等特征提取信息。数据预处理信息集合,可以包含线性插值、野值剔除、平滑、归一化等预处理方法信息。数据聚合信息集合,可以包含秒级、分钟级、小时级数据聚合方法信息。工况信息集合,可以包含动车组牵引制动过程工况、牵引工况、制动工况、匀速工况等信息。
可选地,在本申请实施例提供的数据存取方法中,根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据包括:确定数据筛选条件集合中的每个数据筛选条件,并基于每个数据筛选条件从车载数据中筛选数据,得到多组数据;将多组数据确定为筛选后的车载数据。
具体地,根据数据筛选条件集合以及数据处理方法库对CSV格式的车载数据进行处理,该方法库包括:工况筛选方法、预处理方法、特征处理方法、聚合方法等。
例如,数据筛选条件为“牵引制动过程工况筛选+按秒级进行数据聚合+提取最大值”,则选择速度大于0的连续时间段,将同一秒不同毫秒的数据进行聚合,并提取该秒条件下的最大值。
通过本申请实施例,根据数据筛选条件集合对车载数据进行筛选,得到满足用户需求的车载数据,节省了存储空间,为用户按照需求提取数据奠定了数据基础。
步骤S106,对筛选后的车载数据进行保存,得到存储数据。
可选地,在本申请实施例提供的数据存取方法中,对筛选后的车载数据进行保存,得到存储数据包括:采用目标格式压缩筛选后的车载数据,得到压缩后的车载数据;将压缩后的车载数据进行保存,得到存储数据。
具体地,目标格式压缩可以为parquet压缩格式,通过parquet压缩格式,将筛选得到的CSV格式的车载数据占用空间更小的parquet格式数据,进行数据库存储或本地保存,与相关技术中采用CSV格式文件进行存储的方式相比,节省了数据存储空间,提升数据处理效率。
步骤S108,采用目标数据筛选条件从存储数据提取目标车载数据。
具体地,目标数据筛选条件为用户提取存储数据的条件,目标数据筛选条件为数据筛选条件集合中的条件之一。
可选地,在本申请实施例提供的数据存取方法中,采用目标数据筛选条件从存储数据提取目标车载数据包括:将目标数据筛选条件与数据筛选条件集合中的数据筛选条件进行匹配,得到匹配的数据筛选条件;从存储数据中提取匹配的数据筛选条件对应的车载数据,并将匹配的数据筛选条件对应的车载数据确定为目标车载数据。
具体地,用户根据目标数据筛选条件按需提取数据,供数据分析使用避免每次加载整个parquet文件,同时,由于parquet文件提取方式支持按条件有效节省数据加载空间和时间。此外,采用parquet格式存取文件,与CSV格式文件的读写相比,提升了数据IO效率。
本申请实施例提供的数据存取方法,通过获取列车系统产生的车载数据;根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;对筛选后的车载数据进行保存,得到存储数据;采用目标数据筛选条件从存储数据提取目标车载数据,解决了相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题,进而达到了在存储车载数据时,节省存储空间,在提取车载数据时,提高按需求提取数据的效果。
图2是根据本申请实施例的数据存取方法的流程图。如图2所示,该方法包括以下步骤:
步骤S202,获取列车系统产生的车载数据。
具体地,列车系统可以为动车组系统,动车组各系统的运行状态关系到动车运行安全,因而,需要采用数据系统并分析车载数据,以进行动车状态监控。
在一种实施例中,可以将车载数据以硬盘拷贝或网络传输的方式下载到本地或数据分析处理平台,再按照动车组解析协议,将下载得到的数据进行解析,解析成CSV格式的可读文件。
步骤S204,根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合。
具体地,根据数据筛选条件集合对车载数据进行筛选,即为根据不同用户设定的不同数据筛选条件独立地对车载数据进行,从而得到不同的用户所需的车载数据。
需要说明的是,数据筛选条件集合构成用于配置用户所需的车载数据的配置文件,可以为XML格式的文件,该文件记录并规范了不同用户提供的数据抽取规范信息,也即,根据用户的具体需求设定的多个数据筛选条件,每个数据筛选条件中可以包含一种数据处理方式,也可以包含多种数据处理方式的组合,数据处理方式可以是筛选方式,也可以是数据计算方式,本申请实施例不限定数据处理的方式。
步骤S206,对筛选后的车载数据进行保存,得到存储数据。
需要说明的是,可以采用目标格式压缩筛选后的车载数据,得到压缩后的车载数据,并将压缩后的车载数据进行保存,得到存储数据。
具体地,目标格式压缩可以为parquet压缩格式,通过parquet压缩格式,将筛选得到的CSV格式的车载数据占用空间更小的parquet格式数据,进行数据库存储或本地保存,与相关技术中采用CSV格式文件进行存储相比,节省了数据存储空间,提升数据处理效率。
本申请实施例提供的数据存取方法,通过获取列车系统产生的车载数据;根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;对筛选后的车载数据进行保存,得到存储数据,解决了相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题。进而达到了在存储车载数据时,节省存储空间的效果。
图3是根据本申请实施例的数据存储方法的流程图,如图3所示,该方法包括:
数据下载,可以将车载数据以硬盘拷贝或网络传输的方式下载到本地或数据分析处理平台。
数据解析,可以采用车载数据解析协议,将下载的数据进行解析,解析成CSV格式的可读文件。
数据转换,基于包含多个抽取规范信息的配置文件,从CSV格式的车载数据中筛选数据,并将筛选后的数据进行压缩。
数据存储,对压缩后的数据进行保存,具体地,可以进行数据库存储或本地保存。
其中,如图4所示,数据转换包括:用户根据自身需求,结合多个数据信息字典,分别设定数据抽取规范,得到多个数据抽取规范,具体地,每个数据抽取规范包含一个数据信息字典中的数据处理方式,或包含多个数据处理方式的组合。
具体地,数据信息字典可以包括至少以下之一:数据列信息字典,用来标识动车组采集的车载数据列信息。数据特征字典,包含车载数据列信息的特征,例如,最大值、最小值、方差、25%分位数、50%分位数、众数、75%分位数、标准差、均值、偏度等特征提取信息。数据预处理字典,可以包含线性插值、野值剔除、平滑、归一化等预处理方法信息。数据聚合字典,可以包含秒级、分钟级、小时级数据聚合方法信息。工况筛选字典,可以包含动车组牵引制动过程工况、牵引工况、制动工况、匀速工况等信息。
对多条数据抽取规范进行数据信息配置,也即,去掉相同的规范,保留彼此之间存在差异的规范,初步得到配置信息。
再采用数据检验方法库对初步得到的配置信息进行文件检验,具体地,校验方法库中的校验方法为各个数据信息字典中的信息对应的校验方法。
具体地,校验方法库中可以设置有以下之一校验方法:工况数据合理性校验、特征配置合理性校验、数据聚合合理性校验、数据预处理合理性校验,还可以包括数据类型合理性校验。
对初步得到的配置信息进行文件检验后,得到配置文件,可以为XML配置文件,并根据XML配置文件,以及数据处理方法库中与配置文件对应的数据处理方法,对车载数据进行筛选处理,得到筛选后的数据。
在得到筛选后的数据后,为了减少存储空间,对数据进行压缩转换,具体地,可以采用parquet格式进行文件转换。
通过本申请实施例,对数据先进行筛选、再进行格式转换,然后进行保存,与相关技术中的车载数据的存储方式相比,节省了存储空间,为用户按需提取数据奠定了数据基础。
图5是根据本申请实施例的数据提取方法的流程图,如图5所示,该方法包括:
数据按需求提取,对提取后的数据进行数据分析处理。
其中,如图6所示,数据按需求提取包括:确定用户的数据抽取规范,与xml配置文件中的配置信息进行匹配,确定匹配的配置信息,再从存储文件中筛选配置信息对应的数据。具体地,若采用parquet格式进行文件转换,存储数据为parquet格式的文件,提取数据时筛选得到的也是parquet格式的文件。对筛选得到的parquet文件进行读取,从而实现数据应用。
通过本申请实施例,结合上述数据存储方法,实现了按需提取数据,与相关技术中的数据存储和读取方式相比,提高了数据读取效率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种数据存取装置,需要说明的是,本申请实施例的数据存取装置可以用于执行本申请实施例所提供的用于数据存取方法。以下对本申请实施例提供的数据存取装置进行介绍。
图7是根据本申请实施例的数据存取装置的示意图。如图7所示,该装置包括:第一获取单元71、第一筛选单元72、第一保存单元73和提取单元74。
具体地,第一获取单元71,用于获取列车系统产生的车载数据。
第一筛选单元72,用于根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合。
第一保存单元73,用于对筛选后的车载数据进行保存,得到存储数据。
提取单元74,用于采用目标数据筛选条件从存储数据提取目标车载数据。
本申请实施例提供的数据存取装置,通过第一获取单元71获取列车系统产生的车载数据;第一筛选单元72根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;第一保存单元73,对筛选后的车载数据进行保存,得到存储数据;提取单元74采用目标数据筛选条件从存储数据提取目标车载数据,解决了相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题,进而达到了在存储车载数据时,节省存储空间,在提取车载数据时,提高按需求提取数据的效果。
可选地,在本申请实施例提供的数据存取装置中,该装置还包括:第二获取单元,用于在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,获取预设设定的多个数据筛选条件;去重单元,用于对预设设定的多个数据筛选条件进行去重处理,并基于去重后的数据筛选条件构建预设数据筛选条件集合;校验单元,用于对预设数据筛选条件集合进行校验处理,得到数据筛选条件集合,其中,校验处理包括数据处理方式的合理性校验。
可选地,在本申请实施例提供的数据存取装置中,该装置还包括:第一确定单元,用于在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,基于数据处理需求以及多个数据信息集合,确定至少一种数据处理方式,其中,每个数据信息集合用于表征一个维度的数据处理方式,一个维度的数据处理方式包括多个数据处理方式;第二确定单元,用于根据至少一种数据处理方式确定数据筛选条件。
可选地,在本申请实施例提供的数据存取装置中,数据信息集合至少包括以下之一:数据列信息集合,包括车载数据的列采集信息;数据特征信息集合,包括车载数据的特征信息提取信息;数据预处理信息集合,包括多种车载数据的预处理装置信息;数据聚合信息集合,包括车载数据的不同量级数据的聚合信息;工况信息集合,包括车载数据的工况信息。
可选地,在本申请实施例提供的数据存取装置中,第第一筛选单元72包括:第一确定模块,用于确定数据筛选条件集合中的每个数据筛选条件,并基于每个数据筛选条件从车载数据中筛选数据,得到多组数据;第二确定模块,用于将多组数据确定为筛选后的车载数据。
可选地,在本申请实施例提供的数据存取装置中,第一保存单元73包括:压缩模块,用于采用目标格式压缩筛选后的车载数据,得到压缩后的车载数据;保存模块,用于将压缩后的车载数据进行保存,得到存储数据。可选地,在本申请实施例提供的数据存取装置中,提取单元74包括:匹配模块,用于将目标数据筛选条件与数据筛选条件集合中的数据筛选条件进行匹配,得到匹配的数据筛选条件;筛选模块,用于从存储数据中提取匹配的数据筛选条件对应的车载数据,并将匹配的数据筛选条件对应的车载数据确定为目标车载数据。
可选地,在本申请实施例提供的数据存取装置中,第一获取单元71包括:下载模块,用于下载列车系统产生的预设格式的车载数据,并按照车载数据解析协议解析预设格式的车载数据,得到车载数据。
数据存取装置包括处理器和存储器,上述第一获取单元71、第一筛选单元72、第一保存单元73和提取单元74等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
图8是根据本申请实施例的数据存储装置的示意图。如图8所示,该装置包括:第三获取单元81、第二筛选单元82和第二保存单元83。
具体地,第三获取单元81,用于获取列车系统产生的车载数据。
第二筛选单元82,用于根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合。
第二保存单元83,用于对筛选后的车载数据进行保存,得到存储数据。
本申请实施例提供的数据存储装置,通过第三获取单元81获取列车系统产生的车载数据;第二筛选单元82根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,数据筛选条件集合中包含多个数据筛选条件,每个数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;第二保存单元83,对筛选后的车载数据进行保存,得到存储数据,解决了相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题,进而达到了在存储车载数据时,节省存储空间的效果。
数据存储装置包括处理器和存储器,上述第三获取单元81、第二筛选单元82、第二保存单元83等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决相关技术中由于列车系统产生的车载数据量大,按照用户的需求提取数据的效率低下的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种数据存取方法。
本申请实施例还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种数据存取方法。本文中的电子装置可以是服务器、PC、PAD、手机等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (13)

1.一种数据存取方法,其特征在于,包括:
获取列车系统产生的车载数据;
根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,所述数据筛选条件集合中包含多个数据筛选条件,每个所述数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;
对所述筛选后的车载数据进行保存,得到存储数据;
采用目标数据筛选条件从所述存储数据提取目标车载数据。
2.根据权利要求1所述的方法,其特征在于,在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,所述方法还包括:
获取预设设定的多个数据筛选条件;
对所述预设设定的多个数据筛选条件进行去重处理,并基于去重后的数据筛选条件构建预设数据筛选条件集合;
对所述预设数据筛选条件集合进行校验处理,得到所述数据筛选条件集合,其中,所述校验处理包括所述数据处理方式的合理性校验。
3.根据权利要求1所述的方法,其特征在于,在根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据之前,所述方法还包括:
基于数据处理需求以及多个数据信息集合,确定至少一种数据处理方式,其中,每个所述数据信息集合用于表征一个维度的数据处理方式,所述一个维度的数据处理方式包括多个数据处理方式;
根据所述至少一种数据处理方式确定所述数据筛选条件。
4.根据权利要求3所述的方法,其特征在于,所述数据信息集合至少包括以下之一:
数据列信息集合,包括所述车载数据的列采集信息;
数据特征信息集合,包括所述车载数据的特征信息提取信息;
数据预处理信息集合,包括多种车载数据的预处理方法信息;
数据聚合信息集合,包括车载数据的不同量级数据的聚合信息;
工况信息集合,包括所述车载数据的工况信息。
5.根据权利要求1所述的方法,其特征在于,根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据包括:
确定所述数据筛选条件集合中的每个所述数据筛选条件,并基于每个所述数据筛选条件从所述车载数据中筛选数据,得到多组数据;
将所述多组数据确定为所述筛选后的车载数据。
6.根据权利要求1所述的方法,其特征在于,对所述筛选后的车载数据进行保存,得到存储数据包括:
采用目标格式压缩所述筛选后的车载数据,得到压缩后的车载数据;
将所述压缩后的车载数据进行保存,得到所述存储数据。
7.根据权利要求1所述的方法,其特征在于,采用目标数据筛选条件从所述存储数据提取目标车载数据包括:
将所述目标数据筛选条件与所述数据筛选条件集合中的数据筛选条件进行匹配,得到匹配的数据筛选条件;
从所述存储数据中提取所述匹配的数据筛选条件对应的车载数据,并将所述匹配的数据筛选条件对应的车载数据确定为所述目标车载数据。
8.根据权利要求1所述的方法,其特征在于,获取列车系统产生的车载数据包括:
下载所述列车系统产生的预设格式的车载数据,并按照车载数据解析协议解析所述预设格式的车载数据,得到所述车载数据。
9.一种数据存储方法,其特征在于,包括:
获取列车系统产生的车载数据;
根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,所述数据筛选条件集合中包含多个数据筛选条件,所述数据筛选条件包含一个数据处理方式或多个数据处理方式的组合;
对所述筛选后的车载数据进行保存。
10.一种数据存取装置,其特征在于,包括:
第一获取单元,用于获取列车系统产生的车载数据;
第一筛选单元,用于根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,所述数据筛选条件集合中包含多个数据筛选条件,每个所述数据筛选条件包含一种数据处理方式,或多种数据处理方式的组合;
第一保存单元,用于对所述筛选后的车载数据进行保存,得到存储数据;
提取单元,用于采用目标数据筛选条件从所述存储数据提取目标车载数据。
11.一种数据存储装置,其特征在于,包括:
第二获取单元,用于获取列车系统产生的车载数据;
第二筛选单元,用于根据数据筛选条件集合对车载数据进行筛选,得到筛选后的车载数据,其中,所述数据筛选条件集合中包含多个数据筛选条件,所述数据筛选条件包含一个数据处理方式或多个数据处理方式的组合;
第二保存单元,用于对所述筛选后的车载数据进行保存。
12.一种非易失性存储介质,其特征在于,所非易失性存储介质包括存储的程序,其中,所述程序运行时控制所述非易失性存储介质所在的设备执行权利要求1至8中任意一项所述的数据存取方法。
13.一种电子装置,其特征在于,包含处理器和存储器,所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至8中任意一项所述的数据存取方法。
CN202011150208.3A 2020-10-23 2020-10-23 数据存取方法及装置、数据存储方法及装置 Active CN112258690B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011150208.3A CN112258690B (zh) 2020-10-23 2020-10-23 数据存取方法及装置、数据存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011150208.3A CN112258690B (zh) 2020-10-23 2020-10-23 数据存取方法及装置、数据存储方法及装置

Publications (2)

Publication Number Publication Date
CN112258690A true CN112258690A (zh) 2021-01-22
CN112258690B CN112258690B (zh) 2022-09-06

Family

ID=74261947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011150208.3A Active CN112258690B (zh) 2020-10-23 2020-10-23 数据存取方法及装置、数据存储方法及装置

Country Status (1)

Country Link
CN (1) CN112258690B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988629A (zh) * 2021-03-11 2021-06-18 北京信息科技大学 数据记录装置及方法、存储介质
CN115497191A (zh) * 2022-09-15 2022-12-20 厦门物之联智能科技有限公司 一种走行部监测系统脱轨原始数据轮询上报方法和装置

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070038990A1 (en) * 2005-08-09 2007-02-15 Intermec Ip Corp. Method, apparatus and article to load new instructions on processor based devices, for example, automatic data collection devices
CN101221578A (zh) * 2008-02-01 2008-07-16 中国建设银行股份有限公司 数据筛选的方法、装置以及证券化贷款的筛选方法、装置
CN101770469A (zh) * 2008-12-31 2010-07-07 中国银联股份有限公司 一种基于页面的数据查询方法及其系统
WO2012000393A1 (zh) * 2010-06-29 2012-01-05 中兴通讯股份有限公司 一种进行增值业务指令处理的方法和业务管理平台设备
CN102769610A (zh) * 2012-04-26 2012-11-07 新奥特(北京)视频技术有限公司 一种从xml文件筛选信息的方法
CN103729428A (zh) * 2013-12-25 2014-04-16 中国科学院计算技术研究所 一种大数据分类方法及系统
CN105681287A (zh) * 2015-12-31 2016-06-15 上海百事通信息技术股份有限公司 基于筛选规则的用户服务分配筛选方法
WO2018095037A1 (zh) * 2016-11-24 2018-05-31 杭州海康威视数字技术股份有限公司 一种获取云存储系统中数据的方法及装置
CN108228736A (zh) * 2017-12-12 2018-06-29 深圳市买买提信息科技有限公司 数据处理方法、数据处理系统及计算机可读存储介质
CN108650325A (zh) * 2018-05-17 2018-10-12 浙江中控技术股份有限公司 一种工业数据采集方法、相关设备及系统
CN109561326A (zh) * 2017-09-26 2019-04-02 北京国双科技有限公司 一种数据查询方法及装置
CN109597826A (zh) * 2018-09-04 2019-04-09 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN109696316A (zh) * 2017-10-20 2019-04-30 株洲中车时代电气股份有限公司 一种列车远程监测系统
CN109788030A (zh) * 2018-12-17 2019-05-21 北京百度网讯科技有限公司 无人车数据处理方法、装置、系统及存储介质
CN110825801A (zh) * 2019-11-06 2020-02-21 卡斯柯信号(成都)有限公司 基于分布式架构的列车信号系统车载日志分析系统和方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070038990A1 (en) * 2005-08-09 2007-02-15 Intermec Ip Corp. Method, apparatus and article to load new instructions on processor based devices, for example, automatic data collection devices
CN101221578A (zh) * 2008-02-01 2008-07-16 中国建设银行股份有限公司 数据筛选的方法、装置以及证券化贷款的筛选方法、装置
CN101770469A (zh) * 2008-12-31 2010-07-07 中国银联股份有限公司 一种基于页面的数据查询方法及其系统
WO2012000393A1 (zh) * 2010-06-29 2012-01-05 中兴通讯股份有限公司 一种进行增值业务指令处理的方法和业务管理平台设备
CN102769610A (zh) * 2012-04-26 2012-11-07 新奥特(北京)视频技术有限公司 一种从xml文件筛选信息的方法
CN103729428A (zh) * 2013-12-25 2014-04-16 中国科学院计算技术研究所 一种大数据分类方法及系统
CN105681287A (zh) * 2015-12-31 2016-06-15 上海百事通信息技术股份有限公司 基于筛选规则的用户服务分配筛选方法
WO2018095037A1 (zh) * 2016-11-24 2018-05-31 杭州海康威视数字技术股份有限公司 一种获取云存储系统中数据的方法及装置
CN109561326A (zh) * 2017-09-26 2019-04-02 北京国双科技有限公司 一种数据查询方法及装置
CN109696316A (zh) * 2017-10-20 2019-04-30 株洲中车时代电气股份有限公司 一种列车远程监测系统
CN108228736A (zh) * 2017-12-12 2018-06-29 深圳市买买提信息科技有限公司 数据处理方法、数据处理系统及计算机可读存储介质
CN108650325A (zh) * 2018-05-17 2018-10-12 浙江中控技术股份有限公司 一种工业数据采集方法、相关设备及系统
CN109597826A (zh) * 2018-09-04 2019-04-09 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN109788030A (zh) * 2018-12-17 2019-05-21 北京百度网讯科技有限公司 无人车数据处理方法、装置、系统及存储介质
CN110825801A (zh) * 2019-11-06 2020-02-21 卡斯柯信号(成都)有限公司 基于分布式架构的列车信号系统车载日志分析系统和方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988629A (zh) * 2021-03-11 2021-06-18 北京信息科技大学 数据记录装置及方法、存储介质
CN115497191A (zh) * 2022-09-15 2022-12-20 厦门物之联智能科技有限公司 一种走行部监测系统脱轨原始数据轮询上报方法和装置
CN115497191B (zh) * 2022-09-15 2023-11-17 厦门物之联智能科技有限公司 一种走行部监测系统脱轨原始数据轮询上报方法和装置

Also Published As

Publication number Publication date
CN112258690B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN112258690B (zh) 数据存取方法及装置、数据存储方法及装置
WO2014058711A1 (en) Creation of inverted index system, and data processing method and apparatus
CN113485999A (zh) 数据清理方法、装置和服务器
CN113360269A (zh) 一种任务分配方法、装置、服务器及存储介质
CN107391769B (zh) 一种索引查询方法及装置
CN114511235A (zh) 流程评估方法及系统
CN112948504A (zh) 数据采集方法、装置、计算机设备和存储介质
CN117591301B (zh) 一种监控云资源分配优化方法及系统
CN105912664B (zh) 一种文件处理方法和设备
CN113115069A (zh) 一种行车记录仪的视频存储方法和系统
CN111737206B (zh) 一种文件重删处理方法、系统、终端及存储介质
CN111381768A (zh) 一种数据监控的方法和装置
CN113946717A (zh) 一种子图指标特征获得方法、装置、设备及存储介质
CN114968028A (zh) 基于用户行为分析动态改变菜单布局的方法、设备及介质
CN112256685A (zh) 基于电子表格的分割去重导入方法及相关产品
JP2006114047A (ja) 単一テーブルを用いた性能管理データ処理装置及びその方法
CN113676377A (zh) 基于大数据的在线用户数评估方法、装置、设备及介质
US11023226B2 (en) Dynamic data ingestion
CN112269879A (zh) 基于k-means算法的中台日志分析方法及设备
CN113051278B (zh) 一种数据复制进程延时的处理方法和系统
CN111309683B (zh) 扫描全盘数据的方法及装置
CN114399761B (zh) 转向架的叠加部件数量识别方法、装置和系统
CN108268537B (zh) 数据过滤方法及装置
CN110119406B (zh) 实时任务记录的核对方法及装置
CN112402955A (zh) 游戏日志记录方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant