CN111291035A - 一种对数据进行切片的方法、装置及相关产品 - Google Patents

一种对数据进行切片的方法、装置及相关产品 Download PDF

Info

Publication number
CN111291035A
CN111291035A CN202010207326.7A CN202010207326A CN111291035A CN 111291035 A CN111291035 A CN 111291035A CN 202010207326 A CN202010207326 A CN 202010207326A CN 111291035 A CN111291035 A CN 111291035A
Authority
CN
China
Prior art keywords
data
vehicle
service message
state
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010207326.7A
Other languages
English (en)
Other versions
CN111291035B (zh
Inventor
高雁飞
郭毅
王尧峰
李鹏飞
宋苾莹
梁海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Reach Automotive Technology Shenyang Co Ltd
Original Assignee
Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Reach Automotive Technology Shenyang Co Ltd filed Critical Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority to CN202010207326.7A priority Critical patent/CN111291035B/zh
Publication of CN111291035A publication Critical patent/CN111291035A/zh
Application granted granted Critical
Publication of CN111291035B publication Critical patent/CN111291035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)
  • General Factory Administration (AREA)

Abstract

本申请公开了一种对数据进行切片的方法、装置及相关产品。首先接收第一业务消息,其中携带状态数据项的状态位信息;其后按照状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。由于第一业务消息携带了状态数据项的状态位信息,并且状态位信息是对车辆关联数据进行切片的依据,因此,得到的数据切片与第一业务消息具备关联关系,最终获得的数据切片是与第一业务消息相互匹配的数据切片。可见,本申请技术方案获得的数据切片能够较好地满足了业务需求。如此,该技术方案提升了数据切片的可用性,并能够相应降低后续统计分析操作的复杂程度,从而提升技术人员的工作效率,提升产品的研发速度和优化速度。

Description

一种对数据进行切片的方法、装置及相关产品
技术领域
本申请涉及数据处理技术领域,特别是涉及一种对数据进行切片的方法、装置及相关产品。
背景技术
车辆领域涉及到的数据量庞大且数据种类复杂。对于来自车厂的车辆数据,如果不加处理,很难有效利用。目前可以采用切片的方式处理数据,例如按照时间进行切片。
然而,车辆领域的业务需求十分丰富,例如评估电池健康状态、评估电池管理系统的均衡效果等。由于上述切片方法逻辑单一,因此获得的数据切片很难较好地满足业务需求。实际应用中,如果采用上述方法获得的数据切片执行实际业务需求相关的统计和分析工作,技术人员依然需要耗费较长的时间和较多的精力来处理数据。如此一来,不但导致技术人员的工作效率低下,而且还使业务需求相关的产品的研发速度和优化速度滞后。
发明内容
基于上述问题,本申请提供了一种对数据进行切片的方法、装置及相关产品,以提供与业务需求匹配的数据,从而提升技术人员的工作效率,提升产品的研发速度和优化速度。
本申请实施例公开了如下技术方案:
第一方面,本申请提供一种对数据进行切片的方法,包括:
接收第一业务消息,所述第一业务消息携带状态数据项的状态位信息;
按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。
可选地,所述车辆关联数据包括车辆的车厂数据和/或车外数据;所述车厂数据为车厂提供的与所述车辆相关的数据;
所述车外数据包括:天气数据和/或V2X数据。
可选地,所述第一业务消息还携带车架号,所述按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片,具体包括:
按照所述车架号、所述状态数据项的状态位信息和当前时间对所述车辆关联数据进行切片,得到数据切片;每个所述数据切片包括:所述车架号、起始时间和终止时间。
可选地,方法还包括:
利用所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据;
对所述数据切片对应的数据进行统计分析处理,将处理后的数据加入到所述数据切片中。
可选地,方法还包括:接收第二业务消息,所述第二业务消息携带数据项信息;
所述利用所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据,具体包括:
利用所述数据项信息和所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据,所述数据切片对应的数据与所述第二业务消息相匹配;
所述方法还包括:
利用所述处理后的数据训练获得所述第二业务消息对应的模型。
可选地,当所述第二业务消息对应的业务项目为评估电池健康状态时,所述数据项信息包括以下至少一种:
电压、电流、功率或充放电电量;
当所述第二业务消息对应的业务项目为评估电池安全时,所述数据项信息包括以下至少一种:
电压、电流、单体电压或电池荷电状态;
当所述第二业务消息对应的业务项目为评估用户使用行为时,所述数据项信息包括以下至少一种:
里程、车速、电池荷电状态;
当所述第二业务消息对应的业务项目为评估电池管理系统均衡效果时,所述数据项信息包括:温度和电压;
当所述第二业务消息对应的业务项目为评估校正电池荷电状态时,所述数据项信息包括:单体电压、单体电流、探针温度和充放电电量;
当所述第二业务消息对应的业务项目为评估优化电机时,所述数据项信息包括:电机电流和电机电压。
可选地,状态数据项包括以下至少一种:
车辆状态、挡位数据项、充放电状态数据项、定位状态数据项或电池均衡激活数据项。
可选地,方法还包括:获取所述车辆的点火时间和/或熄火时间;
所述按照所述状态数据项的状态位信息对车辆关联数据进行切片,具体包括:
按照所述状态数据项的状态位信息,以及所述点火时间和/或熄火时间,对所述车辆关联数据进行切片。
第二方面,本申请提供一种对数据进行切片的装置,其特征在于,包括:
业务消息接收模块,用于接收第一业务消息,所述第一业务消息携带状态数据项的状态位信息;
切片模块,用于按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。
可选地,所述第一业务消息还携带车架号,所述切片模块具体用于按照所述车架号、所述状态数据项的状态位信息和当前时间对所述车辆关联数据进行切片,得到数据切片;每个所述数据切片包括:所述车架号、起始时间和终止时间。
可选地,装置还包括:
数据获取模块,用于利用所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据;
数据处理模块,用于对所述数据切片对应的数据进行统计分析处理,将处理后的数据加入到数据切片中。
可选地,业务消息接收模块还用于接收第二业务消息,所述第二业务消息携带数据项信息;
所述数据获取模块,具体用于利用所述数据项信息和所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据,所述数据切片对应的数据与所述第二业务消息相匹配;
作为一种可能的实现方式,装置还包括:
模型训练模块,用于利用所述处理后的数据训练获得所述第二业务消息对应的模型。
可选地,数据处理模块具体用于利用数据统计分析方法对所述数据切片对应的数据进行统计分析,获得统计分析结果。
可选地,所述状态数据项包括以下至少一种:
车辆状态、挡位数据项、充放电状态数据项、定位状态数据项或电池均衡激活数据项。
在实际应用中,可能因为信号不佳的原因,车辆关联数据服务器中将多次放电(或充电)记为一次放电(或充电)。当对车辆关联数据进行切片时,车辆关联数据的错误影响获得的数据切片的准确性。为了避免此问题,本申请技术方案在具体实现时,装置还可以包括:获取所述车辆的点火时间和/或熄火时间;
所述切片模块,具体用于按照所述状态数据项的状态位信息,以及所述点火时间和/或熄火时间,对所述车辆关联数据进行切片。
第三方面,本申请提供一种服务器,包括处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序执行如第一方面提供的对数据进行切片的方法。
第四方面,本申请提供一种计算机可读存储介质,存储计算机程序,所述计算机程序被处理器运行时执行如第一方面提供的对数据进行切片的方法。
相较于现有技术,本申请具有以下有益效果:
在本申请中,首先接收第一业务消息,其中携带状态数据项的状态位信息;其后按照状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。由于第一业务消息携带了状态数据项的状态位信息,并且状态位信息是对车辆关联数据进行切片的依据,因此,得到的数据切片与第一业务消息具备关联关系,最终获得的数据切片是与第一业务消息相互匹配的数据切片。可见,本申请技术方案获得的数据切片能够较好地满足了业务需求。如此,该技术方案提升了数据切片的可用性,并能够相应降低后续统计分析操作的复杂程度,从而提升技术人员的工作效率,提升产品的研发速度和优化速度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种对数据进行切片的方法流程图;
图2a为本申请实施例提供的一种应用场景示意图;
图2b为本申请实施例提供的另一种应用场景示意图;
图3为本申请实施例提供的另一种对数据进行切片的方法流程图;
图4为本申请实施例提供的一种对数据进行切片的装置的结构示意图。
具体实施方式
正如前文描述,目前对数据进行切片的方法通常是按照时间进行切片,较难满足实际的业务需求。例如,业务要求对电池的状态进行评估,但是以时间为依据切分的数据并没有提供便利,后续还需要进行复杂的数据筛选和统计,十分消耗时间。
针对以上问题,发明人经过研究,提供了一种对数据进行切片的方法、装置及相关产品。该技术方案很好地解决了该问题。为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例
本申请实施例提供一种对数据进行切片的方法流程图参见图1。该方法具体可以应用于第一服务器,由第一服务器作为执行主体实现这一方法。作为示例,第一服务器可以是云端数据服务器,也可以是物理服务器。为便于理解,以下以云端数据服务器作为第一服务器的示例形式介绍本实施例方案。
图2a为该方法的一种应用场景示意图。如图2所示,该场景中包括云端数据服务器201、车厂数据服务器202和终端设备203。其中,终端设备203为负责业务项目的技术人员对应的终端设备,终端设备203可以是手机、智能可穿戴设备、平板电脑等移动终端设备,也可以是台式计算机、数字电视等固定终端设备。终端设备203与云端数据服务器201之间可以建立通信连接,由终端设备203向云端数据服务器201发送第一业务消息。
车厂数据服务器202中包含车厂提供的大量的车辆相关的数据,这些数据通常由车厂收集和管理,本实施例中将这些数据称为车厂数据。云端数据服务器201和车厂数据服务器202之前可以建立通信连接,车厂数据服务器202可以在接收到云端数据服务器201的请求后,向云端数据服务器201提供车厂数据。另外,车厂数据服务器202还可以与终端设备203建立通信连接,车厂数据服务器202在接收到终端设备203的请求后,向云端数据服务器201提供车厂数据。
需要说明的是,云端数据服务器201可以在接收到第一业务消息之前获得车厂数据,可以在接收到第一业务消息的同时获得车厂数据,还可以在接收到第一业务消息之后获得车厂数据。获得车厂数据并非每次实施本实施例方法都需要执行的操作,例如在获得车厂数据后可以在后续面临各种业务需求执行本实施例方法时不再重复获取车厂数据。当然,如果对数据进行切片希望数据来源是实时更新的,也可以定时获得车厂数据,以更新进行切片的数据来源。
当云端数据服务器201接收到第一业务消息并获得车厂数据后,即可按照第一业务消息中携带的状态数据项的状态位信息对车厂数据进行切片,并获得数据切片。
参见图2b,该图为本实施例方法的另一种应用场景示意图,该图中相比于图2a场景增加了一个车外数据源204。该车外数据源204用于向云端数据服务器201提供车辆的车外数据,例如天气数据和/或V2X数据。实际应用中,天气数据可以通过网上爬虫的方式获取,V2X数据可以通过车上装设的摄像头或车外信号灯获取。此处对车外数据源204的具体形式不进行限定。
在图2b所示的应用场景中,云端数据服务器201可以获取车外数据源204提供的车外数据,将车外数据和车厂数据汇总为车辆关联数据,然后对车辆关联数据按照第一业务消息携带的状态位信息进行切片,并得到数据切片。
下面结合图1所示的该方法的流程图进行说明。
步骤101:接收第一业务消息。
在本实施例中,第一业务消息携带状态数据项的状态位信息。
状态数据项具体是指车辆相关的状态数据项。此处所述的状态数据项是指具有明确的状态位的数据项。作为示例,车辆状态、挡位数据项、充放电状态数据项、定位状态数据项、电池均衡激活数据项均是状态数据项,此处不一一枚举。需要说明的是,车辆相关的数据项中有一些是不具备明确的状态位的数据项,例如电压、电流、功率、电池温度等,此处不一一枚举。
为便于理解状态数据项的状态位,结合几个示例的状态数据项进行说明。
挡位数据项是指车辆的挡位,车辆的挡位至少包括两种。例如车辆的挡位可能为P挡、N挡、R挡或D挡。这些不同的挡位可以通过数值分别表示。例如,挡位数据项的状态位为0代表车辆挂挡到P挡,状态位为1代表车辆挂挡到N挡,状态位为2代表车辆挂挡到R挡,状态位为3代表车辆挂挡到D挡。
充放电状态数据项至少包括充电状态位和放电状态位。例如,充放电状态数据项的状态位为0代表对车辆电池放电;充放电状态数据项的状态位为1代表对车辆电池充电。
定位状态数据项包括定位功能开启状态位和定位功能关闭状态位。例如,定位状态数据项的状态位为0代表定位功能关闭;定位状态数据项的状态位为1代表定位功能开启。
电池均衡激活数据项包括电池均衡已激活状态位和电池均衡未激活状态位。例如,电池均衡激活数据项的状态位为0代表电池均衡未激活;电池均衡激活数据项的状态位为1代表电池均衡已激活。
关于车辆状态的状态位信息的取值可以参照国标GBT32960中的规定。例如,车辆状态以0x01表示车辆启动状态;0x02表示熄火;0x03表示其他状态;0x04表示异常;0xFF表示无效。另外,关于充电状态、运行模式、车速、累计里程、电压、电流、电池荷电状态、档位、绝缘电阻、预留及DC-DC状态等状态数据项的状态位信息的取值均可以参照国标GBT32960。
本实施例中第一业务消息携带状态数据项的状态位信息。可以理解的是,此处状态位信息所属的状态数据项是符合第一业务消息的业务需求的状态数据项。有些状态数据项可能与业务需求相关性低,则第一业务消息中不会携带这些状态数据项的状态位信息。并且,第一业务消息携带的状态数据项的状态位信息也是与业务需求相关的状态位信息。例如,如果希望执行本实施例方法获得的数据切片应用于评估电池健康状态,则充放电状态数据项为与此业务需求相关的状态数据项,当车辆电池处于充电状态时的数据对于评估电池健康状态具有较好的作用,因此充放电状态数据项的充电状态位为与业务需求相关的状态位。在该示例中,第一业务消息中携带的充放电状态数据项的状态位信息为充电状态位对应的信息,例如可以是充电状态位的描述信息,或者代表充电状态位的数字标识“1”。
步骤102:按照状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。
车辆关联数据可以包括:车辆的车厂数据和/或车外数据。此处,车厂数据可能是目标车辆的车厂数据,目标型号的车辆的车厂数据,目标品牌的车辆的车厂数据,或者该车厂采集和管理的所有车辆的车厂数据。车外数据可以包括:天气数据和/或V2X数据。本步骤在对数据进行切片时,可以按照业务需求对车辆关联数据中的部分或全部数据进行切片。
在本步骤中,按照前一步骤101获得的状态数据项的状态位信息对车辆关联数据进行切片,切片的结果(或称切片后输出的结果)也是一系列数据的形式,本实施例将这一系列的数据分别称为数据切片。并且,在实际应用中还可以依据第一业务消息中携带的车架号(VIN码)并结合携带的状态数据项的状态位信息及当前时间对数据进行切片。由于不同车辆各自具有唯一对应的车架号,因此能够有针对性地对数据进行切片。
在一种可能的实现方式中,每个数据切片可能是一组代表不同时段的索引条件。例如,如果是对目标车辆的车辆关联数据按照充电状态位进行切片,实际上对目标车辆的电池进行充电的时间为从第一时间至第二时间,以及从第三时间至第四时间。则每个数据切片可以包括:该目标车辆的车架号、起始时间和终止时间。仍以上述示例进行描述,则第一数据切片包括:目标车辆的车架号、第一时间和第二时间;第二数据切片包括:目标车辆的车架号、第三时间和第四时间。
以上获得的数据切片因为是依据状态位信息获得的,因此包含了该状态位信息的特征。利用这些数据切片,可以便捷地在车厂数据中获取到更多符合业务需求的可应用的数据。
在本申请实施例提供的对数据进行切片的方法中,首先接收第一业务消息,其中携带状态数据项的状态位信息;其后按照状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。由于第一业务消息携带了状态数据项的状态位信息,并且状态位信息是对车辆关联数据进行切片的依据,因此,得到的数据切片与第一业务消息具备关联关系,最终获得的数据切片是与第一业务消息相互匹配的数据切片。可见,本申请实施例提供的方法获得的数据切片能够较好地满足了业务需求。如此,该技术方案提升了数据切片的可用性,并能够相应降低后续统计分析操作的复杂程度,从而提升技术人员的工作效率,提升产品的研发速度和优化速度。
数据切片可以应用于多种解决业务需求的场景中。下面结合实施例进行说明。
参见图3,该图为本申请实施例提供的另一种对数据进行切片的方法流程图。
如图3所示,本实施例中在执行步骤301-302后,还进一步执行步骤303-305。其中步骤301-302的实现方式与前述实施例中步骤101-102的实现方式基本相同,关于步骤301-302的描述可参照前述实施例,此处不再赘述。
步骤303:利用数据切片从车辆关联数据中获得数据切片对应的数据。
通常来说,车厂数据是十分庞杂的,每秒可上传几十条甚至上百条数据。同理,车外数据也是庞杂的。在本实施例中,前述步骤获得的数据切片可以作为从车辆关联数据中索引所需数据的索引条件。例如,如果数据切片包括:车架号、起始时间和终止时间,则从车辆关联数据中获得该车架号、起始时间和终止时间对应的数据。
在实际应用中,按照数据切片获得的数据可能还包括了一些业务中非必须获取的数据,这些数据可能对于业务项目的开展作用不大。另外,数据量大,不便统计分析。
针对上述场景中的问题,本申请还可以在步骤303执行之前接收第二业务消息,该第二业务消息是比第一业务消息更具有业务针对性的消息。例如,第二业务消息对应的业务项目为评估电池健康状态。第二业务消息中携带数据项信息,数据项信息可以指示一个或多个数据项。例如,第二业务消息携带的数据项信息是电压。步骤303在具体实现时,可以利用数据切片和数据项信息从车辆关联数据中获得数据切片对应的数据。可以理解的是,这些数据包括了数据项信息所指示的数据项的数据,从而,获得的数据与第二业务消息相匹配。
在上述示例中,如果第二业务消息对应的业务项目为评估电池健康状态,数据项信息可以是电压、电流或功率或充放电电量中的至少一种。
当所述第二业务消息对应的业务项目为评估电池安全时,所述数据项信息包括以下至少一种:
电压、电流、单体电压或电池荷电状态;
当所述第二业务消息对应的业务项目为评估用户使用行为时,所述数据项信息包括以下至少一种:
里程、车速、电池荷电状态;
当所述第二业务消息对应的业务项目为评估电池管理系统均衡效果时,所述数据项信息包括:温度和电压;
当所述第二业务消息对应的业务项目为评估校正电池荷电状态时,所述数据项信息包括:单体电压、单体电流、探针温度和充放电电量;
当所述第二业务消息对应的业务项目为评估优化电机时,所述数据项信息包括:电机电流和电机电压。
此处对第二业务消息携带的数据项信息不进行限定。
在本步骤中,利用数据项信息和数据切片从车辆关联数据中获取数据切片对应的数据,能够降低提取到的数据量,筛出有效的数据,提升数据应用的便捷性。
步骤304:对数据切片对应的数据进行统计分析处理,将处理后的数据加入到数据切片中。
作为一种可能的实现方式,本步骤对上一步骤获得的数据进行处理,具体可以是利用数据统计分析方法对所述数据切片对应的数据进行统计分析,获得统计分析结果。通过统计分析,压缩了提取出的数据量,使处理后的数据更加符合所需。
此处,数据统计方法可以是求取平均值、中位数、最大值、最小值等。此处对于采用的数据统计分析方法不做具体限定。
最终获得的处理后的数据可以通过如下表格形式展示。
表1处理后的数据示例表
vin start_time end_time start_time_str end_time_str charge_interval start_soc end_soc
在表1中,vin表示车架号,start_time表示时间戳格式的起始时间,end_time表示时间戳格式的终止时间,start_time_str表示“年-月-日,时-分-秒”格式的起始时间,end_time_str表示“年-月-日,时-分-秒”格式的终止时间,charge_interval表示充电时长,start_soc表示起始电池荷电状态,end_soc表示终止电池荷电状态。
实际应用中,处理后的数据与前述步骤303获得的数据密切相关,并且类型不局限于表1,例如还可能包括最高温度、最低温度、电压中位数等。
步骤305:利用处理后的数据训练获得所述第二业务消息对应的模型。
在以上步骤中获得的处理后的数据可以用于训练第二业务消息对应的模型,模型的功能可能是评估或预测等。例如,如果第二业务消息对应的业务项目为评估电池健康状态,则本步骤训练的模型可以是电池健康状态评估模型。
当接收不同的第二业务消息时,本步骤利用处理后的数据训练的模型也包括多种实现可能,例如电池管理系统均衡效果的评估模型、电池荷电状态预测模型、电池安全评估模型、用户使用行为评估模型、电极等其他车内零部件评估优化模型等。因此,本实施例中对于第二业务消息对应的业务项目,以及对训练的模型功能不进行限定。
在上述实施例中,切片数据从车辆关联数据中获得所述数据切片对应的数据。在对所述数据切片对应的数据进行处理,得到处理后的数据后,可以利用这些处理后的数据来训练与车辆功能或性能相关的模型。该方法获得的数据切片提升了获取车厂提供的有效数据的效率,进而提升对模型的训练效率。数据切片使模型的训练数据获取更为便利,以这些与业务相匹配的数据来训练数据在另一方面也更加具有训练针对性,从而在一定程度上提升了模型功能的准确和有效性。
在实际应用中,可能因为信号不佳的原因,车辆关联数据服务器中将多次放电(或充电)记为一次放电(或充电)。当对车辆关联数据进行切片时,车辆关联数据的错误影响获得的数据切片的准确性。为了避免此问题,本申请技术方案在具体实现时,切片之前还可以获取车辆的点火时间和/或熄火时间。
在进行切片时,具体是按照第一业务消息所携带的状态数据项的状态位信息,以及点火时间和/或熄火时间,对所述车辆关联数据进行切片。点火时间和/或熄火时间可以有助于更加准确地识别多次放电(或充电)的时间,克服信号不佳对准确切片的影响。这样也有助于后续统计分析和训练模型的准确性和可靠性。
基于前述实施例提供的对数据进行切片的方法,相应地,本申请还提供一种对数据进行切片的装置。下面结合实施例和附图进行说明。
装置实施例
参见图4,该图为本申请实施例提供的一种对数据进行切片的装置的结构示意图。该装置具体可以应用于第一服务器,例如图2a所示的场景中的云端数据服务器201或者物理服务器(图2a中未示出)。
如图4所示,该装置包括:
业务消息接收模块401,用于接收第一业务消息,所述第一业务消息携带状态数据项的状态位信息;
切片模块402,用于按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。
由于第一业务消息携带了状态数据项的状态位信息,并且状态位信息是对车辆关联数据进行切片的依据,因此,得到的数据切片与第一业务消息具备关联关系,最终获得的数据切片是与第一业务消息相互匹配的数据切片。可见,本申请实施例提供的装置获得的数据切片能够较好地满足了业务需求。如此,该装置提升了数据切片的可用性,并能够相应降低后续统计分析操作的复杂程度,从而提升技术人员的工作效率,提升产品的研发速度和优化速度。
可选地,所述第一业务消息还携带车架号,所述切片模块402具体用于按照所述车架号、所述状态数据项的状态位信息和当前时间对所述车辆关联数据进行切片,得到数据切片;每个所述数据切片包括:所述车架号、起始时间和终止时间。
可选地,装置还包括:
数据获取模块,用于利用所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据;
数据处理模块,用于对所述数据切片对应的数据进行统计分析处理,将处理后的数据加入到数据切片中。
可选地,业务消息接收模块401还用于接收第二业务消息,所述第二业务消息携带数据项信息;
所述数据获取模块,具体用于利用所述数据项信息和所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据,所述数据切片对应的数据与所述第二业务消息相匹配;
作为一种可能的实现方式,装置还包括:
模型训练模块,用于利用所述处理后的数据训练获得所述第二业务消息对应的模型。
在上述实施例中,切片数据从车辆关联数据中获得所述数据切片对应的数据。在对所述数据切片对应的数据进行处理,得到处理后的数据后并加入到数据切片中,装置还可以利用新的切片中这些处理后的数据来训练与车辆功能或性能相关的模型。该装置获得的数据切片提升了获取车厂提供的有效数据的效率,进而提升对模型的训练效率。数据切片使模型的训练数据获取更为便利,以这些与业务相匹配的数据来训练数据在另一方面也更加具有训练针对性,从而在一定程度上提升了模型功能的准确和有效性。
可选地,所述第二业务消息对应的业务项目为评估电池健康状态;所述数据项信息包括以下至少一种:
电压、电流、功率、充放电电量。
当所述第二业务消息对应的业务项目为评估电池安全时,所述数据项信息包括以下至少一种:
电压、电流、单体电压或电池荷电状态;
当所述第二业务消息对应的业务项目为评估用户使用行为时,所述数据项信息包括以下至少一种:
里程、车速、电池荷电状态;
当所述第二业务消息对应的业务项目为评估电池管理系统均衡效果时,所述数据项信息包括:温度和电压;
当所述第二业务消息对应的业务项目为评估校正电池荷电状态时,所述数据项信息包括:单体电压、单体电流、探针温度和充放电电量;
当所述第二业务消息对应的业务项目为评估优化电机时,所述数据项信息包括:电机电流和电机电压。
可选地,数据处理模块具体用于利用数据统计分析方法对所述数据切片对应的数据进行统计分析,获得统计分析结果。
可选地,所述状态数据项包括以下至少一种:
车辆状态、挡位数据项、充放电状态数据项、定位状态数据项或电池均衡激活数据项。
在实际应用中,可能因为信号不佳的原因,车辆关联数据服务器中将多次放电(或充电)记为一次放电(或充电)。当对车辆关联数据进行切片时,车辆关联数据的错误影响获得的数据切片的准确性。为了避免此问题,本申请技术方案在具体实现时,装置还可以包括:获取所述车辆的点火时间和/或熄火时间;
所述切片模块402,具体用于按照所述状态数据项的状态位信息,以及所述点火时间和/或熄火时间,对所述车辆关联数据进行切片。
基于前述实施例提供的对数据进行切片的方法和装置,相应地,本申请还提供一种服务器。该服务器具体可以为图2a所示场景中的云端数据服务器201或者物理服务器(图2a未示出)。
该服务器包括处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序执行方法实施例中提供的对数据进行切片的方法中部分或全部步骤。
另外,本实施中还提供一种计算机可读存储介质,其用于存储计算机程序,所述计算机程序被处理器运行时执行方法实施例中提供的对数据进行切片的方法中部分或全部步骤。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (11)

1.一种对数据进行切片的方法,其特征在于,包括:
接收第一业务消息,所述第一业务消息携带状态数据项的状态位信息;
按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。
2.根据权利要求1所述的方法,其特征在于,所述车辆关联数据包括车辆的车厂数据和/或车外数据;所述车厂数据为车厂提供的与所述车辆相关的数据;
所述车外数据包括:天气数据和/或V2X数据。
3.根据权利要求1或2所述的方法,其特征在于,所述第一业务消息还携带车架号,所述按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片,具体包括:
按照所述车架号、所述状态数据项的状态位信息和当前时间对所述车辆关联数据进行切片,得到数据切片;每个所述数据切片包括:所述车架号、起始时间和终止时间。
4.根据权利要求1或2所述的方法,其特征在于,还包括:
利用所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据;
对所述数据切片对应的数据进行统计分析处理,将处理后的数据加入到所述数据切片中。
5.根据权利要求4所述的方法,其特征在于,还包括:接收第二业务消息,所述第二业务消息携带数据项信息;
所述利用所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据,具体包括:
利用所述数据项信息和所述数据切片从所述车辆关联数据中获得所述数据切片对应的数据,所述数据切片对应的数据与所述第二业务消息相匹配;
所述方法还包括:
利用所述处理后的数据训练获得所述第二业务消息对应的模型。
6.根据权利要求5所述的方法,其特征在于,
当所述第二业务消息对应的业务项目为评估电池健康状态时,所述数据项信息包括以下至少一种:
电压、电流、功率或充放电电量;
当所述第二业务消息对应的业务项目为评估电池安全时,所述数据项信息包括以下至少一种:
电压、电流、单体电压或电池荷电状态;
当所述第二业务消息对应的业务项目为评估用户使用行为时,所述数据项信息包括以下至少一种:
里程、车速、电池荷电状态;
当所述第二业务消息对应的业务项目为评估电池管理系统均衡效果时,所述数据项信息包括:温度和电压;
当所述第二业务消息对应的业务项目为评估校正电池荷电状态时,所述数据项信息包括:单体电压、单体电流、探针温度和充放电电量;
当所述第二业务消息对应的业务项目为评估优化电机时,所述数据项信息包括:电机电流和电机电压。
7.根据权利要求1或2所述的方法,其特征在于,所述状态数据项包括以下至少一种:
车辆状态、挡位数据项、充放电状态数据项、定位状态数据项或电池均衡激活数据项。
8.根据权利要求1或2所述的方法,其特征在于,还包括:获取所述车辆的点火时间和/或熄火时间;
所述按照所述状态数据项的状态位信息对车辆关联数据进行切片,具体包括:
按照所述状态数据项的状态位信息,以及所述点火时间和/或熄火时间,对所述车辆关联数据进行切片。
9.一种对数据进行切片的装置,其特征在于,包括:
业务消息接收模块,用于接收第一业务消息,所述第一业务消息携带状态数据项的状态位信息;
切片模块,用于按照所述状态数据项的状态位信息对车辆关联数据进行切片,得到数据切片。
10.一种服务器,其特征在于,包括处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序执行如权利要求1-8任一项所述的对数据进行切片的方法。
11.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序被处理器运行时执行如权利要求1-8任一项所述的对数据进行切片的方法。
CN202010207326.7A 2020-03-23 2020-03-23 一种对数据进行切片的方法、装置及相关产品 Active CN111291035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010207326.7A CN111291035B (zh) 2020-03-23 2020-03-23 一种对数据进行切片的方法、装置及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010207326.7A CN111291035B (zh) 2020-03-23 2020-03-23 一种对数据进行切片的方法、装置及相关产品

Publications (2)

Publication Number Publication Date
CN111291035A true CN111291035A (zh) 2020-06-16
CN111291035B CN111291035B (zh) 2023-05-16

Family

ID=71022691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010207326.7A Active CN111291035B (zh) 2020-03-23 2020-03-23 一种对数据进行切片的方法、装置及相关产品

Country Status (1)

Country Link
CN (1) CN111291035B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112669148A (zh) * 2020-12-22 2021-04-16 深圳市富途网络科技有限公司 一种处理订单的方法及装置
CN114257618A (zh) * 2021-12-13 2022-03-29 航天科技控股集团股份有限公司 一种基于车联网平台的车辆运行数据实时分析系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6499033B1 (en) * 1998-05-09 2002-12-24 Isc, Inc. Database method and apparatus using hierarchical bit vector index structure
CN104239509A (zh) * 2014-09-15 2014-12-24 国家电网公司 多版本gis切片服务系统
CN105871831A (zh) * 2016-03-28 2016-08-17 江苏大学 一种车载网中数据分片下载服务方法
CN107562764A (zh) * 2016-07-01 2018-01-09 中国铁路信息技术中心 一种铁路车流数据切片方法和装置
CN108769789A (zh) * 2018-05-31 2018-11-06 海能达通信股份有限公司 一种基于切片的rtp流媒体存储、读取方法及装置
CN109979027A (zh) * 2019-02-20 2019-07-05 钛马信息网络技术有限公司 一种车辆状态数据的处理方法、装置、设备及介质
CN110621045A (zh) * 2018-06-20 2019-12-27 华为技术有限公司 一种物联网业务路由的方法
CN110718070A (zh) * 2019-10-14 2020-01-21 深圳前海中电慧安科技有限公司 一种伴随车辆识别方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6499033B1 (en) * 1998-05-09 2002-12-24 Isc, Inc. Database method and apparatus using hierarchical bit vector index structure
CN104239509A (zh) * 2014-09-15 2014-12-24 国家电网公司 多版本gis切片服务系统
CN105871831A (zh) * 2016-03-28 2016-08-17 江苏大学 一种车载网中数据分片下载服务方法
CN107562764A (zh) * 2016-07-01 2018-01-09 中国铁路信息技术中心 一种铁路车流数据切片方法和装置
CN108769789A (zh) * 2018-05-31 2018-11-06 海能达通信股份有限公司 一种基于切片的rtp流媒体存储、读取方法及装置
CN110621045A (zh) * 2018-06-20 2019-12-27 华为技术有限公司 一种物联网业务路由的方法
CN109979027A (zh) * 2019-02-20 2019-07-05 钛马信息网络技术有限公司 一种车辆状态数据的处理方法、装置、设备及介质
CN110718070A (zh) * 2019-10-14 2020-01-21 深圳前海中电慧安科技有限公司 一种伴随车辆识别方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
金福才: ""数据切片及其在铁路车流数据查询中的应用"" *
陈斌;李彦明;刘成良;吕会娟;: "起重机远程监控数据仓库系统研究及实现" *
陈斌;李彦明;刘成良;吕会娟;: "起重机远程监控数据仓库系统研究及实现", 微计算机信息 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112669148A (zh) * 2020-12-22 2021-04-16 深圳市富途网络科技有限公司 一种处理订单的方法及装置
CN114257618A (zh) * 2021-12-13 2022-03-29 航天科技控股集团股份有限公司 一种基于车联网平台的车辆运行数据实时分析系统

Also Published As

Publication number Publication date
CN111291035B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
CN106993048B (zh) 确定推荐信息的方法及装置、信息推荐方法及装置
CN103593465A (zh) 用于诊断应用推广渠道异常的方法和设备
CN103713989A (zh) 一种针对用户终端的测试用例生成方法和装置
CN111291035A (zh) 一种对数据进行切片的方法、装置及相关产品
CN112744115B (zh) 电动汽车的信息处理方法、装置及系统、处理器
CN104301499A (zh) 移动终端电池电量记录分析方法、装置、平台及移动终端
CN105678596A (zh) 移动终端的更换预测方法及其更换预测系统
CN107203464B (zh) 业务问题的定位方法以及装置
CN113377637A (zh) 性能容量诊断方法及装置
CN112440809B (zh) 一种信息生成、发送方法及服务器和终端设备
CN111782901A (zh) 数据采集方法以及装置
CN102082694A (zh) 一种应用评价方法及应用服务器
CN111459795A (zh) 集群的压力测试方法及装置、计算机设备、存储介质
CN103312540B (zh) 用户业务需求参数确定方法和装置
CN106304085B (zh) 信息处理方法及装置
CN110543410A (zh) 一种处理集群指标的方法、查询集群指标的方法和装置
CN112465565B (zh) 一种基于机器学习的用户画像预测的方法及装置
CN113595174A (zh) 电池管理方法、装置、设备和服务器
CN111812306A (zh) 油品监测方法、电子设备及存储介质
CN110825466B (zh) 一种程序卡顿的处理方法以及卡顿处理装置
CN114764600A (zh) 新能源车电池包的寿命预测方法、装置和电子设备
CN115793559A (zh) Plc采集点表的配置方法、装置、智能网关、设备及介质
CN104219102A (zh) 一种网络数据压缩统计的方法、装置和系统
CN113065894A (zh) 基于用户画像及订单分析的数据归集方法、装置及存储介质
CN108631398B (zh) 充电设备状态监控方法、监控系统和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant