CN114312930A - 基于日志数据的列车运行异常诊断方法和装置 - Google Patents

基于日志数据的列车运行异常诊断方法和装置 Download PDF

Info

Publication number
CN114312930A
CN114312930A CN202111619532.XA CN202111619532A CN114312930A CN 114312930 A CN114312930 A CN 114312930A CN 202111619532 A CN202111619532 A CN 202111619532A CN 114312930 A CN114312930 A CN 114312930A
Authority
CN
China
Prior art keywords
data
log data
train
layer
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111619532.XA
Other languages
English (en)
Other versions
CN114312930B (zh
Inventor
宋康
杨瑞超
刘超
李申
简锐锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Traffic Control Technology TCT Co Ltd
Original Assignee
Traffic Control Technology TCT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Traffic Control Technology TCT Co Ltd filed Critical Traffic Control Technology TCT Co Ltd
Priority to CN202111619532.XA priority Critical patent/CN114312930B/zh
Priority claimed from CN202111619532.XA external-priority patent/CN114312930B/zh
Publication of CN114312930A publication Critical patent/CN114312930A/zh
Application granted granted Critical
Publication of CN114312930B publication Critical patent/CN114312930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明的实施例提供了一种基于日志数据的列车运行异常诊断方法和装置。所述方法包括实时采集日志数据,存储到消息队列中;从消息队列中读取日志数据,输入到预先设计的多维度模型数仓中;在多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据;根据宽表数据中的列车运行速度对列车运行异常状态进行诊断。以此方式,可以实时获取日志数据,快速识别出列车运行异常状态,提高列车异常状态诊断的效率,增加列车运行的安全性。

Description

基于日志数据的列车运行异常诊断方法和装置
技术领域
本发明一般涉及城市智能轨道交通领域,并且更具体地,涉及一种基于日志数据的列车运行异常诊断方法和装置。
背景技术
在轨道交通领域中,列车经常会出现故障,导致列车运行异常的情况发生;常规的列车异常状态检查往往存在滞后性,且效率低下,无法及时发现列车的异常状态。VOBC(vehicle on-board controller,车载控制器)日志数据作为大数据的一种,包含了多种信息,例如站台信息、停车区域信息、逻辑区段信息、计划车次信息、列车运行信息、进路和停车区域关系信息等多种轨道交通的大数据信息。现有的情况下,只能通过对VOBC日志数据进行分析,对列车的运行状态进行离线诊断,无法实时诊断出列车的运行异常状态,使列车运行存在极大风险。
发明内容
根据本发明的实施例,提供了一种基于日志数据的列车运行异常诊断方案。本方案能够实时获取日志数据,快速识别出列车运行异常状态,提高列车异常状态诊断的效率,增加列车运行的安全性。
在本发明的第一方面,提供了一种基于日志数据的列车运行异常诊断方法。该方法包括:
实时采集日志数据,存储到消息队列中;
从所述消息队列中读取日志数据,输入到预先设计的多维度模型数仓中;
在所述多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据;
根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断。
进一步地,所述多维度模型数仓的设计过程,包括:
根据业务过程将日志数据进行梳理和数据域划分;
对业务过程进行粒度声明,并确定业务对应的维度;
选择适用于所述业务过程的事实;
根据所述维度设计维度表,以及根据所述事实设计事实表,生成多维度模型数仓。
进一步地,所述多维度模型数仓为6个层级的分层结构;其中
临时层,用于存储临时表;
贴源数据层,用于从消息队列中读取日志数据,按照实时或离线进行数据解析,解析后的数据输出到明细层;
明细层,用于对贴源数据层输出的数据进行清洗,并根据业务过程确定的事实获得事实表;
维度层,基于每个维度的业务含义,通过定义维度及维度主键,添加维度属性,定义关联维度,建立维度表;
统一数仓层,包括轻粒度汇总层和数据主题层;所述轻粒度汇总层,用于对城轨指标进行轻粒度汇总计算;所述数据主题层,用于对所述轻粒度汇总层输出的数据按主题划分和组织汇总;
应用层,对统一数仓层输出的数据进行聚合,形成宽表数据。
进一步地,在所述应用层中,通过Doris数据库对宽表数据进行存储。
进一步地,所述方法还包括在设计所述多维度模型数仓之前,对日志数据进行探查;
所述对日志数据进行探查,包括:
对数据表中的字段信息是否满足应用需求进行探查;以及
对相关表的结构信息是否为预设的复杂数据结构进行探查;以及
对日志数据的分布和质量进行探查;以及
对日志数据的数据量以及数据增长情况进行探查;以及
对表和字段的元数据信息进行探查。
进一步地,所述对数据的分布和质量进行探查,包括:
查看日志数据是否完整;以及
查看日志数据是否唯一;以及
查看日志数据是否存在异常格式;
查看日志数据的值域范围信息;
查看日志数据中是否有无意义字段;
查看日志数据中是否存在脏数据。
进一步地,所述根据所述宽表数据中的列车运行速度对列车运行异常进行诊断,包括:
根据所述宽表数据中的时间段信息、区间位置信息和历史运行信息生成列车在目标时间和目标区间位置对应的列车运行速度;
若所述列车运行速度不在对应的正常速度区间内,则所述列车在目标时间和目标区间位置的运行异常。
进一步地,所述方法还包括:
当所述列车在对应时间和区间位置的运行异常时,从所述区间位置的上一个区间开始,依次获取所述列车在各区间内运行的列车平均速度,进行列车异常诊断,直至所述列车在对应区间内运行正常,所述对应区间的上一个区间为故障发生区间;
所述列车异常诊断,包括:
若所述列车平均速度在对应的正常速度区间内,则所述列车在对应区间内运行正常;否则,所述列车在对应区间内运行异常。
在本发明的第二方面,提供了一种基于日志数据的列车运行异常诊断装置。该装置包括:
实时采集模块,用于实时采集日志数据,存储到消息队列中;
读取模块,用于从所述消息队列中读取日志数据,输入到预先设计的多维度模型数仓中;
分析处理模块,用于在所述多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据;
诊断模块,用于根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断。
在本发明的第三方面,提供了一种电子设备。该电子设备至少一个处理器;以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明第一方面的方法。
在本发明的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本发明第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本发明的实施例的关键或重要特征,亦非用于限制本发明的范围。本发明的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本发明各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本发明的实施例的基于日志数据的列车运行异常诊断方法的流程图;
图2示出了根据本发明的实施例的多维度模型数仓的分层架构图;
图3示出了根据本发明的实施例的数据在多维度模型数仓中分析流转示意图;
图4示出了根据本发明的实施例的基于日志数据的列车运行异常诊断装置的方框图;
图5示出了能够实施本发明的实施例的示例性电子设备的方框图;
其中,500为电子设备、501为CPU、502为ROM、503为RAM、504为总线、505为I/O接口、506为输入单元、507为输出单元、508为存储单元、509为通信单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本发明中,能够实时获取日志数据,快速识别出列车运行异常状态,提高列车异常状态诊断的效率,增加列车运行的安全性。
图1示出了本发明实施例的基于日志数据的列车运行异常诊断方法的流程图。
该方法包括:
S101、实时采集VOBC日志数据,存储到消息队列中。
VOBC日志数据是二进制格式的数据。在传统方案中对日志数据进行采集是先从指定的FTP服务器上下载对应的二进制数据,然后对下载到的二进制数据进行解析,将解析后的数据再加载到数仓中,故传统方案中无法对VOBC日志数据进行实时采集。
作为本发明的一种实施例,对VOBC日志数据的采集是通过应用程序实时采集,即当VOBC系统每生产一条日志数据时,就会通过应用程序对其实时采集,然后将采集到的日志数据存储到消息队列中。所述消息队列为先入先出队列,对于消息队列中的数据按照实时处理和离线处理两种处理方式进行初步解析,并对解析完成后的数据输入到实时分析系统或离线分析系统进行实时分析或离线分析。由此,增加了对VOBC日志数据的实时处理能力,从而提高列车异常状态诊断的效率。
S102、从所述消息队列中读取VOBC日志数据,输入到预先设计的多维度模型数仓中。
作为本发明的一种实施例,如图2所示,所述多维度模型数仓为6个层级的分层结构;其中包括临时层、贴源数据层、明细层、维度层、统一数仓层和应用层。
临时层TMP,用于存储临时表。所述临时表TMP用于存储临时数据,当使用完毕时即可将临时表删除。例如,数据的流转过程依次为A表、T1表、T2表和C表,其中A表和C表示实体表,用于对外展示数据,T1表和T2表作为数据在流转过程中临时存储的临时表,当计算逻辑复杂时,可以通过临时表简化计算过程。所述临时层TMP贯串整个纵向数仓分层。
贴源数据层ODS,用于从消息队列中读取VOBC日志数据,按照实时或离线进行数据解析,解析后的数据输出到明细层。所述贴源数据层ODS比较接近于最原始的数据,通过对消息队列中数据的读取,进行二进制数据的解析,解析完成后的数据方便后续使用。
明细层DWD,用于对贴源数据层输出的数据进行清洗,并根据业务过程确定的事实获得事实表,如下表1所示。
Figure BDA0003437427100000071
Figure BDA0003437427100000081
表1
维度层DIM,基于每个维度的业务含义,通过定义维度及维度主键,添加维度属性,定义关联维度,建立维度表。具体以维度作为建模驱动,基于每个维度的业务含义,通过定义维度及维度主键,添加维度属性、关联维度等定义计算逻辑和雪花模型,完成属性定义的过程并建立一致的数据分析维表。对于维度表的设计应遵循一致性维度原则。
统一数仓层DW,包括轻粒度汇总层和数据主题层;所述轻粒度汇总层,用于对城轨指标进行轻粒度汇总计算;所述数据主题层DWT,用于对所述轻粒度汇总层输出的数据按不同的主题划分和组织汇总。
应用层ADS,对统一数仓层DW输出的数据进行聚合,形成宽表数据。在应用层使用Doris替代Mysql进行存储最终的分析结果数据。所述Doris是一个MPP分析型数据库,支持及时查询(亚秒级响应时间即可获取查询结果),支持分布式数据查询。将分析完成的数据提供给Web数据应用系统。
ODS层、DWD层、DW层和ADS层中的数据是自下而上加载,不允许存在自上而下的引用。
进一步地,所述多维度模型数仓的设计过程,包括:
根据业务过程将VOBC日志数据进行梳理和数据域划分;
对业务过程进行粒度声明,并确定业务对应的维度;
选择适用于所述业务过程的事实;
根据所述维度设计维度表,以及根据所述事实设计事实表,生成多维度模型数仓。
作为本发明的一种实施例,对多维度数仓的设计采用的是Kimball的多维度模型多维度模型主要分为度量和环境,度量常常以数值的形式存在,最后落入的事实表中,而环境会包围在事实的周围,事实周围的环境也被称之为维度。维度建模的具体流程,包括:
A、结合城轨业务进行业务的梳理和数据域的划分;
B、选择相应的业务过程,进行粒度的声明以及维度的确定;
C、选择适用于业务过程的事实;
D、进行维度表和事实表的设计。
作为本发明的一种实施例,在设计多维度模型数仓之前,需要对VOBC日志数据进行探查。数据探查也即数据调研,进行数据探查工作可以帮助我们快速了解当前数据在质量、结构、分布情况、统计信息等维度的状况,使我们可以快速的掌握数据情报。在从零开始搭建数据仓库的时候,第一步需要做的事情就是根据业务需求,进行数据的探查。
所述对VOBC日志数据进行探查,包括:
对数据表中的字段信息是否满足应用需求进行探查,具体包括:
了解数据表中的字段信息,看数据表中的字段是否能满足应用需求,如果缺少字段或者数据源提供的字段无法满足应用需求,就需要确保需要的字段都可提供。所述数据表包括站台表、停车区域表、车站表、逻辑区段表、计划车次表、计划车次时刻出入站表、列车运行信息列表、进路和停车区域关系表等。VOBC的日志数据,原始状态是二进制数据,经过初步的加工翻译之后,在数据仓库中以数据表的形式进行存储。
对相关表的结构信息是否为预设的复杂数据结构进行探查。所述相关表为主要与列车相关的表,例如运行计划表、列车停放表、列车运行表等。所述预设的复杂数据结构,例如对象、数组或者其他格式比较复杂的数据结构。如果有需要提前拆解处理,以便数仓后续使用。
对VOBC日志数据的分布和质量进行探查,具体包括:
查看VOBC日志数据是否完整,完整体现在是否有空值或者空白情况,如果有,则VOBC日志数据不完整,反之完整。
查看VOBC日志数据是否唯一,通过数据去重处理判断VOBC日志数据是否有重复的情况,如果有,则说明VOBC日志数据不唯一,反之唯一。
查看VOBC日志数据是否存在异常格式,需要解析出数据结构,预先设定标准的数据格式,判断解析出的数据结构是否都属于标准的数据格式,如果是,则VOBC日志数据不存在异常格式,反之存在异常格式。例如,设置标准的时间信息为2021-11-15 11:15:23,如果VOBC日志数据中的时间信息为11:15:23,即只有时分秒数据,没有年月日数据,则该时间信息异常。
查看VOBC日志数据的值域范围信息。预设预期的值域范围,计算数据的最大值、最小值和平均值,是否均在业务方的期望值域范围内。
查看VOBC日志数据中是否有无意义字段。所述无意义的字段就是在此次项目需求中,上游的字段没有被下游使用到。例如,列车运行信息表中的文件、车厢数、内部列车方向、闭塞方式、报警信息、fam信息、回段码字符串等字段,均为无意义字段。
查看VOBC日志数据中是否存在脏数据。所述脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。例如列车运行信息表中的表号为0、车次号为0、方向为Unknown。
通过对VOBC日志数据以上维度的分布和质量查看,可以大概判断对这些数据需要有多少清洗机制,然后制定合理的清洗规则,将数据进行整理清洗即可。
对VOBC日志数据的数据量以及数据增长情况进行探查。了解数据量以及和业务方沟通了解数据的增长情况,可以方便在进行数据抽取时选择合适的数据抽取策略。
对表和字段的元数据信息进行探查,具体包括:
先从数据字典中对表和字段的元数据进行探查,如果数据字典中的信息记录不详或有歧义,再通过系统的业务人员及开发人员进行探查。
了解表及字段的元数据信息对快速了解业务有极大的帮助,因此需要添加确实的描述信息并对描述不清晰的元数据信息进行更正。
通过进行VOBC日志数据的探查,能够了解数据的结构(包括字段信息、表信息、元数据信息、数据量信息、各个字段的含义等)。
S103、在所述多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据。
作为本发明的一种实施例,如图3所示,数据在所述多维度模型数仓中进行分析处理的过程包括:
S301、贴源数据层ODS从消息队列中读取VOBC日志数据,利用数据仓库工具Hive按照实时或离线进行数据解析,解析后的数据输出到明细层DWD。
S302、明细层DWD对贴源数据层输出的数据利用数据仓库工具Hive进行清洗,并根据业务过程确定的事实获得事实表。
S303、维度层DIM基于每个维度的业务含义,利用数据仓库工具Hive通过定义维度及维度主键,添加维度属性,定义关联维度,建立维度表,发送至统一数仓层DW。
S304、统一数仓层DW中,利用数据仓库工具Hive,在轻粒度汇总层对城轨指标进行初步的汇总计算,并汇总计算结果输入到数据主题层DWT,由数据主题层DWT按不同的主题对数据进行划分以及汇总,发送至应用层ADS。
S305、应用层ADS利用数据仓库工具Hive对统一数仓层DW输出的数据进行聚合,形成宽表数据。应用层ADS是在统一数仓层DW的基础上对列车运行计划表按照表号、车次号、停车区域进行分组聚合得到计划停发车时间,然后再与列车停发车表进行关联形成列车运行信息宽表;然后通过对列车运行信息宽表的车组号、车站、车次号、计划到站时间、实际到站时间、正晚点标签字段进行排序、分组聚合得到车组号以及车站维度的统计宽表。利用Doris数据库存储最终的分析结果宽表数据。Doris数据库中的分析结果宽表数据提供给Web数据应用系统进行数据查询服务调用。
S104、根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断。
具体的,根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断,包括:
根据所述宽表数据中的时间段信息、区间位置信息和历史运行信息生成列车在目标时间和目标区间位置对应的列车运行速度;通过预设正常速度区间,判断所述列车运行速度是否在对应目标区间位置的正常速度区间内;若所述列车运行速度不在对应的正常速度区间内,则所述列车在目标时间和目标区间位置的运行异常。列车运行速度不在正常速度区间的情况可以包括低于正常速度区间的最低速度或高于正常速度区间的最高速度。若所述列车运行速度在对应的正常速度区间内,则所述列车运行正常。
作为本发明的一种实施例,当所述列车在对应时间和区间位置的运行异常时,从所述区间位置的上一个区间开始,依次获取所述列车在各区间内运行的列车平均速度,进行列车异常诊断,直至所述列车在对应区间内运行正常,所述对应区间的上一个区间为故障发生区间。
例如,所述列车的运行区间依次为区间1~区间5,当所述列车在区间5运行异常时,需要向前追溯区间5的上一个区间,即区间4;判断所述列车在区间4是否运行异常,如果所述列车在区间4也运行异常,则继续向前追溯区间3;若所述列车在区间3中的运行正常,可以判定所述列车的故障发生区间为区间4。
所述列车异常诊断,包括:
若所述列车平均速度在对应的正常速度区间内,则所述列车在对应区间内运行正常;否则,所述列车在对应区间内运行异常。
根据本发明的实施例,对VOBC日志数据的采集是通过应用程序实时采集,即当VOBC系统每生产一条日志数据时,就会通过应用程序对其实时采集,然后将采集到的日志数据存储到消息队列中。所述消息队列为先入先出队列,对于消息队列中的数据按照实时处理和离线处理两种处理方式进行初步解析,并对解析完成后的数据输入到实时分析系统或离线分析系统进行实时分析或离线分析。由此可以实现对VOBC日志数据的实时采集,提供实时数据处理能力;利用多维度模型进行数据分析处理,能够更高效的利用VOBC日志数据,从VOBC日志数据中获取有价值的信息;能够从历史大数据中快速识别列车的运行异常情况,为进一步分析列车异常原因和故障情况创造条件。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
如图4所示,装置400包括:
实时采集模块410,用于实时采集VOBC日志数据,存储到消息队列中;
读取模块420,用于从所述消息队列中读取VOBC日志数据,输入到预先设计的多维度模型数仓中;
分析处理模块430,用于在所述多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据;
诊断模块440,用于根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本发明的实施例,本发明还提供了一种电子设备和一种可读存储介质。
图5示出了可以用来实施本发明的实施例的电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如方法S101~S104。例如,在一些实施例中,方法S101~S104可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的方法S101~S104的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法S101~S104。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种基于日志数据的列车运行异常诊断方法,其特征在于,包括:
实时采集日志数据,存储到消息队列中;
从所述消息队列中读取日志数据,输入到预先设计的多维度模型数仓中;
在所述多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据;
根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断。
2.根据权利要求1所述的方法,其特征在于,所述多维度模型数仓的设计过程,包括:
根据业务过程将日志数据进行梳理和数据域划分;
对业务过程进行粒度声明,并确定业务对应的维度;
选择适用于所述业务过程的事实;
根据所述维度设计维度表,以及根据所述事实设计事实表,生成多维度模型数仓。
3.根据权利要求1或2所述的方法,其特征在于,所述多维度模型数仓为6个层级的分层结构;其中
临时层,用于存储临时表;
贴源数据层,用于从消息队列中读取日志数据,按照实时或离线进行数据解析,解析后的数据输出到明细层;
明细层,用于对贴源数据层输出的数据进行清洗,并根据业务过程确定的事实获得事实表;
维度层,基于每个维度的业务含义,通过定义维度及维度主键,添加维度属性,定义关联维度,建立维度表;
统一数仓层,包括轻粒度汇总层和数据主题层;所述轻粒度汇总层,用于对城轨指标进行轻粒度汇总计算;所述数据主题层,用于对所述轻粒度汇总层输出的数据按主题划分和组织汇总;
应用层,对统一数仓层输出的数据进行聚合,形成宽表数据。
4.根据权利要求3所述的方法,其特征在于,在所述应用层中,通过Doris数据库对宽表数据进行存储。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括在设计所述多维度模型数仓之前,对日志数据进行探查;
所述对日志数据进行探查,包括:
对数据表中的字段信息是否满足应用需求进行探查;以及
对相关表的结构信息是否为预设的复杂数据结构进行探查;以及
对日志数据的分布和质量进行探查;以及
对日志数据的数据量以及数据增长情况进行探查;以及
对表和字段的元数据信息进行探查。
6.根据权利要求5所述的方法,其特征在于,所述对数据的分布和质量进行探查,包括:
查看日志数据是否完整;以及
查看日志数据是否唯一;以及
查看日志数据是否存在异常格式;
查看日志数据的值域范围信息;
查看日志数据中是否有无意义字段;
查看日志数据中是否存在脏数据。
7.根据权利要求1所述的方法,其特征在于,所述根据所述宽表数据中的列车运行速度对列车运行异常进行诊断,包括:
根据所述宽表数据中的时间段信息、区间位置信息和历史运行信息生成列车在目标时间和目标区间位置对应的列车运行速度;
若所述列车运行速度不在对应的正常速度区间内,则所述列车在目标时间和目标区间位置的运行异常。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当所述列车在对应时间和区间位置的运行异常时,从所述区间位置的上一个区间开始,依次获取所述列车在各区间内运行的列车平均速度,进行列车异常诊断,直至所述列车在对应区间内运行正常,所述对应区间的上一个区间为故障发生区间;
所述列车异常诊断,包括:
若所述列车平均速度在对应的正常速度区间内,则所述列车在对应区间内运行正常;否则,所述列车在对应区间内运行异常。
9.一种基于日志数据的列车运行异常诊断装置,其特征在于,包括:
实时采集模块,用于实时采集日志数据,存储到消息队列中;
读取模块,用于从所述消息队列中读取日志数据,输入到预先设计的多维度模型数仓中;
分析处理模块,用于在所述多维度模型数仓中,将数据进行分析,并处理成通过维度表和事实表描述的宽表数据;
诊断模块,用于根据所述宽表数据中的列车运行速度对列车运行异常状态进行诊断。
10.一种电子设备,至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其特征在于,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
CN202111619532.XA 2021-12-27 基于日志数据的列车运行异常诊断方法和装置 Active CN114312930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111619532.XA CN114312930B (zh) 2021-12-27 基于日志数据的列车运行异常诊断方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111619532.XA CN114312930B (zh) 2021-12-27 基于日志数据的列车运行异常诊断方法和装置

Publications (2)

Publication Number Publication Date
CN114312930A true CN114312930A (zh) 2022-04-12
CN114312930B CN114312930B (zh) 2024-04-26

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115857766A (zh) * 2022-12-08 2023-03-28 上海定卓网络科技有限公司 一种地图交互方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3372473A1 (en) * 2017-03-10 2018-09-12 KNORR-BREMSE Systeme für Schienenfahrzeuge GmbH Method for logging and synchronizing diagnostic related events
US20190079818A1 (en) * 2017-09-08 2019-03-14 Oracle International Corporation Techniques for managing and analyzing log data
CN110888791A (zh) * 2019-12-06 2020-03-17 北京锐安科技有限公司 一种日志处理方法、装置、设备和存储介质
CN111190876A (zh) * 2019-12-31 2020-05-22 天津浪淘科技股份有限公司 日志管理系统及其运行方法
CN111259073A (zh) * 2020-01-08 2020-06-09 国网福建省电力有限公司 基于日志、流量和业务访问的业务系统运行状态智能研判系统
CN112668159A (zh) * 2020-12-15 2021-04-16 交控科技股份有限公司 基于改进fmea系统日志文件的故障排查方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3372473A1 (en) * 2017-03-10 2018-09-12 KNORR-BREMSE Systeme für Schienenfahrzeuge GmbH Method for logging and synchronizing diagnostic related events
US20190079818A1 (en) * 2017-09-08 2019-03-14 Oracle International Corporation Techniques for managing and analyzing log data
CN110888791A (zh) * 2019-12-06 2020-03-17 北京锐安科技有限公司 一种日志处理方法、装置、设备和存储介质
CN111190876A (zh) * 2019-12-31 2020-05-22 天津浪淘科技股份有限公司 日志管理系统及其运行方法
CN111259073A (zh) * 2020-01-08 2020-06-09 国网福建省电力有限公司 基于日志、流量和业务访问的业务系统运行状态智能研判系统
CN112668159A (zh) * 2020-12-15 2021-04-16 交控科技股份有限公司 基于改进fmea系统日志文件的故障排查方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏盛昕;朱存仁;徐建;: "地铁车载日志自动传输及智能分析系统研究", 铁道通信信号, no. 10, 17 October 2019 (2019-10-17) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115857766A (zh) * 2022-12-08 2023-03-28 上海定卓网络科技有限公司 一种地图交互方法

Similar Documents

Publication Publication Date Title
CN108537544B (zh) 一种交易系统实时监控方法及其监控系统
CN108959564B (zh) 数据仓库元数据管理方法、可读存储介质和计算机设备
WO2021052031A1 (zh) 基于统计四分位距的商品库存风险预警方法、系统及计算机可读存储介质
CN106933956B (zh) 数据挖掘方法和装置
CN110502509B (zh) 一种基于Hadoop与Spark框架的交通大数据清洗方法及相关装置
US10810225B2 (en) System and method for large scale data processing of source data
CA2783492C (en) Associative memory visual evaluation tool
CN112445875B (zh) 数据关联及检验方法、装置、电子设备及存储介质
CN111680855A (zh) 一种项目全过程风险自动检测预警方法及系统
CN111782900A (zh) 异常业务检测方法、装置、电子设备及存储介质
CN110825526B (zh) 基于er关系的分布式调度方法及装置、设备以及存储介质
CN109871368A (zh) 数据库检测方法、装置、计算机装置及存储介质
CN112579621A (zh) 数据展示方法、装置、电子设备及计算机存储介质
CN115913710A (zh) 异常检测方法、装置、设备及存储介质
CN116579697A (zh) 冷链全链路数据信息管理方法、装置、设备及存储介质
CN113987086A (zh) 数据处理方法、数据处理装置、电子设备以及存储介质
CN108549672A (zh) 一种数据智能分析方法及系统
CN114312930B (zh) 基于日志数据的列车运行异常诊断方法和装置
CN114312930A (zh) 基于日志数据的列车运行异常诊断方法和装置
CN115408236A (zh) 一种日志数据审计系统、方法、设备及介质
CN114661571A (zh) 模型评测方法、装置、电子设备和存储介质
CN115168509A (zh) 风控数据的处理方法及装置、存储介质、计算机设备
CN114266472A (zh) 基于Spark的地铁站疏散风险分析方法
CN113515560A (zh) 车辆故障的分析方法、装置、电子设备及存储介质
CN111221704B (zh) 一种确定办公管理应用系统运行状态的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant