基于大数据分析的轨道交通杂散电流波形预测系统及方法
技术领域
本发明属于电流波形大数据预测领域,具体涉及基于大数据分析的轨道交通杂散电流波形预测系统及方法。
背景技术
轨道交通对城市交通的疏解和人员运送的作用越来越明显。然而轨道交通常采用直流供电牵引模式,在轨道交通运行期间电流通过轨道回流,部分电流杂散入地,并侵入城市电网和地下管网系统,给电网和管网的运行造成危害。因此,对轨道交通在电网和管网接地位置的杂散电流历史电流数据进行收集,并进行杂散电流短期预测,对电网和管网运行安全具有重要意义。
申请号为202011633135.3的中国发明专利“一种地铁杂散电流引起的变压器直流偏磁地电位计算方法”,提出了利用杂散电流动态分布模型对三维大地电阻率模型,计算地表的大地电位并输出计算杂散电流结果。申请号为202011151504.5的中国发明专利“一种轨道交通与变压器直流偏磁关联性分析方法”提出了一种轨道交通杂散电流和变压器直流偏磁间支持度和置信度的计算和关联规则。
现有技术主要仅对典型杂散电流模型进行仿真计算,然而杂散电流受众多因素影响,现有技术未对轨道交通运行数据进行有效利用和分析,无法针对杂散电流波形进行有效预测。
发明内容
本发明的目的在于提供基于大数据分析的轨道交通杂散电流波形预测系统及方法,可以克服现有技术的中无法对短期轨道交通的杂散电流波形进行有效预测的缺点。
为实现上述目的,本发明采取的技术方案为:基于大数据分析的轨道交通杂散电流波形预测方法,步骤如下:
步骤一、构建轨道交通杂散电流分析大数据库,收集轨道交通的杂散电流历史波形数据、轨道交通历史运行数据、非交通类历史数据和非交通类短期预测数据;
步骤二、对轨道交通历史运行数据和非交通类历史数据进行分类和归集形成杂散电流影响因素数据集;根据杂散电流影响因素数据集,应用人工智能技术预测短期轨道交通运行数据,对杂散电流历史波形数据预处理形成杂散电流波形特征数据集;
步骤三、构建用于杂散电流波形预测的XGBoost模型,以杂散电流波形特征数据集作为训练数据集,将训练数据集输入XGBoost模型进行训练;
步骤四、把步骤二所得的短期轨道交通运行数据输入XGBoost模型,访问轨道交通杂散电流大数据库,提取非交通类短期预测数据,并导入XGBoost模型;通过训练后的XGBoost模型对测时间的轨道交通的杂散电流波形进行预测;
步骤五、预测完成后,测量预测时间的杂散电流波形实测数据,将预测时间的杂散电流波形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波形特征数据集作为测试集,用于检验和修正训练后的XGBoost模型。
进一步的,步骤一中,所述轨道交通杂散电流分析大数据库内部分为杂散电流数据采集区、交通运行状态监测区、数据处理区三个工作区:杂散电流数据采集区连接安装在受杂散电流侵扰的电力系统和管网系统接地位置的电流传感器,获取接地位置杂散电流历史波形;交通运行状态监测区通过接入地铁生产运行数据网和短期天气数值预报系统,收集轨道交通历史运行数据、非交通类历史数据和非交通类短期预测数据,轨道交通历史运行数据包括列车位置、列车运行速度和载客量,非交通类历史数据包括时间、季节和天气的历史数据,非交通类短期预测数据包括时间、季节和天气的短期预测数据。
进一步的,列车位置的特征参数
l en 表示为:
,其中
ρ
0为土壤电阻率,
d 1为正方向最近一趟列车至杂散电流测量位置的直线距离、
d 2为反方向最
近一趟列车至杂散电流测量位置的直线距离,
t 1为正方向最近地铁列车发车间隔、
t 2为反方
向最近地铁列车发车间隔,
d eq 为同方向相邻两列车平均距离,
K l 为电流回流系数;
载客量的特征参数
p表示为:
,其中
N为地铁站数量,
p h 为第
h个地铁站进出站人数差的绝对值,
d h 为第
h个地铁站至杂散电流测量位置的距离,
rat h 为第
h个地铁站乘客分流比;列车运行速度为瞬时速度,列车运行速度与其所处位置一一对应,
根据列车位置直接获取列车运行速度v:
,其中
Ψ v 为列车运行速度函数,根据地铁
生产运行数据网的地铁运行计划获取,
s为列车距始发站的距离。
进一步的,步骤二中,基于数据聚类原理对轨道交通历史运行数据和非交通类历史数据进行分类和归集,按不同属性分类和归集形成杂散电流影响因素数据集INF;INF=[INF 1,INF 2,…,INF i ,…,INF z ];其中INF i 表示杂散电流影响因素数据集的第i个元素,i=1~z,z为杂散电流影响因素数据集INF的元素总数量;杂散电流影响因素数据集为包括列车位置、载客量、列车运行速度、时间、季节、天气公共交通影响因素的时间序列数据子集,应用人工智能技术反演推算不同时间序列数据子集加权特征值,并预测当天不同时刻短期轨道交通运行数据,短期轨道交通运行数据包括轨道交通的列车位置、载客量和列车运行速度。
进一步的,在轨道交通历史运行数据进行分类和归集时,对非交通类数据按属性进行分类,属性类别包括有时间属性、天气属性和季节属性;时间属性类别包括作息日、峰谷期;作息日按客流量规律分为工作日、周末、团聚假日、旅游假日进行分类,团聚假日包括春节、清明、端午、中秋假日,旅游假日包括劳动节、国庆节假日;工作日按峰谷期分为高峰期和平时段,高峰期指工作日7:00-9:00和17:00-19:00,平时段指工作日其他时刻;天气属性类别包括晴、阴、雨、雪、大风五类天气分类,并以当地气象数据为依据;季节属性类别包括春秋、夏、冬三类天气分类,春秋为2-4月和9-10月,夏为5-8月,冬为1月、11月、12月。
进一步的,所述步骤二中对杂散电流历史波形数据进行预处理,通过杂散电流历
史波形数据与杂散电流影响因素数据集映射形成杂散电流波形特征数据集
x sub;
x sub=
[
x sub1,
x sub2,…,
x subk ,…,
x subn ],杂散电流波形特征包括平均值、变化率、加权值、突变量和
扭曲系数的特征参数,其中
x subk 表示第
k个杂散电流波形特征数据集元素,
k=1~n,n为杂散
电流波形特征数据集
x sub的元素总数量;杂散电流波形特征数据集
x sub与杂散电流影响因素
数据集
INF映射关系为:
,其中
t 0为
列车启动阶段持续时间,
s k 为第
k个杂散电流波形特征数据集元素的调差系数,
e为自然对
数,
t为列车运行时间。
进一步的,步骤三中,对XGBoost模型进行参数初始化,将杂散电流波形特征数据集x sub导入XGBoost模型进行训练,利用交互检验函数,计算每次迭代的误差值依次确定最佳决策树的最大深度、迭代次数、收缩步长不分裂分值和复杂度惩罚系数。
步骤四中,把步骤二得到的短期轨道交通运行数据输入训练后的XGBoost模型,访
问轨道交通杂散电流大数据库,提取预测时间
t j 的非交通类短期预测数据,并导入XGBoost
模型;输出所涉及区域的杂散电流波形特征数据集
x sub,绘出预测时间
t j 的预测电流波形
I stray (
t j )为:
;其中,
M(
k,
t j )为电流反演
矩阵中第
k个杂散电流波形特征数据集元素在预测时间
t j 时对应的数据元素,
x subk (
t j )为第
k个杂散电流波形特征数据集元素关于预测时间
t j 的函数。
进一步的,步骤五中,预测完成后,测量预测时间
t j 的杂散电流波形实测数据,对
杂散电流波形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波
形特征数据集作为测试集输入训练后的XGBoost模型,得到杂散电流波形真实的平均值、变
化率、加权值、突变量和扭曲系数的特征参数,并与预测的杂散电流波形的特征参数做比
较,对训练后的XGBoost模型进行修正,第
k个杂散电流波形特征数据集元素的修正系数
MI
(
k)为:
;其中
I stray (
t j )为预测电流波形,
I meas
(
t j )为实测电流波形,
T为列车在两个站点之间的平均运行时间。
基于大数据分析的轨道交通杂散电流波形预测系统,包括轨道交通杂散电流分析大数据库和杂散电流波形预测模块,轨道交通杂散电流分析大数据库内设置有杂散电流数据采集区、交通运行状态监测区和数据处理区三个工作区;杂散电流数据采集区连接安装在受杂散电流侵扰的电力系统和管网系统接地位置的电流传感器,获取接地位置杂散电流历史波形;交通运行状态监测区通过接入地铁生产运行数据网和短期天气数值预报系统,收集轨道交通历史运行数据、非交通类历史数据和非交通类短期预测数据;杂散电流波形预测模块内置有XGBoost模型,数据处理区对杂散电流数据采集区和交通运行状态监测区所采集的数据进行处理,并输入至杂散电流波形预测模块内对XGBoost模型训练,应用人工智能技术预测轨道交通运行的短期轨道交通运行数据,并将短期轨道交通运行数据导入训练后的XGBoost模型内,通过训练后的XGBoost模型对预测时间的轨道交通的杂散电流波形进行预测,预测完成后,测量预测时间的杂散电流波形实测数据,对预测时间的杂散电流波形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波形特征数据集作为测试集,用于检验和修正训练后的XGBoost模型。
与现有技术相比,本发明具有如下有益效果:本发明根据杂散电流受众多因素影响的原因,构建轨道交通杂散电流分析大数据库,收集并分析轨道交通历史运行和杂散电流监测数据,充分的考虑了列车运行过程中轨道交通列车位置、载客量、列车运行速度、节假日客流量、天气情况和季节等因素,大大的提高了预测的准确性,克服了现有技术的中无法对短期轨道交通的杂散电流波形进行有效预测的缺点,再将预测后的波形特征数据集作为测试集,检验和修正XGBoost模型,保证后期XGBoost模型预测的精准度。
附图说明
图1为本发明的方法流程图。
图2为本发明所述基于大数据分析的轨道交通杂散电流波形预测系统的示意图。
具体实施方式
参照图1,基于大数据分析的轨道交通杂散电流波形预测方法,其特征是,步骤如下:
步骤一、构建轨道交通杂散电流分析大数据库,收集轨道交通的杂散电流历史波形数据、轨道交通历史运行数据、非交通类历史数据和非交通类短期预测数据;
进一步的,所述轨道交通杂散电流分析大数据库内部分为杂散电流数据采集区、交通运行状态监测区、数据处理区三个工作区:杂散电流数据采集区连接安装在受杂散电流侵扰的电力系统和管网系统接地位置的电流传感器,获取接地位置杂散电流历史波形;交通运行状态监测区通过接入地铁生产运行数据网和短期天气数值预报系统,收集轨道交通历史运行数据、非交通类历史数据和非交通类短期预测数据,轨道交通历史运行数据包括列车位置、列车运行速度和载客量,非交通类历史数据包括时间、季节和天气的历史数据,非交通类短期预测数据包括时间、季节和天气的短期预测数据。
步骤二、对轨道交通历史运行数据和非交通类历史数据进行分类和归集形成杂散电流影响因素数据集;根据杂散电流影响因素数据集,应用人工智能技术预测短期轨道交通运行数据,对杂散电流历史波形数据预处理形成杂散电流波形特征数据集;
进一步的,列车位置的特征参数
l en 表示为:
,其
中,ρ
0为土壤电阻率,
d 1为正方向最近一趟列车至杂散电流测量位置的直线距离、
d 2为反方
向最近一趟列车至杂散电流测量位置的直线距离,
t 1为正方向最近地铁列车发车间隔、
t 2为
反方向最近地铁列车发车间隔,
d eq 为同方向相邻两列车平均距离,
K l 为电流回流系数;
载客量的特征参数
p表示为:
,其中
N为地铁站数量,
p h 为第
h个地铁站进出站人数差的绝对值,
d h 为第
h个地铁站至杂散电流测量位置的距离,
rat h 为第
h个地铁站乘客分流比;列车运行速度为瞬时速度,列车运行速度与其所处位置一一对应,
根据列车位置直接获取列车运行速度v:
,其中
Ψ v 为列车运行速度函数,根据地铁
生产运行数据网的地铁运行计划获取,
s为列车距始发站的距离。
进一步的,基于数据聚类原理对轨道交通历史运行数据和非交通类历史数据进行分类和归集,按不同属性分类和归集形成杂散电流影响因素数据集INF;INF=[INF 1,INF 2,…,INF i ,…,INF z ];其中INF i 表示杂散电流影响因素数据集的第i个元素,i=1~z,z为杂散电流影响因素数据集INF的元素总数量;杂散电流影响因素数据集为包括列车位置、载客量、列车运行速度、时间、季节、天气公共交通影响因素的时间序列数据子集,应用人工智能技术反演推算不同时间序列数据子集加权特征值,并预测当天不同时刻短期轨道交通运行数据,短期轨道交通运行数据包括轨道交通的列车位置、载客量和列车运行速度。
进一步的,在轨道交通历史运行数据进行分类和归集时,对非交通类数据按属性进行分类,属性类别包括有时间属性、天气属性和季节属性;时间属性类别包括作息日、峰谷期;作息日按客流量规律分为工作日、周末、团聚假日、旅游假日进行分类,团聚假日包括春节、清明、端午、中秋假日,旅游假日包括劳动节、国庆节假日;工作日按峰谷期分为高峰期和平时段,高峰期指工作日7:00-9:00和17:00-19:00,平时段指工作日其他时刻;天气属性类别包括晴、阴、雨、雪、大风五类天气分类,并以当地气象数据为依据;季节属性类别包括春秋、夏、冬三类天气分类,春秋为2-4月和9-10月,夏为5-8月,冬为1月、11月、12月。
进一步的,所述步骤二中对杂散电流历史波形数据进行预处理,通过杂散电流历
史波形数据与杂散电流影响因素数据集映射形成杂散电流波形特征数据集
x sub;
x sub=
[
x sub1,
x sub2,…,
x subk ,…,
x subn ],杂散电流波形特征包括平均值、变化率、加权值、突变量和
扭曲系数的特征参数,其中
x subk 表示第
k个杂散电流波形特征数据集元素,
k=1~n,n为杂散
电流波形特征数据集
x sub的元素总数量;杂散电流波形特征数据集
x sub与杂散电流影响因素
数据集
INF映射关系为:
,其中
t 0为
列车启动阶段持续时间,
s k 为第
k个杂散电流波形特征数据集元素的调差系数,
e为自然对
数,
t为列车运行时间。
步骤三、构建用于杂散电流波形预测的XGBoost模型,以杂散电流波形特征数据集作为训练数据集,将训练数据集输入XGBoost模型进行训练;
进一步的,对XGBoost模型进行参数初始化,将杂散电流波形特征数据集x sub导入XGBoost模型进行训练,利用交互检验函数,计算每次迭代的误差值依次确定最佳决策树的最大深度、迭代次数、收缩步长不分裂分值和复杂度惩罚系数。
步骤四、把步骤二所得的短期轨道交通运行数据输入XGBoost模型,访问轨道交通杂散电流大数据库,提取非交通类短期预测数据,并导入XGBoost模型;通过训练后的XGBoost模型对预测时间的轨道交通的杂散电流波形进行预测。
进一步的,把步骤二得到的短期轨道交通运行数据输入训练后的XGBoost模型,访
问轨道交通杂散电流大数据库,提取预测时间
t j 的非交通类短期预测数据,并导入XGBoost
模型;输出所涉及区域的杂散电流波形特征数据集
x sub,绘出预测时间
t j 的预测电流波形
I stray (
t j )为:
;其中
M(
k,
t j )为电流反演
矩阵中第
k个杂散电流波形特征数据集元素在预测时间
t j 时对应的数据元素,
x subk (
t j )为第
k个杂散电流波形特征数据集元素关于预测时间
t j 的函数。
步骤五、预测完成后,测量预测时间的杂散电流波形实测数据,将预测时间的杂散电流波形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波形特征数据集作为测试集,用于检验和修正训练后的XGBoost模型。
进一步的,预测完成后,测量预测时间
t j 的杂散电流波形实测数据,对杂散电流波
形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波形特征数据
集作为测试集输入训练后的XGBoost模型,得到杂散电流波形真实的平均值、变化率、加权
值、突变量和扭曲系数的特征参数,并与预测的杂散电流波形的特征参数做比较,对训练后
的XGBoost模型进行修正,第
k个杂散电流波形特征数据集元素的修正系数
MI(
k)为:
;其中
I stray (
t j )为预测电流波形,
I meas (
t j )为实
测电流波形,
T为列车在两个站点之间的平均运行时间。
参照图2,基于大数据分析的轨道交通杂散电流波形预测系统,其包括轨道交通杂散电流分析大数据库和杂散电流波形预测模块,轨道交通杂散电流分析大数据库内设置有杂散电流数据采集区、交通运行状态监测区和数据处理区三个工作区;杂散电流数据采集区连接安装在受杂散电流侵扰的电力系统和管网系统接地位置的电流传感器,获取接地位置杂散电流历史波形;交通运行状态监测区通过接入地铁生产运行数据网和短期天气数值预报系统,收集轨道交通历史运行数据、非交通类历史数据和非交通类短期预测数据;杂散电流波形预测模块内置有XGBoost模型,数据处理区对杂散电流数据采集区和交通运行状态监测区所采集的数据进行处理,并输入至杂散电流波形预测模块内对XGBoost模型训练,应用人工智能技术预测轨道交通运行的短期轨道交通运行数据,并将短期轨道交通运行数据导入训练后的XGBoost模型内,通过训练后的XGBoost模型对预测时间的轨道交通的杂散电流波形进行预测,预测完成后,测量预测时间的杂散电流波形实测数据,对预测时间的杂散电流波形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波形特征数据集作为测试集,用于检验和修正训练后的XGBoost模型。
本发明根据杂散电流受众多因素影响的原因,构建轨道交通杂散电流分析大数据库,收集并分析轨道交通历史运行和杂散电流监测数据,充分的考虑了列车运行过程中轨道交通列车位置、载客量、列车运行速度、节假日客流量、天气情况和季节等因素,大大的提高了预测的准确性,克服了现有技术的中无法对短期轨道交通的杂散电流波形进行有效预测的缺点,并且在预测完成后,再将测量预测时间的杂散电流波形实测数据,将测量预测时间的杂散电流波形实测数据预处理,形成实测杂散电流波形特征数据集,并将实测杂散电流波形特征数据集作为测试集,用于检验和修正训练后的XGBoost模型,保证XGBoost模型在后期预测的准确性。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。