CN113128115A - 地铁运行状态的预测及模型的训练方法、装置及存储介质 - Google Patents
地铁运行状态的预测及模型的训练方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113128115A CN113128115A CN202110413835.XA CN202110413835A CN113128115A CN 113128115 A CN113128115 A CN 113128115A CN 202110413835 A CN202110413835 A CN 202110413835A CN 113128115 A CN113128115 A CN 113128115A
- Authority
- CN
- China
- Prior art keywords
- sample
- prediction model
- training
- samples
- target parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012549 training Methods 0.000 title claims abstract description 207
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000003062 neural network model Methods 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 22
- 230000004927 fusion Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims 1
- 230000006403 short-term memory Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 18
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 11
- 238000005259 measurement Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000001133 acceleration Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 3
- 238000010923 batch production Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种地铁运行状态的预测及模型的训练方法、装置、终端及存储介质,属于计算机技术领域。由于本申请在获取运动数据后可以输入至预测模型中,由于该预测模型是基于训练集训练得到的模型,且训练过程中能够通过目标参数处理样本,降低样本中的噪声对于最终训练得到的预测模型的精度的影响。因此,本申请提供的地铁运行状态的预测方法,能够通过该预测模型较为准确地确定地铁的运行状态,从而提高了终端判断地铁运行状态的准确性。
Description
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种地铁运行状态的预测及模型的训练方法、装置及存储介质。
背景技术
随着现代交通的发展,地铁成为城市交通中较为常见的通行方式。能够用于确定地铁当前的运行状态,成为智能终端的一种功能的发展方向。
相关技术中,智能终端通过直接读取惯性测量单元中的数据,将惯性测量单元与指定数据阈值进行比较,判断地铁是否处于运动状态,从而实现终端确定地铁的当前运行情况。然而,该提醒方式由于较为刻板,使得不同的线路的判断逻辑相同且不能够在车辆停车之前预先判断出停车趋势,导致判断时延较高且判断灵敏性较弱。
发明内容
本申请实施例提供了一种地铁运行状态的预测及模型的训练方法、装置及存储介质。所述技术方案如下:
根据本申请的一方面内容,提供了一种地铁运行状态的预测方法,应用于终端中,所述终端中设置有惯性测量单元,所述方法包括:
从所述惯性测量单元中读取运动数据,所述运动数据用于指示所述终端的运动状态;
将所述运动数据输入至预测模型,所述预测模型是初始的预测模型基于训练集训练得到的神经网络模型,所述训练集用于对所述初始的预测模型进行k轮训练以得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数,所述目标参数用于输入至教师网络以得到所述第一样本的权重,所述权重用于从所述训练集中随机确定两个所述第一样本进行融合以得到第二样本,所述第二样本用于训练所述初始的预测模型以得到训练后的预测模型;
通过所述预测模型确定所述地铁的运行状态,所述运行状态包括行驶状态和停车状态。
根据本申请的另一方面内容,提供了一种预测模型的训练方法,所述方法包括:
获取初始的预测模型,所述初始的预测模型是未经过训练的神经网络模型;
基于训练集对所述初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数;
将每一个所述第一样本的所述k组目标参数输入至教师模型,得到所述第一样本的权重;
基于所述权重随机从所述训练集中选取两个所述第一样本进行融合,得到第二样本;
基于所述第二样本训练所述初始的预测模型,得到训练后的预测模型。
根据本申请的另一方面内容,提供了一种地铁运行状态的预测及模型的训练装置,应用于终端中,所述终端中设置有惯性测量单元,所述装置包括:
数据读取模块,用于从所述惯性测量单元中读取运动数据,所述运动数据用于指示所述终端的运动状态;
数据输入模块,用于将所述运动数据输入至预测模型,所述预测模型是初始的预测模型基于训练集训练得到的神经网络模型,所述训练集用于对所述初始的预测模型进行k轮训练以得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数,所述目标参数用于输入至教师网络以得到所述第一样本的权重,所述权重用于从所述训练集中随机确定两个所述第一样本进行融合以得到第二样本,所述第二样本用于训练所述初始的预测模型以得到训练后的预测模型;
状态确定模块,用于通过所述预测模型确定所述地铁的运行状态,所述运行状态包括行驶状态和停车状态。
根据本申请的另一方面内容,提供了一种预测模型的训练装置,所述装置包括:
模型获取模块,用于获取初始的预测模型,所述初始的预测模型是未经过训练的神经网络模型;
第一训练模块,用于基于训练集对所述初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数;
参数传递模块,用于将每一个所述第一样本的所述k组目标参数输入至教师模型,得到所述第一样本的权重;
样本融合模块,用于基于所述权重随机从所述训练集中选取两个所述第一样本进行融合,得到第二样本;
第二训练模块,用于基于所述第二样本训练所述初始的预测模型,得到训练后的预测模型。
根据本申请的另一方面内容,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如本申请各个方面提供的地铁运行状态的预测及模型的训练方法。
根据本申请的另一方面内容,提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如本申请各个方面提供的预测模型的训练方法。
根据本申请的另一方面内容,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如本申请各个方面提供的地铁运行状态的预测方法。
根据本申请的另一方面内容,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如本申请各个方面提供的预测模型的训练方法。
根据本申请的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述地铁运行状态的预测方面提供的方法。
根据本申请的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述预测模型的训练方面的各种可选实现方式中提供的方法。
本申请实施例提供的技术方案带来的有益效果可以包括:
由于本申请在获取运动数据后可以输入至预测模型中,由于该预测模型是基于训练集训练得到的模型,且训练过程中能够通过目标参数处理样本,降低样本中的噪声对于最终训练得到的预测模型的精度的影响。因此,本申请提供的地铁运行状态的预测方法,能够通过该预测模型较为准确地确定地铁的运行状态,从而提高了终端判断地铁运行状态的准确性。
附图说明
为了更清楚地介绍本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请所示实施例涉及的一种应用场景的示意图;
图2是本申请一个示例性实施例提供的一种地铁运行状态的预测方法的流程图;
图3是本申请另一个示例性实施例提供的一种预测模型的训练方法流程图;
图4是本申请实施例提供的一种预测模型的训练方法的流程图;
图5是基于图4所示实施例提供的一种预测模型的结构示意图;
图6是基于图4所示实施例提供的一种教师模型的结构示意图;
图7是本申请一个示例性实施例提供的抗噪声的预测模型的训练方法的流程图;
图8是本申请一个示例性实施例提供的一种地铁运行状态的预测装置的结构框图;
图9是本申请一个示例性实施例提供的一种预测模型的训练装置的结构框图;
图10是本申请一个示例性实施例提供的终端的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
如本文中所使用,根据上下文,术语“如果”任选地被解释为“当......时”、“在……时”、“响应于确定”或“响应于检测”。类似地,根据上下文,短语“如果确定……”或“如果检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。
需要说明的是,使用个人可识别信息应遵循公认为满足或超过维护用户隐私的行业或政府要求的隐私政策和做法。具体地,个人可识别信息在管理和处理的过程中应当向用户明确说明授权使用的性质,以使无意或未经授权的访问或使用的风险最小化。
为了本申请实施例所示方案易于理解,下面对本申请实施例中出现的若干名词进行介绍。
IMU(Inertial Measurement Unit,惯性测量单元),是测量物体三种姿态角以及加速的装置。在一种可能的方式中,IMU也可以测量物体的角速率和加速度。IMU主要包含陀螺仪和加速度计。
一种可能实现的方式中,IMU包括3个单轴的陀螺仪和3个单轴的加速度计。其中,3个单轴的陀螺仪中的任意两个陀螺仪的轴向互相垂直。3个单轴的加速度计中的任意两个加速度计的轴向互相垂直。
示意性的,IMU属于捷联式惯导,该系统中包括3个单轴的陀螺仪和3个单轴的加速度计。其中,加速度计用于测量物体相对于地垂线的加速度分量,速度传感器用于测量物体的角度信息。
EMA(Exponential Moving Average,指数移动平均),又称EXPMA指标。示意性的,EMA是一种趋向类指标,指数移动平均值是以指示递减加权的移动平均。
Batch(批处理)是神经网络模型在训练阶段涉及的一个参数。其中,Batch的数值大小是一个超参数。Batch用于定义在更新神经网络内部模型参数之前要处理的样本数。设计人员将批处理视为循环迭代一个或多个样本数据并进行预测。在该批处理结束时,将预测输出变量和预期输出变量进行比较,并计算两者之间的误差。设计人员根据该误差能够更新算法以改进神经网络模型。
示意性的,学习算法和Batch中包含的样本数的关系介绍如下。当Batch中包含全部的样本时,学习算法称之为批量梯度下降。当每一个Batch中包含的样本数均为1时,学习算法称之为随机梯度下降。当每一个Batch中包含的样本数多于1但是小于训练集中的样本数时,学习算法称之为小批量梯度下降。可选地,当学习算法是小批量梯度下降时,Batch中包含的样本数可以是16、32、64或128等数值。示意性的,Batch中包含的样本数还可以是其它数值,本申请实施例对此不作限定。
可选地,在训练过程中,可能出现训练集没有按照Batch均匀分配。在该场景下,为了提高训练的效果,可以对训练集中的样本数进行调整,以便训练集能够按照Batch均匀分配。在另一种可能的方式中,设计人员也可以调整每个Batch的大小,以使得整个训练集能够按照Batch均匀分配。
Epoch(轮数):Epoch是一个超参数,其定义了学习算法在整个训练数据集中的工作轮数。一个Epoch用于指示训练集中每个样本均有机会更新内部模型参数。Epoch由一个或者多个Batch组成。
可选地,在实际的神经网络模型的训练过程中,Epoch的数量可以是数百或者数千。比如,Epoch可以设置为10、100、500或1000等数值。本申请实施例不对预测模型在训练过程中的Epoch的具体数值进行限定。
随着城市的快速发展,日益庞大的城市规模需要地铁作为交通运力的有效补充。在城市化较好的城市中,用户乘坐地铁是一种常见的出行方式。
同时,由于包括手机在内的智能终端为用户日常的生活提供极大的便利,用户通过随身携带智能终端,为用户提供快捷有效的信息,并能够解决较多的实际问题。
基于该现状,本申请中的设计人员通过为智能终端赋能,通过智能终端中的IMU获取到智能终端所处的运动状态。并且,设计人员若能够提供识别能力较强的数学模型,则智能终端能够识别出用户在地铁中的进站和出站的场景,使得终端能够从普通的加速和减速中分辨出进站场景以及出站场景。数学模型的精度越高,智能终端识别出进站的速度就越快,从而提醒用户下车或换乘的速度均较为及时。在乘坐地铁的场景中,若反应速度能够提高1至2秒,则智能终端提醒的性能将大为提高,并且实用性增强,使得智能终端真正在地铁中具备良好的提醒功能。
需要说明的是,上述介绍中提及的数学模型可以是通过数学方法构造的多种模型中的一种。其中,研究热度较高且使用效果较好的是基于机器学习技术研发的深度神经网络模型。一种可能的应用方案是,神经网络模型在性能优异的服务器或者专用计算机设备中完成训练及测试过程。当神经网络模型的性能满足设计标准时,设计人员可以将训练好的神经网络模型发布或者推送到智能终端中,以令智能终端能够被用户携带乘坐地铁时,较为灵敏地推理出列车的进站和出站。在此基础上,智能终端能够提醒用户当前的站名、下车信息以及换乘信息。智能终端在获知用户的目的地时,还可以提供室内换乘路线以及行程时间等信息。
由此可见,为了提高智能终端预测地铁的进站以及出站场景。智能终端需要性能较为优异的神经网络模型。而本申请提供的地铁运行状态的预测方法能够通过性能较为优异的神经网络模型得到较为准确的预测结果。同时,本申请提供的预测模型的训练方法能够结合抗噪声的神经网络模型的训练方法,在训练过程中降低训练数据中的脏数据对于预测模型的训练效果的影响,从而在训练数据中包含脏数据的情况下,也能够获得性能较为优异的预测模型,进而在运行预测模型的智能终端中,提高较好的地铁运行场景的预测效果。
示意性的,本申请将抗噪声的神经网络模型训练方法引入到IMU判断地铁运行和停止的算法模型的训练中,使得IMU模型能够有效利用带有噪声的训练样本,也即带有噪声的IMU数据进行训练,得到性能较优秀的预测模型,从而实现了在IMU数据的噪声较难去除的情况下,实现了提高预测模型的性能的效果。
请参见图1,图1是本申请所示实施例涉及的一种应用场景的示意图。在图1中,智能终端110被用户携带到地铁车厢100中。在用户站立在车辆100中,或者用户坐在车厢100中的座椅中时,智能终端110相对于车厢100静止。智能终端110中的IMU测量到的运动数据可以近似认定为地铁车厢100的运动数据。也即,用户携带的智能终端110中IMU测量到的运动数据能够近似反映地铁的运动场景。
请参考图2,图2是本申请一个示例性实施例提供的一种地铁运行状态的预测方法的流程图。该地铁运行状态的预测方法可以应用在终端中。示意性的,终端可以是用户能够随身携带的移动终端。在图2中,地铁运行状态的预测方法包括:
步骤210,获取运动数据,运动数据用于指示终端的运动状态。
在本申请实施例中,终端中设置有惯性测量单元IMU。其中,运动数据可以是IMU数据,IMU数据用于指示终端的运动状态。
可选地,本申请能够应用在任意一种被用户随身携带至地铁中的移动终端。例如,智能手机、智能手表、智能手环、平板电脑、笔记本电脑以及智能眼镜等。
在其它可能的应用方式中,终端还可以从其他组件中获取运动数据,本申请实施例对此不作限定。
步骤220,将运动数据输入至预测模型,预测模型是初始的预测模型基于训练集训练得到的神经网络模型,训练集用于对初始的预测模型进行k轮训练以得到n个第一样本各自对应的目标参数,目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组目标参数,目标参数用于输入至教师网络以得到第一样本的权重,权重用于从训练集中随机确定两个第一样本进行融合以得到第二样本,第二样本用于训练初始的预测模型以得到训练后的预测模型。
在本申请中,预测模型是经过教师网络调整后的样本训练而得到的模型。相较于直接使用带有噪声的样本训练得到的模型,本申请提供的预测模型能够在训练的时候对样本进行再处理,处理后的样本是原有的两个样本融合得到的,由于权重较高的样本参与融合的可能性大,并且权重较大的样本是包含噪声较少的样本,因此融合后的样本受到噪声的影响降低,从而使得本申请训练得到的预测模型有较好的性能。
步骤230,通过预测模型确定地铁的运行状态,运行状态包括行驶状态和停车状态。
在本申请实施例中,终端中的预测模型能够输出地铁的运行状态。
在一种可能的实现方式中,预测模型是一种二分类模型,能够判断地铁的运行状态是行驶状态,或者,判断地铁的运行状态是停车状态。
在另一种可能的实现方式中,预测模型输出的参数可以作为中间参数,终端获取该参数后在用户界面(User Interface,UI)上结合其它数据一同显示给用户。例如,终端能够实时判断出地铁当前所处的车站。在此场景中,终端将在状态由运行状态转为停车状态时,显示地铁已到达XX车站。或者,终端在状态由停车状态转为行驶状态时,终端将显示列出已出发,下一站是XX车站。
示意性的,终端还能够结合当前的信息输出模式确定信息通知给用户的方式。一种可能的方式中,若终端的处于耳机连接状态,则终端通过耳机语播报上述提示信息。可选地,在该场景中也可以同时在显示屏中显示上述信息。另一种可能的方式中,若终端处于熄屏且放置在口袋中的状态时,终端将在智能识别到用户将要下车的车站或者识别到用户指定要下车的车站时,进行响铃或者震动等强提醒方式,以便用户被提醒需要下车。
综上所述,本实施例提供的地铁运行状态的预测方法,由于本申请应用在设置有惯性测量单元的终端中,且在获取其中对的运动数据后可以输入至预测模型中,由于该预测模型是基于训练集训练得到的模型,且训练过程中能够通过目标参数处理样本,降低样本中的噪声对于最终训练得到的预测模型的精度的影响。因此,本申请提供的地铁运行状态的预测方法,能够通过该预测模型较为准确地确定地铁的运行状态,从而提高了终端判断地铁运行状态的准确性。
基于上一个实施例所公开的方案,终端还能够提供一种预测模型的训练方法,以提供一种能够在存在噪声的样本的训练集的训练下有较好性能的神经网络模型,请参考如下实施例。
请参见图3,图3是本申请另一个示例性实施例提供的一种预测模型的训练方法流程图。该预测模型的训练方法可以应用在算力较强的设备中,以实现快速训练预测模型的效果。在图3中,该预测模型的训练方法包括:
步骤310,获取初始的预测模型,初始的预测模型是未经过训练的神经网络模型。
在本申请中,预测模型通常在性能较为优异的云端服务器或者专用的设备中进行训练。在训练之前,设备能够获取初始的预测模型,该初始的预测模型中的内部参数以及外部的超参数均为初始参数,该初始的预测模型是没有经过训练的神经网络模型。
步骤320,基于训练集对初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组目标参数。
在本申请中,训练集可以是包括n个第一样本的数据集。在一种可能的训练过程中,若基于训练集进行了一轮训练,则说明n个第一样本均参与了一次预测模型的训练。在上述n次训练中,可以将若干次训练集合为一批(batch),以批为单位进行训练。
一种可能的方式中,基于训练集的一轮(Epoch)训练中包括m批(batch),每一批中包括n/m个第一样本。需要说明的是,m为正整数,n/m也为正整数。
另一种可能的方式中,为了提高训练效果,基于训练集的轮数可以包括几十轮、几百轮或者上千轮。在本申请中,轮数被限定为k,k也为正整数。
在本申请中,以训练集中包括1024个第一样本,k取值为16为例进行说明。设备能够基于包括1024个第一样本的训练集,对初始的预测模型进行16轮训练。相应的,得到了1024个第一样本各自对应的目标参数。由于每一个第一样本都对应的目标参数。设备在完成基于训练集的k轮训练后,每一个第一样本都对应作为一组目标参数的k组目标参数。
在本例中,设备将获得1024个第一样本对应的k组目标参数,目标参数的总数是1024*16组。其中,目标参数用于指示第一样本中包含的噪声的程度。
步骤330,将每一个第一样本的k组目标参数输入至教师模型,得到第一样本的权重。
在本申请中,设备能够将每一个第一样本的k组目标参数输入至教师模型,得到第一样本的权重。
一种可能的方式中,k组目标参数将按照采集的时序排位一个序列。设备将k组目标参数组成的序列输入至教师模型,进行处理并得到第一样本的权重。
步骤340,基于权重随机从训练集中选取两个第一样本进行融合,得到第二样本。
在本申请中,设备能够基于权重随机从训练集中选出2个第一样本进行融合,得到第二样本。
一种可能的方式中,被选出的2个第一样本属于同一批(batch)。在该选择方式中,第一样本的权重用于指示该第一样本在该批中的权重。示意性的,在随机选择第一样本时,权重越大的第一样本被选择到的概率越高。
步骤350,基于第二样本训练初始的预测模型,得到训练后的预测模型。
综上所述,在本申请中,设备能够基于第二样本在此训练初始的预测模型,从而得到训练后的预测模型。由于第二样本较为可能是权重较大的第一样本融合产生的样本,同时权重较大的第一样本是收到噪声影响较小的样本。因此,第二样本收到噪声影响的程度,整体上较之第一样本要小。在此基础上,基于第二样本训练初始的预测模型,能够在使用同样的训练集的基础上,提升最后得到的训练后的预测模型的性能。
在本申请中,设备还能够通过另一种较为详细的设计方案,能够进一步提高预测模型的性能。
请参见图4,图4是本申请实施例提供的一种预测模型的训练方法的流程图。图4所示的方法能够应用在算力较强的设备中,以实现快速训练预测模型的效果。在图4中,该预测模型的训练方法包括:
步骤410,获取初始的预测模型。
示意性的,步骤410的执行过程和步骤210的执行过程相同,此处不再赘述。
在一种可能的方式中,预测模型的结构可以是卷积神经网络(ConvolutionalNeural Networks,CNN)。
在一种具体的实现方式中,请参见图5,图5是基于图4所示实施例提供的一种预测模型的结构示意图。在图5中,预测模型500包括第一卷积层(conv1)510、第二卷积层(conv2)520、第三卷积层(conv3)530、第四卷积层(conv4)540、目标全连接层(Fc)550和逻辑回归层560。
一种可能的方式中,目标全连接层550和逻辑回归层560组成输出层。其中,逻辑回归层中可以包括softmax函数。
在预测模型500中,输入特征从第一卷积层510输入至模型。预测模型500从逻辑回归层560输出分类结果。
在一种可能的方式中,预测模型能够用于预测地铁的运行和静止。在预测模型的训练过程中,训练集中的每一个批(batch)中的第一样本首先经过预测模型,进行前向计算,并计算该批中每一个第一样本的损失。随后,设备再计算该批(batch)中的所有第一样本损失(loss)的γ分位数lpt。其中,当前批(batch)的下一批的γ分位数能够根据当前批的γ分位数lpt算得。具体的,l′pt=EMA(lpt)。其中,l′pt表示当前批的下一批的γ分位数。
步骤421,在一轮训练中,基于训练集中的m批的第一样本对初始的预测模型进行训练,得到n个第一样本各自对应的一组目标参数。
在本申请中,设备将以批为单位,通过每一批中的第一样本对初始的预测模型进行训练,进一步得到n个第一样本各自对应的一组目标参数。
需要说明的是,一组目标参数可以包括多个数据,数据组合在一起说明第一样本中包含噪声的程度。一组目标参数可以包括2个、3个或4个等数据,本申请实施例不对数据的个数进行限定。
步骤422,基于训练集中m批的第一样本,重复对初始的预测模型进行k-1轮训练,总共得到k轮训练后n个第一样本各自对应的目标参数。
在一种可能的方式中,目标参数包括第一样本在当前轮对应的第一损失和当前轮的第一分位数,第一分位数是当前轮的全部第一样本的损失排序后中的指定位置的分位数。
在另一种可能的方式中,目标参数包括第一样本在当前轮对应的第一损失和第一样本在所属批的第二分位数,第二分位数是第一样本所在批的第一样本的损失排序后中的指定位置的分位数。
在该可能的方式中,第一样本所属批的下一批的分位数为第二分位数的指数移动平均值。
示意性的,目标参数可以是第一样本在当前轮对应的第一损失(loss)和γ分位数。在一种可能的方式中,γ是一个超参数,可以取80%、70%或者75%等数据,本申请实施例对此不作限定。
步骤430,将每一个第一样本的k组目标参数输入至教师模型,得到第一样本的权重。
在本申请中,教师模型能够处理目标参数,得到第一样本的权重。其中,教师网络可以循环神经网络(Recurrent Neural Networks,RNN)。在该设计要求下,教师网络能够处理时序数据。其中,目标数据可以是和时序相关的数据。
在一种可能的实现方式中,教师模型的结构可以参见图6。图6是基于图4所示实施例提供的一种教师模型的结构示意图。在图6中,教师模型600包括双向长短期记忆网络(Bi-LSTM)610、第一全连接层(fc1)620、第二全连接层(fc2)630和激活层(sigmoid)640。
在教师模型600中,第一样本的目标参数从双向长短期记忆网络610输入。教师模型600从激活层640输出第一样本的权重。
步骤441,从训练集中确定目标批,遍历目标批中的每一个第一样本。
需要说明的是,当训练中包括1000个第一样本时,设备可以每次以其中一个第一样本为基础,再随机选择一个其它的第一样本来融合。
步骤442,从目标批中确定一个第一样本,从目标批中基于权重随机确定待融合样本,待融合样本是目标批中除已确定的第一样本外的第一样本。
需要说明的是,根据权重随机选择第一样本,能够令权重较大的第一样本被选中的概率高一些。
步骤443,将已确定的第一样本和待融合样本进行融合,得到第二样本。
一种可能的方式中,第一样本和待融合样本的相关数据可以求平均后作为新的第二样本。
另一种可能的方式中,第一样本和待融合样本的相关数据可以按照权重,加权平均后作为新的第二样本。
步骤451,基于第二样本训练初始的预测模型,得到待测试的预测模型。
步骤452,响应于待测试的预测模型满足预设性能指标,将待测试的预测模型确定为训练后的预测模型。
在本申请中,训练后的预测模型是二分类模型,用于判断地铁处于行驶状态或停车状态。
综上所述,本实施例能够通过统计第一样本在训练预测模型后的损失以及损失对应的γ分位数,将损失和γ分位数作为一组目标参数,进而经过k轮后的训练后,将得到k组第一样本的目标参数,将k组第一样本的目标参数按照采集的时序排列后,输入到教师模型得到第一样本的权重,随后,设备能够根据第一样本的权重随机挑出2个第一样本进行融合,得到新的第二样本,在通诺第二样本训练预测模型,从而得到受噪声影响较小的预测模型,在训练集不变的情况下,减少了样本中的噪声对于预测模型的性能的影响。
在本申请所示的实施例中,用于识别地铁运行或停止的数据难以通过人工清晰的方式处理干净。原因在IMU数据难以可视化且数据清洗人员难以区分地铁的不同状态。本申请针对该情况提供了一种能够识别抵抗噪声数据的神经网络模型训练方法来训练预测模型,该预测模型的输入数据是IMU数据。示意性的,本方法通过教师模型来辅助预测模型的训练,使得预测模型能够在训练过程中重点学习噪声较小的样本,而减少学习噪声较大或较可能包含脏数据的样本,从而提高了预测样本在推理阶段准确判断地铁的运行和停止的能力。
作为一种可能的实现方式,请参见如下实施例。
请参考图7,图7是本申请一个示例性实施例提供的抗噪声的预测模型的训练方法的流程图。该抗噪声的预测模型的训练方法可以应用在服务器或者专用设备中。在图7中,抗噪声的预测模型的训练方法包括:
步骤701,获取完成标注的惯性测量单元数据。
在本申请实施例中,惯性测量单元数据又称为IMU数据。IMU数据既可以由采集人员通过乘坐地铁采集,也可以通过设置在地铁中的专用采集设备采集获得。
当IMU数据是采集人员通过乘坐地铁采集的数据时,采集人员可以携带采集设备乘坐地铁。一方面,采集人员能够在地铁从静止开始启动的时刻开始采集IMU数据,当地铁加速至匀速状态时再停止采集IMU数据,并将本次IMU数据作为一个指示地铁加速出站的样本。另一方面,采集人员能够在地铁从匀速开始减速时开始采集IMU数据,当地铁减速至静止时在停止采集IMU数据,并将本次IMU数据作为一个指示地铁减速进站的样本。
示意性的,当IMU数据是采集人员通过地铁中的专用采集设备采集时,该采集设备可以设置在地铁驾驶室中。需要说明的是,在该场景中,采集设备的安全性需要经过严格的限制且仅能够单向读取地铁输出的指示信号。该指示信号可以包括四种信号,分别为地铁开始进站信号、地铁停止进站信号、地铁开始出站信号以及地铁完成出站信号。
在实际应用中,由于地铁驾驶室的控制设备的不同。因此,在一种可能的设备中,指示信号可能仅包括地铁开始进站信号,地铁停止进站信号和地铁开始出站信号。在此场景中,采集设备可以将接收到地铁开始出站信号后的第一时段内的IMU数据作为指示地铁加速出站的样本。示意性的,第一时段的时长可能是5秒、8秒或10秒等任意一种可能的时长。
需要说明的是,采集设备能够自动对上述样本进行标注。比如,当指示信号包括地铁开始进站信号、地铁停止进站信号、地铁开始出站信号以及地铁完成出站信号。
在本例中,指示信号00用于表示地铁开始进站信号,指示信号01用于表示地铁停止进站信号,指示信号10用于表示地铁开始出站信号,指示信号11用于表示地铁完成出站信号。采集设备能够在接收到指示信号00或者指示信号10时开始采集IMU数据,并在接收到指示信号01或者指示信号11时停止采集IMU数据。在此基础上,位于指示信号00与指示信号01之间采集的IMU数据被标注为地铁减速进站的样本;位于指示信号10与指示信号11之间采集的IMU数据被标注为地铁加速出站的样本。
步骤702,设计预测模型,并进行预测模型的第一步训练。
在本例中,预测模型又可称之为IMU模型。第一步训练用于指示执行一个批(batch)的数据训练,并将第一步训练得到的第一样本的损失以及相应的γ分位数传递至教师模型。
步骤703,教师模型根据第一步训练的损失和γ分位数来计算当前批中每一个第一样本的权重。
步骤704,根据每一的样本的权重进行抽样,从当前批中抽取不同的第一样本进行融合,将融合后的成为的第二样本用于训练预测模型。
步骤705,交替训练预测模型和教师模型,直至预测模型满足性能指标。
需要说明的是,教师模型的输入特征是第一样本在k轮(epoch)中的损失(loss)以及γ分位数lpt之差构成的序列。所有第一样本经过一次训练为一轮(epoch),假设经过k轮的训练,则教师模型的输入特征是一共包括k组目标参数所组成的有序序列。每一组目标参数均包括一个损失,以及,损失和其对应的γ分位数之差。在图6所示的教师模型600中,上述输入特征经过双向长短期记忆网络(Bi-LSTM)610以及第一全连接层(fc1)620、第二全连接层(fc2)630处理后,经过激活层(sigmoid)640激活输出第一样本对应的权重w。
在本申请所示的样本混合过程中。预测模型训练时是属于一个批(batch)的第一样本一起训练。设备对于该批(batch)中的每一个第一样本,均能够得到相应的权重。其中,权重可以记录为w=[w1,w2,...,wN]。其中,N用于指示当前批(batch)中的第一样本的总数。通过算式p=softmax(w)得到当前批(batch)中的第一样本的概率分布。随后,设备对当前批(batch)中的每一个第一样本xi按照概率分布p选出抽样样本xj,再将xi和xj按照一定比例相加融合。其中,比例的具体数据可以根据需要进行自由调整。另一方面,第一样本的标签也可以按照该比例进行相加融合。融合之后得到第二样本,该第二样本用于对预测模型进行训练。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图8,图8是本申请一个示例性实施例提供的一种地铁运行状态的预测装置的结构框图。该地铁运行状态的预测装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置包括:
数据获取模块810,用于获取运动数据,所述运动数据用于指示终端的运动状态;
数据输入模块820,用于将所述运动数据输入至预测模型,所述预测模型是初始的预测模型基于训练集训练得到的神经网络模型,所述训练集用于对所述初始的预测模型进行k轮训练以得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数,所述目标参数用于输入至教师网络以得到所述第一样本的权重,所述权重用于从所述训练集中随机确定两个所述第一样本进行融合以得到第二样本,所述第二样本用于训练所述初始的预测模型以得到训练后的预测模型;
状态确定模块830,用于通过所述预测模型确定所述地铁的运行状态,所述运行状态包括行驶状态和停车状态。
综上所述,本申请提供的装置,能够在获取运动数据后可以输入至预测模型中,由于该预测模型是基于训练集训练得到的模型,且训练过程中能够通过目标参数处理样本,降低样本中的噪声对于最终训练得到的预测模型的精度的影响。因此,本申请提供的地铁运行状态的预测方法,能够通过该预测模型较为准确地确定地铁的运行状态,从而提高了终端判断地铁运行状态的准确性。
请参考图9,图9是本申请一个示例性实施例提供的一种预测模型的训练装置的结构框图。该地铁运行状态的预测装置可以通过软件、硬件或者两者的结合实现成为设备的全部或一部分。该装置包括:
模型获取模块910,用于获取初始的预测模型,所述初始的预测模型是未经过训练的神经网络模型;
第一训练模块920,用于基于训练集对所述初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数;
参数传递模块930,用于将每一个所述第一样本的所述k组目标参数输入至教师模型,得到所述第一样本的权重;
样本融合模块940,用于基于所述权重随机从所述训练集中选取两个所述第一样本进行融合,得到第二样本;
第二训练模块950,用于基于所述第二样本训练所述初始的预测模型,得到训练后的预测模型。
在一个可选的实施例中,所述第一训练模块920,用于在一轮训练中,基于所述训练集中的m批的所述第一样本对所述初始的预测模型进行训练,得到n个所述第一样本各自对应的一组目标参数;基于所述训练集中m批的所述第一样本,重复对所述初始的预测模型进行k-1轮训练,总共得到k轮训练后n个所述第一样本各自对应的所述目标参数。
在一个可选的实施例中,所述装置涉及的所述目标参数包括第一样本在当前轮对应的第一损失和当前轮的第一分位数,所述第一分位数是所述当前轮的全部第一样本的损失排序后中的指定位置的分位数;或者,所述目标参数包括第一样本在当前轮对应的第一损失和所述第一样本在所属批的第二分位数,所述第二分位数是所述第一样本所在批的所述第一样本的损失排序后中的指定位置的分位数。
在一个可选的实施例中,所述目标参数包括第一样本在当前轮对应的第一损失和所述第一样本在所属批的第二分位数,所述第一样本所属批的下一批的分位数为所述第二分位数的指数移动平均值。
在一个可选的实施例中,所述样本融合模块940,用于从所述训练集中确定目标批,遍历所述目标批中的每一个所述第一样本;从所述目标批中确定一个所述第一样本,从所述目标批中基于所述权重随机确定待融合样本,所述待融合样本是所述目标批中除已确定的第一样本外的第一样本;将所述已确定的第一样本和所述待融合样本进行融合,得到所述第二样本。
在一个可选的实施例中,所述第二训练模块950,用于基于所述第二样本训练所述初始的预测模型,得到待测试的预测模型;响应于所述待测试的预测模型满足预设性能指标,将所述待测试的预测模型确定为所述训练后的预测模型。
在一个可选的实施例中,所述装置涉及的所述教师网络是循环神经网络。
在一个可选的实施例中,所述装置涉及的所述教师网络包括双向长短期记忆网络、第一全连接层、第二全连接层和激活层。
综上所述,本申请实施例提供的装置,能够通过统计第一样本在训练预测模型后的损失以及损失对应的γ分位数,将损失和γ分位数作为一组目标参数,进而经过k轮后的训练后,将得到k组第一样本的目标参数,将k组第一样本的目标参数按照采集的时序排列后,输入到教师模型得到第一样本的权重,随后,设备能够根据第一样本的权重随机挑出2个第一样本进行融合,得到新的第二样本,在通诺第二样本训练预测模型,从而得到受噪声影响较小的预测模型,在训练集不变的情况下,减少了样本中的噪声对于预测模型的性能的影响。
示例性地,本申请实施例所示的地铁运行状态的预测及模型的训练方法,可以应用在终端中,该终端具备显示屏且具备地铁运行状态的预测及模型的训练功能。终端可以包括手机、平板电脑、膝上型电脑、台式电脑、电脑一体机、服务器、工作站、电视、机顶盒、智能眼镜、智能手表、数码相机、MP4播放终端、MP5播放终端、学习机、点读机、电纸书、电子词典、车载终端、虚拟现实(Virtual Reality,VR)播放终端或增强现实(Augmented Reality,AR)播放终端等。
请参考图10,图10是本申请一个示例性实施例提供的终端的结构框图,如图10所示,该终端包括处理器1020和存储器1040,所述存储器1040中存储有至少一条指令,所述指令由所述处理器1020加载并执行以实现如本申请各个方法实施例所述的地铁运行状态的预测及模型的训练方法。
需要说明的是,图10所示的终端既可以是用于执行地铁运行状态的预测方法的终端,也可以是用于执行预测模型的训练方法的设备,本申请实施例对此不作限定。
处理器1020可以包括一个或者多个处理核心。处理器1020利用各种接口和线路连接整个终端1000内的各个部分,通过运行或执行存储在存储器1040内的指令、程序、代码集或指令集,以及调用存储在存储器1040内的数据,执行终端1000的各种功能和处理数据。可选的,处理器1020可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器1020可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1020中,单独通过一块芯片进行实现。
存储器1040可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选的,该存储器1040包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1040可用于存储指令、程序、代码、代码集或指令集。存储器1040可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等;存储数据区可存储下面各个方法实施例中涉及到的数据等。
本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的地铁运行状态的预测方法。
本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的预测模型的训练方法。
需要说明的是:上述实施例提供的地铁运行状态的预测装置在执行地铁运行状态的预测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的地铁运行状态的预测装置与地铁运行状态的预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
需要说明的是:上述实施例提供的预测模型的训练装置在执行预测模型的训练方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的预测模型的训练装置与预测模型的训练方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的能够实现的示例性的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (16)
1.一种地铁运行状态的预测方法,其特征在于,所述方法包括:
获取运动数据,所述运动数据用于指示终端的运动状态;
将所述运动数据输入至预测模型,所述预测模型是初始的预测模型基于训练集训练得到的神经网络模型,所述训练集用于对所述初始的预测模型进行k轮训练以得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数,所述目标参数用于输入至教师网络以得到所述第一样本的权重,所述权重用于从所述训练集中随机确定两个所述第一样本进行融合以得到第二样本,所述第二样本用于训练所述初始的预测模型以得到训练后的预测模型;
通过所述预测模型确定所述地铁的运行状态,所述运行状态包括行驶状态和停车状态。
2.一种预测模型的训练方法,其特征在于,所述方法包括:
获取初始的预测模型,所述初始的预测模型是未经过训练的神经网络模型;
基于训练集对所述初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数;
将每一个所述第一样本的所述k组目标参数输入至教师模型,得到所述第一样本的权重;
基于所述权重随机从所述训练集中选取两个所述第一样本进行融合,得到第二样本;
基于所述第二样本训练所述初始的预测模型,得到训练后的预测模型。
3.根据权利要求2所述的方法,其特征在于,所述基于训练集对所述初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,包括:
在一轮训练中,基于所述训练集中的m批的所述第一样本对所述初始的预测模型进行训练,得到n个所述第一样本各自对应的一组目标参数;
基于所述训练集中m批的所述第一样本,重复对所述初始的预测模型进行k-1轮训练,总共得到k轮训练后n个所述第一样本各自对应的所述目标参数。
4.根据权利要求3所述的方法,其特征在于,
所述目标参数包括第一样本在当前轮对应的第一损失和当前轮的第一分位数,所述第一分位数是所述当前轮的全部第一样本的损失排序后中的指定位置的分位数;
或者,
所述目标参数包括第一样本在当前轮对应的第一损失和所述第一样本在所属批的第二分位数,所述第二分位数是所述第一样本所在批的所述第一样本的损失排序后中的指定位置的分位数。
5.根据权利要求4所述的方法,所述目标参数包括第一样本在当前轮对应的第一损失和所述第一样本在所属批的第二分位数,其特征在于,所述第一样本所属批的下一批的分位数为所述第二分位数的指数移动平均值。
6.根据权利要求2所述的方法,其特征在于,所述基于所述权重随机从所述训练集中选取两个所述第一样本进行融合,得到融合后的第二样本,包括:
从所述训练集中确定目标批,遍历所述目标批中的每一个所述第一样本;
从所述目标批中确定一个所述第一样本,从所述目标批中基于所述权重随机确定待融合样本,所述待融合样本是所述目标批中除已确定的第一样本外的第一样本;
将所述已确定的第一样本和所述待融合样本进行融合,得到所述第二样本。
7.根据权利要求2所述的方法,其特征在于,所述基于所述第二样本训练所述初始的预测模型,得到训练后的预测模型,包括:
基于所述第二样本训练所述初始的预测模型,得到待测试的预测模型;
响应于所述待测试的预测模型满足预设性能指标,将所述待测试的预测模型确定为所述训练后的预测模型。
8.根据权利要求2至7任一所述的方法,其特征在于,所述教师网络是循环神经网络。
9.根据权利要求8所述的方法,其特征在于,所述教师网络包括双向长短期记忆网络、第一全连接层、第二全连接层和激活层。
10.根据权利要求2至7任一所述的方法,其特征在于,所述训练后的预测模型是二分类模型,用于判断地铁处于行驶状态或停车状态。
11.一种预测地铁运行状态的装置,其特征在于,所述装置包括:
数据获取模块,用于获取运动数据,所述运动数据用于指示终端的运动状态;
数据输入模块,用于将所述运动数据输入至预测模型,所述预测模型是初始的预测模型基于训练集训练得到的神经网络模型,所述训练集用于对所述初始的预测模型进行k轮训练以得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数,所述目标参数用于输入至教师网络以得到所述第一样本的权重,所述权重用于从所述训练集中随机确定两个所述第一样本进行融合以得到第二样本,所述第二样本用于训练所述初始的预测模型以得到训练后的预测模型;
状态确定模块,用于通过所述预测模型确定所述地铁的运行状态,所述运行状态包括行驶状态和停车状态。
12.一种预测模型的训练装置,其特征在于,所述装置包括:
模型获取模块,用于获取初始的预测模型,所述初始的预测模型是未经过训练的神经网络模型;
第一训练模块,用于基于训练集对所述初始的预测模型进行k轮训练,得到n个第一样本各自对应的目标参数,所述目标参数用于指示第一样本中包含的噪声的程度,一个第一样本对应k组所述目标参数;
参数传递模块,用于将每一个所述第一样本的所述k组目标参数输入至教师模型,得到所述第一样本的权重;
样本融合模块,用于基于所述权重随机从所述训练集中选取两个所述第一样本进行融合,得到第二样本;
第二训练模块,用于基于所述第二样本训练所述初始的预测模型,得到训练后的预测模型。
13.一种终端,其特征在于,所述终端包括处理器、和与所述处理器相连的存储器,以及存储在所述存储器上的程序指令,所述处理器执行所述程序指令时实现如权利要求1所述的地铁运行状态的预测方法。
14.一种设备,其特征在于,所述设备包括处理器、和与所述处理器相连的存储器,以及存储在所述存储器上的程序指令,所述处理器执行所述程序指令时实现如权利要求2至10任一所述的预测模型的训练方法。
15.一种计算机可读存储介质,所述存储介质中存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1所述的地铁运行状态的预测方法。
16.一种计算机可读存储介质,所述存储介质中存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求2至10任一所述的预测模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110413835.XA CN113128115A (zh) | 2021-04-16 | 2021-04-16 | 地铁运行状态的预测及模型的训练方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110413835.XA CN113128115A (zh) | 2021-04-16 | 2021-04-16 | 地铁运行状态的预测及模型的训练方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113128115A true CN113128115A (zh) | 2021-07-16 |
Family
ID=76777030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110413835.XA Withdrawn CN113128115A (zh) | 2021-04-16 | 2021-04-16 | 地铁运行状态的预测及模型的训练方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113128115A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113836012A (zh) * | 2021-09-17 | 2021-12-24 | 上海瑾盛通信科技有限公司 | 算法测试方法、装置、电子设备及存储介质 |
CN116484177A (zh) * | 2023-05-04 | 2023-07-25 | 中国科学院地质与地球物理研究所 | 一种用于飞行平台电磁探测的运动诱导噪声预测消除方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376615A (zh) * | 2018-09-29 | 2019-02-22 | 苏州科达科技股份有限公司 | 用于提升深度学习网络预测性能的方法、装置及存储介质 |
CN111325386A (zh) * | 2020-02-11 | 2020-06-23 | Oppo广东移动通信有限公司 | 交通工具运行状态的预测方法、装置、终端及存储介质 |
CN111639710A (zh) * | 2020-05-29 | 2020-09-08 | 北京百度网讯科技有限公司 | 图像识别模型训练方法、装置、设备以及存储介质 |
CN112001364A (zh) * | 2020-09-22 | 2020-11-27 | 上海商汤临港智能科技有限公司 | 图像识别方法及装置、电子设备和存储介质 |
CN112150304A (zh) * | 2020-08-13 | 2020-12-29 | 国电南瑞科技股份有限公司 | 电网运行状态轨迹稳定性预判方法、系统及存储介质 |
-
2021
- 2021-04-16 CN CN202110413835.XA patent/CN113128115A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376615A (zh) * | 2018-09-29 | 2019-02-22 | 苏州科达科技股份有限公司 | 用于提升深度学习网络预测性能的方法、装置及存储介质 |
CN111325386A (zh) * | 2020-02-11 | 2020-06-23 | Oppo广东移动通信有限公司 | 交通工具运行状态的预测方法、装置、终端及存储介质 |
CN111639710A (zh) * | 2020-05-29 | 2020-09-08 | 北京百度网讯科技有限公司 | 图像识别模型训练方法、装置、设备以及存储介质 |
CN112150304A (zh) * | 2020-08-13 | 2020-12-29 | 国电南瑞科技股份有限公司 | 电网运行状态轨迹稳定性预判方法、系统及存储介质 |
CN112001364A (zh) * | 2020-09-22 | 2020-11-27 | 上海商汤临港智能科技有限公司 | 图像识别方法及装置、电子设备和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113836012A (zh) * | 2021-09-17 | 2021-12-24 | 上海瑾盛通信科技有限公司 | 算法测试方法、装置、电子设备及存储介质 |
CN113836012B (zh) * | 2021-09-17 | 2024-05-03 | 上海瑾盛通信科技有限公司 | 算法测试方法、装置、电子设备及存储介质 |
CN116484177A (zh) * | 2023-05-04 | 2023-07-25 | 中国科学院地质与地球物理研究所 | 一种用于飞行平台电磁探测的运动诱导噪声预测消除方法 |
CN116484177B (zh) * | 2023-05-04 | 2024-05-28 | 中国科学院地质与地球物理研究所 | 一种用于飞行平台电磁探测的运动诱导噪声预测消除方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102523886B1 (ko) | 스몰 타깃 검출 방법 및 장치 | |
CN109145680B (zh) | 一种获取障碍物信息的方法、装置、设备和计算机存储介质 | |
JP6842574B2 (ja) | 自律車両運転イベントに応答して乗車者フィードバックを取得するシステムおよび方法 | |
CN111626350B (zh) | 目标检测模型训练方法、目标检测方法及装置 | |
CN110146100A (zh) | 轨迹预测方法、装置及存储介质 | |
CN110378483A (zh) | 部署在模拟平台上的用于训练机器学习模型的系统和方法 | |
CN108025742A (zh) | 使用电极的自动驾驶车辆人类驾驶员接管机制 | |
CN113642431B (zh) | 目标检测模型的训练方法及装置、电子设备和存储介质 | |
CN111325437B (zh) | 异常行驶行为的识别方法、装置以及电子设备 | |
CN113128115A (zh) | 地铁运行状态的预测及模型的训练方法、装置及存储介质 | |
CN111721306B (zh) | 道路匹配方法、装置、电子设备及可读存储介质 | |
KR20190088086A (ko) | 전자 장치 및 이의 제어 방법 | |
CN112193252A (zh) | 驾驶风险的预警方法、装置、计算设备及存储介质 | |
CN112233428B (zh) | 车流量预测方法、装置、存储介质及设备 | |
CN110059646A (zh) | 训练动作规划模型的方法及目标搜索方法 | |
WO2023071768A1 (zh) | 到站提醒方法、装置、终端、存储介质及程序产品 | |
CN116472562A (zh) | 用于自动行程熟悉度识别的移动设备和系统及其对应方法 | |
CN111950702A (zh) | 一种神经网络结构确定方法及其装置 | |
EP4015998A2 (en) | Method and apparatus for prompting navigation information, medium and program product | |
CN110069997B (zh) | 场景分类方法、装置及电子设备 | |
CN115546576A (zh) | 建立预测模型的方法及装置 | |
CN112529836A (zh) | 高压线路缺陷检测方法、装置、存储介质及电子设备 | |
EP3382570A1 (en) | Method for characterizing driving events of a vehicle based on an accelerometer sensor | |
CN116859931A (zh) | 轨迹规划模型的训练方法、车辆控制方式及装置 | |
WO2023051398A1 (zh) | 安全补偿方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210716 |
|
WW01 | Invention patent application withdrawn after publication |