CN117807443B - 拖拉机工况识别模型的训练方法及拖拉机工况识别方法 - Google Patents
拖拉机工况识别模型的训练方法及拖拉机工况识别方法 Download PDFInfo
- Publication number
- CN117807443B CN117807443B CN202410227636.3A CN202410227636A CN117807443B CN 117807443 B CN117807443 B CN 117807443B CN 202410227636 A CN202410227636 A CN 202410227636A CN 117807443 B CN117807443 B CN 117807443B
- Authority
- CN
- China
- Prior art keywords
- tractor
- data
- working condition
- training
- state data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 147
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000002360 preparation method Methods 0.000 claims abstract description 37
- 239000002689 soil Substances 0.000 claims abstract description 35
- 238000010899 nucleation Methods 0.000 claims abstract description 8
- 238000004220 aggregation Methods 0.000 claims description 23
- 230000002776 aggregation Effects 0.000 claims description 23
- 238000013145 classification model Methods 0.000 claims description 23
- 238000004140 cleaning Methods 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 239000002826 coolant Substances 0.000 claims description 4
- 239000000446 fuel Substances 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 7
- 238000003860 storage Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000012271 agricultural production Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012850 discrimination method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241001124569 Lycaenidae Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Agricultural Machines (AREA)
Abstract
本发明涉及机器学习技术领域,具体涉及一种拖拉机工况识别模型的训练方法及拖拉机工况识别方法。本发明采用级联的思想来训练拖拉机工况识别模型,该模型能够精确识别耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地等多种工况。本发明提供的拖拉机工况识别方法易于部署和扩展,能够应用于不同的业务场景。
Description
技术领域
本发明涉及机器学习技术领域,具体涉及一种拖拉机工况识别模型的训练方法及拖拉机工况识别方法。
背景技术
拖拉机作为农业生产工具,其最常见的应用场景即与不同的农具或机具配合,完成相应的农业作业。由于拖拉机装载不同的农具会进行不同的工作情况,如果能正确识别拖拉机车辆的工况,将有助于厂商在精细化计亩、精确保养、动力控制优化等领域的影响力提升。当前行业内可通过RFID、视频识别等方法进行工况的判断,但这些方法的扩展成本过高,在实际应用场景中限制多,可靠性差。因此,行业内亟需一种便于实施和扩展的拖拉机工况识别方案。
发明内容
发明目的:本发明旨在弥补现有技术的不足,提出一种拖拉机工况识别模型的训练方法及拖拉机工况识别方法。
发明内容:本发明提出以下技术方案:
第一方面,提供了一种拖拉机工况识别模型的训练方法,该训练方法包括步骤:
构建训练样本,所述训练样本包括不同工况下的拖拉机状态特征,所述工况包括耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地;
将偏置重耙工况训练样本和平地框工况训练样本归为第一大类,将犁地工况训练样本和联合整地工况训练样本归为第二大类,与其余工况的训练样本一起构建为第一训练样本集;
在所述第一训练样本集上训练得到第一识别模型;
构建偏置重耙工况差异性样本、平地框工况差异性样本、犁地工况差异性样本和联合整地工况差异性样本;
将所述第一识别模型针对所述第一大类训练样本的预测结果分别与所述偏置重耙工况差异样本和所述平地框工况差异性样本进行特征融合,基于融合后的训练样本构建第二训练样本集;
将所述第一识别模型针对所述第二大类训练样本的预测结果分别与所述犁地工况差异性样本和所述联合整地工况差异性样本进行特征融合,基于融合后的训练样本构建第三训练样本集;
在所述第二训练样本集上训练一个二分类模型,得到第二识别模型;
在所述第三训练样本集上训练一个二分类模型,得到第三识别模型;
基于所述第一识别模型、所述第二识别模型和所述第三识别模型,确定所述拖拉机工况识别模型。
作为第一方面所述方法的一种可选实施方式,所述训练样本的构建方法具体包括:
获取不同工况下的拖拉机历史状态数据,包括:车速、发动机冷却液温度、取力器状态、左侧提升器实际提升力、右侧提升器实际提升力、发动机转速、发动机实际扭矩百分比、发动机燃油消耗率;
对所述拖拉机历史状态数据进行数据清洗,以剔除不符合预设条件的异常数据;
将数据清洗后的拖拉机历史状态数据进行数据聚合,以将所述拖拉机历史状态数据映射到统一粒度空间,以得到所述拖拉机状态特征。
具体来说,对所述拖拉机历史状态数据进行数据清洗,可以采用以下方式:
从所述拖拉机历史状态数据中剔除满足预设异常条件的数据。
具体来说,将数据清洗后的拖拉机历史状态数据进行数据聚合,可以采用以下方式:
将数据清洗后的所述拖拉机历史状态数据从秒级聚合为分钟级;
针对分钟级的拖拉机历史状态数据,分别对取力器开启和关闭状态下的所述拖拉机历史状态数据计算众数、最大值、最小值、均值、方差、中位数和极差,以作为补充特征;
将所述补充特征加入相应的分钟级的拖拉机历史状态数据中,得到所述拖拉机状态特征。
具体来说,在对数据清洗后的拖拉机历史状态数据进行数据聚合后,还可以执行以下步骤:
针对数据聚合后的所述拖拉机历史状态数据,从所述拖拉机历史状态数据中剔除取力器开启时长小于预设开启时长阈值的数据和取力器关闭时长小于预设关闭时长阈值的数据。
具体来说,在对数据清洗后的拖拉机历史状态数据进行数据聚合后,还可以执行以下步骤:
从数据聚合后的所述拖拉机历史状态数据中识别出非作业工况下的运输工况数据;
从数据聚合后的所述拖拉机历史状态数据中提出所述运输工况数据。
更具体地,从数据聚合后的所述拖拉机历史状态数据中识别出非作业工况下的运输工况数据,可以采用以下方式:
通过预设的特征匹配规则对数据聚合后的所述拖拉机历史状态数据进行逐一匹配,将成功匹配的数据作为所述运输工况数据。
具体来说,在对数据清洗后的拖拉机历史状态数据进行数据聚合后,还可以执行以下步骤:
从数据聚合后的所述拖拉机历史状态数据中提出作业总时长小于预设的作业时长阈值的数据。
作为第一方面所述方法的一种可选实施方式,在构建所述训练样本时,还包括基于现有的拖拉机状态特征进行特征扩展,包括在现有的所述拖拉机状态特征中加入以下至少一种衍生特征,具体包括:
发动机功率、左提升器实际提升力差分值、右提升器实际提升力差分值、左右提升器力差值、左右提升器力差值的差分值。
第二方面,提供了一种拖拉机工况识别方法,该识别方法包括:
获取目标拖拉机作业工况下的工作状态数据;
将所述工作状态数据输入拖拉机工况识别模型,得到所述目标拖拉机的工况;所述拖拉机工况识别模型是采用上述的拖拉机工况识别模型的训练方法方法预先训练得到的。
第三方面,提供了一种拖拉机工况识别模型的训练装置,该训练包括:
第一数据获取模块,用于获取训练样本,所述训练样本包括不同工况下的拖拉机状态特征,所述工况包括耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地;
第一处理模块,用于将偏置重耙工况训练样本和平地框工况训练样本归为第一大类,将犁地工况训练样本和联合整地工况训练样本归为第二大类,与其余工况的训练样本一起构建为第一训练样本集;以及,在所述第一训练样本集上训练得到第一识别模型;
第二数据获取模块,用于获取偏置重耙工况差异性样本、平地框工况差异性样本、犁地工况差异性样本和联合整地工况差异性样本;
第二处理模块,用于将所述第一识别模型针对所述第一大类训练样本的预测结果分别与所述偏置重耙工况差异样本和所述平地框工况差异性样本进行特征融合,基于融合后的训练样本构建第二训练样本集;将所述第一识别模型针对所述第二大类训练样本的预测结果分别与所述犁地工况差异性样本和所述联合整地工况差异性样本进行特征融合,基于融合后的训练样本构建第三训练样本集;在所述第二训练样本集上训练一个二分类模型,得到第二识别模型;在所述第三训练样本集上训练一个二分类模型,得到第三识别模型;
第三处理模块,用于基于所述第一识别模型、所述第二识别模型和所述第三识别模型,确定所述拖拉机工况识别模型。
第四方面,提供了一种拖拉机工况识别装置,包括:
第三数据获取模块,用于获取目标拖拉机作业工况下的工作状态数据;
识别模块,用于将所述工作状态数据输入拖拉机工况识别模型,得到所述目标拖拉机的工况;所述拖拉机工况识别模型是采用上述的拖拉机工况识别模型的训练方法预先训练得到的。
第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的拖拉机工况识别模型的训练方法,或者,实现所述的拖拉机工况识别方法。
第六方面,提供了一种电子设备,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行所述的拖拉机工况识别模型的训练方法,或者,实现所述的拖拉机工况识别方法。
有益效果:与现有技术相比,本发明具有以下优势:
本发明采用级联的思想来训练拖拉机工况识别模型,该模型能够精确识别耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地等多种工况。
本发明提供的拖拉机工况识别方法易于部署和扩展,能够应用于不同的业务场景。
基于本发明提供的拖拉机工况识别方法,研发部门可以及时准确区分各作业工况条件下拖拉机的运行数据,了解机器在不同工况下的性能表现,从而提供有针对性的设计与改进方案。实现能耗降低、动力控制优化等目标。
基于本发明提供的拖拉机工况识别方法,可以帮助后市场部门进行故障在线分析诊断,及时识别拖拉机运行中的异常情况,并提前采取维修措施,以减少机器故障率和停机时间,提高设备可用性。同时,根据工况数据对设备进行更加准确的维修与保养,延长机器寿命,提高客户满意度。
基于本发明提供的拖拉机工况识别方法,可以帮助最终用户实现精细化计亩、精确保养等需求。
附图说明
图1为实施例示意性给出的一种拖拉机工况识别模型的训练方法的流程示意图;
图2为实施例示意性给出的一种拖拉机工况识别模型的结构示意图;
图3为实施例示意性给出的一种拖拉机工况识别模型的训练装置的结构示意图;
图4为实施例示意性给出的一种拖拉机工况识别方法的流程示意图;
图5为实施例示意性给出的一种拖拉机工况识别装置的结构示意图。
具体实施方式
下面将结合附图和具体实施例对本发明作更进一步的说明。但应当理解的是,本发明可以以各种形式实施,以下在附图中出示并且在下文中描述的一些示例性和非限制性实施例,并不意图将本发明限制于所说明的具体实施例。
应当理解的是,在技术上可行的情况下,以上针对不同实施例所列举的技术特征可以相互组合,从而形成本发明范围内的另外的实施例。此外,本发明所述的特定示例和实施例是非限制性的,并且可以对以上所阐述的结构、步骤、顺序做出相应修改而不脱离本发明的保护范围。
本实施例旨在提出一种拖拉机工况识别模型的训练方法、拖拉机工况识别方法及装置,能够以较低的成本实现拖拉机工况的精准识别,且方案的实现不受实施场景的限制,易于部署和扩展。
请参考图1,本实施例示意性地提出一种拖拉机工况识别模型的训练方法,其流程包括以下步骤:
S100、构建训练样本。
上述的训练样本具体是指不同工况下的拖拉机状态特征,这些不同工况下的拖拉机状态特征具有工况标签,这些工况标签用于表征这些拖拉机状态特征所属的工况,例如:耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地等。
为了构建上述的拖拉机状态特征,可以收集不同工况下的拖拉机历史状态数据,然后对拖拉机历史状态数据进行数据清洗,以剔除不符合预设条件的异常数据;最后将数据清洗后的拖拉机历史状态数据进行数据聚合,以将拖拉机历史状态数据映射到统一粒度空间,以得到上述的拖拉机状态特征。
下面以拖拉机的车联网历史数据为例,来详细阐述拖拉机状态特征的构建过程。
车联网历史数据指的是通过T-Box(Telematics BOX,简称车载T-BOX)采集与传输,存放在车联网数据平台上最近24小时内的车联网工况数据。车辆历史工况数据通过T-Box采集时的采样频率通常为1Hz。车联网历史数据主要包括车速、发动机冷却液温度、取力器(PTO,Power Take Off)状态、左侧提升器实际提升力、右侧提升器实际提升力、发动机转速、发动机实际扭矩百分比、发动机燃油消耗率。
上述的取力器是一种用于向拖拉机动力输出的装置,它通常连接到发动机上,并通过传动装置将动力传递给其他农业设备,比如割草机、农用搅拌机等。取力器状态指的是这个装置的工作状态,通常可以分为″ON″和″OFF″两种状态,″ON″表示PTO激活并提供动力输出,″OFF″表示PTO处于关闭状态,不提供动力输出。
上述的提升器是拖拉机上常见的装置之一,用于增加拖拉机的承载能力和提高作业效率。提升器通常由一个液压系统驱动,通过液压气缸来调节农机的高度。拖拉机上的提升器可以用于提升和降低拖拉机上的工作部件,比如耕作机具、播种机、收获机等,以适应不同的农业作业需求。提升器的作用是提供机械设备的上升和下降功能,便于拖拉机操作人员在农业生产中进行各种操作。
在获取到车联网历史数据后,需要对车联网历史数据进行数据清洗,在数据清洗阶段,主要执行两个步骤:
11)测点匹配处理,即需要检测当前数据集的测点和报文字段解析出的数据字典的一致性,以及当前数据集某些测点的数据缺失情况等。如果不一致或数据缺失则需要盘查原因,例如是否因为当前数据集的时间维度跨越较长,拖拉机国标等规定的测点发生了变化;是否由于解析错误导致数据字典本身的缺失。
12)数据异常处理,即需要检测当前数据集的一些数据范围是否符合人为以及业务上的理解逻辑,剔除不符合预设条件的异常数据。例如,剔除满足以下任一条件的数据:车速大于60km/h、发动机转速小于100rpm、发动机冷却液温度小于60℃、提升器相关信号(%)小于0或大于100对应的数据记录。此处的提升器相关信号具体包括左提升器实际提升力、右提升器实际提升力。
在进行数据清洗后,开始进行特征构建,特征构建阶段可以包括但不限于以下步骤:
21)数据聚合处理:为降低瞬时采样或数据中断造成的秒级误差,需要将原始数据从秒级聚合为分钟级。
22)关键测点处理:为了保证分布的相似性,需要对关键测点进行特殊处理。在一种可实现的方式中,可以对PTO开启样本和PTO关闭样本分别进行每分钟数据的众数、最大值、最小值、均值、方差、中位数、极差的计算。然后将这些计算结果作为补充特征,增加到原始的样本当中去,也即增加了原始样本的维度。
上述的PTO开启样本即作业时会开启PTO的工况,包括耙地、打捆、平地以及播种耙地工况。上述的PTO关闭样本即作业时不开启PTO的工况,包括起垄、犁地、偏置重耙、平地框、联合整地工况。
23)衍生特征扩展:包括基于现有样本数据构建发动机功率、左提升器实际提升力差分、右提升器实际提升力差分、左右提升器力差值、左右提升器力差值差分衍生特征,然后对衍生特征进行众数、最大值、最小值、均值、方差、中位数、极差的计算。发动机功率、左提升器实际提升力差分、右提升器实际提升力差分、左右提升器力差值、左右提升器力差值差的具体的计算公式如下:
①发动机功率:
发动机功率=(发动机转速*参考扭矩*发动机扭矩实际百分比(%))/9550。
②左提升器实际提升力差分:
Δy[n]=y[n]-y[n-1]
其中,y[n]代表当前左提升器实际提升力值,y[n-1]代表前一刻左提升器实际提升力值。
③右提升器实际提升力差分,根据如②公式所述的一阶差分计算特征,其中y[n]代表当前右提升器实际提升力值,y[n-1]代表前一刻右提升器实际提升力值。
④左右提升器力差值:
左右提升器力差值=左提升器力实际提升力(%)-右提升器实际提升力(%)。
⑤左右提升器力差值差分,根据如②公式所述的一阶差分计算特征,其中y[n]代表当前左右提升器力差值,y[n-1]代表前一刻左右提升器力差值。
24)剔除取力器开启时长小于预设开启时长阈值的数据和取力器关闭时长小于预设关闭时长阈值的数据。例如剔除PTO开启和PTO关闭总时长均<40s的数据。因为这样的数据其特征分布信息量不具备客观性,如果使用这样的数据进行模型训练,会导致模型预测偏差较大。
25)剔除非作业工况下的运输工况数据。为了增强模型的鲁棒性,需要对运输工况使用特征规则判别法进行识别。上述的运输工况包含道路运输工况和作业运输工况。所述道路运输工况即迁移工况,该工况不属于实际作业工况,多数情况下代表着拖拉机从一块田地到另一块田地的移动以及拖拉机掉头转弯的移动。所述作业运输工况即作业工况中所包含的迁移工况,由于车辆挂载农具运输时的数据特征分布与平常的道路运输工况不一致,所以称这样的工况为作业运输工况。在本步骤中,可以采用特征规则判别法来识别运输工况,即经过不同特征的阈值组合构成识别条件。例如:发动机功率均值<100kW、左/右提升器实际提升力方差<0.15、左/右提升器实际提升力极差<1.5的数据被判定为道路运输工况;发动机功率均值<100kW、左/右提升器实际提升力方差<1并且未被判定为道路运输工况的数据被判定为作业运输工况。
26)剔除作业时长过短的数据。剔除某辆车一天内作业总时长小于30分钟的作业工况数据,小于30分钟的作业工况数据不作判断。作业时间过短的数据其分布信息量太少从而可能存在偏差,并且对这样的数据进行识别也没有太大价值,为了尽量减小模型误判的风险,不对这样的数据进行训练以及预测。
通过上述过程,可以将原本的车联网历史数据处理为拖拉机状态特征。
S102、训练拖拉机工况识别模型。
在一种可实现的实施方式中,采用了级联的思路来构建拖拉机工况识别模型。请参考图2,该识别模型的框架包括两层,第一层为第一识别模型,第二层包括第二识别模型和第三识别模型。第一识别模型是一个多分类模型,具体可以识别平地框一偏置重耙(即将平地框和偏置重耙作为一类)、犁地-联合整地(即将犁地和联合整地作为一类)、耙地、平地、打捆、起垄和播种耙地工况。第二识别模型是一个二分类模型,具体用于识别偏置重耙工况和平地框工况。第三识别模型也是一个二分类模型,具体用于识别犁地工况和联合整地工况。
在训练时,可以采用以下方式:
首先,将偏置重耙工况训练样本和平地框工况训练样本归为第一大类,将犁地工况训练样本和联合整地工况训练样本归为第二大类,与其余工况的训练样本一起构建为第一训练样本集;
在第一训练样本集上训练得到第一识别模型;
构建偏置重耙工况差异性样本、平地框工况差异性样本、犁地工况差异性样本和联合整地工况差异性样本;
将第一识别模型针对第一大类训练样本的预测结果分别与偏置重耙工况差异样本和平地框工况差异性样本进行特征融合,基于融合后的训练样本构建第二训练样本集;
将第一识别模型针对第二大类训练样本的预测结果分别与犁地工况差异性样本和联合整地工况差异性样本进行特征融合,基于融合后的训练样本构建第三训练样本集;
在第二训练样本集上训练一个二分类模型,得到第二识别模型;
在第三训练样本集上训练一个二分类模型,得到第三识别模型;
将第一识别模型、第二识别模型和第三识别模型,作为拖拉机工况识别模型。
在上述的训练方法中,还可以采用样本权重平衡处理法对数据进行权重平衡。样本权重平衡处理法,即在某些情况下,训练集中的不同类别样本数量可能存在较大的差异,这会导致训练模型时对于数量较少的类别的学习效果不佳。通过样本权重平衡技术,可以调整不同类别样本的权重,使得数量较少的类别在训练过程中得到更多的关注和重视。类别权重平衡法计算公式如下:
其中ωx为类别x的类别权重,N为样本总数量,C为类别总数量,Nx表示类别x在样本中的数量,x的取值为类别a,类别b,类别c等等,这个计算方式保证了每个类别的样本权重与其在样本中的数量成反比。如果某个类别的数量较少,其权重会被增大;如果某个类别的数量较多,其权重会被减小。通过计算出的类别权重平衡,对应到每个类别中的相应样本即为样本权重平衡。
在上述的训练方法中,可以采用XGBoost框架作为机器学习模型,在级联思想中,将偏置重耙、平地框工况归为一类(偏置重耙_平地框类),通过第一层机器学习多分类模型识别作业工况,再对预测出的偏置重耙_平地框类进行第二层机器学习二分类模型识别偏置重耙、平地框工况,第二层二分类模型的预测结果应建立在第一层多分类模型对于偏置重耙_平地框类的预测效果较好的条件上,即若第一层多分类模型对于偏置重耙_平地框类的误判率(偏置重耙_平地框类的召回率)小于30%,则该第二层模型成立。随后第一层模型将特征工程阶段中的所有重要特征及衍生特征(左/右提升器相关特征及左/右提升器衍生特征、发动机转速相关特征、预测出的偏置重耙_平地框类数据作为输入)作为输入,将偏置重耙工况和平地框工况作为输出。同样的,在级联思想中,将犁地、联合整地工况归为一类(犁地_联合整地类),通过第一层机器学习多分类模型识别作业工况,再对预测出的犁地_联合整地类进行第二层机器学习二分类模型识别犁地_联合整地工况,第二层二分类模型的预测结果应建立在第一层多分类模型对于犁地_联合整地类的预测效果较好的条件上,即若第一层多分类模型对于犁地_联合整地类的误判率(犁地_联合整地类的召回率)小于30%,则该第二层模型成立。随后第一层模型将特征工程阶段中的所有重要特征及衍生特征(左/右提升器相关特征及左/右提升器衍生特征相关特征、预测出的犁地_联合整地类数据)作为输入,将犁地工况和联合整地工况作为输出。
在上述的训练方法中,将第一识别模型针对第一大类训练样本的预测结果分别与偏置重耙工况差异样本和平地框工况差异性样本进行特征融合,具体可以采用以下方式:将第一识别模型针对第一大类训练样本的预测结果作为一维特征,补充到偏置重耙工况差异样本和平地框工况差异性样本中去。同样的,可以将第一识别模型针对第二大类训练样本的预测结果作为一维特征,补充到犁地工况差异性样本和联合整地工况差异性样本中去,以实现将第一识别模型针对第二大类训练样本的预测结果分别与犁地工况差异性样本和联合整地工况差异性样本进行特征融合。
与上述检测方法相对应地,本实施例还提供了一种拖拉机工况识别模型的训练装置,其结构如图3所示,包括:
第一数据获取模块,用于获取训练样本,所述训练样本包括不同工况下的拖拉机状态特征,所述工况包括耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地;
第一处理模块,用于将偏置重耙工况训练样本和平地框工况训练样本归为第一大类,将犁地工况训练样本和联合整地工况训练样本归为第二大类,与其余工况的训练样本一起构建为第一训练样本集;以及,在所述第一训练样本集上训练得到第一识别模型;
第二数据获取模块,用于获取偏置重耙工况差异性样本、平地框工况差异性样本、犁地工况差异性样本和联合整地工况差异性样本;
第二处理模块,用于将第一识别模型针对第一大类训练样本的预测结果分别与偏置重耙工况差异样本和平地框工况差异性样本进行特征融合,基于融合后的训练样本构建第二训练样本集;将第一识别模型针对第二大类训练样本的预测结果分别与犁地工况差异性样本和联合整地工况差异性样本进行特征融合,基于融合后的训练样本构建第三训练样本集;在第二训练样本集上训练一个二分类模型,得到第二识别模型;在第三训练样本集上训练一个二分类模型,得到第三识别模型;
第三处理模块,用于基于第一识别模型、第二识别模型和第三识别模型,确定拖拉机工况识别模型。
请参考图4,本实施例还提供了一种拖拉机工况识别方法,包括步骤:
S400、获取目标拖拉机作业工况下的工作状态数据。
S402、将工作状态数据输入拖拉机工况识别模型,得到目标拖拉机的工况。
上述的拖拉机工况识别模型是采用上述的拖拉机工况识别模型的训练方法预先训练得到的。
在将工作状态数据输入拖拉机工况识别模型之前,还需要将工作状态数据处理为拖拉机工况识别模型能够处理的数据格式。
在将上述的拖拉机工况识别模型部署到具体应用场景中时,针对未纳入训练集的数据,或线上的新数据,可以采用上述的特征构建方法,构建得到需要输入模型的特征,然后采用上述的模型训练方法来对拖拉机工况识别模型进行微调。
与上述的识别方法相对应地,本实施例还提供了一种拖拉机工况识别装置,请参考图5,该识别装置包括:
第三数据获取模块,用于获取目标拖拉机作业工况下的工作状态数据;
识别模块,用于将工作状态数据输入拖拉机工况识别模型,得到目标拖拉机的工况;拖拉机工况识别模型是采用上述的拖拉机工况识别模型的训练方法预先训练得到的。
本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的拖拉机工况识别模型的训练方法,或者,实现所述的拖拉机工况识别方法。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
与上述方法对应的,本实施例还提供了一种电子设备,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行所述的拖拉机工况识别模型的训练方法,或者,实现所述的拖拉机工况识别方法。
在硬件层面,该电子设备包括处理器、计算机可读存储介质、内存、数据接口、网络接口,当然还可能包括其他业务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现,比如由处理器从计算机可读存储介质中读取对应的计算机程序到内存中然后运行。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件或者软硬件结合的方式等等,也就是说以上处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种拖拉机工况识别模型的训练方法,其特征在于,包括步骤:
构建训练样本,所述训练样本包括不同工况下的拖拉机状态特征,所述工况包括耙地、平地、打捆、犁地、联合整地、平地框、偏置重耙、起垄和播种耙地;
将偏置重耙工况训练样本和平地框工况训练样本归为第一大类,将犁地工况训练样本和联合整地工况训练样本归为第二大类,与其余工况的训练样本一起构建为第一训练样本集;
在所述第一训练样本集上训练得到第一识别模型;
构建偏置重耙工况差异性样本、平地框工况差异性样本、犁地工况差异性样本和联合整地工况差异性样本;
将所述第一识别模型针对第一大类训练样本的预测结果分别与所述偏置重耙工况差异样本和所述平地框工况差异性样本进行特征融合,基于融合后的训练样本构建第二训练样本集;
将所述第一识别模型针对第二大类训练样本的预测结果分别与所述犁地工况差异性样本和所述联合整地工况差异性样本进行特征融合,基于融合后的训练样本构建第三训练样本集;
在所述第二训练样本集上训练一个二分类模型,得到第二识别模型;
在所述第三训练样本集上训练一个二分类模型,得到第三识别模型;
基于所述第一识别模型、所述第二识别模型和所述第三识别模型,确定所述拖拉机工况识别模型。
2.根据权利要求1所述的方法,其特征在于,所述训练样本的构建方法具体包括:
获取不同工况下的拖拉机历史状态数据,包括:车速、发动机冷却液温度、取力器状态、左侧提升器实际提升力、右侧提升器实际提升力、发动机转速、发动机实际扭矩百分比、发动机燃油消耗率;
对所述拖拉机历史状态数据进行数据清洗,以剔除不符合预设条件的异常数据;
将数据清洗后的拖拉机历史状态数据进行数据聚合,以将所述拖拉机历史状态数据映射到统一粒度空间,以得到所述拖拉机状态特征。
3.根据权利要求2所述的方法,其特征在于,对所述拖拉机历史状态数据进行数据清洗,具体包括:
从所述拖拉机历史状态数据中剔除满足预设异常条件的数据。
4.根据权利要求2所述的方法,其特征在于,将数据清洗后的拖拉机历史状态数据进行数据聚合,具体包括:
将数据清洗后的所述拖拉机历史状态数据从秒级聚合为分钟级;
针对分钟级的拖拉机历史状态数据,分别对取力器开启和关闭状态下的所述拖拉机历史状态数据计算众数、最大值、最小值、均值、方差、中位数和极差,以作为补充特征;
将所述补充特征加入相应的分钟级的拖拉机历史状态数据中,得到所述拖拉机状态特征。
5.根据权利要求2所述的方法,其特征在于,在对数据清洗后的拖拉机历史状态数据进行数据聚合后,还包括:
针对数据聚合后的所述拖拉机历史状态数据,从所述拖拉机历史状态数据中剔除取力器开启时长小于预设开启时长阈值的数据和取力器关闭时长小于预设关闭时长阈值的数据。
6.根据权利要求2所述的方法,其特征在于,在对数据清洗后的拖拉机历史状态数据进行数据聚合后,还包括:
从数据聚合后的所述拖拉机历史状态数据中识别出非作业工况下的运输工况数据;
从数据聚合后的所述拖拉机历史状态数据中提出所述运输工况数据。
7.如权利要求6所述的方法,其特征在于,从数据聚合后的所述拖拉机历史状态数据中识别出非作业工况下的运输工况数据,具体包括:
通过预设的特征匹配规则对数据聚合后的所述拖拉机历史状态数据进行逐一匹配,将成功匹配的数据作为所述运输工况数据。
8.根据权利要求2所述的方法,其特征在于,在对数据清洗后的拖拉机历史状态数据进行数据聚合后,还包括:
从数据聚合后的所述拖拉机历史状态数据中提出作业总时长小于预设的作业时长阈值的数据。
9.根据权利要求1所述的方法,其特征在于,在构建所述训练样本时,还包括基于现有的拖拉机状态特征进行特征扩展,包括在现有的所述拖拉机状态特征中加入以下至少一种衍生特征,具体包括:
发动机功率、左提升器实际提升力差分值、右提升器实际提升力差分值、左右提升器力差值、左右提升器力差值的差分值。
10.一种拖拉机工况识别方法,其特征在于,包括:
获取目标拖拉机作业工况下的工作状态数据;
将所述工作状态数据输入拖拉机工况识别模型,得到所述目标拖拉机的工况;所述拖拉机工况识别模型是采用如权利要求1至9任一项所述的方法预先训练得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410227636.3A CN117807443B (zh) | 2024-02-29 | 2024-02-29 | 拖拉机工况识别模型的训练方法及拖拉机工况识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410227636.3A CN117807443B (zh) | 2024-02-29 | 2024-02-29 | 拖拉机工况识别模型的训练方法及拖拉机工况识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117807443A CN117807443A (zh) | 2024-04-02 |
CN117807443B true CN117807443B (zh) | 2024-05-14 |
Family
ID=90430549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410227636.3A Active CN117807443B (zh) | 2024-02-29 | 2024-02-29 | 拖拉机工况识别模型的训练方法及拖拉机工况识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117807443B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784906A (zh) * | 2021-01-26 | 2021-05-11 | 中国科学院半导体研究所 | 基于多条件时间序列的农机监测数据清洗方法与装置 |
CN113157728A (zh) * | 2021-02-23 | 2021-07-23 | 北京科技大学 | 一种地下柴油铲运机循环工况的识别方法 |
CN113554055A (zh) * | 2021-06-11 | 2021-10-26 | 杭州玖欣物联科技有限公司 | 一种基于聚类算法的加工工况识别方法 |
CN114004263A (zh) * | 2021-12-29 | 2022-02-01 | 四川大学 | 一种特征融合转换的大型设备工况诊断预测方法 |
CN114756990A (zh) * | 2022-04-12 | 2022-07-15 | 中科云谷科技有限公司 | 用于确定挖掘机工况类型的方法、装置、控制器及挖掘机 |
CN114925766A (zh) * | 2022-05-26 | 2022-08-19 | 江苏海平面数据科技有限公司 | 一种基于车联网大数据的柴油发动机机油更换识别方法 |
CN115130511A (zh) * | 2022-06-30 | 2022-09-30 | 广州市天翎网络科技有限公司 | 一种工况识别方法、设备及计算机可读存储介质 |
CN115356133A (zh) * | 2022-08-23 | 2022-11-18 | 华东交通大学 | 一种转向架运行工况在线监测、实时分类与识别算法 |
CN116383641A (zh) * | 2023-02-27 | 2023-07-04 | 中联重科股份有限公司 | 土方机械工况识别方法、装置、存储介质及处理器 |
WO2023151227A1 (zh) * | 2022-02-14 | 2023-08-17 | 中国第一汽车股份有限公司 | 确定车辆工况的方法、装置、存储介质和处理器 |
CN116823298A (zh) * | 2023-06-30 | 2023-09-29 | 徐州徐工挖掘机械有限公司 | 一种挖掘机作业工况识别与计时方法 |
CN116834678A (zh) * | 2023-05-26 | 2023-10-03 | 中联重科股份有限公司 | 工程机械工况识别方法、装置、存储介质及处理器 |
CN116861237A (zh) * | 2023-06-30 | 2023-10-10 | 中科云谷科技有限公司 | 用于挖掘机作业状态的识别方法、装置、挖掘机及处理器 |
CN116894213A (zh) * | 2023-06-15 | 2023-10-17 | 中科云谷科技有限公司 | 用于挖掘机工况识别的方法及挖掘机工况识别装置 |
CN117370921A (zh) * | 2023-09-18 | 2024-01-09 | 中国环境科学研究院 | 多源异构数据融合校验分析方法、设备及存储介质 |
CN117496436A (zh) * | 2024-01-02 | 2024-02-02 | 中南林业科技大学 | 一种基于深浅层特征融合的浮选过程工况识别方法 |
CN117588195A (zh) * | 2023-12-14 | 2024-02-23 | 重庆科技学院 | 一种工况识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5872597B2 (ja) * | 2014-01-16 | 2016-03-01 | 株式会社富士通エフサス | 管理装置および管理方法 |
US11972551B2 (en) * | 2020-12-18 | 2024-04-30 | Blue River Technology Inc. | Machine-learned tillage shank malfunction in an autonomous farming vehicle |
-
2024
- 2024-02-29 CN CN202410227636.3A patent/CN117807443B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784906A (zh) * | 2021-01-26 | 2021-05-11 | 中国科学院半导体研究所 | 基于多条件时间序列的农机监测数据清洗方法与装置 |
CN113157728A (zh) * | 2021-02-23 | 2021-07-23 | 北京科技大学 | 一种地下柴油铲运机循环工况的识别方法 |
CN113554055A (zh) * | 2021-06-11 | 2021-10-26 | 杭州玖欣物联科技有限公司 | 一种基于聚类算法的加工工况识别方法 |
CN114004263A (zh) * | 2021-12-29 | 2022-02-01 | 四川大学 | 一种特征融合转换的大型设备工况诊断预测方法 |
WO2023151227A1 (zh) * | 2022-02-14 | 2023-08-17 | 中国第一汽车股份有限公司 | 确定车辆工况的方法、装置、存储介质和处理器 |
CN114756990A (zh) * | 2022-04-12 | 2022-07-15 | 中科云谷科技有限公司 | 用于确定挖掘机工况类型的方法、装置、控制器及挖掘机 |
CN114925766A (zh) * | 2022-05-26 | 2022-08-19 | 江苏海平面数据科技有限公司 | 一种基于车联网大数据的柴油发动机机油更换识别方法 |
CN115130511A (zh) * | 2022-06-30 | 2022-09-30 | 广州市天翎网络科技有限公司 | 一种工况识别方法、设备及计算机可读存储介质 |
CN115356133A (zh) * | 2022-08-23 | 2022-11-18 | 华东交通大学 | 一种转向架运行工况在线监测、实时分类与识别算法 |
CN116383641A (zh) * | 2023-02-27 | 2023-07-04 | 中联重科股份有限公司 | 土方机械工况识别方法、装置、存储介质及处理器 |
CN116834678A (zh) * | 2023-05-26 | 2023-10-03 | 中联重科股份有限公司 | 工程机械工况识别方法、装置、存储介质及处理器 |
CN116894213A (zh) * | 2023-06-15 | 2023-10-17 | 中科云谷科技有限公司 | 用于挖掘机工况识别的方法及挖掘机工况识别装置 |
CN116823298A (zh) * | 2023-06-30 | 2023-09-29 | 徐州徐工挖掘机械有限公司 | 一种挖掘机作业工况识别与计时方法 |
CN116861237A (zh) * | 2023-06-30 | 2023-10-10 | 中科云谷科技有限公司 | 用于挖掘机作业状态的识别方法、装置、挖掘机及处理器 |
CN117370921A (zh) * | 2023-09-18 | 2024-01-09 | 中国环境科学研究院 | 多源异构数据融合校验分析方法、设备及存储介质 |
CN117588195A (zh) * | 2023-12-14 | 2024-02-23 | 重庆科技学院 | 一种工况识别方法 |
CN117496436A (zh) * | 2024-01-02 | 2024-02-02 | 中南林业科技大学 | 一种基于深浅层特征融合的浮选过程工况识别方法 |
Non-Patent Citations (1)
Title |
---|
基于多源信息融合的行驶工况识别及其在整车转矩分配中的应用;张袅娜等;机械工程学报;20171220;第53卷(第24期);第135-143页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117807443A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Leroux et al. | A general method to filter out defective spatial observations from yield mapping datasets | |
CN111452619A (zh) | 电动车辆在线能耗预测方法及系统 | |
CN110602105B (zh) | 一种基于k-means的大规模并行化网络入侵检测方法 | |
CN108958215A (zh) | 一种基于数据挖掘的工程车辆故障预测系统及其预测方法 | |
CN114076631A (zh) | 超载车辆识别方法、系统及设备 | |
CN110084534A (zh) | 一种基于驾驶行为画像的驾驶风险因子量化方法 | |
Taghavi et al. | Identifying truck stops from a large stream of gps data via a hidden markov chain model | |
CN116758762A (zh) | 基于大数据的控制方法 | |
CN117807443B (zh) | 拖拉机工况识别模型的训练方法及拖拉机工况识别方法 | |
CN116383739A (zh) | 基于域自适应的多模态数据融合的智能故障诊断方法 | |
CN114925766A (zh) | 一种基于车联网大数据的柴油发动机机油更换识别方法 | |
CN112785055B (zh) | 车辆加油日期预测方法及设备 | |
CN117063714A (zh) | 一种基于点云图像联合的辣椒收获机运动参数控制方法 | |
CN115271565A (zh) | 基于dea的高速公路路面养护措施评价方法、装置及设备 | |
CN114750765B (zh) | 一种车辆的路谱数据确定方法、装置、设备、介质及产品 | |
CN103678716B (zh) | 一种基于格式数据集的分布式数据存储与计算方法 | |
KR20230160462A (ko) | e-모빌리티 배터리 가치 판단 결과를 기반으로 중고 배터리 보증 보험 상품을 제공하는 방법 및 이러한 방법을 수행하는 장치 | |
KR20230157115A (ko) | e-모빌리티 배터리 가치 판단 결과를 기반으로 금융 서비스를 제공하기 위한 배터리 포트폴리오 설정 방법 및 이러한 방법을 수행하는 장치 | |
CN112509326B (zh) | 一种基于广义极值t分布偏差的非周期拥堵检测方法 | |
CN113064940A (zh) | 一种基于大数据的高速公路智能实时收费分析系统 | |
CN118506474B (zh) | 一种基于物联网的新能源汽车数据实时采集方法 | |
CN117315943B (zh) | 一种超限运输违法监测分析与预警方法及系统 | |
CN114637793B (zh) | 一种基于大数据分析的装备故障频发区域定位方法 | |
CN110930007B (zh) | 一种农机田间作业状态确定方法和装置 | |
CN118349877B (zh) | 基于机器学习的车联网数据分析方法及其相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |