CN109506942B - 一种大数据分析发动机冷试检测数据与工位相关性的方法 - Google Patents

一种大数据分析发动机冷试检测数据与工位相关性的方法 Download PDF

Info

Publication number
CN109506942B
CN109506942B CN201811474787.XA CN201811474787A CN109506942B CN 109506942 B CN109506942 B CN 109506942B CN 201811474787 A CN201811474787 A CN 201811474787A CN 109506942 B CN109506942 B CN 109506942B
Authority
CN
China
Prior art keywords
detection data
station
data
cold test
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811474787.XA
Other languages
English (en)
Other versions
CN109506942A (zh
Inventor
刘礼
杨宁
王姝
王丹妮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201811474787.XA priority Critical patent/CN109506942B/zh
Publication of CN109506942A publication Critical patent/CN109506942A/zh
Application granted granted Critical
Publication of CN109506942B publication Critical patent/CN109506942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M15/00Testing of engines
    • G01M15/02Details or accessories of testing apparatus

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)
  • Testing Of Engines (AREA)

Abstract

本发明公开了一种大数据分析发动机冷试检测数据与工位相关性的方法,步骤为:1)获取工位检测数据和冷试检测数据。2)补全工位检测数据集和冷试检测数据集的缺失数据。3)对补全后的工位检测数据集进行预处理,得到工位检测数据矩阵M。4)从工位检测数据矩阵M中提取数据样本集X1,...,Xη。5)对数据样本集X1,...,Xη进行稀疏处理。6)计算数据样本集X1,...,Xη和冷试检测数据集B1,...,Bβ的相关性。7)根据数据样本集X1,...,Xη和冷试检测数据集B1,...,Bβ的相关性,分析得到发动机冷试检测数据和发动机工位的相关性。本发明可以提高发动机出厂时性能的一致性,并节约生产成本。

Description

一种大数据分析发动机冷试检测数据与工位相关性的方法
技术领域
本发明涉及发动机数据处理领域,具体是一种大数据分析发动机冷试检测数据与工位相关性的方法。
背景技术
目前,发动机冷试技术被各大汽车厂商引入到发动机的装配检测中。
但由于大部分公司生产线存在出厂性能不稳定、发动机性能不可控以及工艺经验不清晰的问题,工程师无法对理想结果做出解释。
随着汽车工业的快速发展,为了满足更高的性能需求,发动机系统亦日趋复杂化,在生产过程中对发动机进行快速全面的诊断越来越受到人们的重视。
因此,迫切的需要提高发动机出厂时性能的一致性,并解决如何降低生产成本的问题。
发明内容
本发明的目的是解决现有技术中存在的问题。
为实现本发明目的而采用的技术方案是这样的,一种大数据分析发动机冷试检测数据与工位相关性的方法,包括以下步骤:
1)获取同一型号发动机α个工位的工位检测数据和β条冷试检测数据。
所述同一型号的发动机α个工位的工位检测数据集分别记为A1、A2、...、Aα。所述同一型号发动机的β条冷试检测数据集分别记为B1、B2、...、Bβ
2)补全工位检测数据集和冷试检测数据集的缺失数据,步骤如下:
2.1)删除数据集A1,A2,...,Aα和数据集B1,B2,...,Bβ中空项大于70%的列或行。
2.2)利用均值插值法补齐数据集A1,A2,...,Aα和数据集B1,B2,...,Bβ中空项小于70%的列或行。
3)对补全后的工位检测数据集进行预处理,得到工位检测数据矩阵M,步骤如下:
3.1)将补全后的工位检测数据集按照工位号和时间的顺序排列数据。排列的优先序列为时间。
3.2)按照时间排序后,保留最后发生的工位检测数据,删除其之前的同项工位检测数据,得到初步处理后的数据。
3.3)将得到的初步处理后的数据列为数据矩阵M。
Figure GDA0002527170810000021
式中,m为发动机个数,n为工位检测数据和冷试检测数据的个数。
4)从工位检测数据矩阵M中随机提取数据样本集X1,...,Xη。α、β和η均为正整数。
5)对数据样本集X1,...,Xη进行稀疏处理,步骤如下:
5.1)计算参数θ,即:
Figure GDA0002527170810000022
式中,||θ||1为向量θ=(θ1,...,θb)T的L1范数,是向量θ的各元素绝对值和。n为工位检测数据和冷试检测数据的个数。xi为模型输入的工位检测数据。yi为经过学习后的输出集。fθ(xi)为输入函数。
范数||θ||1如下所示:
Figure GDA0002527170810000023
式中,b为向量集θ中的个数。θj为向量集θ中的任意元素。
5.2)计算参数θ的训练平方误差,即:
Figure GDA0002527170810000024
5.3)根据训练平方误差JLS(θ)和参数θ建立稀疏处理模型。
5.4)将数据集A1,A2,...,Aα中2/3的数据变为0。
6)计算数据样本集X1,...,Xη和冷试检测数据集B1,B2,...,Bβ的相关性,步骤如下:
6.1)初步判断工位检测数据和冷试检测数据是否相关,步骤如下:
6.1.1)计算工位检测数据和冷试检测数据偏差的平方,即
Figure GDA0002527170810000031
式中,x为数据样本集X1,...,Xη中的元素。
Figure GDA0002527170810000032
为数据集B1,B2,...,Bβ中的元素。
6.1.2)根据偏差的平方,计算得到两组偏差SX和SB
6.1.3)计算差异参数F,即:
Figure GDA0002527170810000033
式中,S为max(SX,SB)。S为min(SX,SB)。
差异参数F表示工位检测数据和冷试检测数据的差异性。
6.1.4)根据差异参数F,判断工位检测数据和冷试检测数据是否相关,若是,则转入步骤6.2。
若否,则输出工位检测数据和冷试检测数据不相关的结果。
6.2)检验工位检测数据和冷试检测数据的偏离程度χ2,即:
Figure GDA0002527170810000034
式中,j=1,2,3,...,k。k表示数据样本集X中工位的总数。G为任意工位检测数据的观察频数。E为基于计算出的期望频数。P为概率。
偏离程度χ2和工位检测数据和冷试检测数据的差异性正相关。
6.3)利用Wilks's lambda值分析工位检测数据的组间差异,步骤如下:
6.3.1)设X为一个n*p的矩阵,且每行均满足正态分布,即每行的均值为0。矩阵
Figure GDA0002527170810000035
V为X的协方差矩阵。l和d均表示维度。
6.3.2)设定散布矩阵
Figure GDA0002527170810000036
矩阵S中每个元素是各个向量元素之间的协方差,即S~Wp(n,V)
6.3.3)确定发动机工位检测数据集A和冷试检测数据集B的分布,即:
Figure GDA0002527170810000037
式中,g≥p。p为维度。g为自由度的错误程度。h为自由度。
6.3.4)计算组内差异参数λ,即:
Figure GDA0002527170810000041
6.4)结合步骤1至步骤3,建立相关性判断模型。
6.5)计算相关性判断模型的决定系数R,即:
R2=1-SSE/SST。 (10)
式中,SSE为冷试检测数据的总平方和。SST是冷试检测数据残差平方和。
6.6)计算相关性判断模型的错误方差Error,即:
Error=Bias + Variance。 (11)
式中,Bias为工位检测数据和冷试检测数据的误差。Variance为模型每一次输出结果与模型输出期望之间的误差。
6.7)根据差异参数F、偏离程度χ2和相关性判断模型判断工位检测数据和冷试检测数据的相关程度。
7)根据数据样本集X1,...,Xη和冷试检测数据集B1、B2、...、Bβ的相关性,分析得到发动机冷试检测数据和发动机工位的相关性。
本发明的技术效果是毋庸置疑的。本发明将大数据分析算法及模型应用于生产现场,通过对大数据分析发动机工位检测数据与冷试检测数据之间的关系,得出影响冷试检测数据的具体工位,对影响冷试检测数据较大的工位的工艺参数进行更为严格地控制,从而提高发动机出厂时性能的一致性,同时,对影响冷试检测数据较小的工位设备降低档次,可以节约生产成本。
附图说明
图1为方法流程图;
图2为满足||θ||1≤R的θ取值示意图。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参见图1至图2,一种大数据分析发动机冷试检测数据与工位相关性的方法,包括以下步骤:
1)获取同一型号发动机37个工位的工位检测数据和17条冷试检测数据。
所述同一型号的发动机37个工位的工位检测数据集分别记为A1、A2、...、A37
所述同一型号发动机的17条冷试检测数据集分别记为B1、B2、...、B17
37个工位具体名称如表1所示。
冷试检测数据如表2所示。
每个工位完成以后均有一组工位检测数据,工位检测数据是对该工位完成后的检测数据,每个工位的检测项均具有一千条左右,每个工位的检测项数据也具有一千条左右,每个工位的检测项也不相同,数据可以直接通过传感器检测获得,检测获得的数据能够直接导出。
发动机的工位检测数据和冷试检测数据均通过传感器取得。
表1 发动机加工工位对应工艺
A<sub>1</sub> 拧紧主油道堵塞,拆卸下缸体
A<sub>2</sub> 安装主轴上瓦
A<sub>3</sub> 安装张紧器滤网并拧紧油道堵塞
A<sub>4</sub> 安装拧紧机油喷嘴
A<sub>5</sub> 安装并润滑曲轴、止推片
A<sub>6</sub> 装主轴下瓦并安装下缸体并插入1颗螺栓,插入适配板定位销
A<sub>7</sub> 安装主轴下瓦
A<sub>8</sub> 下缸体螺栓拧紧
A<sub>9</sub> 拧紧连杆盖
A<sub>10</sub> 涂胶并拧紧R3/8油堵,安装链轮,安装机油泵定位销
A<sub>11</sub> 安装机油泵、链条,安装张紧器
A<sub>12</sub> 涂胶并拧紧R3/8油道堵塞2个
A<sub>13</sub> 拧紧缸盖螺栓
A<sub>14</sub> 拧紧火花塞
A<sub>15</sub> 安装VVT驱动轮
A<sub>16</sub> 安装润滑凸轮轴,安装正时链轮
A<sub>17</sub> 拧紧凸轮轴盖,测量凸轮轴间隙
A<sub>18</sub> 拧紧动定导轨,安装张紧器
A<sub>19</sub> 拧紧机油阀和张紧器
A<sub>20</sub> 拿取活塞,装衬环
A<sub>21</sub> 安装两瓜片
A<sub>22</sub> 装刮环和气环
A<sub>23</sub> 选配安装连杆盖瓦,活塞销卡簧检测
A<sub>24</sub> 装连杆瓦,连杆盖螺栓
A<sub>25</sub> 拿下凸轮轴缸盖,拧紧限油堵塞,R1/8堵塞
A<sub>26</sub> 放置油封座圏并检测
A<sub>27</sub> 半自动压装进排气门油封
A<sub>28</sub> 安装排气门
A<sub>29</sub> 安装气门弹簧
A<sub>30</sub> 泄漏测试
A<sub>31</sub> R1/4堵塞涂胶拧紧
A<sub>32</sub> 润滑挺柱孔,安装挺柱,带上凸轮轴盖
A<sub>33</sub> 拧紧气缸盖罩螺栓
A<sub>34</sub> 安装拧紧后挂钩,预带两颗调温器螺栓及安装调温器
A<sub>35</sub> 预带两颗调温器座螺栓并拧紧4颗调温器座螺栓,复拧第一颗螺栓
A<sub>36</sub> 安装拧紧调温器盖并复拧第一颗螺栓
A<sub>37</sub> 安装拧紧2个凸轮轴位置传感器
在表1的数据中,每个A代表一个工位数据,其中每条工位数据包含成千上万条类似于螺栓等二级标签,每条二级标签下包含数量不等的三级标签的数据,在进行预处理后所保留的数据均为项目中所使用的数据。
表2 冷试检测数据对应名称
B<sub>1</sub> 1缸排气压力最大值
B<sub>2</sub> 2缸排气压力最大值
B<sub>3</sub> 3缸排气压力最大值
B<sub>4</sub> 4缸排气压力最大值
B<sub>5</sub> 1缸扭矩最大值
B<sub>6</sub> 2缸扭矩最大值
B<sub>7</sub> 3缸扭矩最大值
B<sub>8</sub> 4缸扭矩最大值
B<sub>9</sub> 1缸进气真空度最小值
B<sub>10</sub> 低速油压最大值
B<sub>11</sub> 1缸进气真空度最小值位置
B<sub>12</sub> 1缸排气门开启前泄露值
B<sub>13</sub> 1缸排气压力最大值位置
B<sub>14</sub> 1缸排气门开启位置
B<sub>15</sub> 1缸排气门开启时间
B<sub>16</sub> 高速缸盖振动峰值
B<sub>17</sub> 高速排气侧振动峰值
在如表2所示的冷试检测数据中,每个一级标签下包含上千条数据。
2)补全工位检测数据集和冷试检测数据集的缺失数据。
补全工位检测数据集和冷试检测数据集的缺失数据的步骤如下:
2.1)删除数据集A1,...,A37和数据集B1,...,B17中空项大于70%的列或行。
2.2)利用均值插值法补齐数据集A1,...,A37和数据集B1,...,B17中空项小于70%的列或行。
3)对补全后的工位检测数据集进行预处理,得到工位检测数据矩阵M。
对补全后的工位检测数据集进行预处理的步骤如下:
3.1)将补全后的工位检测数据集按照工位号和时间的顺序排列数据。排列的优先序列为时间。
3.2)按照时间排序后,保留最后发生的工位检测数据,删除其之前的同项工位检测数据,得到初步处理后的数据。
3.3)将得到的初步处理后的数据列为数据矩阵M。
Figure GDA0002527170810000081
式中,m为发动机个数,n为工位检测数据和冷试检测数据的个数。
4)从工位检测数据矩阵M中提取数据样本集X1,...,X7
数据样本集X1的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A8、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A26、工位检测数据集A27、工位检测数据集A29、工位检测数据集A30、工位检测数据集A32、工位检测数据集A33、工位检测数据集A34和工位检测数据集A35的数据。
数据样本集X2的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A8、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A21、工位检测数据集A24、工位检测数据集A25、工位检测数据集A26、工位检测数据集A27、工位检测数据集A29、工位检测数据集A30、工位检测数据集A31、工位检测数据集A32、工位检测数据集A33、工位检测数据集A34和工位检测数据集A35的数据。
数据样本集X3的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A8、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A21、工位检测数据集A27、工位检测数据集A29、工位检测数据集A30、工位检测数据集A32、工位检测数据集A33、工位检测数据集A34和工位检测数据集A35的数据。
数据样本集X4的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A8、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A21、工位检测数据集A22、工位检测数据集A23、工位检测数据集A26、工位检测数据集A27、工位检测数据集A28、工位检测数据集A31、工位检测数据集A33、工位检测数据集A34和工位检测数据集A36的数据。
数据样本集X5的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A8、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A27、工位检测数据集A29、工位检测数据集A31、工位检测数据集A32、工位检测数据集A33、工位检测数据集A34的数据。
数据样本集X6的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A4、工位检测数据集A5、工位检测数据集A6、工位检测数据集A7、工位检测数据集A8、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A25、工位检测数据集A27、工位检测数据集A29、工位检测数据集A33、工位检测数据集A34和工位检测数据集A37的数据。
数据样本集X7的元素为工位检测数据集A1、工位检测数据集A2、工位检测数据集A3、工位检测数据集A4、工位检测数据集A8、工位检测数据集A9、工位检测数据集A10、工位检测数据集A11、工位检测数据集A12、工位检测数据集A13、工位检测数据集A14、工位检测数据集A15、工位检测数据集A16、工位检测数据集A17、工位检测数据集A18、工位检测数据集A19、工位检测数据集A20、工位检测数据集A25、工位检测数据集A27、工位检测数据集A29、工位检测数据集A33、工位检测数据集A34和工位检测数据集A37的数据。
其中,发动机工位检测数据与冷试检测数据的对应关系如表3所示。
表3 发动机工位检测数据与冷试检测数据对应关系
X<sub>1</sub> B<sub>1</sub>
X<sub>1</sub> B<sub>2</sub>
X<sub>1</sub> B<sub>3</sub>
X<sub>1</sub> B<sub>4</sub>
X<sub>2</sub> B<sub>5</sub>
X<sub>2</sub> B<sub>6</sub>
X<sub>2</sub> B<sub>7</sub>
X<sub>2</sub> B<sub>8</sub>
X<sub>3</sub> B<sub>9</sub>
X<sub>4</sub> B<sub>10</sub>
X<sub>4</sub> B<sub>11</sub>
X<sub>5</sub> B<sub>12</sub>
X<sub>5</sub> B<sub>13</sub>
X<sub>5</sub> B<sub>14</sub>
X<sub>5</sub> B<sub>15</sub>
X<sub>6</sub> B<sub>16</sub>
X<sub>7</sub> B<sub>17</sub>
5)对数据样本集X1,...,X7进行稀疏处理。
稀疏处理的步骤如下:
5.1)计算参数θ,即:
Figure GDA0002527170810000101
式中,||θ||1为向量θ=(θ1,...,θb)T的L1范数,是向量θ的各元素绝对值和。n为工位检测数据和冷试检测数据的个数。xi为模型输入的工位检测数据。yi为经过学习后的输出集。fθ(xi)为输入函数。
范数||θ||1如下所示:
Figure GDA0002527170810000111
式中,b为向量集θ中向量个数。θj为向量集θ中的任意元素。
满足||θ||1≤R的范围为四角均在参数轴上的菱形。如图2所示。
5.2)计算参数θ的训练平方误差,即:
Figure GDA0002527170810000112
训练平方误差是关于θ的向下二次凸函数,因此训练平方误差在参数空间内具有呈椭圆状的等高线。在使用Lasso算法对预处理后的数据求解时,其解的范围即为上述的角与等高线的交点,而在所求出参数在参数轴上的点中有若干个0的话,其对应的x也均为0,也就是稀疏解。
5.3)根据训练平方误差JLS(θ)和参数θ建立稀疏处理模型。
5.4)将数据集A1,...,A37中2/3的数据变为0。
6)计算数据样本集X1,...,X7和冷试检测数据集B1,B2,...,B17的相关性。
计算相关性的步骤如下:
6.1)初步判断工位检测数据和冷试检测数据是否相关,步骤如下:
6.1.1)计算工位检测数据和冷试检测数据偏差的平方,即
Figure GDA0002527170810000113
式中,x为数据样本集X1,...,Xη中的元素。
Figure GDA0002527170810000114
为数据集B1,B2,...,B17中的元素。
6.1.2)根据偏差的平方,计算得到两组偏差SX和SB
6.1.3)计算差异参数F,即:
Figure GDA0002527170810000115
式中,S为max(SX,SB)。S为min(SX,SB)。差异参数F表示工位检测数据和冷试检测数据的差异性。
所得的值越大,表示二者差异越大。
6.1.4)根据差异参数F,判断工位检测数据和冷试检测数据是否强相关,若是,则转入步骤2。
6.2)检验工位检测数据和冷试检测数据的偏离程度χ2,即:
Figure GDA0002527170810000121
式中,d=1,2,3,...,k。k表示数据样本集X中工位的总数。G为任意工位检测数据的观察频数。E为基于计算出的期望频数。P为概率。
偏离程度χ2和工位检测数据和冷试检测数据的差异性正相关。
由卡方的计算公式可知,当观察频数与期望频数完全一致时,卡方值为0。观察频数与期望频数越接近,该发动机工位检测数据和冷试检测数据之间的差异越小,卡方值越小,二者间差异越小。反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大,表示二者差异越大。
在进行检验的过程中,P值为进行检验决策的另一重要依据,其反映某一事件发生的可能性大小,范围如表4所示
表4 P值分布意义
Figure GDA0002527170810000122
由表可知,当F检验和卡方检验的P值小于0.01时表示发动机工位检测数据和冷试检测数据的差别有非常显著意义,即原假设工位检测数据和冷试检测数据不存在相关性。在本次计算过程中p=0.01。
6.3)利用Wilks's lambda值分析工位检测数据的组间差异,步骤如下:
6.3.1)设X为一个n*p的矩阵,且每行均满足正态分布,即每行的均值为0。矩阵
Figure GDA0002527170810000123
V为X的协方差矩阵。Np(0,V)表示正态分布。
Wilks's lambda值分析工位检测数据的组间差异,所得值越小,表示相关性程度越高。Wilks'lambda是组内平方和与总平方和之比。当所有观测的组均值相等时,Wilks'lambda值为1;当组内变异与总变异相比小时,Wilks'lambda值接近于0。因此,Wilks'lambda值大,表示各个组的均值基本相等。Wilks'lambda小表示组间有差异。
6.3.2)设定散布矩阵
Figure GDA0002527170810000131
矩阵S中每个元素是各个向量元素之间的协方差,即S~Wp(n,V)
6.3.3)Wilks's lambda分布由两个独立的Wishart分布变量定义其行列式的比值分布,因此发动机工位检测数据集A和冷试检测数据集B的分布如下
Figure GDA0002527170810000132
式中,g≥p。p为维度。g为自由度的错误程度。h为自由度。
6.3.4)计算组内差异参数λ,即:
Figure GDA0002527170810000133
6.4)结合步骤6.3.1至步骤6.3.3,建立相关性判断模型。
6.5)计算相关性判断模型的决定系数R,即:
R2=1-SSE/SST。 (10)
式中,SSE为回归模型的误差平方的总和,也即冷试检测数据的总平方和。SST模型的误差平方的总和,也即冷试检测数据残差平方和。决定系数指在冷试检测数据的总平方和中,由发动机工位检测数据引起的平方和所占比例,它决定了发动机工位检测数据和冷试检测数据间的相关密切程度。
6.6)计算相关性判断模型的错误方差Error,即:
Error=Bias+Variance。 (11)
式中,Bias为工位检测数据和冷试检测数据的误差。Variance为模型每一次输出结果与模型输出期望之间的误差。
拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。值越大越好。
错误方差Error=Bias+Variance。Error反映的是整个模型的准确度,Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。结果如表5所示。
6.7)根据差异参数F、偏离程度χ2和相关性判断模型判断工位检测数据和冷试检测数据的相关程度,即判断为强相关或弱相关。
表5 统计学方法计算后结果
Figure GDA0002527170810000141
7)根据数据样本集X1,...,X7和冷试检测数据集B1,B2,...,B17的相关性,分析得到发动机冷试检测数据和发动机工位的相关性。
表6 发动机相关性分析结果
X<sub>1</sub>工位 P值 相关性程度
A<sub>1</sub> 0.8021 不相关
A<sub>2</sub> 0.4632 不相关
A<sub>3</sub> 0.2187 不相关
A<sub>8</sub> 0.1624 不相关
A<sub>10</sub> 0.0322 弱相关
A<sub>11</sub> 0.0031 强相关
A<sub>12</sub> 0.0399 弱相关
A<sub>14</sub> 0.9282 不相关
A<sub>15</sub> 0.4434 不相关
A<sub>16</sub> 0.9257 不相关
A<sub>17</sub> 0.0575 不相关
A<sub>18</sub> 0.174 不相关
A<sub>19</sub> 0.0622 不相关
A<sub>20</sub> 0.2352 不相关
A<sub>26</sub> 0.9343 不相关
A<sub>27</sub> 0.9564 不相关
A<sub>29</sub> 0.2318 不相关
A<sub>30</sub> 0.4139 不相关
A<sub>32</sub> 0.8691 不相关
A<sub>33</sub> 0.7148 不相关
A<sub>34</sub> 0.5665 不相关
A<sub>35</sub> 0.07 不相关
P值反映了某一事件发生的可能性大小,假设工位检测数据和冷试检测数据不相关,当F检验和卡方检验的P值小于0.01时表示工位检测数据和冷试检测数据的差别有非常显著意义,即原假设不成立,二者相关,当P值大于0.01小于0.05时表示工位检测数据和冷试检测数据的差别有显著意义,即二者弱相关,当P值大于0.05时表示工位检测数据和冷试检测数据的差别无显著意义,即二者不相关。从上表中可得出与B1做相关性分析的X1所有的工位中,A11与B1强相关,A9、A10与B1弱相关,其余工位与B1不相关。即B1的冷试检测数据相关性最强的为A11,相关性较弱的有A10、A12。即影响B1的冷试检测数据最强的为工位A11,影响B1的冷试检测数据较弱的工位为A10和A12,在加工时,若想保证B1的冷试检测数据的稳定性,就尤其需要确保工位A11加工时的稳定性,弱相关的工位A10和工位A12加工时的稳定性为次重要的。其余工位与B1的冷试检测数据不相关。
X2-X7与B2-B17对应计算过程如X1和B1相同,即先计算步骤5,再计算步骤6,可得出最后步骤7的结果。
本发明将大数据分析算法及模型应用于生产现场,通过对大数据分析发动机工位检测数据与冷试检测数据之间的关系,得出影响冷试检测数据的具体工位,对影响冷试检测数据较大的工位的工艺参数进行更为严格地控制,从而提高发动机出厂时性能的一致性,同时,对影响冷试检测数据较小的工位设备降低档次,可以节约生产成本。

Claims (4)

1.一种大数据分析发动机冷试检测数据与工位相关性的方法,其特征在于,包括以下步骤:
1)获取同一型号发动机α个工位的工位检测数据和β条冷试检测数据;所述同一型号的发动机α个工位的工位检测数据集分别记为A1、A2、...、Aα;所述同一型号发动机的β条冷试检测数据集分别记为B1、B2、...、Bβ;α、β为正整数;
2)补全工位检测数据集和冷试检测数据集的缺失数据;
3)对补全后的工位检测数据集进行预处理,得到工位检测数据矩阵M;
4)从工位检测数据矩阵M中随机提取数据样本集X1,...,Xη;η为正整数;
5)对数据样本集X1,...,Xη进行稀疏处理;
6)计算数据样本集X1,...,Xη和冷试检测数据集B1,B2,...,Bβ的相关性;
计算相关性的步骤如下:
6.1)初步判断工位检测数据和冷试检测数据是否相关,步骤如下:
6.1.1)计算工位检测数据和冷试检测数据偏差的平方S2,即:
Figure FDA0002543081030000011
式中,x为数据样本集X1,...,Xη中的元素;
Figure FDA0002543081030000012
为数据集B1,B2,...,Bβ中的元素;
6.1.2)根据偏差的平方,计算得到两组偏差:SX和SB
6.1.3)计算差异参数F,即:
Figure FDA0002543081030000013
式中,S为max(SX,SB);S为min(SX,SB);差异参数F表示工位检测数据和冷试检测数据的差异性;
6.1.4)根据差异参数F,判断工位检测数据和冷试检测数据是否强相关,若是,则转入步骤6.2,若否,则输出工位检测数据和冷试检测数据不相关的结果;
6.2)检验工位检测数据和冷试检测数据的偏离程度χ2,即:
Figure FDA0002543081030000021
式中,d=1,2,3,...,k;k表示数据样本集X1,...,Xη中工位的总数;G为任意工位检测数据的观察频数;E为期望频数;P为概率;
偏离程度χ2和工位检测数据和冷试检测数据的差异性正相关;
6.3)利用Wilks's lambda值分析工位检测数据的组间差异,步骤如下:
6.3.1)设定数据样本集X1,...,Xη为一个n*p的矩阵,且每行均满足正态分布,即每行的均值为0;矩阵
Figure FDA0002543081030000022
V为X1,...,Xη的协方差矩阵;
l和p均表示维度;
6.3.2)设定散布矩阵
Figure FDA0002543081030000023
矩阵S中每个元素是各个向量元素之间的协方差,即S~Wp(n,V);
6.3.3)确定发动机工位检测数据集A和冷试检测数据集B的分布,即:
Figure FDA0002543081030000024
式中,g≥p;p为维度;g为自由度的错误程度;h为自由度;
6.3.4)计算组内差异参数λ,即:
Figure FDA0002543081030000025
式中,det表示行列式;
6.4)结合步骤6.3.1至步骤6.3.3建立相关性判断模型;
6.5)计算相关性判断模型的决定系数R,即:
R2=1-SSE/SST; (10)
式中,SSE为冷试检测数据的总平方和;SST是冷试检测数据残差平方和;
6.6)计算相关性判断模型的错误方差Error,即:
Error=Bias+Variance; (11)
式中,Bias为工位检测数据和冷试检测数据的误差;Variance为模型每一次输出结果与模型输出期望之间的误差;
6.7)根据差异参数F、偏离程度χ2和相关性判断模型判断工位检测数据和冷试检测数据的相关程度;
7)根据数据样本集X1,...,Xη和冷试检测数据集B1、B2、...、Bβ的相关性,分析得到发动机冷试检测数据和发动机工位的相关性。
2.根据权利要求1所述的一种大数据分析发动机冷试检测数据与工位相关性的方法,其特征在于,补全工位检测数据集和冷试检测数据集的缺失数据的步骤如下:
1)删除数据集A1,A2,...,Aα和数据集B1,B2,...,Bβ中空项大于70%的列或行;
2)利用均值插值法补齐数据集A1,A2,...,Aα和数据集B1,B2,...,Bβ中空项小于70%的列或行。
3.根据权利要求1或2所述的一种大数据分析发动机冷试检测数据与工位相关性的方法,其特征在于:对补全后的工位检测数据集进行预处理的步骤如下:
1)将补全后的工位检测数据集按照工位号和时间的顺序排列数据;排列的优先序列为时间;
2)按照时间排序后,保留最后发生的工位检测数据,删除其之前的同项工位检测数据,得到初步处理后的数据;
3)将得到的初步处理后的数据列为数据矩阵M;
Figure FDA0002543081030000031
式中,m为发动机个数,n为工位检测数据和冷试检测数据的个数。
4.根据权利要求1所述的一种大数据分析发动机冷试检测数据与工位相关性的方法,其特征在于,稀疏处理的步骤如下:
1)计算参数θ,即:
Figure FDA0002543081030000032
式中,||θ||1为向量θ=(θ1,...,θb)T的L1范数,是向量θ的各元素绝对值和;n为工位检测数据和冷试检测数据的个数;xi为模型输入的工位检测数据,yi为经过学习后的输出集;fθ(xi)为输入函数;
范数||θ||1如下所示:
Figure FDA0002543081030000041
式中,b为向量集θ中的个数;θj为向量集θ中的任意元素;
2)计算参数θ的训练平方误差JLS(θ),即:
Figure FDA0002543081030000042
3)根据训练平方误差JLS(θ)和参数θ建立稀疏处理模型;
4)将数据样本集X1,...,Xη中2/3的数据变为0。
CN201811474787.XA 2018-12-04 2018-12-04 一种大数据分析发动机冷试检测数据与工位相关性的方法 Active CN109506942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811474787.XA CN109506942B (zh) 2018-12-04 2018-12-04 一种大数据分析发动机冷试检测数据与工位相关性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811474787.XA CN109506942B (zh) 2018-12-04 2018-12-04 一种大数据分析发动机冷试检测数据与工位相关性的方法

Publications (2)

Publication Number Publication Date
CN109506942A CN109506942A (zh) 2019-03-22
CN109506942B true CN109506942B (zh) 2020-08-04

Family

ID=65750127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811474787.XA Active CN109506942B (zh) 2018-12-04 2018-12-04 一种大数据分析发动机冷试检测数据与工位相关性的方法

Country Status (1)

Country Link
CN (1) CN109506942B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580903A (zh) * 2019-09-27 2021-03-30 华晨宝马汽车有限公司 用于评估发动机质量稳定性的方法和装置及存储介质
CN113884305B (zh) * 2021-09-29 2022-06-28 山东大学 基于svm的柴油机装配冷试检测方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3788424B2 (ja) * 2002-03-29 2006-06-21 マツダ株式会社 エンジンの故障診断装置
US20160195506A1 (en) * 2015-01-07 2016-07-07 Bharat Petroleum Corporation Ltd. Estimation of cold-flow properties of refinery product blends
CN106959400B (zh) * 2017-02-28 2020-03-31 中国南方电网有限责任公司 一种基于异常点监测和大数据分析的二次设备隐患故障诊断方法
CN107528824B (zh) * 2017-07-03 2020-08-04 中山大学 一种基于二维度稀疏化的深度信念网络入侵检测方法
CN107436597B (zh) * 2017-07-17 2019-10-18 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN108871762A (zh) * 2018-06-29 2018-11-23 广东工业大学 一种风电机组齿轮箱故障诊断方法

Also Published As

Publication number Publication date
CN109506942A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN109506942B (zh) 一种大数据分析发动机冷试检测数据与工位相关性的方法
Lygoe et al. A real-world application of a many-objective optimisation complexity reduction process
CN112949196B (zh) 一种基于残差神经网络的抽油机井故障诊断方法及系统
de Nola et al. Volumetric efficiency estimation based on neural networks to reduce the experimental effort in engine base calibration
CN113504050B (zh) 一种egr系统积碳结焦测试方法及装置
US20060230821A1 (en) Method and a relative device for diagnosing misfire or partial combustion conditions in an internal combustion engine
CN110210110B (zh) 一种面向船用柴油机机身加工过程工艺可靠性的建模方法
CN113689038B (zh) 一种基于多传感器模糊评估的发动机气缸故障预测方法
CN113884305B (zh) 基于svm的柴油机装配冷试检测方法及系统
US11401881B2 (en) Fourier diagnosis of a charge cycle behavior of an internal combustion engine
US10273886B2 (en) Process for reducing abnormal combustion within an internal combustion engine
CN115510926B (zh) 跨机型的柴油机燃烧室故障诊断方法及系统
US6055852A (en) Method and apparatus for estimation of relative cylinder compression balance by cranking speed analysis
CN112415892B (zh) 一种汽油机起动标定控制参数优化方法
Kale et al. Development of an improved residuals estimation model for dual independent cam phasing spark-ignition engines
Czech Diagnosing faults in the timing system of a passenger car spark ignition engine using the Bayes classifier and entropy of vibration signals
Lee et al. Real-time estimation of combustion variability for model-based control and optimal calibration of spark ignition engines
RU2789571C1 (ru) Способ автоматизированной локализации негерметичных клапанов ГРМ
CN110555470B (zh) 一种喷油器分组方法
CN115700360A (zh) 发动机摩擦功测试方法
CN114091540B (zh) 柴油机冷试智能检测模型构建方法、检测方法及系统
CN113468748B (zh) 一种发动机配气装置摩擦模型的构建方法及装置
Antory Fault diagnosis application in an automotive diesel engine using auto-associative neural networks
CN114757117B (zh) 柴油机进气道性能评估方法、系统、终端设备及存储介质
Wisniewski et al. Tolerance Analysis Using VSA-3D® for Engine Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant