CN110751101B - 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法 - Google Patents

基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法 Download PDF

Info

Publication number
CN110751101B
CN110751101B CN201911005880.0A CN201911005880A CN110751101B CN 110751101 B CN110751101 B CN 110751101B CN 201911005880 A CN201911005880 A CN 201911005880A CN 110751101 B CN110751101 B CN 110751101B
Authority
CN
China
Prior art keywords
clustering
learning machine
matrix
fatigue
unsupervised
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201911005880.0A
Other languages
English (en)
Other versions
CN110751101A (zh
Inventor
孙文财
司仪豪
李世武
郭梦竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201911005880.0A priority Critical patent/CN110751101B/zh
Publication of CN110751101A publication Critical patent/CN110751101A/zh
Application granted granted Critical
Publication of CN110751101B publication Critical patent/CN110751101B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法,属于驾驶安全技术领域,通过高斯混合模型及贝叶斯信息准则,确定最佳分类簇数和各类别下概率密度分布函数,确定了在疲劳识别数据组中最佳的识别模型。再通过无监督极限学习机的特征提取非迭代算法,获得收敛于全环境最小值,得到输出矩阵;通过PCA算法充分利用了在无监督极限学习机特征提取下四种聚类算法对不同特征划分学习下的优势,将疲劳识别点识别准确度矩阵进行成分得分系数矩阵计算,通过归一化得分系数转化为平衡四种聚类算法在疲劳识别领域中的权重系数,使得训练集数据聚类的精度趋于平衡。

Description

基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法
技术领域
本发明属于驾驶安全技术领域,特别是涉及到一种使用无监督极限学习机通过高斯混合模型以及贝叶斯信息准则算法对交通工程学中的驾驶员疲劳特征信号的获取方法。
背景技术
使用传统无监督聚类方法进行驾驶员疲劳特征区域划分可克服有监督聚类划分及主观评价等主观性大、大数据下大量数据仍需人工标定的缺点,有助于寻找驾驶员疲劳多特征划分规律,从而提高驾驶员状态监测和驾驶行为预测的准确性。但传统的单一无监督分类算法对不平衡数据特征学习分类的准确率低,驾驶员疲劳多特征有数据分布复杂、噪声点较多的特点,而常规单一聚类方法所依赖性特征有仅对高斯分布、均匀分布或稀疏数据或高维数据等聚类效果较好、以及仅对“球状簇”或“互邻簇”或“单自然簇”等聚类相关性较强、聚类边界较生硬等缺陷。因此,寻求合理有效的聚类方法成为提高驾驶疲劳划分精度和提高划分智能化程度的关键问题。国内外学者已对驾驶疲劳特征下典型聚类方法进行了研究并取得了一些成果。但是,改进的疲劳特征聚类识别算法存在时间复杂度提高的问题;在无监督学习中则尚存在需大量人工干预确定聚类数目的缺陷。因此针对现有技术当中存在的诸多不足之处,本领域亟需要一种新的技术方案来解决这一问题。
发明内容
本发明所要解决的技术问题是:提供一种基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法,能够有效地减少数据的不平衡分布对数据分类正确率的干扰,得到更好的分类效果,以实现驾驶员疲劳多特征数据准确、动态的数据聚类预测。
基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法,其特征是:包括以下步骤,且以下步骤顺次进行,
步骤一、使用BIOPAC生理记录仪,在三种场景下采集驾驶员的生理数据特征,将生理数据特征以数组形式存入CSV逗号分隔值文件中并进行数据标签化,形成原始数据特征矩阵;
步骤二、限定分类簇数为[1,10],定义高斯混合模型Gaussian Mixture,获得数据特征数组被分配到每个簇的概率;
步骤三、对去除标签的训练样本集合进行高斯混合模型下的聚类,获得概率分布的参数;
步骤四、将期望最大化方法EM-Algo、谱聚类Spectral、平衡k均值聚类方法K-Means以及自组织映射方法Self-organizing Maps嵌入无监督极限学习机US-ELM中,进行特征提取;
步骤五、通过无监督学习机重复反馈输出矩阵out-matrix过程,将步骤四得到的四种聚类在无监督极限学习机特征提取下不同特征划分学习的结果与数据标签进行比对得到准确精度构造为精度矩阵,进行PCA主成分分析,得到成分得分系数矩阵计算,通过归一化得分系数转化为平衡四种聚类算法获得疲劳识别权重系数。
所述步骤三中高斯混合模型GMM的聚类方法为,将步骤一中原始数据的高斯混合模型的对数似然函数
Figure GDA0003549026950000022
进行迭代,获得参数πk、μk和∑k
Figure GDA0003549026950000021
确定每个分类簇数中的概率密度函数,再通过贝叶斯信息BIC准则,进行每一次分类簇数贝叶斯信息值的比较,通过似然率测试决策规则获得最小的错误概率;最小化错误概率的决策规则就是最大化后验概率判据,确定最优分类簇数模型
BIC=Kln(n)-2ln(L)
其中,K为模型参数个数,n为样本数量,L为似然函数。
通过上述设计方案,本发明可以带来如下有益效果:一种基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法,能够有效地减少数据的不平衡分布对数据分类正确率的干扰,得到更好的分类效果,以实现驾驶员疲劳多特征数据准确、动态的数据聚类预测。
进一步的,本发明的方法较好地弥补了期望最大化方法EM-Algo、谱聚类Spectral、平衡k均值聚类方法K-Means以及自组织映射方法Self-organizing Maps四种聚类方法的缺陷,能够很好地处理数据的不平衡分布与噪声点,在进行驾驶员疲劳识别点划分时聚类效果优于常规四种聚类方法,提高了驾驶员疲劳识别点聚类质量。
附图说明
以下结合附图和具体实施方式对本发明作进一步的说明:
图1为本发明基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法流程示意框图。
具体实施方式
基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法,如图1所示,通过高斯混合模型及贝叶斯信息准则,确定最佳分类簇数和各类别下概率密度分布函数,确定了在疲劳识别数据组中最佳的识别模型。再通过无监督极限学习机unsupervised ELM的特征提取非迭代算法,通过随机初始化其中输入层和隐藏层之间的权重,并且使用目标函数计算隐藏层和输出层之间的权重;获得收敛于全环境最小值,得到输出矩阵output_matrix。通过期望最大化方法EM-Algo、谱聚类spectral、平衡k均值聚类方法K-means和自组织映射方法Self Organizing Map的四种聚类从无监督极限学习机ELM获得的特征学习和来自贝叶斯信息准则BIC的聚类数。通过PCA算法充分利用了在无监督极限学习机特征提取下的EM-Algo、spectral、K-means和Self Organizing Map的四种聚类算法对不同特征划分学习下的优势,将疲劳识别点识别准确度矩阵进行成分得分系数矩阵计算,通过归一化得分系数转化为平衡四种聚类算法在疲劳识别领域中的权重系数,使得训练集数据聚类的精度趋于平衡。
具体操作步骤如下:
步骤一:数据采集
使用BIOPAC生理记录仪,通过以下三种实验设计,
共进行以下三组模拟驾驶实验:
(1)正常驾驶试验
从上午九点开始无间断持续驾驶,直到由于疲劳而无法继续驾驶作业。
(2)清醒驾驶验证试验
要求试验前2日保证充足睡眠,试验时间段9:00am-11:00am。
(3)疲劳驾驶验证试验
限制实验开始前一天睡眠时间为5小时,试验时间段14:00pm-16:00pm。
在三种实验场景下采集驾驶员的生理数据特征,将生理数据特征以数组形式存入csv逗号分隔值文件中并进行数据标签化,作为原始数据特征矩阵。
步骤二:对去除标签的训练样本集合进行高斯混合模型下的聚类,从而估计它们概率分布的参数。
具体操作如下:
假设数据服从混合高斯分布(Mixture Gaussian Distribution),数据可以看作是从数个高斯分布(Gaussian Distribution)中生成出来的,我们可以任意地逼近任何连续的概率密分布。
将现有数据,高斯混合模型GMM的对数似然函数log-likelihood function:
Figure GDA0003549026950000041
通过迭代,确定参数πk、μk和∑k,以此来由公式
Figure GDA0003549026950000042
确定每个分类簇数cluster中的概率密度函数。再通过贝叶斯信息BIC准则,进行每一次分类簇数贝叶斯BIC值的比较,通过似然率测试决策规则得到最小的错误概率。这个错误概率称为贝叶斯错误率,且是所有分类器中可以得到的最好结果。最小化错误概率的决策规则就是最大化后验概率判据,确定最优分类簇数cluster模型
BIC=Kln(n)-2ln(L)
其中,K为模型参数个数,n为样本数量,L为似然函数。
步骤三:参数设计
限定分类簇数为[1,10],定义高斯混合模型Gaussian Mixture,计算数据特征数组被分配到每个分类簇数cluster的概率;
其中,定义n_components:混合高斯模型个数,设为分类数;
covariance_type:协方差类型,设为对角协方差矩阵。
步骤四:
第1步:随机初始化偏差b,连接输入和隐藏层之间的权重W;
第2步:计算H矩阵(H:隐藏层节点输出),其中,H=s(WX+b);
第3步:计算图拉普拉斯矩阵L=D-W,其中W是相似矩阵,D是对角矩阵
Figure GDA0003549026950000051
第4步:计算HTLH;
第5步:计算由A=Inh+λHTLH给定的矩阵A,其中,nh为隐藏神经元个数,Inh为维度为nh的单位矩阵,λ为权衡系数;
第6步:计算矩阵A的特征向量;
第7步:选择对应于最小特征向量的最小无特征向量;
第8步:归一化特征向量;
第9步:计算嵌入矩阵E=Hβ,其中β为隐藏层与输出层输出权重;
第10步:将将期望最大化方法EM-Algo、谱聚类Spectral、平衡K均值聚类方法K-Means以及自组织映射方法Self-organizing Maps应用于第9步获得的嵌入式矩阵。
步骤五:
通过无监督学习机重复反馈输出矩阵out-matrix过程,将得到的四种聚类在无监督极限学习机特征提取下不同特征划分学习的结果与数据标签进行比对得到准确精度构造为精度矩阵,进行PCA主成分分析,得到成分得分系数矩阵计算,通过归一化得分系数转化为平衡四种聚类算法在疲劳识别领域中的权重系数。
本发明的方法较好地弥补了四种聚类方法的缺陷,能够很好地处理数据的不平衡分布与噪声点,在进行驾驶员疲劳识别点划分时聚类效果优于常规四种聚类方法,提高了驾驶员疲劳识别点聚类质量。能对系统进行较准确、动态的数据聚类预测,这将对都具有非常重要的现实意义,将聚类算法与来自统计学等传统方法紧密结合,融入到聚类的过程中,改善聚类过程的质量。

Claims (1)

1.基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法,其特征是:包括以下步骤,且以下步骤顺次进行,
步骤一、使用BIOPAC生理记录仪,在三种场景下采集驾驶员的生理数据特征,将生理数据特征以数组形式存入CSV逗号分隔值文件中并进行数据标签化,形成原始数据特征矩阵;
步骤二、限定分类簇数为[1,10],定义高斯混合模型Gaussian Mixture,获得数据特征数组被分配到每个簇的概率;
步骤三、对去除标签的训练样本集合进行高斯混合模型下的聚类,获得概率分布的参数;
步骤四、将期望最大化方法EM-Algo、谱聚类Spectral、平衡k均值聚类方法K-Means以及自组织映射方法Self-organizing Maps嵌入无监督极限学习机US-ELM中,进行特征提取;
步骤五、通过无监督学习机重复反馈输出矩阵out-matrix过程,将步骤四得到的四种聚类在无监督极限学习机特征提取下不同特征划分学习的结果与数据标签进行比对得到准确精度构造为精度矩阵,进行PCA主成分分析,得到成分得分系数矩阵计算,通过归一化得分系数转化为平衡四种聚类算法获得疲劳识别权重系数;
所述步骤三中高斯混合模型GMM的聚类方法为,将步骤一中原始数据的高斯混合模型的对数似然函数
Figure FDA0003549026940000011
进行迭代,获得参数πk、μk和∑k
Figure FDA0003549026940000012
确定每个分类簇数中的概率密度函数,再通过贝叶斯信息BIC准则,进行每一次分类簇数贝叶斯信息值的比较,通过似然率测试决策规则获得最小的错误概率;最小化错误概率的决策规则就是最大化后验概率判据,确定最优分类簇数模型
BIC=Kln(n)-2ln(L)
其中,K为模型参数个数,n为样本数量,L为似然函数。
CN201911005880.0A 2019-10-22 2019-10-22 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法 Expired - Fee Related CN110751101B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911005880.0A CN110751101B (zh) 2019-10-22 2019-10-22 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911005880.0A CN110751101B (zh) 2019-10-22 2019-10-22 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法

Publications (2)

Publication Number Publication Date
CN110751101A CN110751101A (zh) 2020-02-04
CN110751101B true CN110751101B (zh) 2022-05-17

Family

ID=69279297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911005880.0A Expired - Fee Related CN110751101B (zh) 2019-10-22 2019-10-22 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法

Country Status (1)

Country Link
CN (1) CN110751101B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111309770B (zh) * 2020-02-24 2023-03-28 电子科技大学 一种基于无监督机器学习的自动生成规则系统及方法
CN112256122B (zh) * 2020-09-25 2022-08-19 北京师范大学 基于精神疲劳的操控工效分析方法、设备及系统
CN113243891B (zh) * 2021-05-31 2024-10-18 平安科技(深圳)有限公司 轻度认知障碍识别方法、装置、计算机设备及存储介质
CN114391845A (zh) * 2021-12-07 2022-04-26 福州大学 一种建筑施工设备操作人员心理疲劳的测量方法及系统
CN117367751B (zh) * 2023-10-19 2024-05-10 中聚科技股份有限公司 超脉冲掺铥激光器的性能检测方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714261A (zh) * 2014-01-14 2014-04-09 吉林大学 二阶段混合模型的智能辅助医疗决策支持方法
CN104778298A (zh) * 2015-01-26 2015-07-15 江南大学 基于egmm的高斯过程回归软测量建模方法
CN108364015A (zh) * 2018-01-10 2018-08-03 杭州电子科技大学 一种具有安全机制的半监督超限学习机分类方法
CN108364294A (zh) * 2018-02-05 2018-08-03 西北大学 基于超像素的腹部ct图像多器官分割方法
CN108875783A (zh) * 2018-05-09 2018-11-23 西安工程大学 一种面向不平衡数据集的极限学习机变压器故障诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160086087A1 (en) * 2014-09-19 2016-03-24 King Fahd University Of Petroleum And Minerals Method for fast prediction of gas composition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714261A (zh) * 2014-01-14 2014-04-09 吉林大学 二阶段混合模型的智能辅助医疗决策支持方法
CN104778298A (zh) * 2015-01-26 2015-07-15 江南大学 基于egmm的高斯过程回归软测量建模方法
CN108364015A (zh) * 2018-01-10 2018-08-03 杭州电子科技大学 一种具有安全机制的半监督超限学习机分类方法
CN108364294A (zh) * 2018-02-05 2018-08-03 西北大学 基于超像素的腹部ct图像多器官分割方法
CN108875783A (zh) * 2018-05-09 2018-11-23 西安工程大学 一种面向不平衡数据集的极限学习机变压器故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multi-view clusting with extreme learning machine;Qiang Wang et al.;《Neurocomputing》;20160623;第483-494页 *
改进无监督极限学习机的不平衡数据分类;徐昌 等;《安徽师范大学学报(自然科学版)》;20181130;第41卷(第6期);第544-551页 *

Also Published As

Publication number Publication date
CN110751101A (zh) 2020-02-04

Similar Documents

Publication Publication Date Title
CN110751101B (zh) 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法
CN109636026B (zh) 一种基于深度学习模型的晶圆良率预测方法
CN112083498B (zh) 一种基于深度神经网络的多波地震油气储层预测方法
CN107609588B (zh) 一种基于语音信号的帕金森患者updrs得分预测方法
CN112557034B (zh) 一种基于pca_cnns的轴承故障诊断方法
Cateni et al. A hybrid feature selection method for classification purposes
CN110120218A (zh) 基于gmm-hmm的高速公路大型车辆识别方法
CN112613536B (zh) 一种基于smote和深度学习的近红外光谱柴油牌号识别方法
CN110807544B (zh) 一种基于机器学习的油田剩余油饱和度分布的预测方法
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN112163640A (zh) 基于深度卷积迁移学习行星齿轮箱故障诊断方法及系统
CN110880369A (zh) 基于径向基函数神经网络的气体标志物检测方法及应用
CN117033912B (zh) 一种设备故障预测方法、装置、可读存储介质及电子设备
CN112504682A (zh) 基于粒子群优化算法的底盘发动机故障诊断方法及系统
CN114881429B (zh) 基于数据驱动的台区线损量化方法及系统
CN116340746A (zh) 一种基于随机森林改进的特征选择方法
CN115640526A (zh) 钻井风险识别模型及建立方法、识别方法和计算机设备
CN117633597A (zh) 基于自适应谱聚类的居民峰谷用电特性分类方法及系统
CN104182511B (zh) 一种簇特征加权的模糊紧致散布聚类方法
CN111209939A (zh) 一种具有智能参数优化模块的svm分类预测方法
CN118194067A (zh) 一种基于多维高斯混合模型的广告外溢检测方法
CN113705110A (zh) 一种基于双重随机森林回归方法的爆破振动速度预测方法
CN113523904A (zh) 一种刀具磨损检测方法
CN110852178A (zh) 基于提升决策树的钢琴乐谱难度识别方法
CN115563520A (zh) 一种基于kmeans聚类的半监督学习方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220517