CN109614904A - 一种基于Shapelet的多传感器融合的活动识别方法 - Google Patents

一种基于Shapelet的多传感器融合的活动识别方法 Download PDF

Info

Publication number
CN109614904A
CN109614904A CN201811463074.3A CN201811463074A CN109614904A CN 109614904 A CN109614904 A CN 109614904A CN 201811463074 A CN201811463074 A CN 201811463074A CN 109614904 A CN109614904 A CN 109614904A
Authority
CN
China
Prior art keywords
shapelet
collection
myinstance
time series
sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811463074.3A
Other languages
English (en)
Inventor
王波涛
张凯
梁伟
李俞呈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201811463074.3A priority Critical patent/CN109614904A/zh
Publication of CN109614904A publication Critical patent/CN109614904A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明提供一种基于Shapelet的多传感器融合的活动识别方法,本发明所提出的方法将多个传感器信息融合构建机器学习模型,与对每个传感器数据构建一个模型再使用模型分类结果进行投票的方法相比,减少了由于单个传感器分类不准确导致整体分类不准确的问题。该方法首先将时间序列的每一维上提取的Shapelet组成一个SShapelet集合,其次将原始时间序列数据集按照相同的时间间隔组成myInstance集,再通过计算myInstance集与SShapelet集的距离得到新的训练集,最后使用机器学习分类算法对所产生的新的训练集进行训练生成模型,所生成的模型能准确地分类日常活动的传感器数据,同时与传统的基于传感器的活动识别方法相比,可以使用更少的数据集达到更高的准确率。

Description

一种基于Shapelet的多传感器融合的活动识别方法
技术领域
本发明涉及时间序列分类、活动识别领域,具体的涉及一种基于Shapelet的多传感器融合的人类活动传感器数据的分类方法。
背景技术
随着可穿戴传感器技术的飞速发展,人类活动识别(HAR)由于其在各种应用领域中的高需求而引起人们极大的关注,具有非常广泛的应用前景。同时,在不同的领域催生出了很多基于感知计算的应用,例如健康医疗、智能家居、体感游戏机等。迄今为止,基于可穿戴传感的活动识别仍然存在着很多问题,为了提高识别的准确性,人们一直致力于基于可穿戴传感器的活动识别的研究。
目前,已经存在很多研究成果实现了对不同的人体活动进行分类识别,包括基于传统机器学习的方法和基于模板匹配的方法。现有的活动识别方法在一定程度上存在缺陷,比如需要考虑时间序列的全局特征,容易受到噪音数据的影响,从而影响预测的精度。Shapelet是一种具有辨识性的时间序列子序列,利用识别局部特征达到对时间序列准确分类的目的,具有可解释性。因此使用Shapelet来对活动识别传感器数据这种时间序列进行分类能够解决数据噪音等问题。
由于人体活动传感器数据的复杂性,传统的基于Shapelet的多元时间序列分类方法在应用到活动识别领域时,无法取得较好的效果。Mueen A等人提出的将多元时间序列级联成一个一元的时间序列,再按照一元时间序列分类的方法进行分类,该方法需要付出较高的计算代价。Ghalwash等人通过求解凹凸优化问题来提取Shapelet,该方法在每一维上只能提取一个Shapelet,对分类精度会造成一定的影响。
Om P.Patri2014年提出的SF算法,是多元时间序列分类的典型算法之一。SF算法将特征提取和特征选择结合在一起,在多元时间序列的每一维上提取Shapelet,为每一维构建决策树,并为这一棵决策树学习一个权值,最终分类结果通过各个有权值的决策树投票产生。基于Shapelet的多元时间序列分类的另一个典型的算法为SE(ShapeletEnsemble)算法。由MS Cetin等人于2015年提出。SE算法同样对多元时间序列的每一维提取shapelet,并为每一维的Shapelet构建一个随机森林,多个维度组成多个随机森林,通过投票产生最终的分类结果。
上述的基于Shapelet的多元时间序列分类方法多用于工业中的异常检测和医疗中患者病情诊断,当应用到活动识别领域,用于对人类活动传感器数据进行分类时效果不佳。
发明内容
本发明提供一种基于Shapelet转换的多元时间序列分类方法MTC-BST,解决了现有方法不得不足。该方法把时间序列的每一维上提取的Shapelet组成一个Shapelet集合,将用于训练的多元时间序列与Shapelet集合计算距离作为新的训练集,最后使用随机森林作为分类器对新的训练集进行训练生成模型,所生成的模型能准确地分类日常活动的传感器数据,同时与传统的基于传感器的活动识别方法相比,可以使用更少的数据集达到更高的准确率。
本发明采用的技术方案:
一种基于Shapelet转换的的多元时间序列分类方法,将所有传感器信息组成一个分类器,这样做的好处是在分类不同的活动时考虑所有传感器的信息,避免由于单个传感器分类不准确导致整体投票不准确的问题。
具体包括如下步骤:
第一步,对多维时间序列的每一维提取Shapelet
将传感器采集到的活动数据集分为两部分:训练集和测试集,对训练集中的多维时间序列的每一维,产生所有长度为minLen到maxLen的候选Shapelet集,计算出每一个候选Shapelet的信息增益值,并将Shapelet按照信息增益值的大小进行排序,同时,移除掉自相似的Shapelet,所述自相似的Shapelet为来自同一条时间序列且具有重叠的Shapelet;从移除自相似后的Shapelet中选取出信息值最大的K个Shapelet组成KShapelets集;从训练集的每一维中提取出的Shapelet都要加入到Kshapelets集中,不断更新KShapelets集,使得KShapelets中始终保存着当前最好的K个Shapelet;
从训练集中提取出了KShapelets后,将KShapelets进行聚类操作,得到含有S个Shapelet的SShapelets集,即为所有传感器产生的Shapelet的一个融合;
第二步,建立myInstance集
myInstance集是由相同时间间隔内各个传感器的数据及所属的类别组成,将不同传感器文件中行号相同的时间序列及这一组时间序列的标签组合在一起,每个传感器文件中有n条时间序列,则最终产生n个myInstance,形成myInstance集;
第三步,计算相似性矩阵
相似性矩阵是通过SShapelets集与myInstance集计算距离得到的一个新的数据集,新的数据集以矩阵的形式体现;SShapelets中的每一个Shapelet来自多维时间序列中的一维,myInstance集中的一个myInstance是多维的时间序列,多维的myInstance与一维的Shapelet计算距离的规则是:当前Shapelet属于哪一维度,就计算该Shapelet与myInstance哪一维的距离,即计算Shapelet与myInstance中与Shapelet同一维度的时间序列的距离;将Shapelet作为行,myInstance作为列,计算得出的距离作为矩阵中的元素,该矩阵称为相似性矩阵,将该相似性矩阵作为新的训练集;
第四步,训练模型及预测
对新的训练集使用机器学习分类算法进行训练,产生活动识别模型;将第一步中的测试集做第二步、第三步操作,得到测试集的相似性矩阵,将该相似性矩阵放入到活动识别模型中,模型自动给出预测结果。
进一步地,上述第四步,所述的机器学习分类算法为随机森林、决策树,SVM,神经网络中的一种。
本发明的有益效果为,基于Shapelet的多传感器融合的活动识别方法,将所有传感器信息组成一个分类器,这样做的好处是在分类不同的活动时考虑所有传感器的信息,避免由于单个传感器分类不准确导致整体投票不准确的问题。同时,通过识别局部特征达到对时间序列准确分类的目的,能够减少噪音的影响。
附图说明
图1是本发明中多元时间序列与Shapelet距离计算过程图。
图2是本发明的整个训练过程图。
图3是该发明在PAMAP indoor公开数据集上取得的结果。
图4是该发明在PAMAP outdoor公开数据集上取得的结果。
图5是该发明在SmartPhoneWrist公开数据集上取得的结果。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实例,对本发明做进一步详细说明。这些实例仅仅是说明性的,而并非对本发明的限制。
具体的实施步骤:
步骤一,加载12个传感器数据文件,分别表示加速度传感器X轴的数据,加速度传感器Y轴的数据,加速度传感器Z轴的数据,陀螺仪X轴数据等等。每个文件包含1000行,101列,每一行表示一个时间段的传感器数据,每一列表示一个时间点,第101列表示该传感器数据的类别。将加速度X轴传感器每一行数据切分成长度为40-60的子序列作为候选Shapelet,计算所产生的子序列的信息增益值,并根据信息增益的大小排序选出候选Shapelet中信息增益最大的200个形成KShapelet集。对于其他的传感器文件,做同样的操作,不断更新KShapelet集,使得KShapelet集中始终保持200个Shapelet。再将这200个Shapelet进行聚类操作,最终得到含有130个Shapelet的SShapelet集。
步骤二,将所加载的12个传感器数据文件中的行号相同的行组成一个myInstance,如:将加速度X轴传感器数据文件的第一行,加速度Y轴传感器数据文件的第一行,加速度传感器Z轴数据文件第一行等放在同一个数组中,作为一个myInstance。由于传感器数据文件含有1000行,所以最终形成含有1000个myInstance的myInstance集。
步骤三,步骤一中得到的SShapelet集与步骤二中得到的myInstance集计算距离,得到相似性矩阵,该相似性矩阵可以视为由原始时间序列训练集转换的新的训练集,作为机器学习分类算法的输入特征。得到相似性矩阵的过程如图1所示。由于Shapelet集中的第一个Shapelet来自于加速度传感器Y轴数据,所以相似性矩阵第一行第一列位置的元素大小应为第一个Shapelet与第一个myInstance中的加速度传感器Y轴的时间序列的距离。相似性矩阵第一行第二列位置的元素大小应为第二个Shapelet与第一个myInstance中的加速度传感器Z轴的时间序列的距离。矩阵中其他元素的计算过程同理。
步骤四,该过程与传统的机器学习分类方法相同。整个训练过程的示意图如图2所示,该发明所提出的方法在三个公开的活动识别数据集PAMAP indoor,PAMAP outdoor,SmartPhoneWrist上的识别结果分别如图3,图4,图5所示。
可以载入各种人类活动传感器数据文件,通过测试,本发明和之前的方法相比,可以使用更少的训练数据产生更高的准确率。

Claims (2)

1.一种基于Shapelet的多传感器融合的活动识别方法,其特征在于,将所有传感器信息组成一个分类器,包括如下步骤:
第一步,对多维时间序列的每一维提取Shapelet
将传感器采集到的活动数据集分为两部分:训练集和测试集,对训练集中的多维时间序列的每一维,产生所有长度为minLen到maxLen的候选Shapelet集,计算出每一个候选Shapelet的信息增益值,并将Shapelet按照信息增益值的大小进行排序,同时,移除掉自相似的Shapelet,所述自相似的Shapelet为来自同一条时间序列且具有重叠的Shapelet;从移除自相似后的Shapelet中选取出信息值最大的K个Shapelet组成KShapelets集;从训练集的每一维中提取出的Shapelet都要加入到Kshapelets集中,不断更新KShapelets集,使得KShapelets中始终保存着当前最好的K个Shapelet;
从训练集中提取出了KShapelets后,将KShapelets进行聚类操作,得到含有S个Shapelet的SShapelets集,即为所有传感器产生的Shapelet的一个融合;
第二步,建立myInstance集
myInstance集是由相同时间间隔内各个传感器的数据及所属的类别组成,将不同传感器文件中行号相同的时间序列及这一组时间序列的标签组合在一起,每个传感器文件中有n条时间序列,则最终产生n个myInstance,形成myInstance集;
第三步,计算相似性矩阵
相似性矩阵是通过SShapelets集与myInstance集计算距离得到的一个新的数据集,新的数据集以矩阵的形式体现;SShapelets中的每一个Shapelet来自多维时间序列中的一维,myInstance集中的一个myInstance是多维的时间序列,多维的myInstance与一维的Shapelet计算距离的规则是:计算Shapelet与myInstance中与Shapelet同一维度的时间序列的距离;将Shapelet作为行,myInstance作为列,计算得出的距离作为矩阵中的元素,该矩阵称为相似性矩阵,将该相似性矩阵作为新的训练集;
第四步,训练模型及预测
对新的训练集使用机器学习分类算法进行训练,产生活动识别模型;将第一步中的测试集做第二步、第三步操作,得到测试集的相似性矩阵,将该相似性矩阵放入到活动识别模型中,模型自动给出预测结果。
2.根据权利要求1所述的基于Shapelet的多传感器融合的活动识别方法,其特征在于,第四步,所述的机器学习分类算法为随机森林、决策树、SVM或神经网络中的一种。
CN201811463074.3A 2018-12-03 2018-12-03 一种基于Shapelet的多传感器融合的活动识别方法 Pending CN109614904A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811463074.3A CN109614904A (zh) 2018-12-03 2018-12-03 一种基于Shapelet的多传感器融合的活动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811463074.3A CN109614904A (zh) 2018-12-03 2018-12-03 一种基于Shapelet的多传感器融合的活动识别方法

Publications (1)

Publication Number Publication Date
CN109614904A true CN109614904A (zh) 2019-04-12

Family

ID=66005689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811463074.3A Pending CN109614904A (zh) 2018-12-03 2018-12-03 一种基于Shapelet的多传感器融合的活动识别方法

Country Status (1)

Country Link
CN (1) CN109614904A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580595A (zh) * 2020-12-30 2021-03-30 江西省农业科学院农业工程研究所 一种基于Shapelet的双季稻田遥感识别方法
CN113254641A (zh) * 2021-05-27 2021-08-13 中国电子科技集团公司第十五研究所 一种情报数据融合方法与装置
CN113988161A (zh) * 2021-10-15 2022-01-28 贵州大学 一种用户用电行为模式识别方法
WO2022194322A1 (de) 2021-03-16 2022-09-22 Schaeffler Technologies AG & Co. KG Dünnblech und verfahren zum walzen von dünnblech für eine elektrochemische zelle
DE102022104250A1 (de) 2021-03-16 2022-09-22 Schaeffler Technologies AG & Co. KG Dünnblech und Verfahren zum Walzen von Dünnblech für eine elektrochemische Zelle
US11906658B2 (en) 2019-12-18 2024-02-20 Tata Consultancy Services Limited Systems and methods for shapelet decomposition based gesture recognition using radar

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235139A1 (en) * 2014-02-20 2015-08-20 Nec Laboratories America, Inc. Extracting interpretable features for classification of multivariate time series from physical systems
US9165255B1 (en) * 2012-07-26 2015-10-20 Google Inc. Automatic sequencing of video playlists based on mood classification of each video and video cluster transitions
CN106127229A (zh) * 2016-06-16 2016-11-16 南京大学 一种基于时间序列类别的计算机数据分类方法
CN108108766A (zh) * 2017-12-28 2018-06-01 东南大学 基于多传感器数据融合的驾驶行为识别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9165255B1 (en) * 2012-07-26 2015-10-20 Google Inc. Automatic sequencing of video playlists based on mood classification of each video and video cluster transitions
US20150235139A1 (en) * 2014-02-20 2015-08-20 Nec Laboratories America, Inc. Extracting interpretable features for classification of multivariate time series from physical systems
CN106127229A (zh) * 2016-06-16 2016-11-16 南京大学 一种基于时间序列类别的计算机数据分类方法
CN108108766A (zh) * 2017-12-28 2018-06-01 东南大学 基于多传感器数据融合的驾驶行为识别方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11906658B2 (en) 2019-12-18 2024-02-20 Tata Consultancy Services Limited Systems and methods for shapelet decomposition based gesture recognition using radar
CN112580595A (zh) * 2020-12-30 2021-03-30 江西省农业科学院农业工程研究所 一种基于Shapelet的双季稻田遥感识别方法
WO2022194322A1 (de) 2021-03-16 2022-09-22 Schaeffler Technologies AG & Co. KG Dünnblech und verfahren zum walzen von dünnblech für eine elektrochemische zelle
DE102022104250A1 (de) 2021-03-16 2022-09-22 Schaeffler Technologies AG & Co. KG Dünnblech und Verfahren zum Walzen von Dünnblech für eine elektrochemische Zelle
CN113254641A (zh) * 2021-05-27 2021-08-13 中国电子科技集团公司第十五研究所 一种情报数据融合方法与装置
CN113988161A (zh) * 2021-10-15 2022-01-28 贵州大学 一种用户用电行为模式识别方法

Similar Documents

Publication Publication Date Title
CN109614904A (zh) 一种基于Shapelet的多传感器融合的活动识别方法
Liu et al. Time series classification with multivariate convolutional neural network
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN101561868B (zh) 基于高斯特征的人体运动情感识别方法
CN103714261B (zh) 二阶段混合模型的智能辅助医疗决策支持方法
CN104931960B (zh) 动向报文与雷达目标态势信息全航迹段数据关联方法
CN110472665A (zh) 模型训练方法、文本分类方法及相关装置
CN109612513A (zh) 一种面向大规模高维传感器数据的在线式异常检测方法
CN108597601A (zh) 基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法
CN110197235B (zh) 一种基于独特性注意力机制的人体活动识别方法
Patra et al. Integration of FCM, PCA and neural networks for classification of ECG arrhythmias
CN110225055A (zh) 一种基于knn半监督学习模型的网络流量异常检测方法与系统
CN103955680B (zh) 基于形状上下文的动作识别方法及装置
Kadam et al. Machine learning methode for automatic potato disease detection
CN110390565A (zh) 通过ai边缘计算实现智能网关自适应管理的方法及系统
Kumar et al. Advanced prediction of performance of a student in an university using machine learning techniques
US11410055B2 (en) Learning of a feature based on betti sequences obtained from time series data
CN108398266A (zh) 一种基于集成迁移学习的轴承故障诊断方法
CN101957889A (zh) 一种基于选择性磨损的设备最优维修时间预测方法
CN105425150A (zh) 一种基于rbf和pca-svdd的电机故障诊断方法
CN108762503A (zh) 一种基于多模态数据采集的人机交互系统
CN106264545B (zh) 步伐识别方法及装置
CN106529470A (zh) 一种基于多级深度卷积神经网络的手势识别方法
CN109840466A (zh) 基于聚类及全局/局部距离综合的多重度量学习方法
Souza et al. Unsupervised drift detection on high-speed data streams

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20230721

AD01 Patent right deemed abandoned