CN111401507A - 一种自适应决策树跌倒检测方法及系统 - Google Patents

一种自适应决策树跌倒检测方法及系统 Download PDF

Info

Publication number
CN111401507A
CN111401507A CN202010171028.7A CN202010171028A CN111401507A CN 111401507 A CN111401507 A CN 111401507A CN 202010171028 A CN202010171028 A CN 202010171028A CN 111401507 A CN111401507 A CN 111401507A
Authority
CN
China
Prior art keywords
decision tree
falling
features
training
fall detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010171028.7A
Other languages
English (en)
Other versions
CN111401507B (zh
Inventor
刘超
孔志强
孔繁星
向永红
赵统旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datong Gongyuan Sanjiuba Smart Aged Service Co ltd
Original Assignee
Datong Gongyuan Sanjiuba Smart Aged Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datong Gongyuan Sanjiuba Smart Aged Service Co ltd filed Critical Datong Gongyuan Sanjiuba Smart Aged Service Co ltd
Priority to CN202010171028.7A priority Critical patent/CN111401507B/zh
Publication of CN111401507A publication Critical patent/CN111401507A/zh
Application granted granted Critical
Publication of CN111401507B publication Critical patent/CN111401507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/04Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons
    • G08B21/0407Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons based on behaviour analysis
    • G08B21/043Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons based on behaviour analysis detecting an emergency event, e.g. a fall
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/04Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons
    • G08B21/0438Sensor means for detecting
    • G08B21/0446Sensor means for detecting worn on the body to detect changes of posture, e.g. a fall, inclination, acceleration, gait
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/04Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons
    • G08B21/0438Sensor means for detecting
    • G08B21/0492Sensor dual technology, i.e. two or more technologies collaborate to extract unsafe condition, e.g. video tracking and RFID tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Gerontology & Geriatric Medicine (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Social Psychology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自适应决策树跌倒检测方法及系统,属于人体行为识别判断技术领域。该方法包括以下步骤:步骤1:获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度数据并筛选;步骤2:计算合加速度及合角加速度并划分训练集、测试集和验证集代入TSFRESH库计算特征,筛选删除无用特征;步骤3:利用随机森林筛选择初步重要特征;步骤4:建立决策树模型进行训练和验证,并测试结果;步骤5:继续获取新的样本,重复以上步骤2至步骤4,更新决策树模型。本发明能够通过计算量较小的决策树算法,得到准确的跌倒判断结果;且在收集到一定数量的样本后,通过更新决策树模型,能够进一步提升算法的判断精度。

Description

一种自适应决策树跌倒检测方法及系统
技术领域
本发明属于人体行为识别判断技术领域,尤其是涉及一种自适应决策树跌倒检测方法及系统。
背景技术
老龄化严重,老人不慎跌倒的情况越来越多,特别是老人独处时,跌倒后无法报警,无人知晓,会错过最佳救援时机。研制一款能随身携带的可穿戴设备,能自动检测老人是否发生跌倒,并自动报警的设备势在必行。
目前有较多类似设备,但因为存在设备误报率太高,用户难以接受的问题,所以基本无法推广。由于可穿戴设备都是基于嵌入式计算模块,计算能力有限,很难采用复杂的机器学习或者深度学习等准确度较高的跌倒动作识别算法。计算复杂度稍低点的机器学习算法同样具有跌倒检测准确率难以达到实际推广应用的要求。要提高跌倒判断的精度,就需要采用更好的算法,在确保设备正常运行,用户方便使用的前提下,尽量采用性能高的计算芯,使之能运行计算量较小的机器学习算法,比如决策树算法。跌倒检测的另一个困难是跌倒样本收集,很难收集到真实跌倒样本。因此需要有一种方法,在收集到一定数量的样本后,尽快更新决策树模型,提升算法的判断精度。
发明内容
有鉴于此,本发明旨在提出一种自适应决策树跌倒检测方法及系统,能够通过计算量较小的决策树算法,得到准确的跌倒判断结果;且在收集到一定数量的样本后,通过更新决策树模型,能够进一步提升算法的判断精度。
根据本发明的第一方面,提供了一种自适应决策树跌倒检测方法,包括以下步骤:
步骤1:获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度,对其进行筛选得到可用样本;
步骤2:将可用样本及利用可用样本计算出的合加速度和合角速度作为样本集,将所述样本集划分为训练集、测试集和验证集并带入TSFRESH进行计算,得到初步可用特征,并获得初步可用特征对应的训练集特征数据、测试集特征数据和验证集特征数据;
步骤3:利用初步可用特征构建随机森林模型,使用所述训练集特征数据对模型进行训练,并根据特征重要性评分对初步可用特征进行筛选,确定初步重要特征;
步骤4:基于初步重要特征建立决策树模型,利用所述训练集特征数据对决策树模型进行训练,并利用所述验证集特征数据对训练后的决策树模型进行跌倒检测验证,根据验证结果继续调整决策树模型,得到最优决策树模型,最后用所述测试集特征数据对最优决策树模型进行测试得到测试结果;
步骤5:继续获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度并经筛选后得到新的可用样本,重复以上步骤2至步骤4,得到新的最优决策树模型及对应的测试结果,根据测试结果比较完成最优决策树模型的优化。
进一步的,利用可用样本计算出的合加速度和合角速度具体包括:
Figure BDA0002409186510000021
Figure BDA0002409186510000022
其中,Ax,Ay,Az为三轴加速度,Gx,Gy,Gz为三轴角速度,cA为合加速度,cG为合角速度。
进一步的,在所述步骤1和步骤5中,获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度具体包括:从自收集样本集中和公开样本集中获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度。
进一步的,所述自收集样本集为通过人体佩戴传感器执行模拟跌倒和非跌倒动作获得的三轴加速度和三轴角速度,所述公开样本集为SisFall公开数据集。
进一步的,在所述步骤1和步骤5中获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度后的筛选操作具体包括:从获取的跌倒和非跌倒动作的三轴加速度和三轴角速度中删除传输过程中部分数据丢失导致不完整的样本,取剩余样本中跌倒时与地面碰撞瞬间前后一段时间内的数据作为可用样本。
进一步的,所述跌倒时与地面碰撞瞬间前后一段时间内的数据具体包括:跌倒时与地面碰撞瞬间前一秒和后四秒的样本。
进一步的,在所述步骤2中,初步可用特征指从TSFRESH的全部特征中剔除计算结果中值全为0或1的以及计算时间过长的特征后的剩余特征。
进一步的,所述计算时间过长的特征具体为计算时间超过20ms的特征。
进一步的,所述步骤3具体包括:
步骤31:利用初步可用特征建立随机森林模型,使用所述训练集特征数据对随机森林模型进行训练并对随机森林模型中的初步可用特征按照特征重要性评分降序排序;
步骤32:从排序后的初步可用特征中剔除一定比例分值较低的初步可用特征,得到新的初步可用特征;
步骤33:重复以上步骤,直到剩下所需数量的初步可用特征作为初步重要特征。
进一步的,所述剔除的比例为50%。
进一步的,当剔除后剩余的初步可用特征数量小于所需数量时,按照特征重要性评分从高往低从剔除前的初步可用特征中取出所需数量的初步可用特征作为初步重要特征。
进一步的,特征重要性评分通过基尼指数或袋外数据计算。
进一步的,在所述步骤4中,利用所述样本集特征数据对决策树模型进行训练具体包括:通过训练获取模型参数,以及对决策树模型进行剪枝操作。
进一步的,所述剪枝操作为后剪枝中的悲观剪枝。
进一步的,所述训练集、所述测试集和所述验证集的样本数量比例为6:2:2。
根据本发明的第二方面,提供了一种跌倒检测系统,其特征在于,包括:
处理器和用于存储可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令,以执行如本发明的第一方面所述的自适应决策树跌倒检测方法。
根据本发明的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明的第一方面所述的自适应决策树跌倒检测方法。
相对于现有技术,本发明所述的一种自适应决策树跌倒检测方法及系统具有以下优势:
(1)计算量小且精准度高:本发明通过计算量较小的决策树算法,得到准确的跌倒判断结果。
(2)能够持续更新优化:本发明提出一个可以持续更新优化决策树模型的流程。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述的自适应决策树跌倒检测方法的流程图;
图2为本发明实施例所述的自适应决策树跌倒检测方法特征筛选步骤示意图;
图3为本发明实施例所述的TSFRESH特征列表平均运行时间。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
多个,包括两个或者两个以上。
和/或,应当理解,对于本公开中使用的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
如图1所示,根据本发明的自适应决策树跌倒检测方法,包括以下步骤:
步骤1:从自收集样本集中和公开样本集中获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度,从获取的跌倒和非跌倒动作的三轴加速度和三轴角速度中删除传输过程中部分数据丢失导致不完整的样本,取剩余样本中跌倒时与地面碰撞瞬间前后一段时间内的数据作为可用样本;将可用样本及利用可用样本计算出的合加速度和合角速度作为样本集,将所述样本集划分为训练集、测试集和验证集,所述训练集、所述测试集和所述验证集的样本数量比例为6:2:2;
步骤2:将所述训练集、测试集和验证集带入TSFRESH进行计算,去除计算结果中值全为0或1的特征,以及参照图3计算时间超过20ms的特征,得到初步可用特征,并获得初步可用特征对应的训练集特征数据、测试集特征数据和验证集特征数据;
步骤3:如图2所示,利用初步可用特征建立随机森林模型,使用所述训练集特征数据对随机森林模型进行训练并对随机森林模型中的初步可用特征按照特征重要性评分降序排序;
从排序后的初步可用特征中剔除50%分值较低的初步可用特征,得到新的初步可用特征;
当剔除后剩余的初步可用特征数量小于所需数量时,按照特征重要性评分从高往低从剔除前的初步可用特征中取出所需数量的初步可用特征作为初步重要特征。
重复以上步骤,直到剩下所需数量的初步可用特征作为初步重要特征;
步骤4:基于初步重要特征建立决策树模型,利用所述训练集特征数据对决策树模型进行训练获取模型参数,以及对决策树模型进行剪枝操作,并利用所述验证集特征数据对训练后的决策树模型进行跌倒检测验证,根据验证结果继续调整决策树模型,得到最优决策树模型,最后用所述测试集特征数据对最优决策树模型进行测试得到测试结果;
步骤5:继续获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度并经筛选后得到新的可用样本,重复以上步骤2至步骤4,得到新的最优决策树模型及对应的测试结果,根据测试结果比较完成最优决策树模型的优化。
实施例
(一)数据获取
跌倒检测设备采用MPU6050作为姿态传感器收集佩戴者的三轴加速度和三轴角速度数据。数据通过WiFi模块传输至本地电脑或者通过SIM卡模块传输至网络服务器。该跌倒检测设备方便携带,有扣可以挂裤腰带上,也可以别在口袋或者衣服上。
一般情况下,跌倒动作持续的时间不会超过0.5秒,同时考虑到如果佩戴者发生意外跌倒,会保持基本静止的状态,因此收集跌倒动作前1秒和后4秒的数据作为样本。数据采样率为100Hz,即每秒钟采集100条三轴加速度和三轴角速度数据。跌倒动作本身是一种具有较大危险性的动作,很可能会对人造成伤害。因此,往往采用模拟跌倒的方式收集数据,即在地上垫上软垫子,通过人跌倒在垫子上来模拟真实跌倒。
为获取更加全面的数据,根据老人的特点,设计了24个更加契合老人跌倒的动作
Figure BDA0002409186510000071
Figure BDA0002409186510000081
通过多次收集样本,最终获取了3650个样本,包括3275个正样本(跌倒样本),375个负样本(非跌倒样本)。为了确保数据的多样性,增加了SisFall公开数据集的数据。该数据集包含正(跌倒)样本1798个,负样本2712个。
(二)数据清洗和处理
收集到的数据被保存为csv格式的文件,一个文件对应一个人执行一次跌倒动作,文件根据一定的规则命名,具有唯一性,文件名包含动作执行人、执行日期时间、动作名称和执行次数等信息。首先检查是否在传输过程中有部分数据丢失,导致样本数据不完整的情况。如果数据没有丢失,则定位并提取跌倒时与地面碰撞瞬间前1秒和后4秒的数据作为算法用样本。
利用样本中的三轴加速度Ax,Ay,Az和三轴角速度Gx,Gy,Gz传感器数据,计算出的合加速度cA和合角速度cG,合加速度cA和合角速度cG的计算公式如下:
Figure BDA0002409186510000082
Figure BDA0002409186510000083
其中60%的样本作为训练集应用于使用随机森林进行特征重要性排序,20%的样本作为测试集用来完成对决策树的训练,20%的样本作为验证集用来最终验证决策树性能。
(三)特征初步选择
TSFRESH是开源的提取时序数据特征的python包,能够提取出超过4000种特征。将所述三轴加速度Ax,Ay,Az、所述三轴角速度Gx,Gy,Gz及所述合加速度cA和所述合角速度cG分别命名为:x_a,y_a,z_a,x_g,y_g,z_g,total_ac,total_gc,并代入Python的TSFRESH库,TSFRESH库计算了65个特征,这些特征可以应用到8列数据的每一列,由于部分特征还可以设置不同的参数,最终TSFRESH为每轴数据计算了794个特征,8轴数据一共有6352个特征。这么多特征,重要性和有效性都有较大区别。比如,对于某一个跌倒样本,借助TSFRESH计算得到列cA的特征“ca__large_standard_deviation__r_0.5”的值全为0,特征“ca__symmetry_looking__r_0.05”的值全为1,都无法作为有效特征。
同时TSFRESH给出的部分特征计算量非常大,不适合作为计算资源受限的设备端决策树算法的特征,因此,从单轴的794个特征中手动去掉了这些特征。参照图3,考虑到嵌入式设备计算能力限制,将计算时间超过20ms的特征全部去掉,这些特征包括:agg_linear_trend,approximate_entropy,augmented_dickey_fuller,change_quantile,friedrich_coefficient,has_duplicate_max,has_duplicate_min,large_standard_deviation,max_langevin_fixed_point,number_cwt_peaks,number_peaks,ratio_beyond_r_sigma,sample_entropy。所有这些特征及其带不同参数的特征去掉以后,单轴特征还剩余184个,8个轴一共还有1472个特征。
所选嵌入式设备计算模块的基本计算资源如下:
处理器:32-bit ARM7EJ-STM RISC 260MHz。
内存:OpenCPU模块构建在4MB闪存和4MB内存之上。系统有320KB的空间可用于存放用户应用代码镜像文件,100KB静态内存空间和500KB动态内存空间,120KB用户文件系统空间。
(四)利用随机森林筛选择重要特征
一个数据集中往往有成百上千个特征,可以用随机森林算法来进行特征筛选,选择对结果影响最大的少量特征,以减少建立模型时特征数,降低模型复杂度。用随机森林算法进行特征重要性评估的思想,就是计算每个特征在随机森林中的每棵树上做出的贡献,取这些贡献的平均值,然后根据平均值大小确定特征的重要性。贡献大小通常使用基尼指数或者袋外数据(OOB)作为衡量指标。
对于使用基尼指数的情况,将特征重要性评分(Variable Importance Measures)用VIM来表示,将基尼指数用GI来表示。选定一个特征a,统计随机森林的每一棵树中,由a形成的分支节点的基尼指数下降程度(或不纯度下降程度)之和,这就是a的重要性。假设有C个特征X1,X2,…,XC,计算每个特征Xj的基尼指数评分
Figure BDA0002409186510000101
亦即第j个特征在随机森林所有决策树中节点分裂不纯度的平均改变量。由基尼指数的计算公式可知:
Figure BDA0002409186510000102
其中K表示类别个数,pmi表示节点m中的重要性,即节点m分枝前后的基尼指数变化量为:
Figure BDA0002409186510000103
其中GIl和GIr分别表示分枝后两个新节点的基尼指数。如果特征Xj在决策树i中出现的节点在集合M中,那么Xj在第i棵树的重要性为
Figure BDA0002409186510000104
假设随机森立中共有n棵树,那么
Figure BDA0002409186510000111
最后,把所有求得的重要性评分做一个归一化处理即可。
Figure BDA0002409186510000112
将归一化后的评分进行从高到低的排序,即得到特征重要性从高到低的排序。
对于使用袋外数据,选定一个特征a,在所有袋外数据样本的特征特征a上人为添加噪声,再测试模型在袋外数据上的判断精确率,精确率相比没有噪声时下降了多少,就表示该特征有多重要。计算步骤如下:
1)对每一颗决策树,选择相应的袋外数据,计算袋外数据误差,记为
Figure BDA0002409186510000113
所谓袋外数据是指,每次建立决策树时,通过重复抽样得到一个数据用于训练决策树,这时还有大约1/3的数据没有被利用,没有参与决策树的建立。这部分数据可以用于对决策树的性能进行评估,计算模型的预测错误率,称为袋外数据误差。这已经经过证明是无偏估计的,所以在随机森林算法中无需再进行交叉验证或者单独的测试集来获取测试集误差的无偏估计。
2)随机对袋外数据所有样本的特征Xj加入噪声干扰(可以随机改变样本在特征Xj处的值),再次计算袋外数据误差,记为
Figure BDA0002409186510000114
3)假设森林中有n棵树,则特征Xj的重要性
Figure BDA0002409186510000115
如果加入随机噪声后,袋外数据准确率大幅度下降(即
Figure BDA0002409186510000116
大幅度上升),说明这个特征对于样本的预测结果有很大影响,进而说明其重要程度比较高。
如果决定从所有特征中选择r个特征,可按照如下步骤进行:
1)用所选择的特征集建立随机森林。
2)对随机森林中的特征变量按照VIM降序排序。
3)确定删除比例,从当前的特征变量中剔除相应比例不重要的指标,从而得到一个新的特征集。
4)重复以上步骤,直到剩下r个特征。
在步骤1)中,最初使用所有的特征作为特征集建立随机森林。由于特征数比较多,一般在步骤3)中,每次删除比例可以设定为50%,且当剔除后剩余的初步可用特征数量小于所需数量时,按照特征重要性评分从高往低从剔除前的初步可用特征中取出所需数量的初步可用特征作为初步重要特征。
在本发明中,
首先构建随机森林模型:
tree=RandomForestClassifier(n_estimators=178,n_jobs=12,oob_score=True)
导入数据,对模型进行训练:
tree.fit(X_train.loc[:,useful_columns],y_train)
然后保存模型:
joblib.dump(tree,'./rfc.pkl')
将所有样本都作为训练样本进行训练,得到特征重要性评分的值,根据该值从大到小排序取靠前的特征作为决策树的特征。为了确保所选择的特征具有更好的代表性,模型中不设置random_state的值,系统每次都会自动给random_state一个随机值,即每次选择的特征集不一样,这样经过多次重复上述过程,每次得到特征重要性的排序,然后根据统计结果得到最终特征重要性的排序。
数据集设计包含3轴加速度和3轴角速度数据,以及合加速度和合角速度数据,一共8列,分别命名为:x_a,y_a,z_a,x_g,y_g,z_g,total_ac,total_gc。基于TSFRESH库,筛选出来10条最重要的特征:
(1)total_ac__c3__lag_2
(2)total_ac__quantile__q_0.1
(3)total_gc__quantile__q_0.6
(4)total_gc__median
(5)total_ac__standard_deviation
(6)total_ac__abs_energy
(7)total_ac__skewness
(8)y_g__quantile__q_0.2
(9)y_g__c3__lag_3
(10)x_a__standard_deviation
(五)决策树训练
通过对10个所选取的特征构建决策树,并对通过训练获取模型参数,以及对决策树模型进行悲观剪枝操作,得到最优决策树模型。这里提到的模型参数,实际上是指决策树的判断规则。最终决策树算法用到了8个特征,得到的决策树模型结果为:准确率97.8%,精确率98.4%,灵敏度98.9%,特异度92.1%。
所用到的八个特征按重要性由高到低排序为:
(1)total_ac__c3__lag_2
(2)x_a__standard_deviation
(3)total_gc__quantile__q_06
(4)total_ac__quantile__q_01
(5)total_gc__median
(6)y_g__c3__lag_3
(7)y_g__quantile__q_02
(8)total_ac__skewness
由此完成决策树特征的选择。通过上述方式得到的特征,所建立的决策树模型具有非常高的精确度。经过多次验证,算法具有较好的稳定性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种自适应决策树跌倒检测方法,其特征在于,所述方法用于人体行为识别,具体包括以下步骤:
步骤1:获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度,对其进行筛选得到可用样本;
步骤2:将可用样本及利用可用样本计算出的合加速度和合角速度作为样本集带入TSFRESH进行计算,得到初步可用特征,并获得初步可用特征对应的样本集特征数据;
步骤3:利用初步可用特征构建随机森林模型,使用样本集特征数据对模型进行训练,并根据特征重要性评分对初步可用特征进行筛选,确定初步重要特征;
步骤4:基于初步重要特征建立决策树模型,利用样本集特征数据对决策树模型分别进行训练及跌倒检测验证,根据验证结果继续调整决策树模型得到最优决策树模型,对最优决策树模型进行测试得到测试结果;
步骤5:继续获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度并经筛选后得到新的可用样本,重复以上步骤2至步骤4,得到新的最优决策树模型及对应的测试结果,根据测试结果比较完成最优决策树模型的优化。
2.根据权利要求1所述的一种自适应决策树跌倒检测方法,其特征在于,在所述步骤1和步骤5中,获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度具体包括:从自收集样本集中和公开样本集中获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度。
3.根据权利要求1所述的一种自适应决策树跌倒检测方法,其特征在于,在所述步骤1和步骤5中获取人体跌倒和非跌倒动作的三轴加速度和三轴角速度后的筛选操作具体包括:从获取的跌倒和非跌倒动作的三轴加速度和三轴角速度中删除传输过程中部分数据丢失导致不完整的样本,取剩余样本中跌倒时与地面碰撞瞬间前后一段时间内的数据作为可用样本。
4.根据权利要求1所述的一种自适应决策树跌倒检测方法,其特征在于,所述步骤3具体包括:
步骤31:利用初步可用特征建立随机森林模型,使用所述样本集特征数据对随机森林模型进行训练并对随机森林模型中的初步可用特征按照特征重要性评分降序排序;
步骤32:从排序后的初步可用特征中剔除一定比例分值较低的初步可用特征,得到新的初步可用特征;
步骤33:重复以上步骤,直到剩下所需数量的初步可用特征作为初步重要特征。
5.根据权利要求4所述的一种自适应决策树跌倒检测方法,其特征在于,特征重要性评分通过基尼指数或袋外数据进行计算。
6.根据权利要求1所述的一种自适应决策树跌倒检测方法,其特征在于,在所述步骤4中,利用所述样本集特征数据对决策树模型进行训练具体包括:通过训练获取模型参数,以及对决策树模型进行剪枝操作。
7.根据权利要求1所述的一种自适应决策树跌倒检测方法,其特征在于,所述样本集分为训练集、验证集和测试集,所述样本集特征数据包括与所述训练集、所述验证集和所述测试集分别对应的训练集特征数据、验证集特征数据和测试集特征数据。
8.根据权利要求7所述的一种自适应决策树跌倒检测方法,其特征在于,所述训练集特征数据用于所述步骤3中对随机森林模型进行训练及所述步骤4中对决策树模型进行训练,所述验证集特征数据用于所述步骤4中对跌倒检测进行验证,所述测试集特征数据用于所述步骤4中对最优决策树模型进行测试。
9.一种跌倒检测系统,其特征在于,包括:
处理器和用于存储可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令,以执行如权利要求1至8中任一项所述的自适应决策树跌倒检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的自适应决策树跌倒检测方法。
CN202010171028.7A 2020-03-12 2020-03-12 一种自适应决策树跌倒检测方法及系统 Active CN111401507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010171028.7A CN111401507B (zh) 2020-03-12 2020-03-12 一种自适应决策树跌倒检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010171028.7A CN111401507B (zh) 2020-03-12 2020-03-12 一种自适应决策树跌倒检测方法及系统

Publications (2)

Publication Number Publication Date
CN111401507A true CN111401507A (zh) 2020-07-10
CN111401507B CN111401507B (zh) 2021-01-26

Family

ID=71432386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010171028.7A Active CN111401507B (zh) 2020-03-12 2020-03-12 一种自适应决策树跌倒检测方法及系统

Country Status (1)

Country Link
CN (1) CN111401507B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070154A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据处理方法和装置
CN112070155A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据标注方法和装置
CN112699744A (zh) * 2020-12-16 2021-04-23 南开大学 跌倒姿态的分类识别方法、装置和可穿戴设备
CN115054237A (zh) * 2022-08-16 2022-09-16 武汉理工大学 基于决策树模型的实时跌倒预测及助力恢复方法
CN116028885A (zh) * 2023-02-14 2023-04-28 华南师范大学 基于信道状态信息的跌倒检测方法、系统、设备及介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915679A (zh) * 2015-05-26 2015-09-16 浪潮电子信息产业股份有限公司 一种基于随机森林加权距离的大规模高维数据分类方法
CN106652343A (zh) * 2016-12-16 2017-05-10 合肥寰景信息技术有限公司 一种基于视频监控的人体摔倒识别与预警系统
CN106910314A (zh) * 2017-02-03 2017-06-30 同济大学 一种基于体形的个性化跌倒检测方法
CN108230618A (zh) * 2017-12-21 2018-06-29 北京工业大学 一种面向社区基于ZigBee的低功耗跌倒检测系统
US10055961B1 (en) * 2017-07-10 2018-08-21 Careview Communications, Inc. Surveillance system and method for predicting patient falls using motion feature patterns
CN108509897A (zh) * 2018-03-29 2018-09-07 同济大学 一种人体姿态识别方法和系统
CN108717548A (zh) * 2018-04-10 2018-10-30 中国科学院计算技术研究所 一种面向传感器动态增加的行为识别模型更新方法及系统
CN108830252A (zh) * 2018-06-26 2018-11-16 哈尔滨工业大学 一种融合全局时空特征的卷积神经网络人体动作识别方法
CN109522876A (zh) * 2018-12-13 2019-03-26 北京交通大学 基于bp神经网络的地铁站楼扶梯选择预测方法及系统
CN109685111A (zh) * 2018-11-26 2019-04-26 深圳先进技术研究院 动作识别方法、计算系统、智能设备及存储介质
CN110222708A (zh) * 2019-04-29 2019-09-10 中国科学院计算技术研究所 一种基于集成决策树的跌倒检测方法和系统
CN110647456A (zh) * 2019-09-29 2020-01-03 苏州浪潮智能科技有限公司 一种存储设备的故障预测方法、系统及相关装置
CN110659595A (zh) * 2019-09-10 2020-01-07 电子科技大学 一种基于特征分类的跌倒类型及伤害部位检测方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915679A (zh) * 2015-05-26 2015-09-16 浪潮电子信息产业股份有限公司 一种基于随机森林加权距离的大规模高维数据分类方法
CN106652343A (zh) * 2016-12-16 2017-05-10 合肥寰景信息技术有限公司 一种基于视频监控的人体摔倒识别与预警系统
CN106910314A (zh) * 2017-02-03 2017-06-30 同济大学 一种基于体形的个性化跌倒检测方法
US10055961B1 (en) * 2017-07-10 2018-08-21 Careview Communications, Inc. Surveillance system and method for predicting patient falls using motion feature patterns
CN108230618A (zh) * 2017-12-21 2018-06-29 北京工业大学 一种面向社区基于ZigBee的低功耗跌倒检测系统
CN108509897A (zh) * 2018-03-29 2018-09-07 同济大学 一种人体姿态识别方法和系统
CN108717548A (zh) * 2018-04-10 2018-10-30 中国科学院计算技术研究所 一种面向传感器动态增加的行为识别模型更新方法及系统
CN108830252A (zh) * 2018-06-26 2018-11-16 哈尔滨工业大学 一种融合全局时空特征的卷积神经网络人体动作识别方法
CN109685111A (zh) * 2018-11-26 2019-04-26 深圳先进技术研究院 动作识别方法、计算系统、智能设备及存储介质
CN109522876A (zh) * 2018-12-13 2019-03-26 北京交通大学 基于bp神经网络的地铁站楼扶梯选择预测方法及系统
CN110222708A (zh) * 2019-04-29 2019-09-10 中国科学院计算技术研究所 一种基于集成决策树的跌倒检测方法和系统
CN110659595A (zh) * 2019-09-10 2020-01-07 电子科技大学 一种基于特征分类的跌倒类型及伤害部位检测方法
CN110647456A (zh) * 2019-09-29 2020-01-03 苏州浪潮智能科技有限公司 一种存储设备的故障预测方法、系统及相关装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070154A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据处理方法和装置
CN112070155A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据标注方法和装置
CN112699744A (zh) * 2020-12-16 2021-04-23 南开大学 跌倒姿态的分类识别方法、装置和可穿戴设备
CN115054237A (zh) * 2022-08-16 2022-09-16 武汉理工大学 基于决策树模型的实时跌倒预测及助力恢复方法
CN115054237B (zh) * 2022-08-16 2022-11-29 武汉理工大学 基于决策树模型的实时跌倒预测及助力恢复方法
CN116028885A (zh) * 2023-02-14 2023-04-28 华南师范大学 基于信道状态信息的跌倒检测方法、系统、设备及介质

Also Published As

Publication number Publication date
CN111401507B (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN111401507B (zh) 一种自适应决策树跌倒检测方法及系统
CN109766872B (zh) 图像识别方法和装置
CN112232476B (zh) 更新测试样本集的方法及装置
CN107462258B (zh) 一种基于手机三轴加速度传感器的计步方法
CN105184325A (zh) 一种人体动作识别方法和移动智能终端
CN105975959A (zh) 基于神经网络的人脸特征提取建模、人脸识别方法及装置
CN109063977B (zh) 一种无感式交易风险监测方法及装置
CN110782333B (zh) 一种设备风险控制方法、装置、设备及介质
CN109903053B (zh) 一种基于传感器数据进行行为识别的反欺诈方法
CN107767055A (zh) 一种基于串谋检测的众包结果汇聚方法及装置
CN111339165B (zh) 一种基于Fisher分和近似马尔科夫毯的移动用户出境特征选择方法
CN112107866A (zh) 用户行为数据处理方法、装置、设备及存储介质
CN110152290A (zh) 游戏运行方法和装置、存储介质及电子装置
CN108717548B (zh) 一种面向传感器动态增加的行为识别模型更新方法及系统
CN110096859A (zh) 用户验证方法、装置、计算机设备及计算机可读存储介质
CN111540375A (zh) 音频分离模型的训练方法、音频信号的分离方法及装置
CN107239897A (zh) 一种人格职业类型测试方法及系统
CN108875549A (zh) 图像识别方法、装置、系统及计算机存储介质
CN108681928A (zh) 一种智能广告投放方法
CN115798022A (zh) 一种基于特征提取的人工智能识别方法
CN110147493A (zh) 活跃因子的确定方法、装置、计算机设备及存储介质
CN111860598B (zh) 一种用于运动行为、关系识别的数据分析方法、电子设备
CN112463394A (zh) 基于大数据和云计算的数据筛选方法及云服务器
CN108399387A (zh) 用于识别目标群体的数据处理方法及装置
CN110180158B (zh) 一种跑步状态识别方法、系统及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant