CN117009876B - 基于人工智能的运动状态量评估方法 - Google Patents

基于人工智能的运动状态量评估方法 Download PDF

Info

Publication number
CN117009876B
CN117009876B CN202311279430.7A CN202311279430A CN117009876B CN 117009876 B CN117009876 B CN 117009876B CN 202311279430 A CN202311279430 A CN 202311279430A CN 117009876 B CN117009876 B CN 117009876B
Authority
CN
China
Prior art keywords
data
training
sample
weight
generator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311279430.7A
Other languages
English (en)
Other versions
CN117009876A (zh
Inventor
王旭业
杨龙晶
韩琦
侯雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun Guanghua University
Original Assignee
Changchun Guanghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun Guanghua University filed Critical Changchun Guanghua University
Priority to CN202311279430.7A priority Critical patent/CN117009876B/zh
Publication of CN117009876A publication Critical patent/CN117009876A/zh
Application granted granted Critical
Publication of CN117009876B publication Critical patent/CN117009876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于人工智能的运动状态量评估方法,属于健康数据处理领域,包括:(1)运动状态量评估数据采集,之后标注为五个等级;(2)数据预处理,包括缺失值处理,数据标准化,异常值处理,异常值检测;(3)训练数据扩充;(4)数据特征提取,包括初始化,计算损失和梯度,势垒建立,计算隧道损失概率,概率隧道决策,层间信息交换,权重更新,迭代;(5)训练分类器,包括初始化蜜源,搜索参数,动态调整KELM学习率,权重稀疏化,训练核极限学习机;(6)运动状态量评估。本发明使生成的数据更贴近实际应用,提高模型的泛化能力;有效避免神经网络训练过程中的局部最优问题,同时提高分类器的准确性、增加鲁棒性。

Description

基于人工智能的运动状态量评估方法
技术领域
本发明属于健康数据处理领域,具体涉及一种基于人工智能的运动状态量评估方法。
背景技术
在现代健康和体育科学中,对运动状态量的精确评估是至关重要的。这不仅能够为专业运动员提供个性化的训练方案,还能在康复医学和日常健康管理中发挥作用。然而,目前的运动状态量评估通常依赖于人为的观察或者一些非常基础的生理参数,如心率、血氧饱和度等。对于生理参数监测,使用各种传感器和设备,如心率带、智能手环、肌电图(EMG)等,来收集运动者在运动过程中的生理数据。传统机器学习方法,例如决策树、支持向量机(SVM)和随机森林等,用于分类和预测运动状态。近年来,深度神经网络,特别是卷积神经网络(CNN)和循环神经网络(RNN),在运动分类和状态评估方面得到了越来越多的应用。
CN202310412823.4提出一种基于压力传感器的踝泵运动监测与评估方法、设备及存储介质,方法包括:固定压力传感器,弹簧的一端与压力传感器连接,所述弹簧的另一端穿戴于患者的脚趾上,其中,压力传感器为电阻应变式压力传感器。通过弹簧形变,压力传感器获取患者进行踝泵运动的第一压力值,对压力传感器的输出灵敏度进行温度补偿,并校准第一压力值,得到第二压力值。根据第二压力值确认踝泵运动的运动状态,获取运动状态对应的运动时间,根据运动时间和第二压力值,判断运动状态是否有效。实现在低成本的基础上精确测量踝泵运动的压力值,且实时检测患者进行踝泵运动的有效性。克服现有技术中监测踝泵运动不能测量出踝泵运动力量值的缺点。CN202310223971.1提出一种基于人工智能的运动训练过程控制方法及系统,涉及人工智能技术领域,方法包括:将目标训练人员的生理状态信息与历史运动训练参数,输入运动训练管理模型进行运动分析,获得人员运动训练需求后运动训练专家组进行评估,并构建运动训练知识图谱,对人员运动训练方案集合中的各训练方案进行评估,获得训练方案评估特征值集合并对人员运动训练方案集合进行方案筛选,根据训练反馈指标对目标训练人员进行实时训练监测,对人员最优运动训练方案进行动态调整,解决了现有技术中对目标训练人员无法生成对应的最优运动训练方案,使得最终人员的训练效果不佳的技术问题,实现了运动训练的全流程、高效管理,提高训练人员的运动训练效果。CN202310841298.8提出一种骨质健康评估方法、装置及存储介质,属于健康状态评估技术领域,包括获取患者在第一运动状态、第二运动状态和第三运动状态下的生命体征数据;基于患者不同运动状态的生命体征数据,根据第一预测模型,预测患者在不同运动状态下骨折的粗略概率区间;获取患者的性别信息及关于性别的特征信息,根据第二预测模型,基于预测的粗略概率区间内确定精确概率区间;基于预测的患者骨折的精确概率区间,确定患者在不同运动状态下骨折的精确概率区间,提出运动指导意见。为了使骨质得到更健康的训练,提出运动指导意见,控制运动时间,使患者能安全地进行训练,增强体质。
分析总结发现,这些方法往往不能提供全面和精确的评估,还存在以下问题:
1、模型泛化性能差: 如果训练样本不够多样,那么模型的泛化能力可能会受限。2、模型参数陷入局部最优: 传统的梯度下降方法在参数优化时容易陷入局部最优解,这限制了模型的性能。3、梯度消失和爆炸问题: 传统神经网络在训练过程中可能会遇到梯度消失或梯度爆炸的问题,这些问题可能导致训练过程变得复杂和不稳定。4、分类器过拟合:许多传统的机器学习算法,特别是深度学习模型,在面对有限的训练样本时容易过拟合。5、局限性在于参数选择: 在一些传统模型中,参数选择通常需要大量的人工干预,这不仅耗时还可能影响模型性能。
发明内容
本发明的目的是提供一种基于人工智能的运动状态量评估方法,使生成的数据更贴近实际应用,提高模型的泛化能力;有效避免神经网络训练过程中的局部最优问题,同时提高分类器的准确性、增加鲁棒性。
本发明采取的技术方案是:
基于人工智能的运动状态量评估方法,首先建立运动状态量评估模型,其次,在模型中输入评估数据并对评估数据进行预处理,再将预处理后的数据输入到训练完成的特征提取模型中进行特征提取,然后将特征提取后的数据输入到分类模型中进行分类,分类结果为运动状态量评估等级,所述评估等级包括Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级,具体是:
Ⅰ级为基础水平,代表运动状态量较低,表示非常基础的运动者或者是初学者;Ⅱ级为初级水平,代表运动者具有一定的基础,但还需要在部分方面进行改进;Ⅲ级为中级水平,代表运动者在多数或所有评估指标上都达到了中等水平;Ⅳ级为高级水平,代表运动者在多数或所有评估指标上都表现出较高水平;Ⅴ级为精英水平,最高的评估等级,代表运动者在所有评估的生理和心理指标上都表现出极高的水平。
进一步的,所述运动状态量评估模型的建立包括以下步骤:
步骤一:运动状态量评估数据采集与标注
通过穿戴设备传感器从运动者采集生理参数数据,穿戴设备传感器能够实时地监测和记录运动者在运动过程中的生理参数数据,所述生理参数数据是特定运动时段或特定时间点的离散数据,或者是训练周期内的总结数据,所述生理参数数据的存储形式为json格式,在使用时通过Python语言进行读取;所述穿戴设备传感器包括心率监测仪、肌电传感器;
数据采集完成后,对所述生理参数数据进行标注,标注类别为运动状态量评估等级,所述评估等级包括Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级,具体是:
Ⅰ级为基础水平,代表运动状态量较低,表示非常基础的运动者或者是初学者(在各项生理和心理指标上通常都是基础或低于平均水平);
Ⅱ级为初级水平,代表运动者具有一定的基础,但还需要在部分方面进行改进(在一些指标上可能达到或超过平均水平,但在其他方面仍然有待提升);
Ⅲ级为中级水平,代表运动者在多数或所有评估指标上都达到了中等水平(通常是多数常规运动者或健身爱好者所处的水平);
Ⅳ级为高级水平,代表运动者在多数或所有评估指标上都表现出较高水平(通常是专业运动员或者是非常资深的健身爱好者);
Ⅴ级为精英水平,最高的评估等级,代表运动者在所有评估的生理和心理指标上都表现出极高的水平(通常是顶级的专业运动员或者是在某一特定运动领域具有高度成就的人);
对所述生理参数数据标注完成后,得到运动状态量评估训练数据集;
步骤二:数据预处理
(对所述运动状态量评估训练数据集进行数据预处理,以提高训练数据集质量,进而提高模型训练效果)。
S21,进行缺失值处理:设所述运动状态量评估训练数据集为数据矩阵其中,表示运动状态量评估训练数据集中第/>个样本的第/>个特征,若/>有缺失,则填补缺失值的方式可以表示为:
,
其中,是总样本数;
S22,进行数据标准化:设所述运动状态量评估训练数据集中的一个特征向量,其标准化定义如下:
,
其中,是标准化之前的特征,/>是特征/>的均值,/>是特征/>的标准差,/>是标准化结果;
S23,进行异常值处理:利用IQR(四分位距)来识别和处理异常值;对于一个特征,首先计算其Q1(25%分位数)和Q3(75%分位数);然后,计算IQR,计算方式为:
,
其中,Q1表示第一四分位数,指数据集中所有数值从小到大排列后的第25%的位置的数字;Q3表示第三四分位数,指数据集中所有数值从小到大排列后的第75%的位置的数字;IQR表示四分位数范围,指数据集的中间50%的范围,也可以理解为数据的离散程度或分布的幅度,即,在范围之外的任何值都被认为是异常值,选择删除这些异常值;
S24,采用基于局部密度的异常值检测方法,为每个数据点(数据点,即在数据的特征空间中,数据所在的位置)定义一个局部密度值,然后根据数据点其邻居的密度进行比较,表示为:
,
其中,为样本/>的局部密度,/>是/>个样本的标准差;若低于预设的阈值,则/>被视为异常值进行删除;/>是样本/>的邻居样本,所述邻居的衡量标准以欧氏距离进行测算;
步骤三:训练数据扩充
可以理解的是,在运动状态量评估任务中,数据的采集耗时耗力,且训练数据常常由于数量不足导致人工智能算法模型训练达不到拟合水平,因此,本发明采用数据扩充技术,提出一种基于域自适应学习的生成对抗网络进行样本的生成,进而实现训练数据扩充的目的。
生成对抗网络(GAN)通过生成器和判别器的博弈过程生成数据,为了使生成的数据在运动状态量评估任务中更适合特定的任务域,提出一种域自适应学习策略,该策略使得生成的数据分布更加接近目标域的数据分布。
利用量子编码的方式对随机噪声进行编码,生成编码后的量子态;具体的,利用Hadamard门,在两个正交状态之间进行叠加,从而生成多种可能的输出(输出表示编码后的样本),即,将随机噪声/>编码到一个量子态/>,通过Hadamard门操作将其变换为一个新的量子态z,表示为:
其中,/>是Hadamard门量子编码操作;
在样本生成过程中,生成对抗网络的生成器G负责生成数据,判别器D负责判断生成的数据是否来自真实分布,即:
生成器G,尝试映射从隐空间中的样本z到数据空间中的样本x的函数,即,其中,/>是生成器的参数,z为由Hadamard门量子编码得到的量子态;
在生成器生成样本时,考虑到不同的数据源和不同的特征需要不同的网络结构进行优化,因此提出一种基于自适应机制的生成器网络动态拓扑结构调整方法(允许网络根据输入数据的特性自动调整其结构),具体过程是:对于生成器G中的每一个节点node,为其分配一个权重;所述节点是指神经网络中的单一计算单位(也被称为神经元),在一个标准的前馈神经网络中,每个节点从输入层、隐藏层或前一个层的其他节点接收输入,然后经过一个激活函数处理这些输入,并将输出传递给下一层的节点;所述权重/>决定了节点在网络中的激活程度,且权重/>由预设的元网络M计算得到,表示为:
,
其中,是Sigmoid激活函数,将输出限制在0和1之间,代表节点的激活概率;如果一个节点的权重接近于0,那么这个节点在这次前向传播中是被关闭的(因此其对输出的贡献会很小或没有);而如果权重接近于1,那么这个节点是打开的,并会正常地处理并传递信息;在GAN训练过程中,对于生成器G的拓扑结构调整,在前向传播时,根据/>的值决定是否激活对应的节点;如果节点被激活,则输入数据会通过这个节点;否则,这个节点被跳过,数据直接流向下一个节点;生成器G的输出表示为:,
其中,是拓扑结构调整之前的生成器,/>是激活函数,/>表示元素乘法,w是所有节点的权重集合;
判别器D,尝试判断输入样本x是真实数据还是生成器生成的数据;即,其中,/>是判别器的参数,x为判别器的输入;在训练过程中,生成器和判别器的目标函数表示为:
其中,/>和/>表示该任务是一个两层优化问题,即,判别器D尝试最大化函数,生成器G尝试最小化函数/>;/>是目标函数,衡量生成器和判别器在对抗过程中的表现;/>是数学期望的符号;/>表示X是从真实数据分布中随机采样的,/>表示z是从某个先验分布/>(本发明中为高斯分布)中随机采样的;/>为自然对数函数;/>是判别器D给出的一个样本x来自真实数据分布的概率;/>是生成器G根据隐变量z生成的数据样本;/>是判别器D对生成器G生成的样本/>的评估,即,/>是/>来自真实数据分布的概率;表示判别器D尝试最大化对真实数据x的正确识别概率;表示判别器D尝试最大化识别出生成器G生成的伪样本的能力;/>表示原始样本所在的样本域与新生成样本所在的样本域的Wasserstein距离;/>为Wasserstein距离的权重参数,由人为预设;
生成器G在训练过程中逐渐学习如何生成越来越接近真实数据分布的样本,而判别器D逐渐变得越来越难以区分真实样本和生成样本;最终,当训练轮数达到预设的轮数时,训练完成,生成器G生成的数据分布接近真实数据分布/>,即/>,则/>为生成器在训练完成后产生的样本,即为扩充样本;
将生成的样本与预处理后的运动状态量评估训练数据集进行混合,形成扩充后的运动状态量评估训练数据集;
步骤四:数据特征提取
采用神经网络对扩充后的运动状态量评估训练数据集进行特征提取;所述神经网络为3层全连接的神经网络,是一种基于量子隧道优化(QTO)的神经网络参数优化方法,区别于传统的神经网络在训练时采用的梯度下降法,本发明提出的方法可以避免传统的梯度下降法产生的梯度消失和梯度爆炸现象,同时解决传统的梯度下降法在参数寻优的过程中容易陷入局部最优的情况。
在量子力学中,隧道效应描述了粒子有非零的概率穿越一个势垒,即使其能量不足以克服这个势垒。将这种思维应用于神经网络的优化,即,认为神经网络在参数寻优的过程中,有时需要“穿越”不良的局部最小值,找到更好的优化地带。
当网络陷入局部最小值时,传统的梯度下降会停止。但在QTO优化算法中,给予其一个小的概率,使其能够“穿越”这个最小值。
这种“穿越”是随机的,并且其概率与局部最小值的“深度”或“势垒”高度有关。
在利用量子隧道优化算法对神经网络的参数进行寻优的步骤为:
S41,初始化:给定权重初始化和设定隧道决策参数/>,设定势垒的高度、/>、与势垒宽度相关的常数k、粒子质量m、约化普朗克常数h;
模拟量子隧道的行为,定义一个量子势垒模型,设是势垒,对于一维的简化情况为:
,其中,/>是势垒的高度,k是一个与势垒宽度相关的常数,决定了势垒的宽度,/>为交叉熵损失函数,/>为有限势垒函数,表示为:
,
处达到最大值1,并且当/>变大时,渐渐趋于零;量子势垒模型表现为一个对称的障碍。随着x的增加,势垒趋于0。
参考量子力学,隧道概率T由以下公式表示:
,
其中,T为隧道概率,m是粒子质量,是粒子能量,h是约化普朗克常数,a是势垒的宽度;
S42,计算损失和梯度:对于当前的权重W,计算交叉熵损失和交叉熵损失的梯度/>;
S43,势垒建立:基于损失和梯度的关系来建立势垒,表示为:
S44,计算隧道损失概率:
,
其中,E为隧道损失概率;a是势垒的宽度,与梯度的大小成反比,即:
,
其中,c是人为预设的常数.
S45,概率隧道决策:
如果(其中,/>是一个很小的阈值,表示梯度接近0),则:
,
其中,p是隧道概率决策因子,为在迭代过程中隧道损失概率的变化量,/>是一个接近1的系数,由人为预设;
如果,则跳过本步骤;
S46,层间信息交换:本发明的特征提取神经网络为3层,其中,第1层的激活表示为;为了让这3层网络在训练过程中相互交换信息,从而加速收敛并增强网络的表达能力,定义一个交换矩阵/>,其元素/>表示从第i层到第j层的信息流量,表示为:其中,/>为信息交换前的第1层的激活表示,/>为信息交换后的第1层的激活表示,/>为交换矩阵,每一层的激活都会受到其他层的激活的加权影响;
S47,权重更新:如果,则使用梯度信息更新权重:
,
其中,是学习率,/>为能量守恒权重,由人为预设,/>为偏差能量,/>为当前迭代的时间动量,/>为时间动量的权重,由人为预设,其决定对动量的依赖强度;
在计算时间动量时,在每次迭代时进行更新,更新方式为:
其中,为上一轮迭代的时间动量,/>为当前迭代的权重,/>为上一次迭代的权重,/>是一个接近1的系数,由人为预设;
在计算偏差能量时,参考能量守恒公式:
其中,为释放能量,/>为行为发生前的能量,/>为行为发生后的能量;则,释放能量/>为每次权重更新所释放的能量,由所有权重变化的梯度加和获得,偏差能量/>的计算方式为:
基于此,在每次更新过程中,不仅要考虑最小化损失,还要考虑网络能量的守恒;具体的,当更新网络权重时,需要确保释放的能量与隧道效应的能量相匹配;
如果,根据所述隧道概率决策因子P的大小决定是否穿越隧道,即,隧道概率决策因子P是否大于预设的阈值;如果隧道概率决策因子P大于预设的阈值,则决定穿越隧道,则随机更新权重:
,
其中,是从某种分布中抽取的小的随机值;
S48,迭代:重复步骤S42-S47,直到达到最大迭代次数,所述最大迭代次数由人为预设;
迭代完成后,即表示所述特征提取神经网络训练完成,则,用训练完成的神经网络进行特征提取;
步骤五:训练分类器
对于特征提取后得到的训练样本数据集,提出一种基于改进的蜜罐优化的核极限学习机算法(IHK-ELM)进行分类,参考蜜蜂觅食行为,选择最优的核参数,具体步骤为:
S51,初始化蜜源:定义蜜源为解的候选解,其位置代表KELM中的核参数,所述核参数为高斯核的宽度;初始化一组随机的蜜源位置:
每一个蜜源/>在KELM中的性能通过交叉验证得分来衡量,选择得分最高的蜜源作为当前最佳解;
S52,根据搜索策略进行参数搜索:引入局部搜索机制,每次迭代时,不仅考虑全局最佳蜜源,还考虑当前蜜源的邻居,具体的,对于每一个蜜源,随机选择一个邻居/>,并计算新位置:
其中,是当前最佳的蜜源,/>和/>是随机的权重因子;如果/>的得分更高,则更新/>的位置;
S53,动态调整KELM的学习率:传统的KELM算法中的学习率是一个固定的或手动调整的参数,本发明提出一种基于前馈网络的动态学习率调整策略,具体的,在每一次迭代中,计算出模型的误差,计算方式表示为:
其中,是目标输出的类别向量,/>是模型在第t次迭代输出的类别向量;
根据误差的变化情况自动调整学习率,即,定义学习率的更新策略如下:
,
更新学习率为:
,
其中,和/>为人为预设的常数;如果误差开始增加,则说明当前的学习率可能太大,模型在超过最优点;反之,如果误差减少的很慢或几乎不变,学习率可能太小,故,通过/>反映误差的变化趋势,并自适应调整学习率;
S54,权重稀疏化:为了使KELM更为高效和可解释,本发明采用基于自信息的权重稀疏化策略,使得KELM模型减少不必要的连接并保留关键的权重,具体的,首先自信息计算,对于KELM的权重w,其自信息表示为:
其中,/>代表权重w的概率;
在KELM中,设权重分布为高斯分布,均值为,方差为/>;则,/>的计算方式为:
,
代入自信息公式,得到:
.
为实现权重的稀疏化,根据每个权重的自信息值设定一个阈值;当权重的自信息低于这个阈值时被设为零(即被稀疏化),表示为:
其中,/>是人为预设的自信息阈值;
S55,训练核极限学习机:对于核函数,定义为:
核函数/>的参数由蜜罐优化策略得出;对于输入层到隐藏层的映射,可得到隐藏层输出矩阵H,其组成元素/>表示为:
使用标准的KELM方法训练模型,根据极限学习机的原理,输出权重的计算方式,表示为:
其中,H是核矩阵,其元素/>;是目标输出向量,/>是正则化参数;
对于新的输入样本x,其输出为:
,
将上述输出与目标输出进行比较,得到分类结果;基于此,得到一个更鲁棒、更少受过拟合影响的KELM分类器;
核极限学习机(KELM)是一个高效的神经网络,利用核技巧直接映射数据到高维特征空间中,从而进行线性分类。然而,传统的KELM可能存在过拟合的风险。为了提高其鲁棒性并减少过拟合的风险,本发明引入了改进的蜜罐优化策略。改进的蜜罐优化策略确保了在选择核参数时,能够找到更全局的最优解,同时加入了局部搜索机制,提高了收敛速度。
进一步地,步骤一中,所述生理参数数据包括以下属性:
运动类型:标识所进行的运动类型,包括跑步、跨栏、游泳;
运动强度:表示运动的强度水平,使用相对指标(例如轻度、中度、高度)或绝对指标(例如功率、速度)进行表示;
运动时间:记录运动的时长,以分钟为单位;
心率:在运动期间监测的平均心率,以bpm表示;
呼吸频率:运动期间的呼吸次数,每分钟呼吸次数;
肌肉耐力:评估肌肉的耐力水平,通过特定次数的重复动作表示;
脂肪燃烧:估计运动期间的脂肪燃烧情况,使用卡路里消耗衡量;
动作质量:对运动姿势和技巧的评估,以得分的形式表示;
体验满意度:运动后运动者对训练体验的主观评价,通过问卷调查获得;
运动频率:每周参与该类运动的频率,用于表示运动者的训练习惯。
进一步地,步骤三中,所述Wasserstein距离的计算方式为,设原始运动状态量评估训练数据集为源域样本,新生成样本所在的样本域为目标域,则为了实现域适应,使用Wasserstein距离衡量生成的数据与原始运动状态量评估训练数据集中的数据之间的差异,Wasserstein距离的计算方式表示为:
,
其中,是L1范数符号,/>是一个1-Lipschitz激活函数,/>表示x服从于源域/>样本的分布,/>表示/>服从于目标域/>样本的分布,/>是数学期望的符号/>表示源域,/>表示目标域,/>为人为预设的参数,用于平衡网络复杂度的惩罚。
进一步地,步骤三中,在生成器生成样本的过程中,随机采样是指从某个先验分布中随机采样一个点,并编码为量子态z,即:
,将随机采样得到的z通过生成器G,得到生成样本/>,即:其中,/>为生成器G的参数;
判别器D对生成的样本进行判断,输出一个介于0和1之间的数值/>,表示是真实样本的概率,即:/>其中,/>为判别器D的参数。
进一步地,步骤四中,为了保证网络的稳定性,交换矩阵Em要求为稀疏矩阵,并满足以下约束:其目的为,确保信息流的总量不会过大;/>其目的为,不允许层与自己交换信息;
在优化交换矩阵的过程中,目的是找到一个交换矩阵使得整体损失最小化;本发明采用梯度下降的方式来优化,表示为:/>其中,是学习率,由人为预设;/>为交换矩阵/>从第/>层到第k层的信息流,/>为交换矩阵/>对于第/>层自身层的信息流;/>为交换矩阵/>从第i层到第j层的信息流。
本发明的有益效果:
本发明的运动状态量评估方法涉及到了三方面的创新:(1)样本扩充:提出一种改进的生成对抗网络(GAN)样本扩充方法,利用生成对抗网络进行训练数据的扩充,特别是对于运动状态量评估这种数据采集成本高的任务,通过域自适应策略,使生成的数据更贴近实际应用,提高模型的泛化能力。(2)特征提取:采用基于量子隧道效应的优化算法,能够有效地避免神经网络训练过程中的局部最优问题。(3)分类器构建:改进的核极限学习机(IHK-ELM)通过引入蜜罐优化策略,不仅提高了分类器的准确性,还增加了鲁棒性。
上述创新点产生的技术效果包括:
(1)增加训练数据多样性:通过生成对抗网络和域自适应学习,模型将能够训练更多样化的数据,提高模型的泛化性。(2)减少数据依赖:利用数据扩充技术,有助于减少对大量原始数据的依赖,降低数据采集成本。(3)高效的特征提取:量子隧道优化能够更有效地提取运动状态的关键特征,提高模型的预测准确性。(4)避免局部最优:由于引入了量子隧道优化,模型在特征提取阶段更不容易陷入局部最优。(5)高准确度与鲁棒性:通过使用改进的核极限学习机,大幅提高模型的准确度,并且增强模型对于噪声和异常值的鲁棒性,加速模型的收敛,缩短训练时间。
具体实施方式
基于人工智能的运动状态量评估方法,主要步骤包括:
步骤一:运动状态量评估数据采集与标注
通过穿戴设备传感器从运动者采集生理参数数据,穿戴设备传感器能够实时地监测和记录运动者在运动过程中的生理参数数据,所述生理参数数据是特定运动时段或特定时间点的离散数据,或者是训练周期内的总结数据,所述生理参数数据的存储形式为json格式,在使用时通过Python语言进行读取;所述穿戴设备传感器包括心率监测仪、肌电传感器;所述生理参数数据包括以下属性:
运动类型:标识所进行的运动类型,包括跑步、跨栏、游泳;
运动强度:表示运动的强度水平,使用相对指标(例如轻度、中度、高度)或绝对指标(例如功率、速度)进行表示;
运动时间:记录运动的时长,以分钟为单位;
心率:在运动期间监测的平均心率,以bpm表示;
呼吸频率:运动期间的呼吸次数,每分钟呼吸次数;
肌肉耐力:评估肌肉的耐力水平,通过特定次数的重复动作表示;
脂肪燃烧:估计运动期间的脂肪燃烧情况,使用卡路里消耗衡量;
动作质量:对运动姿势和技巧的评估,以得分的形式表示;
体验满意度:运动后运动者对训练体验的主观评价,通过问卷调查获得;
运动频率:每周参与该类运动的频率,用于表示运动者的训练习惯。
在本实施例中,以心率监测为例,收集了不同运动类型和强度下的数据,表示如下:
在本实施例中,每个数据点包含了10个不同的属性,涵盖了运动类型、强度、运动时间、心率、呼吸频率、肌肉耐力、脂肪燃烧、动作质量、体验满意度和运动频率等信息。
数据采集完成后,对所述生理参数数据进行标注,标注类别为运动状态量评估等级,所述评估等级包括Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级,具体是:
Ⅰ级为基础水平,代表运动状态量较低,表示非常基础的运动者或者是初学者(在各项生理和心理指标上通常都是基础或低于平均水平);
Ⅱ级为初级水平,代表运动者具有一定的基础,但还需要在部分方面进行改进(在一些指标上可能达到或超过平均水平,但在其他方面仍然有待提升);
Ⅲ级为中级水平,代表运动者在多数或所有评估指标上都达到了中等水平(通常是多数常规运动者或健身爱好者所处的水平);
Ⅳ级为高级水平,代表运动者在多数或所有评估指标上都表现出较高水平(通常是专业运动员或者是非常资深的健身爱好者);
Ⅴ级为精英水平,最高的评估等级,代表运动者在所有评估的生理和心理指标上都表现出极高的水平(通常是顶级的专业运动员或者是在某一特定运动领域具有高度成就的人);
对所述生理参数数据标注完成后,得到运动状态量评估训练数据集;
步骤二:数据预处理
对所述运动状态量评估训练数据集进行数据预处理,以提高训练数据集质量,进而提高模型训练效果
S21,进行缺失值处理:设所述运动状态量评估训练数据集为数据矩阵,其中,表示运动状态量评估训练数据集中第/>个样本的第/>个特征,若/>有缺失,则填补缺失值的方式可以表示为:
,
其中,是总样本数;
S22,进行数据标准化:设所述运动状态量评估训练数据集中的一个特征向量,其标准化定义如下:
,
其中,是标准化之前的特征,/>是特征/>的均值,/>是特征/>的标准差,/>是标准化结果;
S23,进行异常值处理:利用IQR(四分位距)来识别和处理异常值;对于一个特征bF,首先计算其Q1(25%分位数)和Q3(75%分位数);然后,计算IQR,计算方式为:
,
其中,Q1表示第一四分位数,指数据集中所有数值从小到大排列后的第25%的位置的数字;Q3表示第三四分位数,指数据集中所有数值从小到大排列后的第75%的位置的数字;IQR表示四分位数范围,指数据集的中间50%的范围,也可以理解为数据的离散程度或分布的幅度,即,在范围之外的任何值都被认为是异常值,选择删除这些异常值;
S24,采用基于局部密度的异常值检测方法,为每个数据点(数据点,即在数据的特征空间中,数据所在的位置)定义一个局部密度值,然后根据数据点其邻居的密度进行比较,表示为:
,
其中,为样本/>的局部密度,/>是/>个样本的标准差;若低于预设的阈值,则/>被视为异常值进行删除;/>是样本/>的邻居样本,所述邻居的衡量标准以欧氏距离进行测算;
步骤三:训练数据扩充
可以理解的是,在运动状态量评估任务中,数据的采集耗时耗力,且训练数据常常由于数量不足导致人工智能算法模型训练达不到拟合水平,因此,本发明采用数据扩充技术,提出一种基于域自适应学习的生成对抗网络进行样本的生成,进而实现训练数据扩充的目的。
生成对抗网络(GAN)通过生成器和判别器的博弈过程生成数据,为了使生成的数据在运动状态量评估任务中更适合特定的任务域,提出一种域自适应学习策略,该策略使得生成的数据分布更加接近目标域的数据分布。
利用量子编码的方式对随机噪声进行编码,生成编码后的量子态;具体的,利用Hadamard门,在两个正交状态之间进行叠加,从而生成多种可能的输出(输出表示编码后的样本),即,将随机噪声/>编码到一个量子态/>,通过Hadamard门操作将其变换为一个新的量子态z,表示为:/>其中,/>是Hadamard门量子编码操作;
在样本生成过程中,生成对抗网络的生成器G负责生成数据,判别器D负责判断生成的数据是否来自真实分布,即:
生成器G,尝试映射从隐空间中的样本z到数据空间中的样本x的函数,即,其中,/>是生成器的参数,z为由Hadamard门量子编码得到的量子态;
在生成器生成样本时,考虑到不同的数据源和不同的特征需要不同的网络结构进行优化,因此提出一种基于自适应机制的生成器网络动态拓扑结构调整方法(允许网络根据输入数据的特性自动调整其结构),具体过程是:
对于生成器G中的每一个节点node,为其分配一个权重;所述节点是指神经网络中的单一计算单位(也被称为神经元),在一个标准的前馈神经网络中,每个节点从输入层、隐藏层或前一个层的其他节点接收输入,然后经过一个激活函数处理这些输入,并将输出传递给下一层的节点;所述权重/>决定了节点在网络中的激活程度,且权重/>由预设的元网络M计算得到,表示为:
,其中,/>是Sigmoid激活函数,将输出限制在0和1之间,代表节点的激活概率;如果一个节点的权重接近于0,那么这个节点在这次前向传播中是被关闭的(因此其对输出的贡献会很小或没有);而如果权重接近于1,那么这个节点是打开的,并会正常地处理并传递信息;
在GAN训练过程中,对于生成器G的拓扑结构调整,在前向传播时,根据的值决定是否激活对应的节点;如果节点被激活,则输入数据会通过这个节点;否则,这个节点被跳过,数据直接流向下一个节点;生成器G的输出表示为:
,其中,/>是拓扑结构调整之前的生成器,是激活函数,/>表示元素乘法,W是所有节点的权重集合;
判别器D,尝试判断输入样本X是真实数据还是生成器生成的数据;即,其中,/>是判别器的参数,X为判别器的输入;
在训练过程中,生成器和判别器的目标函数表示为:
,
其中,和/>表示该任务是一个两层优化问题,即,判别器D尝试最大化函数/>,生成器G尝试最小化函数/>;/>是目标函数,衡量生成器和判别器在对抗过程中的表现;/>是数学期望的符号;/>表示X是从真实数据分布中随机采样的,/>表示z是从某个先验分布/>(本发明中为高斯分布)中随机采样的;/>为自然对数函数;/>是判别器D给出的一个样本x来自真实数据分布的概率;/>是生成器G根据隐变量z生成的数据样本;/>是判别器D对生成器G生成的样本/>的评估,即,/>是/>来自真实数据分布的概率;表示判别器D尝试最大化对真实数据x的正确识别概率;表示判别器D尝试最大化识别出生成器G生成的伪样本的能力;/>表示原始样本所在的样本域与新生成样本所在的样本域的Wasserstein距离;/>为Wasserstein距离的权重参数,由人为预设;
所述Wasserstein距离的计算方式为,设原始运动状态量评估训练数据集为源域样本,新生成样本所在的样本域为目标域,则为了实现域适应,使用Wasserstein距离衡量生成的数据与原始运动状态量评估训练数据集中的数据之间的差异,Wasserstein距离的计算方式表示为:
,
其中,是L1范数符号,/>是一个1-Lipschitz激活函数,/>表示x服从于源域/>样本的分布,/>表示/>服从于目标域/>样本的分布,/>是数学期望的符号/>表示源域,/>表示目标域,/>为人为预设的参数,用于平衡网络复杂度的惩罚。
在生成器生成样本的过程中,随机采样是指从某个先验分布中随机采样一个点z,即:
将随机采样得到的z通过生成器G,得到生成样本,即:/>
,其中,/>为生成器G的参数;
判别器D对生成的样本进行判断,输出一个介于0和1之间的数值/>,表示是真实样本的概率,即:
其中,/>为判别器D的参数。
生成器G在训练过程中逐渐学习如何生成越来越接近真实数据分布的样本,而判别器D逐渐变得越来越难以区分真实样本和生成样本;最终,当训练轮数达到预设的轮数时,训练完成,生成器G生成的数据分布接近真实数据分布/>,即/>,则/>为生成器在训练完成后产生的样本,即为扩充样本;
将生成的样本与预处理后的运动状态量评估训练数据集进行混合,形成扩充后的运动状态量评估训练数据集;
步骤四:数据特征提取
采用神经网络对扩充后的运动状态量评估训练数据集进行特征提取;所述神经网络为3层全连接的神经网络,是一种基于量子隧道优化(QTO)的神经网络参数优化方法,区别于传统的神经网络在训练时采用的梯度下降法,本发明提出的方法可以避免传统的梯度下降法产生的梯度消失和梯度爆炸现象,同时解决传统的梯度下降法在参数寻优的过程中容易陷入局部最优的情况。
在量子力学中,隧道效应描述了粒子有非零的概率穿越一个势垒,即使其能量不足以克服这个势垒。将这种思维应用于神经网络的优化,即,认为神经网络在参数寻优的过程中,有时需要“穿越”不良的局部最小值,找到更好的优化地带。
当网络陷入局部最小值时,传统的梯度下降会停止。但在QTO优化算法中,给予其一个小的概率,使其能够“穿越”这个最小值。
这种“穿越”是随机的,并且其概率与局部最小值的“深度”或“势垒”高度有关。
在利用量子隧道优化算法对神经网络的参数进行寻优的步骤为:
S41,初始化:给定权重初始化和设定隧道决策参数/>,设定势垒的高度/>、与势垒宽度相关的常数k、粒子质量m、约化普朗克常数h;
模拟量子隧道的行为,定义一个量子势垒模型,设是势垒,对于一维的简化情况为:
,其中,/>是势垒的高度,k是一个与势垒宽度相关的常数,决定了势垒的宽度,/>为交叉熵损失函数,/>为有限势垒函数,表示为:
,/>
处达到最大值1,并且当/>变大时,渐渐趋于零;量子势垒模型表现为一个对称的障碍。随着x的增加,势垒趋于0。
参考量子力学,隧道概率T由以下公式表示:
,
其中,T为隧道概率,m是粒子质量,是粒子能量,h是约化普朗克常数,a是势垒的宽度;
S42,计算损失和梯度:对于当前的权重W,计算交叉熵损失和交叉熵损失的梯度/>;
S43,势垒建立:基于损失和梯度的关系来建立势垒,表示为:
S44,计算隧道损失概率:
其中,E为隧道损失概率;a是势垒的宽度,与梯度的大小成反比,即:
,
其中,c是人为预设的常数;
S45,概率隧道决策:
如果(其中,/>是一个很小的阈值,表示梯度接近0),则:
,
其中,p是隧道概率决策因子,为在迭代过程中隧道损失概率的变化量,/>是一个接近1的系数,由人为预设;/>
如果,则跳过本步骤;
S46,层间信息交换:本发明的特征提取神经网络为3层,其中,第1层的激活表示为;为了让这3层网络在训练过程中相互交换信息,从而加速收敛并增强网络的表达能力,定义一个交换矩阵/>,其元素/>表示从第/>层到第/>层的信息流量,表示为:
,
其中,为信息交换前的第1层的激活表示,/>为信息交换后的第1层的激活表示,/>为交换矩阵,每一层的激活都会受到其他层的激活的加权影响;
为了保证网络的稳定性,交换矩阵要求为稀疏矩阵,并满足以下约束:
其目的为,确保信息流的总量不会过大;/>其目的为,不允许层与自己交换信息;
在优化交换矩阵的过程中,目的是找到一个交换矩阵使得整体损失最小化;本发明采用梯度下降的方式来优化,表示为:
其中,/>是学习率,由人为预设;/>为交换矩阵/>从第/>层到第k层的信息流,/>为交换矩阵/>对于第/>层自身层的信息流;/>为交换矩阵/>从第i层到第j层的信息流;
S47,权重更新:如果,则使用梯度信息更新权重:
,
其中,是学习率,/>为能量守恒权重,由人为预设,/>为偏差能量,/>为当前迭代的时间动量,/>为时间动量的权重,由人为预设,其决定对动量的依赖强度;
在计算时间动量时,在每次迭代时进行更新,更新方式为:
,
其中,为上一轮迭代的时间动量,/>为当前迭代的权重,/>为上一次迭代的权重,/>是一个接近1的系数,由人为预设,其决定对过去动量的依赖程度;/>
在计算偏差能量时,参考能量守恒公式:
,
其中,为释放能量,/>为行为发生前的能量,/>为行为发生后的能量;则,释放能量/>为每次权重更新所释放的能量,由所有权重变化的梯度加和获得,偏差能量/>的计算方式为:
基于此,在每次更新过程中,不仅要考虑最小化损失,还要考虑网络能量的守恒;具体的,当更新网络权重时,需要确保释放的能量与隧道效应的能量相匹配;
如果p,根据所述隧道概率决策因子p的大小决定是否穿越隧道,即,隧道概率决策因子p是否大于预设的阈值;如果隧道概率决策因子p大于预设的阈值,则决定穿越隧道,则随机更新权重:/>,其中,/>是从某种分布中抽取的小的随机值;
S48,迭代:重复步骤S42-S47,直到达到最大迭代次数,所述最大迭代次数由人为预设;
迭代完成后,即表示所述特征提取神经网络训练完成,则,用训练完成的神经网络进行特征提取;
步骤五:训练分类器
对于特征提取后得到的训练样本数据集,提出一种基于改进的蜜罐优化的核极限学习机算法(IHK-ELM)进行分类,参考蜜蜂觅食行为,选择最优的核参数,具体步骤为:
S51,初始化蜜源:定义蜜源为解的候选解,其位置代表KELM中的核参数,所述核参数为高斯核的宽度;初始化一组随机的蜜源位置:
,
每一个蜜源在KELM中的性能通过交叉验证得分来衡量,选择得分最高的蜜源作为当前最佳解;
S52,根据搜索策略进行参数搜索:引入局部搜索机制,每次迭代时,不仅考虑全局最佳蜜源,还考虑当前蜜源的邻居,具体的,对于每一个蜜源,随机选择一个邻居/>,并计算新位置:
,
其中,是当前最佳的蜜源,/>和/>是随机的权重因子;如果/>的得分更高,则更新/>的位置;/>
S53,动态调整KELM的学习率:传统的KELM算法中的学习率是一个固定的或手动调整的参数,本发明提出一种基于前馈网络的动态学习率调整策略,具体的,在每一次迭代中,计算出模型的误差,计算方式表示为:
其中,是目标输出的类别向量,/>是模型在第t次迭代输出的类别向量;
根据误差的变化情况自动调整学习率,即,定义学习率的更新策略如下:
,
更新学习率为:
,
其中,和/>为人为预设的常数;如果误差开始增加,则说明当前的学习率可能太大,模型在超过最优点;反之,如果误差减少的很慢或几乎不变,学习率可能太小,故,通过/>反映误差的变化趋势,并自适应调整学习率;
S54,权重稀疏化:为了使KELM更为高效和可解释,本发明采用基于自信息的权重稀疏化策略,使得KELM模型减少不必要的连接并保留关键的权重,具体的,首先自信息计算,对于KELM的权重w,其自信息表示为:
其中,/>代表权重w的概率;
在KELM中,设权重分布为高斯分布,均值为,方差为/>;则,/>的计算方式为:
,
代入自信息公式,得到:
为实现权重的稀疏化,根据每个权重的自信息值设定一个阈值;当权重的自信息低于这个阈值时被设为零(即被稀疏化),表示为:
其中,是人为预设的自信息阈值;
S55,训练核极限学习机:对于核函数,定义为:
核函数的参数由蜜罐优化策略得出;对于输入层到隐藏层的映射,可得到隐藏层输出矩阵H,其组成元素/>表示为:/>;
使用标准的KELM方法训练模型,根据极限学习机的原理,输出权重的计算方式,表示为:
,
其中,H是核矩阵,其元素;/>是目标输出向量,/>是正则化参数;
对于新的输入样本x,其输出为:
,
将上述输出与目标输出进行比较,得到分类结果;基于此,得到一个更鲁棒、更少受过拟合影响的KELM分类器;
核极限学习机(KELM)是一个高效的神经网络,利用核技巧直接映射数据到高维特征空间中,从而进行线性分类。然而,传统的KELM可能存在过拟合的风险。为了提高其鲁棒性并减少过拟合的风险,本发明引入了改进的蜜罐优化策略。改进的蜜罐优化策略确保了在选择核参数时,能够找到更全局的最优解,同时加入了局部搜索机制,提高了收敛速度。
步骤六:运动状态量评估
利用训练好的模型进行运动状态量评估,首先,将输入的运动状态数据进行预处理,再将预处理后的数据输入到训练完成的特征提取模型中进行特征提取,然后将特征提取后的数据输入到分类模型中再进行分类,分类结果为运动状态量评估等级。

Claims (5)

1.基于人工智能的运动状态量评估方法,其特征在于,首先建立运动状态量评估模型,其次,在模型中输入评估数据并对评估数据进行预处理,再将预处理后的数据输入到训练完成的特征提取模型中进行特征提取,然后将特征提取后的数据输入到分类模型中进行分类,分类结果为运动状态量评估等级,所述评估等级包括Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级,具体是:
Ⅰ级为基础水平,代表运动状态量较低,表示非常基础的运动者或者是初学者;Ⅱ级为初级水平,代表运动者具有一定的基础,但还需要在部分方面进行改进;Ⅲ级为中级水平,代表运动者在多数或所有评估指标上都达到了中等水平;Ⅳ级为高级水平,代表运动者在多数或所有评估指标上都表现出较高水平;Ⅴ级为精英水平,最高的评估等级,代表运动者在所有评估的生理和心理指标上都表现出极高的水平;
所述运动状态量评估模型的建立包括以下步骤:
步骤一:运动状态量评估数据采集与标注
通过穿戴设备传感器从运动者采集生理参数数据,穿戴设备传感器能够实时监测和记录运动者在运动过程中的生理参数数据,所述生理参数数据是特定运动时段或特定时间点的离散数据,或者是训练周期内的总结数据,所述生理参数数据的存储形式为json格式,在使用时通过Python语言进行读取;所述穿戴设备传感器包括心率监测仪、肌电传感器;
数据采集完成后,对所述生理参数数据进行标注,标注类别为运动状态量评估等级;对所述生理参数数据标注完成后,得到运动状态量评估训练数据集;
步骤二:数据预处理
S21,进行缺失值处理:设所述运动状态量评估训练数据集为数据矩阵,其中,/>表示运动状态量评估训练数据集中第/>个样本的第/>个特征,若/>有缺失,则填补缺失值的方式表示为:
其中,是总样本数;
S22,进行数据标准化:设所述运动状态量评估训练数据集中的一个特征向量,其标准化定义如下:
其中,是标准化之前的特征,/>是特征/>的均值,/>是特征/>的标准差,是标准化结果;
S23,进行异常值处理:利用IQR识别和处理异常值;对于一个特征,首先计算其Q1和Q3;然后,计算IQR,计算方式为:/>
其中,Q1表示第一四分位数,指数据集中所有数值从小到大排列后的第25%的位置的数字;Q3表示第三四分位数,指数据集中所有数值从小到大排列后的第75%的位置的数字;IQR表示四分位数范围,指数据集的中间50%的范围,也可以理解为数据的离散程度或分布的幅度,即,在范围之外的任何值都被认为是异常值,选择删除这些异常值;
S24,采用基于局部密度的异常值检测方法,为每个数据点定义一个局部密度值,然后与数据点的邻居的密度进行比较,表示为:
其中,为样本/>的局部密度,/>是/>个样本的标准差;若/>低于预设的阈值,则/>被视为异常值进行删除;/>是样本/>的邻居样本,所述邻居的衡量标准以欧氏距离进行测算;
步骤三:训练数据扩充
在训练数据扩充中,采用一种基于域自适应学习的生成对抗网络进行样本的生成;
利用量子编码的方式对随机噪声进行编码,生成编码后的量子态;具体的,利用Hadamard门,在两个正交状态之间进行叠加,从而生成多种可能的输出,即,将随机噪声编码到一个量子态|z>,通过Hadamard门操作将其变换为一个新的量子态z,表示为:
其中,是Hadamard门量子编码操作;
在样本生成过程中,生成对抗网络的生成器G负责生成数据,判别器D负责判断生成的数据是否来自真实分布,即:
生成器G,尝试映射从隐空间中的样本到数据空间中的样本/>的函数,即/>,其中,/>是生成器的参数,/>为由Hadamard门量子编码得到的量子态;
在生成器生成样本时,考虑到不同的数据源和不同的特征需要不同的网络结构进行优化,因此采用一种基于自适应机制的生成器网络动态拓扑结构调整方法,具体过程是:
对于生成器中的每一个节点/>ode,为其分配一个权重/>;所述节点是指神经网络中的单一计算单位,在一个标准的前馈神经网络中,每个节点从输入层、隐藏层或前一个层的其他节点接收输入,然后经过一个激活函数处理这些输入,并将输出传递给下一层的节点;所述权重/>决定了节点在网络中的激活程度,且权重/>由预设的元网络/>计算得到,表示为:
其中,是Sigmoid激活函数,将输出限制在0和1之间,代表节点的激活概率;如果一个节点的权重接近于0,那么这个节点在这次前向传播中是被关闭的;而如果权重接近于1,那么这个节点是打开的,并会正常地处理并传递信息;
在GAN训练过程中,对于生成器G的拓扑结构调整,在前向传播时,根据的值决定是否激活对应的节点;如果节点被激活,则输入数据会通过这个节点;否则,这个节点被跳过,数据直接流向下一个节点;生成器/>的输出表示为:
其中,是拓扑结构调整之前的生成器,/>是激活函数,/>表示元素乘法,/>是所有节点的权重集合;
判别器D,尝试判断输入样本是真实数据还是生成器生成的数据;即/>,其中,是判别器的参数,/>为判别器的输入;
在训练过程中,生成器和判别器的目标函数表示为:
其中,和/>表示该任务是一个两层优化问题,即,判别器/>尝试最大化函数,生成器/>尝试最小化函数/>;/>是目标函数,衡量生成器和判别器在对抗过程中的表现;/>是数学期望的符号;/>表示/>是从真实数据分布/>中随机采样的,/>表示/>是从某个先验分布/>中随机采样的;/>为自然对数函数;/>是判别器给出的一个样本/>来自真实数据分布的概率;/>是生成器/>根据隐变量/>生成的数据样本;/>是判别器/>对生成器/>生成的样本/>的评估,即,/>是/>来自真实数据分布的概率;/>表示判别器/>尝试最大化对真实数据/>的正确识别概率;表示判别器/>尝试最大化识别出生成器/>生成的伪样本/>的能力;/>表示原始样本所在的样本域与新生成样本所在的样本域的Wasserstein距离;/>为Wasserstein距离的权重参数,由人为预设;
生成器G在训练过程中逐渐学习如何生成越来越接近真实数据分布的样本,而判别器D逐渐变得越来越难以区分真实样本和生成样本;最终,当训练轮数达到预设的轮数时,训练完成,生成器G生成的数据分布接近真实数据分布/>,即/>,则/>为生成器在训练完成后产生的样本,即为扩充样本;
将生成的样本与预处理后的运动状态量评估训练数据集进行混合,形成扩充后的运动状态量评估训练数据集;
步骤四:数据特征提取
采用基于量子隧道优化的神经网络参数优化方法对扩充后的运动状态量评估训练数据集进行特征提取,包括以下步骤:
S41,初始化:给定权重初始化和设定隧道决策参数/>,设定势垒的高度/>、与势垒宽度相关的常数/>、粒子质量/>、/>
模拟量子隧道的行为,定义一个量子势垒模型,设是势垒,对于一维的简化情况为:
其中,是势垒的高度,/>是一个与势垒宽度相关的常数,决定了势垒的宽度,/>为交叉熵损失函数,/>为有限势垒函数,表示为:
在/>处达到最大值1,并且当/>变大时,/>渐渐趋于零;
参考量子力学,隧道概率由以下公式表示:
其中,为隧道概率,/>是粒子质量,/>是粒子能量,/>是约化普朗克常数,/>是势垒的宽度;
S42,计算损失和梯度:对于当前的权重,计算交叉熵损失/>和交叉熵损失的梯度
S43,势垒建立:基于损失和梯度的关系来建立势垒,表示为:
S44,计算隧道损失概率:
其中,为隧道损失概率;/>是势垒的宽度,与梯度的大小成反比,即:
其中,是人为预设的常数;
S45,概率隧道决策:
如果,则:/>
其中,是隧道概率决策因子,/>为在迭代过程中隧道损失概率的变化量,/>是一个接近1的系数,由人为预设;
如果,则跳过本步骤;
S46,层间信息交换:所述特征提取神经网络为3层,其中,第层的激活表示为/>;为了让这3层网络在训练过程中相互交换信息,从而加速收敛并增强网络的表达能力,定义一个交换矩阵/>,其元素/>表示从第/>层到第/>层的信息流量,表示为:
其中,为信息交换前的第/>层的激活表示,/>为信息交换后的第/>层的激活表示,/>为交换矩阵,每一层的激活都会受到其他层的激活的加权影响;
S47,权重更新:如果,则使用梯度信息更新权重:
其中,是学习率,/>为能量守恒权重,由人为预设,/>为偏差能量,/>为当前迭代的时间动量,/>为时间动量的权重,由人为预设,其决定对动量的依赖强度;
在计算时间动量时,在每次迭代时进行更新,更新方式为:
其中,为上一轮迭代的时间动量,/>为当前迭代的权重,/>为上一次迭代的权重,/>是一个接近1的系数,由人为预设;
在计算偏差能量时,参考能量守恒公式:
其中,为释放能量,/>为行为发生前的能量,/>为行为发生后的能量;则,释放能量/>为每次权重更新所释放的能量,由所有权重变化的梯度加和获得,偏差能量/>的计算方式为:/>
基于此,在每次更新过程中,不仅要考虑最小化损失,还要考虑网络能量的守恒;具体的,当更新网络权重时,需要确保释放的能量与隧道效应的能量相匹配;
如果,根据所述隧道概率决策因子/>的大小决定是否穿越隧道,即,隧道概率决策因子/>是否大于预设的阈值;如果隧道概率决策因子/>大于预设的阈值,则决定穿越隧道,则随机更新权重:
其中,是从某种分布中抽取的小的随机值;
S48,迭代:重复步骤S42-S47,直到达到最大迭代次数,所述最大迭代次数由人为预设;
迭代完成后,即表示所述特征提取神经网络训练完成,则用训练完成的神经网络进行特征提取;
步骤五:训练分类器
对于特征提取后得到的训练样本数据集,采用一种基于改进的蜜罐优化的核极限学习机算法进行分类,参考蜜蜂觅食行为,选择最优的核参数,具体步骤为:
S51,初始化蜜源:定义蜜源为解的候选解,其位置代表KELM中的核参数,所述核参数为高斯核的宽度;初始化一组随机的蜜源位置:
每一个蜜源在KELM中的性能通过交叉验证得分来衡量,选择得分最高的蜜源作为当前最佳解;
S52,根据搜索策略进行参数搜索:采用局部搜索机制,每次迭代时,不仅考虑全局最佳蜜源,还考虑当前蜜源的邻居,具体的,对于每一个蜜源,随机选择一个邻居/>,并计算新位置:
其中,是当前最佳的蜜源,/>和/>是随机的权重因子;如果/>的得分更高,则更新/>的位置;
S53,动态调整KELM的学习率:传统的KELM算法中的学习率是一个固定的或手动调整的参数,采用一种基于前馈网络的动态学习率调整策略,具体的,在每一次迭代中,计算出模型的误差,计算方式表示为:
其中,是目标输出的类别向量,/>是模型在第t次迭代输出的类别向量;
根据误差的变化情况自动调整学习率,即,定义学习率的更新策略如下:
更新学习率为:
其中,和/>为人为预设的常数;如果误差开始增加,则说明当前的学习率可能太大,模型在超过最优点;反之,如果误差减少的很慢或几乎不变,学习率可能太小,故,通过/>反映误差的变化趋势,并自适应调整学习率;
S54,权重稀疏化:为了使KELM更为高效和可解释,采用基于自信息的权重稀疏化策略,使得KELM模型减少不必要的连接并保留关键的权重,具体的,首先自信息计算,对于KELM的权重,其自信息/>表示为:
其中,代表权重/>的概率;
在KELM中,设权重分布为高斯分布,均值为,方差为/>;则,/>的计算方式为:
代入自信息公式,得到:
为实现权重的稀疏化,根据每个权重的自信息值设定一个阈值;当权重的自信息低于这个阈值时被设为零,表示为:
其中,是人为预设的自信息阈值;
S55,训练核极限学习机:对于核函数,定义为:
核函数的参数由蜜罐优化策略得出;对于输入层到隐藏层的映射,可得到隐藏层输出矩阵H,其组成元素/>表示为:
使用标准的KELM方法训练模型,根据极限学习机的原理,输出权重的计算方式,表示为:
其中,是核矩阵,其元素/>;/>是目标输出向量,/>是正则化参数;
对于新的输入样本x,其输出为:
将上述输出与目标输出进行比较,得到分类结果;基于此,得到一个更鲁棒、更少受过拟合影响的KELM分类器。
2.如权利要求1所述的基于人工智能的运动状态量评估方法,其特征在于,步骤一中,所述生理参数数据包括以下属性:
运动类型:标识所进行的运动类型,包括跑步、跨栏、游泳;
运动强度:表示运动的强度水平,使用相对指标或绝对指标进行表示;
运动时间:记录运动的时长,以分钟为单位;
心率:在运动期间监测的平均心率,以bpm表示;
呼吸频率:运动期间的呼吸次数,每分钟呼吸次数;
肌肉耐力:评估肌肉的耐力水平,通过特定次数的重复动作表示;
脂肪燃烧:估计运动期间的脂肪燃烧情况,使用卡路里消耗衡量;
动作质量:对运动姿势和技巧的评估,以得分的形式表示;
体验满意度:运动后运动者对训练体验的主观评价,通过问卷调查获得;
运动频率:每周参与该类运动的频率,用于表示运动者的训练习惯。
3.如权利要求1所述的基于人工智能的运动状态量评估方法,其特征在于,步骤三中,所述Wasserstein距离的计算方式为,设原始运动状态量评估训练数据集为源域样本,新生成样本所在的样本域为目标域,则为了实现域适应,使用Wasserstein距离衡量生成的数据与原始运动状态量评估训练数据集中的数据之间的差异,Wasserstein距离的计算方式表示为:
其中,是L1范数符号,/>是一个1-Lipschitz激活函数,/>表示/>服从于源域样本的分布,/>表示/>服从于目标域/>样本的分布,/>是数学期望的符号/>表示源域,/>表示目标域,/>为人为预设的参数,用于平衡网络复杂度的惩罚。
4.如权利要求1所述的基于人工智能的运动状态量评估方法,其特征在于,步骤三中,在生成器生成样本的过程中,随机采样是指从某个先验分布中随机采样一个点,并编码为量子态/>,即:
将随机采样得到的通过生成器G,得到生成样本/>,即:
其中,为生成器G的参数;
判别器D对生成的样本进行判断,输出一个介于0和1之间的数值/>,表示/>是真实样本的概率,即:
其中,为判别器D的参数。
5.如权利要求1所述的基于人工智能的运动状态量评估方法,其特征在于,步骤四中,为了保证网络的稳定性,交换矩阵要求为稀疏矩阵,并满足以下约束:
其目的为,确保信息流的总量不会过大;
其目的为,不允许层与自己交换信息;
在优化交换矩阵的过程中,目的是找到一个交换矩阵使得整体损失最小化;采用梯度下降的方式来优化,表示为:
其中,是学习率,由人为预设;/>为交换矩阵/>从第/>层到第/>层的信息流,/>为交换矩阵/>对于第/>层自身层的信息流;/>为交换矩阵/>从第/>层到第/>层的信息流。
CN202311279430.7A 2023-10-07 2023-10-07 基于人工智能的运动状态量评估方法 Active CN117009876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311279430.7A CN117009876B (zh) 2023-10-07 2023-10-07 基于人工智能的运动状态量评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311279430.7A CN117009876B (zh) 2023-10-07 2023-10-07 基于人工智能的运动状态量评估方法

Publications (2)

Publication Number Publication Date
CN117009876A CN117009876A (zh) 2023-11-07
CN117009876B true CN117009876B (zh) 2024-01-09

Family

ID=88565788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311279430.7A Active CN117009876B (zh) 2023-10-07 2023-10-07 基于人工智能的运动状态量评估方法

Country Status (1)

Country Link
CN (1) CN117009876B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117272029B (zh) * 2023-11-20 2024-03-01 北京世纪慈海科技有限公司 基于大数据处理的老人安全监测方法及装置
CN117315376B (zh) * 2023-11-28 2024-02-13 聊城莱柯智能机器人有限公司 基于机器学习的机械零件工业质检方法
CN117612694A (zh) * 2023-12-04 2024-02-27 西安好博士医疗科技有限公司 一种基于数据反馈的热疗机数据识别方法和系统
CN117474295B (zh) * 2023-12-26 2024-04-26 长春工业大学 一种基于Dueling DQN算法的多AGV负载均衡与任务调度方法
CN117594192B (zh) * 2024-01-15 2024-04-30 广东工业大学 一种与运动处方相结合的户外健身设备服务系统
CN117648643B (zh) * 2024-01-30 2024-04-16 山东神力索具有限公司 基于人工智能的索具预测性诊断方法及装置
CN117764631A (zh) * 2024-02-22 2024-03-26 山东中翰软件有限公司 基于源端静态数据建模的数据治理优化方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108852377A (zh) * 2018-04-13 2018-11-23 中国科学院苏州生物医学工程技术研究所 基于多生理参数的人体运动性疲劳监测系统
CN109063308A (zh) * 2018-07-26 2018-12-21 北京航空航天大学 一种基于深度量子学习的健康评估方法
CN110334573A (zh) * 2019-04-09 2019-10-15 北京航空航天大学 一种基于密集连接卷积神经网络的人体运动状态判别方法
CN110830124A (zh) * 2019-11-21 2020-02-21 长春理工大学 基于量子粒子群优化极限学习机的频谱感知方法
CN111044928A (zh) * 2019-12-31 2020-04-21 福州大学 一种锂电池健康状态估计方法
CN112131711A (zh) * 2020-08-27 2020-12-25 东华大学 一种基于概率神经网络的运动紧身服合体性水平预测方法
CN113171080A (zh) * 2021-04-19 2021-07-27 中国科学院深圳先进技术研究院 一种基于可穿戴传感信息融合的能量代谢评估方法和系统
CN115700843A (zh) * 2022-10-09 2023-02-07 北京师范大学 一种基于现代机器学习模型的运动状态精准评估方法
CN116312951A (zh) * 2023-04-27 2023-06-23 华南理工大学 一种基于多模态耦合分析的运动功能评估方法及其系统
CN116758469A (zh) * 2023-05-24 2023-09-15 中国电子科技集团公司第二十八研究所 一种人群异常情况和单人运动状态检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108852377A (zh) * 2018-04-13 2018-11-23 中国科学院苏州生物医学工程技术研究所 基于多生理参数的人体运动性疲劳监测系统
CN109063308A (zh) * 2018-07-26 2018-12-21 北京航空航天大学 一种基于深度量子学习的健康评估方法
CN110334573A (zh) * 2019-04-09 2019-10-15 北京航空航天大学 一种基于密集连接卷积神经网络的人体运动状态判别方法
CN110830124A (zh) * 2019-11-21 2020-02-21 长春理工大学 基于量子粒子群优化极限学习机的频谱感知方法
CN111044928A (zh) * 2019-12-31 2020-04-21 福州大学 一种锂电池健康状态估计方法
CN112131711A (zh) * 2020-08-27 2020-12-25 东华大学 一种基于概率神经网络的运动紧身服合体性水平预测方法
CN113171080A (zh) * 2021-04-19 2021-07-27 中国科学院深圳先进技术研究院 一种基于可穿戴传感信息融合的能量代谢评估方法和系统
CN115700843A (zh) * 2022-10-09 2023-02-07 北京师范大学 一种基于现代机器学习模型的运动状态精准评估方法
CN116312951A (zh) * 2023-04-27 2023-06-23 华南理工大学 一种基于多模态耦合分析的运动功能评估方法及其系统
CN116758469A (zh) * 2023-05-24 2023-09-15 中国电子科技集团公司第二十八研究所 一种人群异常情况和单人运动状态检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A New Quantum Tunneling Particle Swarm Optimization Algorithm for Training Feedforward Neural Networks;Geraldine Bessie Amali et al;《International Journal of Intelligent Systems and Applications》;全文 *
Tunneling and speedup in quantum optimization for permutation-symmetric problems;Siddharth Muthukrishnan et al;《arXiv》;全文 *

Also Published As

Publication number Publication date
CN117009876A (zh) 2023-11-07

Similar Documents

Publication Publication Date Title
CN117009876B (zh) 基于人工智能的运动状态量评估方法
Pham et al. Application of the bees algorithm to the training of learning vector quantisation networks for control chart pattern recognition
CN107239514A (zh) 一种基于卷积神经网络的植物识别方法及系统
CN116451879B (zh) 一种干旱风险预测方法、系统及电子设备
US10610109B2 (en) Emotion representative image to derive health rating
US11587665B2 (en) Methods, systems, and non-transitory computer readable media for estimating maximum heart rate and maximal oxygen uptake from submaximal exercise intensities
Alharthi et al. Deep learning for ground reaction force data analysis: Application to wide-area floor sensing
CN108399434A (zh) 基于特征提取的高维时间序列数据的分析预测方法
Azma et al. Hybrid machine learning models for prediction of daily dissolved oxygen
Hernandez-Garcia et al. Learning sparse representations incrementally in deep reinforcement learning
Hong et al. A cooperative method for supervised learning in spiking neural networks
CN117198517B (zh) 基于机器学习的运动反应性评估和预测模型的建模方法
CN108364098A (zh) 一种天气特征对用户签到影响的度量方法
CN116966513A (zh) 健身器材的监控方法及其系统
CN107967455A (zh) 一种智能人体多维自然特征大数据透明学习方法与系统
US20210245005A1 (en) Implementation of machine learning for skill-improvement through cloud computing and method therefor
Mohamed et al. Adaptive trainer for multi-layer perceptron using artificial gorilla troops optimizer algorithm
Hayashi et al. Extraction of knowledge from the topographic attentive mapping network and its application in skill analysis of Table Tennis
CN115736840A (zh) 一种基于心电数据的睡眠质量识别分类方法
CN113343774B (zh) 一种细粒度的工程力学跳水动作模拟与评估方法
Oliva et al. How development in the Bayesian brain facilitates learning
Zakiyyah et al. Prediction of covid-19 infection in indonesia using machine learning methods
CN115273176A (zh) 一种基于生命体征和表情的疼痛多算法客观评估方法
CN115153549A (zh) 一种基于bp神经网络的人机交互界面认知负荷预测方法
CN111466877B (zh) 一种基于lstm网络的氧减状态预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant