CN115358367A - 一种基于多模型学习集成的动态自适应脑机接口解码方法 - Google Patents

一种基于多模型学习集成的动态自适应脑机接口解码方法 Download PDF

Info

Publication number
CN115358367A
CN115358367A CN202210950240.2A CN202210950240A CN115358367A CN 115358367 A CN115358367 A CN 115358367A CN 202210950240 A CN202210950240 A CN 202210950240A CN 115358367 A CN115358367 A CN 115358367A
Authority
CN
China
Prior art keywords
model
data
models
representing
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210950240.2A
Other languages
English (en)
Other versions
CN115358367B (zh
Inventor
祁玉
王跃明
祝歆韵
朱君明
张建民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202210950240.2A priority Critical patent/CN115358367B/zh
Publication of CN115358367A publication Critical patent/CN115358367A/zh
Application granted granted Critical
Publication of CN115358367B publication Critical patent/CN115358367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明公开了一种基于多模型学习集成的动态自适应脑机接口解码方法,在训练过程中使用迭代方式自主学习多个线性模型,并在脑机接口系统测试解码过程中,根据数据情况自动切换线性模型,实现自适应脑信号解码。通过上述自主学习多模型,并分时集成的策略,能够融合刻画不同特征线性解码器的能力,提高运动脑机接口系统的准确性和稳定性,在一定程度上解决了脑机接口系统因神经信号非稳态性造成的解码性能不稳定问题。

Description

一种基于多模型学习集成的动态自适应脑机接口解码方法
技术领域
本发明涉及脑机接口、神经信号解码领域,尤其是涉及一种基于多模型学习集成的动态自适应脑机接口解码方法。
背景技术
脑机接口横跨神经科学、认知科学、计算机科学、控制及信息科学与技术、医学等众多学科领域,现已逐步成为具有变革性影响的前沿交叉研究方向,对于人类与社会具有重大研究意义。
侵入式运动脑机接口,借助植入在大脑运动皮层中的微电极阵列采集神经信号,并将其解码成运动信号,旨在于大脑和外部设备之间建立一条直接的神经信息交流与控制通道。该技术有望通过神经信号控制外骨骼与电脑光标等设备,恢复瘫痪病人的部分运动功能。
在侵入式运动脑机接口系统中,神经解码算法至关重要。研究人员提出了许多从神经信号中解码运动信息的算法,包括集群向量法、最佳线性估计法、递归贝叶斯解码器和深度神经网络等。
在这些方法中,卡尔曼滤波器结合了轨迹的变化过程,将其作为先验知识,以获得更准确的预测,因此被广泛应用于在线光标解码和外骨骼控制中,达到最优在线控制性能。
当前的侵入式运动脑机接口使用的解码器大多假设神经信号和运动之间有稳定的函数关系,因此使用一个固定的解码模型。然而,在线解码过程中,采集的神经信号偶尔会引入噪声或者干脆消失;同时,由于神经元具有可塑性,大脑活动模式会随时间或不同行为状态发生改变。上述噪声和改变的存在,使得神经信号到运动信号的映射函数不稳定并且随时间持续变化。固定的解码函数会导致不稳定、不准确的解码结果,因此需要每隔一段时间重新训练以维持一定的性能。
针对神经信号不稳定性问题提出的解码器可以被分为两类。第一类仍然使用固定模型,依赖于周期性地重新训练或在线逐步更新模型参数维持性能。第二类使用动态模型追踪神经信号的变化,这可以避免重新训练的代价,更适合长期解码任务。但是,这一类方法中,很少有研究直接对神经信号的不稳定性进行建模。有研究使用多模型动态集成的方式,尝试直接建模神经信号的非稳态性,但是其候选模型池的生成较为随机,依赖于模型权重的随机扰动与神经元的随机丢失。
因此,如何构建一个有效的候选模型池,并通过多模型集成建模神经信号的动态性,以得到稳定鲁棒的解码性能,是当前运动神经解码领域亟待解决的重要问题。
发明内容
本发明提供了一种基于多模型学习集成的动态自适应脑机接口解码方法,通过数据驱动的方式,自主迭代学习模型池中的模型,并使用这些模型替换卡尔曼滤波器中的观测函数,以实现在线动态集成解码器,来更好地适应神经信号的变化。在解码过程中,根据贝叶斯更新机制,自动选择和结合这些模型,从而大大降低了神经信号不稳定性对解码性能的影响,提高了解码器的鲁棒性。
一种基于多模型学习集成的动态自适应脑机接口解码方法,包括以下步骤:
(1)获取原始运动神经信号,进行预处理后按比例分成训练集、验证集和测试集;
(2)模型池初始设定,具体包括:
(2-1)设定模型池中模型的组数及每组内模型的个数;
(2-2)设定每个组别的模型类型;
(2-3)设定每个模型初始分配数据占全部数据的比例;
(2-4)根据设定分配数据的比例,对于每一个组别,从训练集中为组内的所有模型随机分配一批数据;
(3)根据分配的数据学习模型,对于每个组别每个模型,使用被分配到的训练样本,学习所设类型的模型;
(4)根据学习到的模型重分配数据,具体包括:
(4-1)计算每个模型对每个时刻训练样本的拟合误差;
(4-2)对于每个组别,计算得到各个时刻使训练样本误差最小的组内模型,并将该时刻数据分配给该模型;
(4-3)对于每个模型被分配到的数据,设置一个接受阈值γ,只接受误差小的一部分数据;
(5)对于每个组别,迭代上述步骤(3)至(4),直到在所有训练样本上的预测误差之和小于一个预设值;使用最后一次迭代后学到的所有模型作为候选模型,构建模型池;
(6)使用动态贝叶斯多模型集成框架,根据每一个测试样本的神经信号,估计其对应的运动信号:
(6-1)使用上述构建的多个候选模型动态表征状态变量与观测变量之间的关系;其中,状态变量为运动信号,观测变量为神经信号;
(6-2)根据贝叶斯模型平均法则动态组合模型池中的候选模型,作为状态空间模型的观测函数;
(6-3)应用过程中,利用构建的状态空间模型对待解码的神经信号进行状态估计,估计不同候选模型对应的状态并进行集成,得到解码后的运动信号。
步骤(1)中,预处理过程为:从硬件设备中获取原始运动神经信号,选择适合的窗口大小计算神经信号发放率,依据状态标签截取有效数据段,对数据进行标准化和平滑操作,得到经过预处理的运动神经信号。
作为优选,可去除范式准备与返回阶段的数据,选择实际操作阶段进行分析。
作为优选,标准化和平滑操作,可采用Matlab中z-score函数和movmean函数,对运动信号的每一个维度进行标准化和平滑操作,对神经信号的每一个神经元的发放频率进行平滑,具体平滑窗口大小可根据实际需求选择。
作为优选,步骤(1)中数据的划分,可以按照6:2:2的比例分为训练集、验证集和测试集。
步骤(2)中,模型池初始设定如下:
设定模型池中模型的组数为G,第g组的组内模型个数为Mg,则模型池内模型总数为M=M1+M2+…MG,任意一个模型表示为
Figure BDA0003788147910000041
作为优选,设定每个组别的模型类型候选包括:线性模型,二次多项式模型,神经网络,可使用矩阵
Figure BDA00037881479100000415
表示各组各模型的类型,Pij=1代表线性模型,Pij=2代表二次多项式模型,Pij=3代表神经网络模型,Pij=0代表无模型。
设定每个模型初始分配数据占全部训练数据的比例为rseg;对于每一个组别,从训练集中为组内的所有模型随机分配一批数据,数据长度为
Figure BDA0003788147910000042
其中Ttrain为训练集样本数量;
每个模型所分配到的训练数据为
Figure BDA0003788147910000043
其中,
Figure BDA0003788147910000044
表示模型
Figure BDA0003788147910000045
所分配到的运动数据,
Figure BDA0003788147910000046
表示模型
Figure BDA0003788147910000047
所分配到的神经数据,dx和dy分别表示运动数据和神经数据的特征维度。
步骤(3)中,根据分配的数据学习模型的方式如下:
Figure BDA0003788147910000048
其中,
Figure BDA0003788147910000049
表示独立同分布的观测噪声。
作为优选,当模型类型为线性模型时,其表达式为
Figure BDA00037881479100000410
Figure BDA00037881479100000411
当模型类型为二次多项式模型时,其表达式为
Figure BDA00037881479100000412
Figure BDA00037881479100000413
当模型类型为神经网络时,其表达式为
Figure BDA00037881479100000414
步骤(4)中,根据学习到的模型重分配数据的方式如下:
计算每个模型对每个时刻训练样本的预测:
Figure BDA0003788147910000051
其中,
Figure BDA0003788147910000052
表示由模型
Figure BDA0003788147910000053
所预测的所有运动数据对应的神经数据;
Figure BDA0003788147910000054
表示所有运动数据;n表示独立同分布的观测噪声;
计算每个模型在所有时刻的误差:
Figure BDA0003788147910000055
其中,
Figure BDA0003788147910000056
表示所有神经数据;
Figure BDA0003788147910000057
表示
Figure BDA0003788147910000058
与y的误差。
作为优选,对每个模型在所有时刻的误差做平滑:
Figure BDA0003788147910000059
其中,
Figure BDA00037881479100000510
表示经过平滑的
Figure BDA00037881479100000511
与y的误差,lsmooth表示平滑窗口大小。
对于每个组别,计算得到各个时刻使训练样本平滑误差最小的组内模型,并将该时刻数据分配给该模型:
Figure BDA00037881479100000512
Figure BDA00037881479100000513
其中,
Figure BDA00037881479100000514
表示第g组内各模型的误差,每一行代表一个模型的误差;
Figure BDA00037881479100000515
表示每一时刻的训练数据所选择的模型索引;mg表示第g组内,模型的索引;
根据每个数据选择的模型,为每个模型
Figure BDA00037881479100000516
(即模型
Figure BDA00037881479100000517
)分配新一轮的训练数据
Figure BDA00037881479100000518
其中
Figure BDA00037881479100000519
表示模型
Figure BDA00037881479100000520
所分配到的运动数据,
Figure BDA00037881479100000521
表示模型
Figure BDA00037881479100000522
所分配到的神经数据,
Figure BDA00037881479100000523
表示第m个模型(即第g组内第mg个模型)所分配到的数据长度。
为使得每个模型使用的训练数据具有更高的质量,引入一个接受阈值γ。对于每个模型被分配到的数据,只接受误差较小的前100γ%的数据。因此,最终模型
Figure BDA0003788147910000061
新一轮的训练数据为
Figure BDA0003788147910000062
其中
Figure BDA0003788147910000063
Figure BDA0003788147910000064
表示模型
Figure BDA0003788147910000065
所选择的运动数据,
Figure BDA0003788147910000066
表示模型
Figure BDA0003788147910000067
所选择的神经数据,
Figure BDA0003788147910000068
表示第m个模型所选择的数据长度。
步骤(5)中,对于每个组别,迭代过程停止准则为:
errorg<βerrorg-1
其中,β为预先设定的终止阈值;
作为优选,
Figure BDA0003788147910000069
表示该组模型在所有训练数据上的最小误差之和。
迭代停止后,构建最终候选模型池
Figure BDA00037881479100000610
步骤(6-1)中,构建的多个候选模型动态表征状态变量与观测变量之间的关系如下:
xk=f(xk-1)+vk-1
yk=hk(xk)+nk
其中,k表示离散的时间步长;
Figure BDA00037881479100000611
表示运动数据,即状态变量;
Figure BDA00037881479100000612
表示神经数据,即观测变量;vk、nk表示独立同分布的状态转移噪声和观测噪声;
Figure BDA00037881479100000613
表示k时刻的观测函数由模型池中的模型集成得到,αk,m表示每个模型的集成权重。
步骤(6-2)中,所述贝叶斯模型平均法则的状态估计如下:
Figure BDA00037881479100000614
式中,
Figure BDA00037881479100000615
是第k时刻选择第m个模型时,状态的后验概率;
Figure BDA00037881479100000616
是第k时刻选择第m个模型的后验概率,计算公式如下:
Figure BDA0003788147910000071
其中,
Figure BDA0003788147910000072
为第k时刻选择第m个模型的先验概率;pm(yk|y0:k-1)为第k时刻选择第m个模型的边缘似然。
第k时刻选择第m个模型的先验概率计算公式如下:
Figure BDA0003788147910000073
其中,
Figure BDA0003788147910000074
为第k-1时刻选择第m个模型的概率;α为遗忘因子,0<α<1。
第k时刻选择第m个模型的边缘似然计算公式如下:
pm(yk|y0:k-1)=∫pm(yk|xk)p(xk|y0:k-1)dxk
其中,pm(yk|xk)是关于第m个模型的似然函数。
步骤(6-3)中,所述状态估计采用粒子滤波算法,基于粒子计算
Figure BDA0003788147910000075
Figure BDA0003788147910000076
步骤(6-3)中,假设此刻为第k个时间步的开始,已知
Figure BDA0003788147910000077
和一个带有权重的粒子集
Figure BDA0003788147910000078
其中Ns代表粒子集大小,
Figure BDA0003788147910000079
是权重为
Figure BDA00037881479100000710
的粒子。假设
Figure BDA00037881479100000711
Figure BDA00037881479100000712
其中δ(.)代表狄拉克δ函数,下面展示如何使用粒子滤波计算
Figure BDA00037881479100000713
Figure BDA00037881479100000714
(6-3-1)基于粒子滤波的
Figure BDA00037881479100000715
首先,从状态转移先验
Figure BDA00037881479100000716
中获得
Figure BDA00037881479100000717
然后根据重要性采样原则,可得:
Figure BDA00037881479100000718
其中,
Figure BDA00037881479100000719
代表当选择第m个模型时,第i个粒子归一化后的重要性权重。
(6-3-2)基于粒子滤波的
Figure BDA00037881479100000720
给定
Figure BDA00037881479100000721
首先使用步骤(6-2)中遗忘因子计算
Figure BDA00037881479100000722
的先验概率。在似然pm(yk|y0:k-1),m=1,…,M已知的情况下,可计算
Figure BDA0003788147910000081
的后验概率
Figure BDA0003788147910000082
在所述步骤3-1中,状态转移先验被用作重要性函数,即q(xk|xk-1,y0:k)=p(xk|xk-1)。因此,xk的分布可由粒子近似得到,即
Figure BDA0003788147910000083
进而可得:
Figure BDA0003788147910000084
值得注意的是,粒子滤波通常有粒子退化问题,经过几次迭代后,只有少量粒子具有较高的权重。因此,采用重采样方法去除权重过小或过大的粒子来减轻粒子退化问题。
本发明基于传统状态空间模型以及粒子滤波,提出了一种基于多模型学习集成的动态自适应脑机接口解码方法应用于神经信号解码,在一定程度上减少了因神经信号不稳定性带来的影响。在测试中优于卡尔曼滤波算法,证明了该方法的有效性。
附图说明
图1为本发明采用的多模型学习集成方法在仿真数据上的解码轨迹与其他方法的对比图;
图2为本发明的多模型学习集成方法在训练时不同模型的数据分配情况和在测试时不同模型的权重变化情况;
图3为本发明实施例中多模型学习集成方法在猴子避障数据集上使用两个模型分别刻画顺时针trial与逆时针trial的可视化结果。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
本研究采用多个数据集,包括一个仿真数据集,及两个猴子数据集(center-out数据集和避障数据集)。
一种基于多模型学习集成的动态自适应脑机接口解码方法,包括以下步骤:
(1)运动神经信号预处理:从硬件设备中获取原始运动神经信号,选择适合的窗口大小计算神经信号发放率,依据状态标签截取有效数据段,对数据进行标准化和平滑操作,得到经过预处理的运动和神经信号;将数据按照合理的比例分成训练集、验证集、测试集。
具体而言,实验使用Neuroport系统(NSP,Blackrock Microsystems)记录神经信号。神经活动经过放大、数字化后,以30KHz的频率进行记录。使用Central软件包(Blackrock Microsystem)将每个经过高通滤波(250Hz截止频率)的电极的神经动作电位检测的阈值分别设置为-6.5RMS到-5.5RMS。在每项日常任务开始时,研究人员会手动对锋电位进行分类,这大约需要25到35分钟。峰值活动被转换为20ms中的发放率,并使用具有450ms窗口的指数平滑函数进行低通滤波。
(2)模型池初始设定,具体包括:
设定模型池中模型的组数为G,第g组的组内模型个数为Mg,则模型池内模型总数为M=M1+M2+…MG,任意一个模型可以表示为
Figure BDA0003788147910000091
设定每个组别的模型类型候选包括:线性模型,二次多项式模型,神经网络,可使用矩阵
Figure BDA0003788147910000092
表示各组各模型的类型,Pij=1代表线性模型,Pij=2代表二次多项式模型,Pij=3代表神经网络模型,Pij=0代表无模型。
在本实例在线实验中,使用4组线性模型,每组分别包含4、6、8、10个线性模型:
Figure BDA0003788147910000101
在本实例离线实验中,使用3组模型,第一组为线性模型,第二组为二次多项式模型,第三组为神经网络模型,每组分别包含5个模型:
Figure BDA0003788147910000102
(3)根据分配的数据学习模型:
Figure BDA0003788147910000103
其中,
Figure BDA0003788147910000104
表示独立同分布的观测噪声。
当模型类型为线性模型时,其表达式为
Figure BDA0003788147910000105
当模型类型为二次多项式模型时,其表达式为
Figure BDA0003788147910000106
Figure BDA0003788147910000107
当模型类型为神经网络时,其表达式为
Figure BDA0003788147910000108
Figure BDA0003788147910000109
离线实验中,神经网络为多层感知机,其输入层为运动信号的维度,输出层为神经信号的维度,包含一层隐藏层,隐藏层节点数设为50。
(4)根据学习到的模型重分配数据,具体包括:
计算每个模型对每个时刻训练样本的预测:
Figure BDA00037881479100001010
其中,
Figure BDA00037881479100001011
表示由模型
Figure BDA00037881479100001012
所预测的所有运动数据对应的神经数据;
Figure BDA00037881479100001013
表示所有运动数据;n表示独立同分布的观测噪声。
计算每个模型在所有时刻的误差:
Figure BDA00037881479100001014
其中,
Figure BDA00037881479100001015
表示所有神经数据;
Figure BDA00037881479100001016
表示
Figure BDA00037881479100001017
与y的误差。
对每个模型在所有时刻的误差做平滑:
Figure BDA0003788147910000111
其中,
Figure BDA0003788147910000112
表示经过平滑的
Figure BDA0003788147910000113
与y的误差,lsmo表示平滑窗口大小。
在本实例中,平滑窗口大小设置为10个时间步。
对于每个组别,计算得到各个时刻使训练样本平滑误差最小的组内模型,并将该时刻数据分配给该模型:
Figure BDA0003788147910000114
Figure BDA0003788147910000115
其中,
Figure BDA0003788147910000116
表示第g组内各模型的误差,每一行代表一个模型的误差;
Figure BDA0003788147910000117
表示每一时刻的训练数据所选择的模型索引;mg表示第g组内,模型的索引。
根据每个数据选择的模型,为每个模型
Figure BDA0003788147910000118
(即模型
Figure BDA0003788147910000119
)分配新一轮的训练数据
Figure BDA00037881479100001110
其中
Figure BDA00037881479100001111
表示模型
Figure BDA00037881479100001112
所分配到的运动数据,
Figure BDA00037881479100001113
表示模型
Figure BDA00037881479100001114
所分配到的神经数据,
Figure BDA00037881479100001115
表示第m个模型(即第g组内第mg个模型)所分配到的数据长度。
对于每个模型被分配到的数据,只接受误差较小的在前100γ%的数据。因此,最终模型
Figure BDA00037881479100001116
新一轮的训练数据为
Figure BDA00037881479100001117
其中
Figure BDA00037881479100001118
Figure BDA00037881479100001119
表示模型
Figure BDA00037881479100001120
所选择的运动数据,
Figure BDA00037881479100001121
表示模型
Figure BDA00037881479100001122
所选择的神经数据,
Figure BDA00037881479100001123
表示第m个模型所选择的数据长度。
在本实例中,模型的接受阈值γ设置为0.3。
(5)对于每一组别,所述迭代过程停止准则为:
errorg<βerrorg-1
其中,β为预先设定的终止阈值,
Figure BDA0003788147910000121
表示该组模型在所有训练数据上的最小误差之和。
在本实例中,终止阈值β设为1e-3。
迭代停止后,构建最终候选模型池
Figure BDA0003788147910000122
(6)基于动态集成的状态空间模型:
(6-1)、扩展的观测模型:对传统状态空间模型进行扩展,使用上述所学习到的一组模型而非一个固定的函数(即候选模型)来动态表征观测变量与状态变量之间的关系。
传统的状态空间模型由一个状态转移函数f(·)和一个观测函数h(·)组成:
xk=f(xk-1)+vk-1
yk=h(xk)+nk
其中,k表示离散时间步长;
Figure BDA0003788147910000123
表示运动信号;
Figure BDA0003788147910000124
表示神经信号;vk、nk表示独立同分布的状态转移噪声和观测噪声。
在神经解码领域,给定一个神经信号序列y0:k,其目标是迭代估计xk的概率密度。当神经信号与运动信号都满足线性高斯的假设时,卡尔曼滤波器可以提供最优解析解。
传统状态空间模型的观测函数h(·)是事先计算好的,不能适应变化的神经信号。步骤(6)中的观测模型对其进行了改进:允许观测函数在线调整。改进后的状态空间模型表达如下:
xk=f(xk-1)+vk-1
yk=hk(xk)+nk
其中,k表示离散的时间步长;
Figure BDA0003788147910000125
表示运动数据,即状态变量;
Figure BDA0003788147910000126
表示神经数据,即观测变量;vk、nk表示独立同分布的状态转移噪声和观测噪声;
Figure BDA0003788147910000127
表示k时刻的观测函数由模型池中的模型集成得到,αk,m表示每个模型的集成权重。
在模型集
Figure BDA0003788147910000131
中的模型,类似于神经编码器,可以将输入的动力学参数xt转换为神经信号yt
(6-2)、贝叶斯模型平均法则估计状态:
Figure BDA0003788147910000132
式中,
Figure BDA0003788147910000133
是第k时刻选择第m个模型时,状态的后验概率;
Figure BDA0003788147910000134
是第k时刻选择第m个模型的后验概率,即αk,m
第k时刻选择第m个模型的后验概率计算公式如下:
Figure BDA0003788147910000135
其中,
Figure BDA0003788147910000136
为第k时刻选择第m个模型的先验概率;pm(yk|y0:k-1)为第k时刻选择第m个模型的边缘似然。
第k时刻选择第m个模型的先验概率计算公式如下:
Figure BDA0003788147910000137
其中,
Figure BDA0003788147910000138
为第k-1时刻选择第m个模型的概率;α为遗忘因子,0<α<1。
在本实例中,遗忘因子设置从0.1~0.9不等。当遗忘因子设为0.9时,极大程度上考虑了前向时刻运动状态的影响,因此使得解码出的运动状态更加平滑。
第k时刻选择第m个模型的边缘似然计算公式如下:
pm(yk|y0:k-1)=∫pm(yk|xk)p(xk|y0:k-1)dxk
其中,pm(yk|xk)是关于第m个模型的似然函数。
(6-3)、学习候选模型并进行状态估计:使用训练集和验证集得到一组不同的候选模型。可基于粒子滤波算法,在每一个时间步使用加权粒子集为每个候选模型估计运动状态,基于粒子计算
Figure BDA0003788147910000141
Figure BDA0003788147910000142
假设此刻为第k个时间步的开始,已知
Figure BDA0003788147910000143
Figure BDA0003788147910000144
和一个带有权重的粒子集
Figure BDA0003788147910000145
其中Ns代表粒子集大小,
Figure BDA0003788147910000146
是权重为
Figure BDA0003788147910000147
的粒子。假设
Figure BDA0003788147910000148
其中δ(.)代表狄拉克δ函数,下面展示如何使用粒子滤波计算
Figure BDA0003788147910000149
Figure BDA00037881479100001410
(6-3-1)、基于粒子滤波的
Figure BDA00037881479100001411
首先,从状态转移先验
Figure BDA00037881479100001412
中获得
Figure BDA00037881479100001413
然后根据重要性采样原则,可得:
Figure BDA00037881479100001414
其中,
Figure BDA00037881479100001415
代表当选择第m个模型时,第i个粒子归一化后的重要性权重。
本实例中,采用训练集作为粒子集,避免了随机撒粒子带来的不稳定性。
(6-3-2)、基于粒子滤波的
Figure BDA00037881479100001416
给定
Figure BDA00037881479100001417
首先使用步骤(6-2)中遗忘因子计算
Figure BDA00037881479100001418
的先验概率。在似然pm(yk|y0:k-1),m=1,…,M已知的情况下,可计算
Figure BDA00037881479100001419
的后验概率
Figure BDA00037881479100001420
在所述步骤3-1中,状态转移先验被用作重要性函数,即q(xk|xk-1,y0:k)=p(xk|xk-1)。因此,xk的分布可由粒子近似得到,即
Figure BDA00037881479100001421
进而可得:
Figure BDA00037881479100001422
值得注意的是,粒子滤波通常有粒子退化问题,经过几次迭代后,只有少量粒子具有较高的权重。因此,采用重采样方法去除权重过小或过大的粒子来减轻粒子退化问题。
(7)多模型学习集成方法的性能评估:在测试集数据中使用本方法与其他方法对比,评估本方法性能与有效性。
本实例采样多个数据集,包括一个仿真数据集,两个猴子数据集(center-out数据集和避障数据集)以及一个临床在线控制数据集。如图1所示,展示了仿真数据集上的解码轨迹。仿真数据使用鼠标绘制运动轨迹,将每一个trial分成三个阶段,每个阶段为每个神经元设定不同的偏好方向(Preferred Direction,PD),由此生成仿真神经信号。与多模型学习集成方法对比的方法分别是“全部PD”、“初始PD”、“单个模型”。其中,“全部PD”表示使用训练数据的每个trial的全部数据拟合出一个PD,使用群体向量法解码;“初始PD”表示使用训练数据的每个trial的初始一部分数据拟合出一个PD,使用群体向量法解码;“单个模型”表示使用训练数据的每个trial的全部数据拟合出一个线性编码模型,并且使用粒子滤波进行解码。从图1可以看出,本发明的多模型学习集成方法的解码轨迹最接近真实轨迹,表明了该方法的有效性。
如图2所示,使用猴子center-out数据集,画出了四个方向各个trial在训练过程中的每个模型所选择的数据情况以及测试过程中每个模型权重的变化情况。可以看到对于相同方向的运动,模型的变化展示出了可重复性,表明多模型学习具有有效性。
如图3所示,使用了猴子避障数据集,使用了两个模型。其展示了第一个模型偏好逆时针方向的运动,第二个模型偏好顺时针方向的运动,这从直观上解释了本发明多模型学习集成方法有效的原因。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,包括以下步骤:
(1)获取原始运动神经信号,进行预处理后按比例分成训练集、验证集和测试集;
(2)模型池初始设定,具体包括:
(2-1)设定模型池中模型的组数及每组内模型的个数;
(2-2)设定每个组别的模型类型;
(2-3)设定每个模型初始分配数据占全部数据的比例;
(2-4)根据设定分配数据的比例,对于每一个组别,从训练集中为组内的所有模型随机分配一批数据;
(3)根据分配的数据学习模型,对于每个组别每个模型,使用被分配到的训练样本,学习所设类型的模型;
(4)根据学习到的模型重分配数据,具体包括:
(4-1)计算每个模型对每个时刻训练样本的拟合误差;
(4-2)对于每个组别,计算得到各个时刻使训练样本误差最小的组内模型,并将该时刻数据分配给该模型;
(4-3)对于每个模型被分配到的数据,设置一个接受阈值γ,只接受误差小的一部分数据;
(5)对于每个组别,迭代上述步骤(3)至(4),直到在所有训练样本上的预测误差之和小于一个预设值;使用最后一次迭代后学到的所有模型作为候选模型,构建模型池;
(6)使用动态贝叶斯多模型集成框架,根据每一个测试样本的神经信号,估计其对应的运动信号:
(6-1)使用上述构建的多个候选模型动态表征状态变量与观测变量之间的关系;其中,状态变量为运动信号,观测变量为神经信号;
(6-2)根据贝叶斯模型平均法则动态组合模型池中的候选模型,作为状态空间模型的观测函数;
(6-3)应用过程中,利用构建的状态空间模型对待解码的神经信号进行状态估计,估计不同候选模型对应的状态并进行集成,得到解码后的运动信号。
2.根据权利要求1所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(2)中,模型池初始设定如下:
设定模型池中模型的组数为G,第g组的组内模型个数为Mg,则模型池内模型总数为M=M1+M2+…MG,任意一个模型表示为
Figure FDA0003788147900000021
设定每个模型初始分配数据占全部训练数据的比例为rseg;对于每一个组别,从训练集中为组内的所有模型随机分配一批数据,数据长度为
Figure FDA0003788147900000022
其中Ttrain为训练集样本数量;
每个模型所分配到的训练数据为
Figure FDA0003788147900000023
其中,
Figure FDA0003788147900000024
表示模型
Figure FDA0003788147900000025
所分配到的运动数据,
Figure FDA0003788147900000026
表示模型
Figure FDA0003788147900000027
所分配到的神经数据,dx和dy分别表示运动数据和神经数据的特征维度。
3.根据权利要求2所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(3)中,根据分配的数据学习模型的方式如下:
Figure FDA0003788147900000028
其中,
Figure FDA0003788147900000029
表示独立同分布的观测噪声。
4.根据权利要求2所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(4)中,根据学习到的模型重分配数据的方式如下:
计算每个模型对每个时刻训练样本的预测:
Figure FDA00037881479000000210
其中,
Figure FDA0003788147900000031
表示由模型
Figure FDA0003788147900000032
所预测的所有运动数据对应的神经数据;
Figure FDA0003788147900000033
表示所有运动数据;n表示独立同分布的观测噪声;
计算每个模型在所有时刻的误差:
Figure FDA0003788147900000034
其中,
Figure FDA0003788147900000035
表示所有神经数据;
Figure FDA0003788147900000036
表示
Figure FDA0003788147900000037
与y的误差;
对每个模型在所有时刻的误差做平滑:
Figure FDA0003788147900000038
其中,
Figure FDA0003788147900000039
表示经过平滑的
Figure FDA00037881479000000310
与y的误差,lsmoot表示平滑窗口大小;
对于每个组别,计算得到各个时刻使训练样本平滑误差最小的组内模型,并将该时刻数据分配给该模型:
Figure FDA00037881479000000311
Figure FDA00037881479000000312
其中,
Figure FDA00037881479000000313
表示第g组内各模型的误差,每一行代表一个模型的误差;
Figure FDA00037881479000000314
表示每一时刻的训练数据所选择的模型索引;mg表示第g组内,模型的索引;
根据每个数据选择的模型,为每个模型
Figure FDA00037881479000000315
分配新一轮的训练数据
Figure FDA00037881479000000316
其中
Figure FDA00037881479000000317
表示模型
Figure FDA00037881479000000318
所分配到的运动数据,
Figure FDA00037881479000000319
表示模型
Figure FDA00037881479000000320
所分配到的神经数据,
Figure FDA00037881479000000321
表示第m个模型所分配到的数据长度;
对于每个模型被分配到的数据,只接受误差在前100γ%的那部分数据;最终模型
Figure FDA00037881479000000322
新一轮的训练数据为
Figure FDA00037881479000000323
其中
Figure FDA00037881479000000324
表示模型
Figure FDA0003788147900000041
所选择的运动数据,
Figure FDA0003788147900000042
表示模型
Figure FDA0003788147900000043
所选择的神经数据,
Figure FDA0003788147900000044
表示第m个模型所选择的数据长度。
5.根据权利要求2所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(5)中,对于每个组别,迭代过程停止准则为:
errorg<βerrorg-1
其中,β为预先设定的终止阈值;
Figure FDA0003788147900000045
表示第g组模型在所有训练数据上的最小误差之和;
迭代停止后,构建最终候选模型池
Figure FDA0003788147900000046
6.根据权利要求1所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(6-1)中,构建的多个候选模型动态表征状态变量与观测变量之间的关系如下:
xk=f(xk-1)+vk-1
yk=hk(xk)+nk
其中,k表示离散的时间步长;
Figure FDA0003788147900000047
表示运动数据,即状态变量;
Figure FDA0003788147900000048
表示神经数据,即观测变量;vk、nk表示独立同分布的状态转移噪声和观测噪声;
Figure FDA0003788147900000049
表示k时刻的观测函数由模型池中的模型集成得到,αk,m表示每个模型的集成权重。
7.根据权利要求2所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(6-2)中,所述贝叶斯模型平均法则的状态估计如下:
Figure FDA00037881479000000410
式中,
Figure FDA00037881479000000411
是第k时刻选择第m个模型时,状态的后验概率;
Figure FDA00037881479000000412
是第k时刻选择第m个模型的后验概率,计算公式如下:
Figure FDA0003788147900000051
其中,
Figure FDA0003788147900000052
为第k时刻选择第m个模型的先验概率;pm(yk|y0:k-1)为第k时刻选择第m个模型的边缘似然。
8.根据权利要求7所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,第k时刻选择第m个模型的先验概率计算公式如下:
Figure FDA0003788147900000053
其中,
Figure FDA0003788147900000054
为第k-1时刻选择第m个模型的概率;α为遗忘因子,0<α<1。
9.根据权利要求7所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,第k时刻选择第m个模型的边缘似然计算公式如下:
pm(yk|y0:k-1)=∫pm(yk|xk)p(xk|y0:k-1)dxk
其中,pm(yk|xk)是关于第m个模型的似然函数。
10.根据权利要求7所述的基于多模型学习集成的动态自适应脑机接口解码方法,其特征在于,步骤(6-3)中,所述状态估计采用粒子滤波算法,基于粒子计算
Figure FDA0003788147900000055
Figure FDA0003788147900000056
CN202210950240.2A 2022-08-09 2022-08-09 一种基于多模型学习集成的动态自适应脑机接口解码方法 Active CN115358367B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210950240.2A CN115358367B (zh) 2022-08-09 2022-08-09 一种基于多模型学习集成的动态自适应脑机接口解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210950240.2A CN115358367B (zh) 2022-08-09 2022-08-09 一种基于多模型学习集成的动态自适应脑机接口解码方法

Publications (2)

Publication Number Publication Date
CN115358367A true CN115358367A (zh) 2022-11-18
CN115358367B CN115358367B (zh) 2023-04-18

Family

ID=84001223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210950240.2A Active CN115358367B (zh) 2022-08-09 2022-08-09 一种基于多模型学习集成的动态自适应脑机接口解码方法

Country Status (1)

Country Link
CN (1) CN115358367B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060165811A1 (en) * 2005-01-26 2006-07-27 Black Michael J Method and system for automatic decoding of motor cortical activity
US20190318202A1 (en) * 2016-10-31 2019-10-17 Tencent Technology (Shenzhen) Company Limited Machine learning model training method and apparatus, server, and storage medium
CN111712192A (zh) * 2018-01-18 2020-09-25 神经股份有限公司 具有对于高速、准确和直观的用户交互的适配的大脑-计算机接口
CN112244876A (zh) * 2020-09-30 2021-01-22 北京工业大学 一种基于可变遗忘因子的自适应滤波器的脑电信号时序随机噪声去除方法
CN112764526A (zh) * 2020-12-29 2021-05-07 浙江大学 一种基于多模型动态集成的自适应脑机接口解码方法
CN113298242A (zh) * 2021-06-08 2021-08-24 浙江大学 一种基于脉冲神经网络的脑机接口解码方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060165811A1 (en) * 2005-01-26 2006-07-27 Black Michael J Method and system for automatic decoding of motor cortical activity
US20190318202A1 (en) * 2016-10-31 2019-10-17 Tencent Technology (Shenzhen) Company Limited Machine learning model training method and apparatus, server, and storage medium
CN111712192A (zh) * 2018-01-18 2020-09-25 神经股份有限公司 具有对于高速、准确和直观的用户交互的适配的大脑-计算机接口
CN112244876A (zh) * 2020-09-30 2021-01-22 北京工业大学 一种基于可变遗忘因子的自适应滤波器的脑电信号时序随机噪声去除方法
CN112764526A (zh) * 2020-12-29 2021-05-07 浙江大学 一种基于多模型动态集成的自适应脑机接口解码方法
CN113298242A (zh) * 2021-06-08 2021-08-24 浙江大学 一种基于脉冲神经网络的脑机接口解码方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JONATHAN R. WOLPAW等: "Brain–computer interfaces for communication and control", 《CLINICAL NEUROPHYSIOLOGY》 *
YU QI等: "Dynamic Ensemble Modeling Approach to Nonstationary Neural Decoding in Brain-Computer Interfaces", 《ARXIV》 *
孙京诰等: "基于Actor-Critic和神经网络的闭环脑机接口控制器设计", 《控制与决策》 *

Also Published As

Publication number Publication date
CN115358367B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN110334843B (zh) 一种时变注意力改进Bi-LSTM的住院就医行为预测方法及装置
CN107992976B (zh) 热点话题早期发展趋势预测系统及预测方法
CN109472088B (zh) 一种页岩气调产井生产压力动态预测方法
CN111602150A (zh) 计算机实现的确定方法和系统
CN111178486B (zh) 一种基于种群演化的超参数异步并行搜索方法
EP1534122A2 (en) Medical decision support systems utilizing gene expression and clinical information and method for use
Jaimes et al. A stress-free life: just-in-time interventions for stress via real-time forecasting and intervention adaptation
Schulam et al. Integrative analysis using coupled latent variable models for individualizing prognoses
CN112764526B (zh) 一种基于多模型动态集成的自适应脑机接口解码方法
Durkan et al. Sequential neural methods for likelihood-free inference
WO2021077097A1 (en) Systems and methods for training generative models using summary statistics and other constraints
CN110796175A (zh) 一种基于轻量卷积神经网络的脑电数据的在线分类方法
CN111297327B (zh) 一种睡眠分析方法、系统、电子设备及存储介质
Chrol-Cannon et al. Learning structure of sensory inputs with synaptic plasticity leads to interference
Lones et al. Characterising neurological time series data using biologically motivated networks of coupled discrete maps
CN116959585B (zh) 基于深度学习的全基因组预测方法
CN114220164A (zh) 一种基于变分模态分解和支持向量机的手势识别方法
CN112084935B (zh) 一种基于扩充高质量脑电样本的情绪识别方法
CN115358367B (zh) 一种基于多模型学习集成的动态自适应脑机接口解码方法
Ma et al. sEMG‐based neural network prediction model selection of gesture fatigue and dataset optimization
CN113035348A (zh) 一种基于gru特征融合的糖尿病诊断方法
CN115985513B (zh) 一种基于多组学癌症分型的数据处理方法、装置及设备
US20210103807A1 (en) Computer implemented method and system for running inference queries with a generative model
US11429847B2 (en) Systems, methods, and media for decoding observed spike counts for spiking cells
WO2014188659A1 (en) Latent feature models estimation device, method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant