发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于多通道生理数据的心理压力预测方法和系统,解决了现有技术中不能准确的测试出人们的心理压力的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供一种基于多通道生理数据的心理压力预测方法,所述方法包括以下步骤:
S1、获取待测用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号;
S2、对所述皮肤电阻信号和所述脉搏信号进行预处理;
S3、提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征;
S4、基于所述皮肤电阻信号的统计特征、所述脉搏信号的统计特征和预设的压力二分类模型确定待测用户是否存在压力,或是,则执行步骤S5,否则,则输出测试结果;
S5、将预处理后的皮肤电阻信号和脉搏信号切分为长度一致的待测数据;
S6、基于所述待测数据和预设的压力多分类预测模型确定待测用户的压力等级。
优选的,所述对所述皮肤电阻信号和所述脉搏信号进行预处理包括:
S201、对所述皮肤电阻信号进行归一化处理,对所述所述脉搏信号进行归一化处理;
S202、采用陷波滤波器对对归一化处理后的皮肤电阻信号和脉搏信号进行滤波处理。
优选的,所述提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征,包括:
提取预处理后的皮肤电阻信号的时域统计特征和频域统计特征,提取预处理后的脉搏信号的时域统计特征和频域统计特征。
优选的,所述预设的压力二分类模型的构建过程包括:
A1、获取多个用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号,并基于多个用户的压力反馈信息对多个用户的皮肤电阻信号和脉搏信号进行标签化处理;
A2、对多个用户的皮肤电阻信号和脉搏信号进行预处理;
A3、提取多个用户的预处理后的皮肤电阻信号的统计特征和脉搏信号的统计特征;
A4、基于所述皮肤电阻信号的统计特征分别对随机森林模型、决策树模型和极端随机树模型进行训练,基于所述脉搏信号的统计特征分别对随机森林模型、决策树模型和极端随机树模型进行训练,得到由6个不同的二分类模型组成的压力二分类模型。
优选的,所述预设的压力多分类预测模型的构建过程包括:
C1、获取多个用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号,并基于多个用户的压力反馈信息对多个用户的皮肤电阻信号和脉搏信号进行标签化处理;
C2、对多个用户的皮肤电阻信号和脉搏信号进行预处理;
C3、将预处理后的多个用户的皮肤电阻信号和脉搏信号切分为多个长度一致的训练数据,所述训练数据构成训练集;
C4、基于所述训练集对神经网络模型进行训练,得到压力多分类预测模型。
优选的,所述皮肤电阻信号的统计特征包括:皮肤电阻信号的时域统计特征和皮肤电阻信号的时域统计特征的频域统计特征;
其中,所述皮肤电阻信号的时域统计特征包括:皮肤电阻信号标准状态下的均值、中值、标准差、最大值、最小值、最大最小值之差、最小值比率和最大值比率中的至少一个,皮肤电阻信号一阶差分后所得的均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率中的至少一个,和/或,皮肤电阻信号二阶差分后所得的均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率中的至少一个;
所述皮肤电阻信号的频域统计特征包括:皮肤电阻信号进行快速傅里叶变换后的均值、中值、标准差、最小值、最大值、最大值最小值之差中的至少一个。
优选的,所述脉搏信号的统计特征包括:脉搏信号的时域统计特征和脉搏信号的时域统计特征的频域统计特征;
其中,所述脉搏信号的时域统计特征包括:脉搏信号标准状态下的均值、中值、标准差、最大值、最小值、最大最小值之差、最小值比率和最大值比率中的至少一个,脉搏信号一阶差分后所得的均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率中的至少一个,和/或,脉搏信号二阶差分后所得的均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率中的至少一个;
所述脉搏信号的频域统计特征包括:脉搏信号进行快速傅里叶变换后的均值、中值、标准差、最小值、最大值、最大值最小值之差中的至少一个。
本发明还提供一种基于多通道生理数据的心理压力预测系统,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取待测用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号;
S2、对所述皮肤电阻信号和所述脉搏信号进行预处理;
S3、提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征;
S4、基于所述皮肤电阻信号的统计特征、所述脉搏信号的统计特征和预设的压力二分类模型确定待测用户是否存在压力,或是,则执行步骤S5,否则,则输出测试结果;
S5、将预处理后的皮肤电阻信号和脉搏信号切分为长度一致的待测数据;
S6、基于所述待测数据和预设的压力多分类预测模型确定待测用户的压力等级。
(三)有益效果
本发明提供了一种基于多通道生理数据的心理压力预测方法和系统。与现有技术相比,具备以下有益效果:
本发明首先获取待测用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号;然后对所述皮肤电阻信号和所述脉搏信号进行预处理;提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征;基于所述皮肤电阻信号的统计特征、所述脉搏信号的统计特征和预设的压力二分类模型确定待测用户是否存在压力,或是,则执行下一步,否则,则输出测试结果;将预处理后的皮肤电阻信号和所述脉搏信号切分为长度一致的待测数据;基于所述待测数据和预设的压力多分类预测模型确定待测用户的压力等级。本发明使用预设的心理压力刺激源,让待测用户产生一定的心理压力,并同步记录压力状态下的皮肤电阻信号和脉搏信号随时间变化的数据。然后对皮肤电阻信号和脉搏信号进行一系列的处理,将经过处理后数据输入到压力二分类模型判断待测用户是否存在压力,若存在压力,则通过压力多分类预测模型进一步判断待测用户的压力等级。本发明通过能真实反映待测用户的压力信息的皮肤电阻信号和脉搏信号,结合压力二分类模型和压力多分类预测模型能准确的预测出待测用户是否有压力和压力等级,且本发明采用测量人体皮肤电阻信号和脉搏信号的方式来预测压力,简单方便。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于多通道生理数据的心理压力预测方法,解决了现有技术中不能准确的测试出人们的心理压力的技术问题,实现简单方便、准确的预测出待测用户是否有压力和压力等级。本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例使用预设的心理压力刺激源,让待测用户产生一定的心理压力,并同步记录压力状态下的皮肤电阻信号和脉搏信号随时间变化的数据。然后对皮肤电阻信号和脉搏信号进行一系列的处理,将经过处理后数据输入到压力二分类模型判断待测用户是否存在压力,若存在压力,则通过压力多分类预测模型进一步判断待测用户的压力等级。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明实施例提供一种基于多通道生理数据的心理压力预测方法,如图1所示,该方法包括步骤S1~S6:
S1、获取待测用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号;
S2、对皮肤电阻信号和所述脉搏信号进行预处理;
S3、提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征;
S4、基于皮肤电阻信号的统计特征、脉搏信号的统计特征和预设的压力二分类模型确定待测用户是否存在压力,或是,则执行步骤S5,否则,则输出测试结果;
S5、将预处理后的皮肤电阻信号和脉搏信号切分为长度一致的待测数据;
S6、基于待测数据和预设的压力多分类预测模型确定待测用户的压力等级。
本发明实施例通过能真实反映待测用户的压力信息的皮肤电阻信号和脉搏信号,结合压力二分类模型和压力多分类预测模型能准确的预测出待测用户是否有压力和压力等级,且本发明采用测量人体皮肤电阻信号和脉搏信号的方式来预测压力,简单方便。
下面对各个步骤进行详细描述:
在步骤S1中,获取待测用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号。具体为:
本发明实施例使用认知负荷作为压力刺激诱导源,通过一系列心理学测试任务来实现给待测用户增加负荷来激发压力。测试过程中,在待测用户手指上佩戴皮肤电阻和脉搏数据采集传感器。皮肤电阻和脉搏一分钟采样200次,即采样频率为200Hz。
对于刺激源的选择,本发明实施例参考了国际上著名的心理研究测试实验,Stroop测试和Kraepelin测试,分别使用了Stroop Color测试、旋转字母测试、大小数字测试和连续加法计算测试(Kraepelin test),测试能较全面的从多个维度、从不同程度上给待测用户施加一定认知压力。所有测试都要求待测用户尽可能快的速度完成,并且有实验人员全程监督,共分为8段测试,2~7段测试通过键盘提交答案,第8段测试使用鼠标提交答案。测试题依次随机从后台题库中抽取并显示到屏幕,达到设定的数据采集时间结束后当前测试。为了防止长时间处于测试状态产生疲劳,严格控制每段测试的时间,平静阶段采集时间为20秒,紧接着的6段实验采集时间均为1分钟,最后的连续加法计算测试采集了2分30秒。然后放松休息几分钟,恢复一下状态,接着开始后面一阶段的测试。中间的休息时间没有收集记录数据。
其中:
Stroop Color测试为判断词义和颜色是否一致。
旋转字母测试为判断左边字母是右边基准字母仅仅通过旋转还是旋转加轴对称得到,有多个不对称的字母图像出现。
大小数字测试为判断左右两个数字的值和字体是否一致(字体和值均大于另一个则为一致)
Kraepelin测试为把所有的数字相加,并设置有红色字体为计时。
皮肤电阻信号和脉搏信号的数据采集共分为8段,依次是平静阶段(参照),Stroopcolor测试、Stroop color反转测试、旋转字母测试、旋转字母反转测试、大小数字测试、大小数字反转、连续加法计算测试(Kraepelintest)。反转测试主要是在测试过程中增加了一道认知加工过程(增加认知负荷),需要待测用户先判断出正确结果,提交时选择错误的答案。
在步骤S2中,对皮肤电阻信号和所述脉搏信号进行预处理。具体为:
S201、对所述皮肤电阻信号进行归一化处理,对所述所述脉搏信号进行归一化处理。
生理信号反应基础水平个体差异很大,不同人的生理信号表现出来的数值水平各不相同,甚至同一个人在不同时间、不同环境下都会有所不同。为了研究不同的人生理信号水平与压力之间的关系,需要去除每个被试者生理信号的基础水平差异,也就是个体差异性,才能研究出信号反应的某些内在特征随着压力状态不同产生的变化。具体的操作就是将待测用户在不同压力测试状态下的数据分别与他对应的平静状态下的数据均值相减,得到的数据便去除了个体差异,也就是对数据进行了归一化。皮肤电阻信号和脉搏信号分别做同样的处理。
S202、采用陷波滤波器对对归一化处理后的皮肤电阻信号和脉搏信号进行滤波处理。
生理信号在收集的时候容易受到噪音干扰,放大器收到微弱的干扰就会产生很多的无用信号。因此要对收集到的生理信号再次预处理以矫正结果。
人体的脉搏信号的有效频率在0-20HZ之间,且最高频率不超过40HZ。在本发明实施例中,采用Notch滤波器(陷波滤波器)对归一化处理后的脉搏信号进行滤波,截至频率设置为40HZ,去除高频噪声,保留低频信号。人体皮肤电阻信号有效频率在0—5Hz之间,同样使用滤波器做低通滤波,截止频率设为10Hz。
在步骤S3中,提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征。具体为:
统计特征包括时域统计特征和频域统计特征。
对脉搏信号和皮肤电阻信号的预处理结束后,本发明实施例时域和频域两个方面来计算其统计值作为统计特征,对预处理后的皮肤电阻信号和脉搏信号做相同的处理。得到的皮肤电阻信号和脉搏信号的时域统计特征均包括信号标准状态下的均值、中值、标准差、最大值、最小值、最大最小值之差、最小值比率和最大值比率中的至少一个,信号一阶差分后所得的均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率中的至少一个,和/或,信号二阶差分后所得的均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率中的至少一个;
皮肤电阻信号和脉搏信号的频域统计特征均包括:信号进行快速傅里叶变换后的均值、中值、标准差、最小值、最大值、最大值最小值之差中的至少一个。
需要说明书的是,在本发明实施例中,皮肤电阻信号的时域统计特征包括上述24个值,皮肤电阻信号的频域统计特征包括上述6个值。脉搏信号的时域统计特征包括上述24个值,脉搏信号的频域统计特征包括上述6个值。
在步骤S4中,基于皮肤电阻信号的统计特征、脉搏信号的统计特征和预设的压力二分类模型确定待测用户是否存在压力,或是,则执行步骤S5,否则,则输出测试结果。具体为:
在本发明实施例中,预设的压力二分类模型为6个不同的二分类模型组成的,通过将皮肤电阻信号的统计特征和脉搏信号的统计特征分别输入到这两个不同的6个不同的二分类模型中,以二分类模型输出的结果中取出现次数多的作为最终判别结果。
在本发明实施例中,预设的压力二分类模型的构建过程具体包括:
A1、获取多个用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号,并基于多个用户的压力反馈信息对多个用户的皮肤电阻信号和脉搏信号进行标签化处理。
刺激源的选择、皮肤电阻信号和脉搏信号的获取可以参考上述步骤S1中的过程,此处不再赘述。不同的是,每段测试结束后,多个用户对当前一段测试给出自己的主观心理压力感受,0表示没有压力,1表示有压力,2表示压力较大,将主观心理压力感受作为皮肤电阻信号和脉搏信号的标签,对皮肤电阻信号和脉搏信号进行标签化处理。
在本发明实施例中,一共得到120位测试者的皮肤电阻信号和脉搏信号的有效生理数据信息,每个用户每个数据通道分别有200*20+200*60+200*60+200*60+200*60+200*60+200*60+200*180=112000个数据点。
A2、对多个用户的皮肤电阻信号和脉搏信号进行预处理。这一步骤可以参考上述步骤S2中的过程,此处不再赘述。
A3、提取多个用户的预处理后的皮肤电阻信号的统计特征和脉搏信号的统计特征。这一步骤可以参考上述步骤S3中的过程,此处不再赘述。
A4、基于所述皮肤电阻信号的统计特征分别对随机森林模型、决策树模型和极端随机树模型进行训练,基于所述脉搏信号的统计特征分别对随机森林模型、决策树模型和极端随机树模型进行训练,得到由6个不同的二分类模型组成的压力二分类模型。具体为:
在本发明实施例分别使用皮肤电阻信号和脉搏信号的统计特征训练随机森林模型、决策树模型和极端随机树模型,上训练模型,得到由6个不同的二分类模型组成的压力二分类模型。训练所用的数据由步骤S3中的30个值的顺序组成,一条数据一共30个值,即30维的输入向量,分类标签为数据采集时用户的主观心理压力感受(0、1或者2),在本发明实施例中,压力二分类模型因为只做二分类,标签0不变,标签1和2合并为标签1。
在步骤S5中,将预处理后的皮肤电阻信号和脉搏信号切分为长度一致的待测数据。具体为:
将步骤S2预处理后的皮肤电阻信号和脉搏信号切分为长度一致的待测数据,在本发明实施例中采用时长20秒作为序列待测数据长度。
在步骤S6中,基于待测数据和预设的压力多分类预测模型确定待测用户的压力等级。具体为:
将待测数据输入到预设的压力多分类预测模型中,输出待测用户的压力等级为1或者2。
在本发明实施例中,预设的压力多分类预测模型的构建过程具体包括:
C1、获取多个用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号,并基于多个用户的压力反馈信息对多个用户的皮肤电阻信号和脉搏信号进行标签化处理。这一步骤可以参考上述步骤A1中的过程,此处不再赘述。
C2、对多个用户的皮肤电阻信号和脉搏信号进行预处理。这一步骤可以参考上述步骤A2中的过程,此处不再赘述。
C3、将预处理后的多个用户的皮肤电阻信号和脉搏信号切分为多个长度一致的训练数据,所述训练数据构成训练集。具体包括:
将步骤C2预处理后的皮肤电阻信号和脉搏信号切分为长度一致的训练数据,在本发明实施例中,将最短时长20秒作为序列数据长度;时长为1分钟的测试段,将数据从后面截取40秒时长切分为两段作为训练数据;时长为2分30秒的数据截取后100秒切分为5段保留作为后续训练数据,现在即每条数据均为200*20长度,每人共1+1*2*6+1*5=18条数据。数据分成多条的训练数据,多条训练数据构成训练集,每条数据对应的标签和未切分时相同。
C4、基于所述训练集对神经网络模型进行训练,得到压力多分类预测模型。具体包括:
将训练集中的训练数据输入到神经网络模型中,对神经网络模型进行训练。训练数据分类标签为数据采集时用户的主观心理压力感受0、1和2,将其转换成one-hot向量,0对应向量[100],1对应向量[010],2对应向量[001]。神经网络模型使用一层LSTM加一个全连接层,每层激活函数均使用relu激活函数,输出为一个3维的one-hot向量。通过训练,得到压力多分类预测模型。
本发明实施例还提供一种基于多通道生理数据的心理压力预测系统,上述系统包括计算机,上述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,上述至少一个存储单元中存储有至少一条指令,上述至少一条指令由上述至少一个处理单元加载并执行以实现以下步骤:
S1、获取待测用户在预设的心理压力刺激源刺激下的皮肤电阻信号和脉搏信号;
S2、对皮肤电阻信号和所述脉搏信号进行预处理;
S3、提取预处理后的皮肤电阻信号的统计特征和所述脉搏信号的统计特征;
S4、基于皮肤电阻信号的统计特征、脉搏信号的统计特征和预设的压力二分类模型确定待测用户是否存在压力,或是,则执行步骤S5,否则,则输出测试结果;
S5、将预处理后的皮肤电阻信号和脉搏信号切分为长度一致的待测数据;
S6、基于待测数据和预设的压力多分类预测模型确定待测用户的压力等级。
可理解的是,本发明实施例提供的上述基于多通道生理数据的心理压力预测系统与上述基于多通道生理数据的心理压力预测方法相对应,其有关内容的解释、举例、有益效果等部分可以参考基于多通道生理数据的心理压力预测方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明实施例通过能真实反映待测用户的压力信息的皮肤电阻信号和脉搏信号,结合压力二分类模型和压力多分类预测模型能准确的预测出待测用户是否有压力和压力等级。
2、本发明实施例采用测量人体皮肤电阻信号和脉搏信号的方式来预测压力,简单方便。
3、本发明实施例的刺激源为一系列心理测试,通过一系列心理测试激发人体压力状态,客观性高,实现相对简单,同时克服量表测试带有很强主观性的缺点。
4、本发明实施例的压力二分类模型通过多个不同的模型投票决策,结果更加准确可靠,压力多分类预测模型使用神经网络模型自动从处理好的序列特征中学习特征,能准确的对压力多等级的进行预测。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。