CN112200162B

CN112200162B - 基于端到端网络的非接触式心率测量方法、系统和装置

Info

Publication number: CN112200162B
Application number: CN202011393744.6A
Authority: CN
Inventors: 葛国敬; 朱贵波; 王金桥
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-02-23
Anticipated expiration: 2040-12-03
Also published as: CN112200162A

Abstract

本发明属于数据识别领域，具体涉及了一种基于端到端网络的非接触式心率测量方法、系统和装置，旨在解决如何无接触地进行无接触心率测量并提高测量方法的鲁棒性和泛化能力的问题。本发明包括：获取包含人脸信息的待测视频帧序列，基于所述待测视频帧序列，通过人脸检测模型获取人脸感兴趣区域图像序列，通过人脸关键点模型获取人脸关键点位置序列，基于所述人脸感兴趣区域图像序列，通过训练好的端到端双分支网络获取时间段内平均心率值。本发明提高了非接触式心率检测方法的鲁棒性和泛化能力、扩大了可精确测量的心率范围和提高了心率测量的精确度。

Description

基于端到端网络的非接触式心率测量方法、系统和装置

技术领域

本发明属于数据识别领域，具体涉及了基于端到端网络的非接触式心率测量方法、系统和装置。

背景技术

心率是在很多场合都需要被测量的一个重要的指标，特别是在健康领域。传统的设备中，监测心跳速率和心脏活动是由测量电生理讯号与心电图 (ECG) 或者是光体积变化描记图法（PPG）来完成的，ECG需要将电极连接到身体来量测心脏组织中所引发电活动的信号，PPG也需要通过设备与人体接触才能测量，接触式的设备让被测试的人感觉不舒服，特别是对于疫情期间无接触医疗需求的激增，为了解决这个问题，最近几年通过人脸测心率的技术被工业界和学术界广泛的研究。首先解释为什么可以通过摄像头来测量人的心率：皮肤的光吸收会随着血容量脉冲周期性变化，真皮和皮下层微血管中的诸如血红蛋白之类的染色体吸收了不成比例的光，因此当血液通过下面的静脉和动脉泵出时，颜色会发生微小变化。虽然人眼看不见，但嵌入可穿戴设备中的 RGB 传感器可以轻松捕获，这是通过人脸获取心率的理论依据。

在早期的远程心率测量研究中，许多传统的方法通过两个阶段完成这个任务，首先从检测或者跟踪到的人脸关键区域中获取rPPG的信号，然后从频域中分析得到心率值。一方面，一些传统方法分析脸部区域的微妙的颜色变化用以做心率测量：Verkrussysse首先发现rPPG信号可以使用从自然光下抽取的绿色通道得到心率信号；Poh 使用独立成分分析去除噪声；Li提出一种跟踪定义好的人脸关键区域的方法通过光线较正和非刚体的运动消除来做粗rPPG信号的恢复；Tulyakov 提出自适应矩阵分解的方法做心率估计。另一方面，CHROM 和POS使用颜色子空间变换的方法用来做皮肤像素的心率测量。

基于一些传统方法的先验知识，通过人脸测心率这个任务被设计成非端到端的方式。通过传统的CHROM 方法抽取了rPPG信号，对于获取到的rPPG信号，经过时域滤波、主成分分析、信号选择、心率估计然后得到心率值。

近年来，一些基于深度学习的非端到端的通过人脸测试心率的方法发展起来，Spetik 提出一个两阶段的方法，首先通过一个二维的卷积神经网络获取rPPG 信号，然后通过另外的一维的卷积神经网络回归得到心率值。也有一些端到端的通过人脸测心率的方法最近被提出来，Niu在RhythmNet提出一种端到端的方法。比如输入人脸视频帧序列，直接得到人脸的实时心率或者是一段时间内（比如10s）心率的平均值。

深度学习是近年来机器学习领域一个热门研究方向，已经在计算机视觉、自然语言处理等领域获得了巨大的成功。现有的通过人脸测试心率的方法尚有以下不足：首先，现有的数据集不足够大，这样我们只能采用浅层神经网络，学习的模型比较容易过拟合，而通常来说，在训练数据足够多的情况下，更深的神经网络的判别能力和泛化能力更强；其次，通过人脸测心率这个任务容易受到头部运动、光线变化和不同设备的影响；再次不同的损失函数对结果影响也比较大。

发明内容

为了解决现有技术中的上述问题，即如何无接触地进行无接触心率测量并提高测量方法的鲁棒性和泛化能力的问题，本发明提供了一种基于端到端网络的非接触式心率测量方法，所述方法包括：

步骤S10，获取包含人脸信息的待测视频帧序列；

步骤S20，基于所述待测视频帧序列，通过MTCNN人脸检测模型和人脸关键点模型获取人脸感兴趣区域图像序列；

步骤S30，基于所述人脸感兴趣区域图像序列，通过训练好的端到端双分支网络获取各帧图像对应的心率值；

其中，所述端到端双分支网络包括α分支和β分支，并通过带正确心率标签的训练图像序列以及设定的全局损失函数进行迭代训练直至全局损失值低于设定阈值或达到设定训练次数获得训练好的的端到端双分支网络；

所述α分支包括顺次连接的1个第一多分支构建模块、α分支1阶特征提取模块、α分支2阶特征提取模块、α分支3阶特征提取模块和α分支4阶特征提取模块；所述α分支的通道数为所述β分支的4倍；所述α分支的α分支上每个偏置网络与α分支的连接点之后通过非局部区域自注意模块生成α分支对应阶的特征序列；

β分支包括顺次连接的1个第二多分支构建模块、β分支1阶特征提取模块、β分支2阶特征提取模块、β分支3阶特征提取模块和β分支4阶特征提取模块；所述β分支每秒采集图像帧数为所述α分支的n倍，n为预设的大于1的正整数；所述β分支的β分支各阶特征提取模块的输出端通过偏置网络与对应阶的α特征提取模块相连；

在α分支上每个偏置网络与α分支的连接点之后通过非局部区域自注意模块生成α分支对应阶的特征序列。

进一步地，步骤S30包括：

步骤S31，通过所述端到端双分支网络中的α分支按时间顺序均匀采集所述人脸感兴趣区域图像序列中x张图像作为α分支待处理图像序列，通过β分支按时间顺序均匀采集nx张图像作为β分支待处理图像序列

步骤S32，令s=1，基于所述α分支待处理图像序列，通过第一多分支构建模块获取α分支s阶特征序列；基于所述β分支待处理图像序列，通过第二多分支构建模块获取β分支s阶特征序列；

步骤S33，基于所述α分支s阶特征序列，通过α分支s阶特征提取模块获取α分支s+1阶待融合特征序列；基于所述β分支s阶特征序列，通过β分支s阶特征提取模块获取β分支s+1阶特征序列；

步骤S34，将所述β分支第s+1阶特征序列通过偏置网络进行尺度调整生成β分支s+1阶偏置特征序列，将所述β分支s+1阶偏置特征序列和所述α分支s+1阶待融合特征序列融合为α分支s+1阶特征序列；

步骤S35，基于所述α分支s+1阶待注意特征序列，通过非局部区域自注意模块获取α分支s+1阶特征序列；

步骤S36，令s=s+1，重复步骤S33-步骤S35的过程直至s+1=5；此时α分支第s+1阶特征序列即为时间段内平均心率值。

进一步地，所述训练好的端到端双分支网络，其训练方法为：

步骤A10，获取训练视频帧序列，所述训练视频帧序列为标注了标准心率的视频帧序列；

步骤A20，基于所述训练视频帧序列，重复步骤S31-步骤S36的操作，通过坐标下降法调整端到端双分支网络的参数和各阶段的权重，直至皮尔逊负相关系数损失与L1损失之和小于预设的第一阈值或迭代至预设的次数，获得训练好的端到端双分支网络。

进一步地，所述非局部区域自注意模块包括3个第三卷积层和1个第四卷积层；

第1个第三卷积层和第2个第三卷积层基于所述α分支s+1阶待注意特征序列获取第一1阶注意特征序列和第二1阶注意特征序列，将所述第一1阶注意特征序列和第二1阶注意特征序列相乘并通过softmax进行分类生成第一2阶待注意特征序列；

第3个第三卷积层基于所述待注意特征序列获取第二2阶待注意特征序列，并将所述第二2阶待注意特征序列与第一2阶待注意特征序列相乘生成3阶待注意特征序列；

第四卷积层基于所述3阶待注意特征序列生成3阶注意特征序列，将所述3阶注意特征序列与所述α分支s+1阶待注意特征序列加和，生成α分支s+1阶特征序列。

进一步地，特征提取模块由数个基础块和数个瓶颈块构建；

所述基础块包括顺次连接的第五卷积层、第三归一化层、第三修正线性成、第六卷积层、第四归一化层、第四修正线性层、第七卷积层和第五归一化层组成；其中第五卷积层的卷积核为[1 1 1],第六卷积层的卷积核为[1 3 3]，第七个卷积层的卷积核为[1 1 1]。

所述瓶颈块包括顺次连接的第八卷积层、第六归一化层、第五修正线性层、第九卷积层、第七归一化层、第六修正线性层、第十卷积层和第八归一化层组成；其中第八卷积层的卷积核是[3 1 1],第九卷积层的卷积核是[1 3 3]，第十卷积层的卷积核为 [1 1 1]。

α分支1阶特征提取模块包括3个基础块，输入的通道为

，输出的通道为

；α 分支2阶特征提取模块包括4个基础块，输入的通道为

，输出通道为

；α分支3阶特征提取模块,包括6个瓶颈块，输入通道为

，输出通道为

；α分支4阶特征提取模块，包括3个瓶颈块，输入通道为

，输出通道为

；k为正整数；

β分支1阶特征提取模块包括3个瓶颈块，输入的通道为

，输出的通道为

；β分支2阶特征提取模块包括4个瓶颈块，输入的通道为

，输出通道为

；β分支3阶特征提取模块,包括6个瓶颈块，输入通道为

，输出通道为

；β分支4阶特征提取模块，包括 3个瓶颈块，输入通道为

，输出通道为

；l为正整数，l+2=k。

进一步地，步骤S20和步骤S30之间还包括步骤S20B基于感兴趣区域图像序列进行样本扩增；

步骤S21B，基于所述感兴趣区域图像序列，通过人脸关键点模型获取人脸关键点位置序列；

步骤S22B，基于所述感兴趣区域图像序列和人脸关键点位置序列，通过裁剪和仿射变换的方法获取不同尺度的人脸图片集；

步骤S23B，基于所述不同尺度的人脸图片集，通过部分区域擦除和左右翻转的方法进行样本扩增获得扩增人脸图片集，并将扩增人脸图片集按时间排序生成扩增的人脸感兴趣区域图像序列。

进一步地，所述第一多分支构建模块和第二多分支构建模块结构相同，包括顺次连接的第一卷积层、第一归一化层、第一修正线性层和第一池化层；所述偏置网络包括顺次连接的第二卷积层、第二归一化层、第二修正线性层和第二池化层。

本发明的另一方面，提出了一种端到端的非接触式心率测量系统，所述系统包括：图像获取单元、人脸提取单元和心率提取单元；

所述图像获取单元，用于获取包含人脸信息的待测视频帧序列；

所述人脸提取单元，用于基于所述待测视频帧序列，通过人脸检测模型获取人脸感兴趣区域图像序列；通过人脸关键点模型获取人脸关键点位置序列；

所述心率提取单元，用于基于所述人脸感兴趣区域图像序列，通过训练好的端到端双分支网络获取时间段内平均心率值；

其中，所述端到端双分支网络包括α分支和β分支，并通过带正确心率标签的训练图像序列以及设定的全局损失函数进行迭代训练直至全局损失值低于设定阈值或达到设定训练次数；

所述β分支包括顺次连接的1个第二多分支构建模块、β分支1阶特征提取模块、β分支2阶特征提取模块、β分支3阶特征提取模块和β分支4阶特征提取模块；所述β分支每秒采集图像帧数为所述α分支的n倍，n为预设的大于1的正整数；所述β分支的β分支各阶特征提取模块的输出端通过偏置网络与对应阶的α特征提取模块相连本发明的第三方面，提出了一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述基于端到端网络的非接触式心率测量方法。

本发明的第四方面，提出了一种处理装置，包括处理器、存储装置；所述处理器，适于执行各条程序；所述存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述基于端到端网络的非接触式心率测量方法。

本发明的有益效果：

（1）本发明通过基于3D卷积网络构建的端到端双分支网络从人脸序列图像中端到端地自动学习丰富且具有判别力的特征，并对心率进行预测，使得非接触测试心率的方法能够适应各种因为光线变化和头部运动的影响，具有更强的判别能力和泛化能力。

（2）本发明通过端到端双分支网络的α分支和β分支分别从人脸序列图像中抽取不同时间跨度的人脸图像序列，通过对不同时间跨度的人脸图像进行处理可以更好地提取出时间特征和空间特征，并通过偏置网络将时间特征和空间特征进行融合，使得心率测量方法可以很好的兼顾低心率和高心率的情况，也能适应头部运动，在更大的量程内获得较高精度。

（3）本发明通过非局部自注意模块，直接计算两个位置之间的关系快速捕获场长范围依赖，并且非局部区域自注意力模块计算每个像素位置输出时，不再只和领域计算，而是和图像中所有位置计算相关性，然后将相关性作为一个权重表征其他位置和当前待计算位置的相似度，使得心率测量方法可以适应各种光线变化和头部运动，提高了判别能力。

（4）现有技术也可以通过增加各种光线效果的样本训练心率测量模型以实现心率测量，但是现有的技术只用一个分支进行训练，很难兼顾强照明/若照明条件和高心率/低心率的测量，本发明通过双分支、多尺度分布式的处理，并通过偏置网络将更具判别力的特征结合起来，使心率测量模型具有更好的泛化能力，同时兼顾了光照变化、运动变化和心率范围较大的心率测量。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1为本发明端到端网络的非接触式心率测量方法流程示意图；

图2为本发明实施例中端到端双分支网络的结构框图；

图3为本发明实施例中非局部区域自注意模块网络结构框图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本发明提供一种方法，本方法所述基于端到端网络的非接触式心率测量方法包括：步骤S10-步骤S30，具体步骤详述如下：

步骤S10，获取包含人脸信息的待测视频帧序列；

步骤S20，基于所述待测视频帧序列，通过MTCNN人脸检测模型和人脸关键点模型来获取人脸感兴趣区域图像序列；

其中，所述端到端双分支网络包括α分支和β分支，并通过带正确心率标签的训练图像序列以及设定的全局损失函数进行迭代训练直至全局损失值低于设定阈值或达到设定训练次数

所述β分支包括顺次连接的1个第二多分支构建模块、β分支1阶特征提取模块、β分支2阶特征提取模块、β分支3阶特征提取模块和β分支4阶特征提取模块；所述β分支每秒采集图像帧数为所述α分支的n倍，n为预设的大于1的正整数；所述β分支的β分支各阶特征提取模块的输出端通过偏置网络与对应阶的α特征提取模块相连。

为了更清晰地对本发明基于端到端网络的非接触式心率测量方法进行说明，下面结合图1对本发明方法实施例中各步骤展开详述。

本发明基于端到端网络的非接触式心率测量方法，包括步骤S10-步骤S30，具体步骤详述如下：

步骤S10，获取包含人脸信息的待测视频帧序列；

步骤S20，基于所述待测视频帧序列，通过MTCNN人脸检测模型和关键点模型获取人脸感兴趣区域图像序列；

在本实施例中，通过Joint Face Detection and Alignment using Multi-taskCascaded Convolutional Networks所述的通过三阶的级联卷积神经网络对任务进行从粗到细的处理算法来训练人脸检测和关键点模型，第一阶段，通过一个浅层的卷积神经网络迅速生成候选窗口。该阶段是一个全部由卷积层组成的卷积神经网络，获取候选人脸窗口以及人脸框回归向量。基于人脸框回归向量对候选窗口进行校正。之后采用合并高重叠率的候选窗口。第二阶段，通过一个更复杂的卷积神经网络否决大量非人脸窗口从而精化人脸窗口。第三阶段，使用更复杂的卷积神经网络进一步精细化结果并输出个人脸特征点。

在本实施例中，还包括步骤S20B基于感兴趣区域图像序列进行样本扩增；

步骤S21B，基于所述感兴趣区域图像序列，通过人脸关键点模型获取感兴趣区域图像序列；

在本实施例中，步骤S30包括：

步骤S31，通过所述端到端双分支网络中的α分支按时间顺序均匀采集所述人脸感兴趣区域图像序列中x张图像作为α分支待处理图像序列，通过β分支按时间顺序均匀采集nx张图像作为β分支待处理图像序列；

在本实施例中，A分支和B分支的区别在于优选的B分支的参数量是A分支的1/16轻量化不增加A分支的负担，区别是：A分支对于处理心率比较慢的图像序列，取得显著效果；B分支对于处理心率比较快的图像序列，取得显著效果。

步骤S32，令s=1，基于所述α分支待处理图像序列，通过第一多分支构建模块获取α分支1阶特征序列；基于所述β分支待处理图像序列，通过第二多分支构建模块获取β分支1阶特征序列；

步骤S34，将所述β分支第s+1阶特征序列通过偏置网络进行尺度调整生成β分支s+1阶偏置特征序列，将所述β分支s+1阶偏置特征序列和所述α分支s+1阶待融合特征序列融合为α分支s+1阶待注意特征序列；

步骤S36，令s=s+1，重复步骤S33-步骤S35的过程直至s=5；此时α分支第s+1阶特征序列即为各帧图像对应的心率值。

在本实施例中，α分支1阶特征提取模块包括顺次连接的卷积层、归一化层和3个第一残差结构；所述第一残差结构为残差卷积层、归一化层、修正线性层、残差卷积层、归一化层、修正线性层、残差卷积层和归一化层，其中三个残差结构的卷积层均为3D卷积层；第一残差结构中第1个残差卷积层卷积核为[1 1 1]，步长为[1 1 1]，填充为[0 0 0 ]；第2个残差卷积层卷积核为[1 3 3]，步长为[1 1 1]，填充为[0 1 1 ]；第3个残差卷积层卷积核为[1 1 1]，步长为[1 1 1]，填充为[0 0 0 ]。

α分支2阶段特征提取模块包括顺次连接的卷积层、归一化层和4个第二残差结构；所述第二残差结构为残差卷积层、归一化层、修正线性层、残差卷积层、归一化层、修正线性层、残差卷积层和归一化层；第二残差结构中第1个残差卷积的卷积核为[1 1 1]，步长为[1 1 1]，填充为[0 0 0 ]，第2个残差卷积的卷积核为[1 3 3]，步长为[1 1 1]，填充为[0 1 1 ]，第3个卷积的卷积核为[1 1 1]，步长为[1 1 1]，填充为[0 0 0 ]。

α分支3阶段特征提取模块包括顺次连接的卷积层、归一化层和6个第三残差结构；所述第三残差结构为残差卷积层、归一化层、修正线性层、残差卷积层、归一化层、修正线性层、残差卷积层和归一化层；第三残差结构中第1个残差卷积的卷积核为[3 1 1]，步长为[1 1 1]，填充为[0 0 0 ]，第2个残差卷积的卷积核为[1 3 3]，步长为[1 1 1]，填充为[0 1 1 ]，第3个卷积的卷积核为[1 1 1]，步长为[1 1 1]，填充为[0 0 0 ]。

α分支4阶段特征提取模块包括顺次连接的卷积层、归一化层和3个第四残差结构；所述第四残差结构为残差卷积层、归一化层、修正线性层、残差卷积层、归一化层、修正线性层、残差卷积层和归一化层；第三残差结构中第1个残差卷积的卷积核为[3 1 1]，步长为[1 1 1]，填充为[0 0 0 ]，第2个残差卷积的卷积核为[1 3 3]，步长为[1 1 1]，填充为[01 1 ]，第3个卷积的卷积核为[1 1 1]，步长为[1 1 1]，填充为[0 0 0 ]。

在本实施例中，所述训练好的端到端双分支网络，其训练方法为：

步骤A20，基于所述训练视频帧序列，重复步骤S31-步骤S36的操作，通过坐标下降调整端到端双分支网络各阶段的权重，直至皮尔逊负相关系数损失与L1损失之和小于预设的第一阈值或迭代至预设的次数，获得训练好的端到端双分支网络。

假设有两个变量X，Y，那么两个变量间的皮尔逊负相关系数计算方法：

在本实施例中，所述非局部区域自注意模块包括3个第三卷积层和1个第四卷积层；第三卷积层卷积核的大小为[1 1 1]，步长为[1 1 1]；第四卷积层卷积核为[1 1 1]，步长为[1 1 1]；

如图3所示，本实施例自注意机制为：

其中，对于一个特定的特征序列，

表示这个特征序列

的第i个子块；

表示经过变换之后的一个特征序列的子块，

表示对特征序列

进行1×1×1卷积操作，

表示3 阶注意特征序列的第i个子块；

其中，

表示对特征序列x的第j 个子块进行1×1×1卷积操作，

表示对特征序列x的第i 个子块进行1×1×1卷积操作，

表示对特征序列x的第j 个子块进行1×1×1卷积操作，

表示对

对应的向量矩阵与

代表的向量进行矩阵乘法得到的特征序列，用于计算特征的相似度，T表示转置，

表示对计算得到的第i 块特征和所有的其他计算的第j块特征相似度的求和

其中，所述端到端双分支网络包括α分支和β分支；并通过带正确心率标签的训练图像序列以及设定的全局损失函数进行迭代训练直至全局损失值低于设定阈值或达到设定训练次数；

本实施例提供的双分支网络的结构如图2所示，其中1为第一多分支构建模块，3为α分支1阶特征提取模块，5为α分支2阶特征提取模块，7为α分支3阶特征提取模块，9为α分支4阶特征提取模块；2为第二多分支构建模块，4为β分支1阶特征提取模块，6为β分支2阶特征提取模块，8为β分支3阶特征提取模块，10为β分支4阶特征提取模块；

在本实施例中α分支有1个输入层、69个卷积层和一个损失输出层组成。

在本实施例中，所述第一多分支构建模块和第二多分支构建模块结构相同，包括顺次连接的第一卷积层、第一归一化层、第一修正线性层和第一池化层；所述偏置网络包括顺次连接的第二卷积层、第二归一化层、第二修正线性层和第二池化层。

在本实施例中，α分支的多分支构建模块的卷积层全部为3D卷积，卷积核为[1 77], 步长为[1 2 2],填充为[0 3 3]。归一化层为3D归一化，池化层为最大池化，其中卷积核为[1 3 3]，步长为[1 2 2]，填充为[0 1 1]，输入通道为4，输出通道为8。

在本实施例中，β分支的多分支构建模块卷积层全部为3D卷积，卷积核为[5 7 7]，步长为[1 2 2]，填充为[2 3 3]。归一化层为3D归一化，池化层为最大池化，其中卷积核为[1 3 3]，步长为[1 2 2]，填充为[0 1 1]，输入通道为32，输出通道为8。

在本实施例中，特征提取模块由数个基础块和数个瓶颈块构建；

α分支1阶特征提取模块包括3个基础块，输入的通道为

，输出的通道为

；α 分支2阶特征提取模块包括4个基础块，输入的通道为

，输出通道为

；α分支3阶特征提取模块,包括6个瓶颈块，输入通道为

，输出通道为

；α分支4阶特征提取模块，包括3个瓶颈块，输入通道为

，输出通道为

；k为正整数；

在本实施例中，优选的将k取值为5，l取值为3；

β分支1阶特征提取模块包括3个瓶颈块，输入的通道为

，输出的通道为

；β分支2阶特征提取模块包括4个瓶颈块，输入的通道为

，输出通道为

；β分支3阶特征提取模块,包括6个瓶颈块，输入通道为

，输出通道为

；β分支4阶特征提取模块，包括 3个瓶颈块，输入通道为

，输出通道为

；l为正整数，l+2=k。

在α分支上每个偏置网络与α分支的连接点之后通过非局部区域自注意模块生成α分支对应阶的输出信息。

本实施例中，偏置网络包括卷积层、归一化层、修正线性层；输入通道为8，输出通道为16，卷积核为[7 1 1]，步长为[4 1 1]，填充为[3 0 0 ]， BN层为3D归一化。

本发明第二实施例的基于端到端网络的非接触式心率测量系统，包括：图像获取单元、人脸提取单元和心率提取单元；

其中，所述端到端双分支网络包括α分支和β分支；α分支和β分支均基于3D残差结构构建；α分支采用大时序跨度，β分支采用小时序跨度，β分支每秒采集图像帧数为α分支的n倍，n为预设的大于1的正数；β分支的通道数是α分支通道数的1/4；

α分支包括顺次连接的1个第一多分支构建模块、α分支1阶特征提取模块、α分支2阶特征提取模块、α分支3阶特征提取模块和α分支4阶特征提取模块； β分支包括顺次连接的1个第二多分支构建模块、β分支1阶特征提取模块、β分支2阶特征提取模块、β分支3阶特征提取模块和β分支4阶特征提取模块；β分支各阶特征提取模块的输出端还通过偏置网络连接对应阶的α特征提取模块相连；

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第三实施例的一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于端到端网络的非接触式心率测量方法。

本发明第四实施例的一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于端到端网络的非接触式心率测量方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的模块、方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，软件模块、方法步骤对应的程序可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

术语“第一”、 “第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。