CN116712048A - 血压测量方法、装置及相关设备 - Google Patents
血压测量方法、装置及相关设备 Download PDFInfo
- Publication number
- CN116712048A CN116712048A CN202310564910.1A CN202310564910A CN116712048A CN 116712048 A CN116712048 A CN 116712048A CN 202310564910 A CN202310564910 A CN 202310564910A CN 116712048 A CN116712048 A CN 116712048A
- Authority
- CN
- China
- Prior art keywords
- blood pressure
- user
- feature
- attention
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000009530 blood pressure measurement Methods 0.000 title claims abstract description 26
- 230000036772 blood pressure Effects 0.000 claims abstract description 106
- 239000013598 vector Substances 0.000 claims abstract description 60
- 230000035487 diastolic blood pressure Effects 0.000 claims abstract description 37
- 230000035488 systolic blood pressure Effects 0.000 claims abstract description 37
- 238000000605 extraction Methods 0.000 claims abstract description 36
- 238000003860 storage Methods 0.000 claims abstract description 13
- 230000001815 facial effect Effects 0.000 claims description 29
- 238000011176 pooling Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 230000007246 mechanism Effects 0.000 claims description 15
- 238000010586 diagram Methods 0.000 claims description 14
- 238000013507 mapping Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000005259 measurement Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 3
- 229910052753 mercury Inorganic materials 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013186 photoplethysmography Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
- A61B5/021—Measuring pressure in heart or blood vessels
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Cardiology (AREA)
- Veterinary Medicine (AREA)
- Physiology (AREA)
- Pathology (AREA)
- Heart & Thoracic Surgery (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Vascular Medicine (AREA)
- Fuzzy Systems (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
Abstract
本发明公开了一种血压测量方法、装置、计算机设备及存储介质,所述方法包括:获取待测用户的面部视频和个体信息;将待测用户的面部视频和个体信息输入至血压预测模型,得到待测用户的收缩压和舒张压,其中,血压预测模型包括时空特征提取模块和血压信号预测模块,时空特征提取模块用于对待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量;血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到待测用户的收缩压和舒张压;输出待测用户的收缩压和舒张压。采用本发明可以不需要与被测者直接接触,降低血压测量复杂度和成本,提高血压测量效率和测量精度。
Description
技术领域
本发明涉及人脸视频特征处理和血压测量技术领域,尤其涉及一种血压测量方法、装置、计算机设备及存储介质。
背景技术
血压是指心脏将血液运输至身体周围的过程中,对脉管施加的压力,是人体一项很重要的健康指标,在医学诊断、健康监控等领域发挥着重要作用。水银血压计和袖带式电子血压计是目前较为常见和主流对的血压检测设备,水银血压计测量得到的结果较为准确,但是需要与被测者接触,操作比较复杂,且对专业性要求较高,电子血压计也需要与被测者接触,且在使用过程中存在很多局限性,例如精度受传感器位置影响、无法进行连续测量等。
光电容积脉搏波描记法(photoplethysmographic,PPG)是一种利用光电技术检测人体脉搏波的方法,其根据皮下血液容积随着心脏周期性射血而产生周期性变化的原理,利用光电探测器检测这种脉动性变化获得容积脉搏波信号,随着该技术的发展,市场上也出现了许多基于光电式容积脉搏波的血压测量设备(例如血压测量手环),但是这也提高血压测量成本,其这些设备普遍存在测量精度不高、对于异常血压的捕获能力不足的问题。
因此,如何提高血压测量的灵活性,降低血压测量复杂度和成本,提高血压测量效率和测量精度是目前亟待解决的问题。
发明内容
本发明实施例提供一种血压测量方法、装置、计算机设备和存储介质,不需要与被测者直接接触,能够提高血压的灵活性,降低血压测量复杂度和成本,提高血压测量效率和测量精度。
为了解决上述技术问题,本申请实施例提供一种血压测量方法,包括以下步骤:获取待测用户的面部视频和个体信息,所述面部视频包括多个面部图像序列;将所述待测用户的面部视频和所述个体信息输入至血压预测模型,得到所述待测用户的收缩压和舒张压,其中,所述血压预测模型包括时空特征提取模块和血压信号预测模块,所述时空特征提取模块用于对所述待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量;所述血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到所述待测用户的收缩压和舒张压;输出所述待测用户的收缩压和舒张压。
在一种可能的实现方式中,将所述待测用户的面部视频输入至浅层特征提取网络进行卷积处理,输出浅层特征图,所述浅层特征提取网络包括多个2D卷积块;基于所述浅层特征图和多尺度核空间注意力机制,得到注意力特征图;将所述注意力特征图输入基于分步时空自注意力的编码器进行编码,得到所述包含全局空间信息和时间信息的特征向量。
在另一种可能的实现方式中,利用多个不同尺寸大小的卷积核对所述浅层特征图进行卷积操作,提取得到多尺度特征图;将所述多尺度特征图进行级联并在通道维度上分别进行全局最大池化和全局平均池化,得到全局最大池化特征图和全局平均池化特征图;根据所述全局最大池化特征图和所述全局平均池化特征图,得到注意力权重图;基于所述注意力权重图和所述浅层特征图,得到所述注意力特征图。
在另一种可能的实现方式中,将所述注意力特征图输入嵌入层Embedding网络,得到所述注意力特征图对应的嵌入向量token;将所述嵌入向量token输入至基于longformer的编码网络,输出所述包含全局空间信息和时间信息的特征向量,所述基于longformer的编码网络用于对所述嵌入向量token在时间维度和空间维度上采用自注意力机制。
在另一种可能的实现方式中,将所述个体信息输入至线性映射网络进行映射处理,得到所述个体信息对应的个体特征;利用自注意力机制对所述个体特征和所述特征向量进行融合,生成融合后的特征向量;将所述融合后的特征向量输入至全连接层网络,得到所述待测用户的收缩压和舒张压的预测值。
在另一种可能的实现方式中,获取样本数据,所述样本数据包括样本人脸视频、所述样本人脸视频对应的个体信息和所述样本人脸视频对应的真实血压值,所述真实血压值包括收缩压和舒张压;将所述样本数据输入至初始血压预测模型;所述初始血压预测模型预测得到所述样本人脸视频对应的血压值,并将得到的血压值与所述真实血压值进行比对,计算得到血压损失函数;根据所述血压损失函数对所述初始血压预测模型中的参数和权重进行调整,得到所述血压预测模型。
为了解决上述技术问题,本申请实施例还提供一种血压测量装置,包括:数据获取模块,用于获取待测用户的面部视频和个体信息,所述面部视频包括多个面部图像序列;预测模块,用于将所述待测用户的面部视频和所述个体信息输入至血压预测模型,得到所述待测用户的收缩压和舒张压,其中,所述血压预测模型包括时空特征提取模块和血压信号预测模块,所述时空特征提取模块用于对所述待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量;所述血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到所述待测用户的收缩压和舒张压;输出模块,用于输出所述待测用户的收缩压和舒张压。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明实施例提供的血压测量方法、装置、计算机设备及存储介质,在获取待测用户的面部视频后,通过预先构建的端到端血压预测模型对待测用户的血压进行直接的预测,可以避免由于信号处理和手工特征提取所造成的测量精度下降的问题,降低血压测量复杂度和测量成本,此外,通过不同人群的个体信息与血压之间的相关性,将待测用户的个体信息,例如性别、年龄、身高、体重等信息与面部视频所包含的特征信息进行融合处理以辅助血压的预测,可以进一步提高测量精度,而且整个测量过程不需要与被测用户进行直接接触,提高了检测灵活性,拓宽了使用场景。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图。
图2是本申请的血压测量方法的一个实施例的流程图。
图3是本申请的血压预测模型结构的一个示意图。
图4是本申请的多尺度核空间注意力机制结构的一个示意图。
图5是本申请的血压预测模型训练过程的一个实施例的流程图。
图6是根据本申请的血压测量装置的一个实施例的结构示意图。
图7是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备110、网络120和服务器130。网络120用以在终端设备110和服务器130之间提供通信链路的介质。网络120可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备110通过网络120与服务器130交互,以接收或发送消息等。
终端设备110可以是具有显示屏并且支持网页浏览和拍摄功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器130可以是提供各种服务的服务器,例如对终端设备110上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的血压测量方法由服务器执行,相应地,血压测量装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备110具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种血压测量方法,以该方法应用在图1中的服务端为例进行说明,详述如下。
S201、获取待测用户的面部视频和个体信息。
具体地,待测用户可以通过终端设备(例如手机)拍摄包含自己整个面部图像的视频,然后将该视频以及自身的个体信息通过网络发送至服务器,或者是将预先存储的包含整个面部图像的视频以及个体信息发送至服务器,由服务器对该视频和个体信息进行进一步处理。需要说明的是,待测用户的个体信息可以是待测用户的性别、年龄、身高、体重等基本信息。
可选的,服务器在接收到待测用户的面部视频之后,可以对该面部视频进行预处理,例如将面部视频中所包含的面部图像进行缩放处理,将图像缩放到同一尺度,或对面部图像进行归一化和减均值处理,从而保证在后续处理过程中,所有的数据都具有统一性,提高数据处理效率。
S202、将待测用户的面部视频和个体信息输入至血压预测模型,得到待测用户的收缩压和舒张压。
具体地,服务器在接收到用户的面部视频和个体信息后,可以针对面部视频中所包含的面部图像序列,将其连同用户的个体信息输入至已经训练好的,具备血压测量能力的血压预测模型中,从而得到待测用户的收缩压和舒张压。
示例性的,如图3所示,血压预测模型中包括时空特征提取模块和血压信号预测模块,其中,时空特征提取模块用于对待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量,然后血压信号预测模块将特征向量和待测用户的个体信息进行融合,得到融合后的特征向量,并基于融合后的特征向量预测得到待测用户的收缩压和舒张压。
需要说明的是,血压信号预测模型是基于卷积神经网络构建的检测模型,在利用其进行血压测量之前,需要先对其进行训练以使得其具备预测能力,后面将对血压信号预测模型的训练过程进行详细说明。
在一种可能的实现方式中,将待测用户的面部视频输入至浅层特征提取网络进行卷积处理,输出浅层特征图,所述层次特征图提取网络包括多个2D卷积块,基于浅层特征图和多尺度核注意力机制,得到注意力特征图,将注意力特征图输入基于分步时空自注意力的编码器进行编码,得到包含全局空间信息和时间信息的特征向量。
具体地,对于输入的面部视频所包含的每一个面部图像帧,每个2D卷积块对其进行2D卷积操作并使用激活函数非线性化,最终得到浅层特征图,其包含较多的局部空间信息。应理解,浅层特征图的本质是一个F×W×H×C的矩阵,其中,F表示个数,W表示宽,H表示高,C表示通道数。
在另一种可能的实现方式中,利用多个不同尺寸大小的卷积核对浅层特征图进行卷积操作,提取得到多尺度特征图,将多尺度特征图进行级联并在通道维度上分别进行全局最大池化和全局平均池化,得到全局最大池化特征图和全局平均池化特征图,根据所述全局最大池化特征图和所述全局平均池化特征图,得到注意力权重图,基于注意力权重图和浅层特征图,得到注意力特征图。
具体地,在得到浅层特征图之后,为了对浅层特征里富含有效信号分布的空间赋予更大的权重,可以采用不同尺寸大小的卷积核对浅层特征图进行卷积操作,在不同的感受视野下提取多尺度特征,得到多个不同尺度下的多尺度特征图,然后将多尺度特征图进行级联,然后在通道维度上进行全局最大池化和全局平均池化,得到全局最大池化特征图和全局平均池化特征图,接着将两种池化后的特征图再进行级联,并将其通过一个1×1卷积层和激活函数后得到注意力权重图,最后将生成的注意力权重图与浅层特征图进行逐元素相乘,那么最后将得到注意力权重增强后的注意力特征图。
值得说明的是,多尺度特征图进行级联后存在多个通道,在通道维度上进行全局最大池化,就是在特征图上的同一空间位置在不同通道上的所有值里取最大的一个来代表这一位置,同理,全局平均池化就是所有值里取平均值来表示这一位置,这样特征图在通道维度上就被压缩了,即得到的特征图只有一个通道。
示例性的,如图4所示,利用1×1卷积核、3×3卷积核、5×5卷积核分别对浅层特征图进行卷积操作,然后将卷积结果进行级联,对级联后的特征图分别进行全局最大池化和全局平均池化处理,并将池化结果进行级联,最后通过一个1×1卷积层和激活函数生成注意力权重图。
在另一种可能的实现方式中,将注意力特征图输入嵌入层Embedding网络,得到该注意力特征图对应的嵌入向量token,然后将该嵌入向量token输入至基于longformer的编码网络,输出包含全局空间信息和时间信息的特征向量,该基于longformer的编码网络用于对嵌入向量token在时间维度和空间维度上采用自注意力机制。
具体地,基于分步时空自注意力的编码器由Embedding层和多个包含基于longformer的编码块组成,Embedding层对输入的注意力特征图进行向量表示,并结合空间位置和时间位置进行编码,得到一组输入的token,然后基于longformer的编码块依次对输入的token在时间维度和空间维度上采用自注意力机制,得到包含全局空间信息和时间信息的特征向量。
应理解,Embedding层的本质就是将输入表示为一个序列形式,将一张输入图像划分为一组图像块,对每个图像块应用线性变换,将其映射到一个低维特征空间,这样可以得到一个序列化的特征表示,每个位置(包括空间位置和时间位置)的图像块对应一个token,最后基于longformer的编码块所包含的自注意力机制可以分别在时间维度和空间维度获取图像块之间的时空关系,这些关系通过权重体现,最终生成的特征向量就是被分配了不同权重后的结果。
在另一种可能的实现方式中,将待测用户的面部视频所对应的个体信息输入至线性映射网络进行映射处理,得到该个体信息对应的个体特征,然后利用自注意力机制对该个体特征和特征向量进行融合,生成融合后的特征向量,最后将融合后的特征向量输入至全连接层网络,得到待测用户的收缩压和舒张压的预测值。
具体地,在获取到待测用户的个体信息之后,利用线性映射网络对该个体信息向高维空间映射为个体特征,其具体的映射过程可以通过下列公式进行表示:
hd=w×xd+b
其中,xd表示个体信息,w表示映射权重矩阵,b表示偏置项,hd表示进行空间映射后的个体特征。
在得到个体特征之后,利用自注意力机制对个体特征和特征向量进行融合,生成融合后的特征向量,最后将融合后的特征向量通过全连接层,就可以得到待测用户的收缩压(systolic blood pressure,SBP)和舒张压(diastolic blood pressure,DBP)的预测值。
可以看出,血压信号预测模型通过所构建的端到端血压预测网络对血压进行直接的预测,可以有效避免由于信号处理和手工特征提取等所造成的血压测量精度下降的问题,降低血压测量复杂度和测量成本,此外,通过不同人群的个体信息与血压之间的相关性,将待测用户的个体信息与面部视频包含的特征信息进行融合以辅助血压的预测,可以进一步提高测量精度,而且整个测量过程不需要与被测用户进行直接接触,提高了检测灵活性,拓宽了应用场景。
S203、输出待测用户的收缩压和舒张压。
具体地,在通过血压预测模型得到待测用户的收缩压和舒张压之后,可以将其发送至与待测用户关联的终端设备,例如手机上进行显示,从而可以帮助用户清楚的知晓自身的血压信息。
下面将对血压预测模型的训练过程进行说明,请参见图5。
S501、获取样本数据。
具体地,获取的样本数据包括样本人脸视频、该样本人脸视频对应的个体信息和样本人脸视频对应的真实血压值,该真实血压值包括收缩压和舒张压。进一步的,基于已有的图像采集终端,在真实自然开放环境下采集样本人脸视频,或者是从人脸视频数据库中获取人脸视频,视频时间可以根据需要进行选择,例如可以选取连续15秒的人脸视频作为样本人脸视频,本申请对此不作限定。对于每一个人脸视频,记录该人脸视频对应的个体信息,包括性别、年龄、身高、体重等,并可以通过电子血压计获取该人脸视频对应的被测者实时的血压值(包括收缩压和舒张压)等参数。
需要说明的是,在获取样本人脸视频的过程中,需要采集具备不同质量的人脸视频,从而提高模型对数据的泛化能力,扩大模型的适用范围。
S502、将样本数据输入至初始血压预测模型进行训练。
具体地,初始血压预测模型在输入样本人脸视频之后,通过时刻特征提取模块进行特征提取,得到特征向量,然后利用血压信号预测模块将特征向量和个体信息进行融合,并基于融合后的特征向量进行预测,得到预测的收缩压和舒张压,然后将预测得到的收缩压和舒张压与真实的收缩压和舒张压进行比较,计算得到血压损失函数,这里可以使用预测血压与真实血压之间的均方误差作为损失函数。
S503、根据血压损失函数对初始血压预测模型中的参数和权重进行调整,得到血压预测模型。
具体地,在计算得到血压损失函数之后,根据该血压损失函数对初始血压预测模型中的参数和权重进行调整,通过不断的迭代执行,即不断调整网络中的参数和权重,直至预测模型所输出的预测血压与真实血压的误差小于阈值(或血压损失函数收敛),此时,血压预测模型训练完成,其已具备血压测量的能力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图6示出与上述实施例血压测量方法一一对应的血压测量装置的原理框图。如图6所示,该多血压测量装置600包括数据获取模块610、预测模块620和输出模块630。各功能模块详细说明如下。
数据获取模块610,用于获取待测用户的面部视频和个体信息,所述面部视频包括多个面部图像序列。
预测模块620,用于将所述待测用户的面部视频和所述个体信息输入至血压预测模型,得到所述待测用户的收缩压和舒张压,其中,所述血压预测模型包括时空特征提取模块和血压信号预测模块,所述时空特征提取模块用于对所述待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量;所述血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到所述待测用户的收缩压和舒张压。
输出模块630,用于输出所述待测用户的收缩压和舒张压。
关于血压测量装置的具体限定可以参见上文中对于血压测量方法的限定,在此不再赘述。上述血压测量装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
所述计算机设备700包括通过系统总线相互通信连接存储器710、处理器720、网络接口730。需要指出的是,图中仅示出了具有组件连接存储器710、处理器720、网络接口730的计算机设备700,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器710至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器710可以是所述计算机设备700的内部存储单元,例如该计算机设备700的硬盘或内存。在另一些实施例中,所述存储器710也可以是所述计算机设备700的外部存储设备,例如该计算机设备700上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器710还可以既包括所述计算机设备700的内部存储单元也包括其外部存储设备。本实施例中,所述存储器710通常用于存储安装于所述计算机设备700的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器710还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器720在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器720通常用于控制所述计算机设备700的总体操作。本实施例中,所述处理器720用于运行所述存储器710中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口730可包括无线网络接口或有线网络接口,该网络接口730通常用于在所述计算机设备700与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的多生理指标检测方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种血压测量方法,其特征在于,所述方法包括:
获取待测用户的面部视频和个体信息,所述面部视频包括多个面部图像序列;
将所述待测用户的面部视频和所述个体信息输入至血压预测模型,得到所述待测用户的收缩压和舒张压,其中,所述血压预测模型包括时空特征提取模块和血压信号预测模块,所述时空特征提取模块用于对所述待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量;所述血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到所述待测用户的收缩压和舒张压;
输出所述待测用户的收缩压和舒张压。
2.如权利要求1所述的方法,其特征在于,所述时空特征提取模块用于对所述待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量包括:
将所述待测用户的面部视频输入至浅层特征提取网络进行卷积处理,输出浅层特征图,所述浅层特征提取网络包括多个2D卷积块;
基于所述浅层特征图和多尺度核空间注意力机制,得到注意力特征图;
将所述注意力特征图输入基于分步时空自注意力的编码器进行编码,得到所述包含全局空间信息和时间信息的特征向量。
3.如权利要求2所述的方法,其特征在于,所述基于所述浅层特征图和多尺度核空间注意力机制,得到注意力特征图包括:
利用多个不同尺寸大小的卷积核对所述浅层特征图进行卷积操作,提取得到多尺度特征图;
将所述多尺度特征图进行级联并在通道维度上分别进行全局最大池化和全局平均池化,得到全局最大池化特征图和全局平均池化特征图;
根据所述全局最大池化特征图和所述全局平均池化特征图,得到注意力权重图;
基于所述注意力权重图和所述浅层特征图,得到所述注意力特征图。
4.如权利要求2所述的方法,其特征在于,所述将所述注意力特征图输入基于分步时空自注意力的编码器进行编码,得到所述包含全局空间信息和时间信息的特征向量包括:
将所述注意力特征图输入嵌入层Embedding网络,得到所述注意力特征图对应的嵌入向量token;
将所述嵌入向量token输入至基于longformer的编码网络,输出所述包含全局空间信息和时间信息的特征向量,所述基于longformer的编码网络用于对所述嵌入向量token在时间维度和空间维度上采用自注意力机制。
5.如权利要求1所述的方法,其特征在于,所述血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到所述待测用户的收缩压和舒张压包括:
将所述个体信息输入至线性映射网络进行映射处理,得到所述个体信息对应的个体特征;
利用自注意力机制对所述个体特征和所述特征向量进行融合,生成融合后的特征向量;
将所述融合后的特征向量输入至全连接层网络,得到所述待测用户的收缩压和舒张压的预测值。
6.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取样本数据,所述样本数据包括样本人脸视频、所述样本人脸视频对应的个体信息和所述样本人脸视频对应的真实血压值,所述真实血压值包括收缩压和舒张压;
将所述样本数据输入至初始血压预测模型;
所述初始血压预测模型预测得到所述样本人脸视频对应的血压值,并将得到的血压值与所述真实血压值进行比对,计算得到血压损失函数;
根据所述血压损失函数对所述初始血压预测模型中的参数和权重进行调整,得到所述血压预测模型。
7.一种血压测量装置,其特征在于,所述装置包括:
数据获取模块,用于获取待测用户的面部视频和个体信息,所述面部视频包括多个面部图像序列;
预测模块,用于将所述待测用户的面部视频和所述个体信息输入至血压预测模型,得到所述待测用户的收缩压和舒张压,其中,所述血压预测模型包括时空特征提取模块和血压信号预测模块,所述时空特征提取模块用于对所述待测用户的面部视频进行特征提取,得到包含全局空间信息和时间信息的特征向量;所述血压信号预测模块用于对所述特征向量和所述个体信息进行融合,并基于融合后的特征向量预测得到所述待测用户的收缩压和舒张压;
输出模块,用于输出所述待测用户的收缩压和舒张压。
8.如权利要求7所述的装置,其特征在于,所述时空特征提取模块,具体用于:
将所述待测用户的面部视频输入至浅层特征提取网络进行卷积处理,输出浅层特征图,所述浅层特征提取网络包括多个2D卷积块;
基于所述浅层特征图和多尺度核空间注意力机制,得到注意力特征图;
将所述注意力特征图输入基于分步时空自注意力的编码器进行编码,得到所述包含全局空间信息和时间信息的特征向量。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310564910.1A CN116712048A (zh) | 2023-05-18 | 2023-05-18 | 血压测量方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310564910.1A CN116712048A (zh) | 2023-05-18 | 2023-05-18 | 血压测量方法、装置及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116712048A true CN116712048A (zh) | 2023-09-08 |
Family
ID=87868804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310564910.1A Pending CN116712048A (zh) | 2023-05-18 | 2023-05-18 | 血压测量方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116712048A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117577270A (zh) * | 2024-01-15 | 2024-02-20 | 吉林大学 | 患者的智能化营养管理方法及系统 |
-
2023
- 2023-05-18 CN CN202310564910.1A patent/CN116712048A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117577270A (zh) * | 2024-01-15 | 2024-02-20 | 吉林大学 | 患者的智能化营养管理方法及系统 |
CN117577270B (zh) * | 2024-01-15 | 2024-04-26 | 吉林大学 | 患者的智能化营养管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020623B (zh) | 基于条件变分自编码器的人体活动识别系统及方法 | |
WO2021179852A1 (zh) | 图像检测方法、模型训练方法、装置、设备及存储介质 | |
CN112784778B (zh) | 生成模型并识别年龄和性别的方法、装置、设备和介质 | |
CN113159143B (zh) | 基于跳跃连接卷积层的红外与可见光图像融合方法和装置 | |
CN108197592B (zh) | 信息获取方法和装置 | |
CN111105852B (zh) | 一种电子病历推荐方法、装置、终端及存储介质 | |
CN112883227B (zh) | 一种基于多尺度时序特征的视频摘要生成方法和装置 | |
CN113192639B (zh) | 信息预测模型的训练方法、装置、设备及存储介质 | |
CN113538070B (zh) | 用户生命价值周期检测方法、装置和计算机设备 | |
CN116712048A (zh) | 血压测量方法、装置及相关设备 | |
CN116311539B (zh) | 基于毫米波的睡眠动作捕捉方法、装置、设备及存储介质 | |
CN115311730A (zh) | 一种人脸关键点的检测方法、系统和电子设备 | |
CN110363072A (zh) | 舌象识别方法、装置、计算机设备及计算机可读存储介质 | |
CN111126049B (zh) | 对象关系预测方法、装置、终端设备及可读存储介质 | |
CN116327133A (zh) | 一种多生理指标检测方法、装置及相关设备 | |
CN107729144B (zh) | 应用控制方法、装置、存储介质及电子设备 | |
CN113421646A (zh) | 患病持续时长预测方法、装置、计算机设备及存储介质 | |
CN113827240A (zh) | 情绪分类方法和情绪分类模型的训练方法、装置及设备 | |
CN111079560A (zh) | 一种摔倒监测方法、装置及终端设备 | |
CN116739154A (zh) | 一种故障预测方法及其相关设备 | |
CN110841143A (zh) | 一种用于预测输液管路状态的方法及系统 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
CN115424725A (zh) | 数据的分析方法和装置、存储介质及处理器 | |
KR20190109194A (ko) | 불확정성을 모델링할 수 있는 뉴럴네트워크 학습 장치 및 방법 | |
CN113780239A (zh) | 虹膜识别方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |