CN115312191A - 一种老年人轻度认知功能损害发病风险的预测方法 - Google Patents

一种老年人轻度认知功能损害发病风险的预测方法 Download PDF

Info

Publication number
CN115312191A
CN115312191A CN202210694485.3A CN202210694485A CN115312191A CN 115312191 A CN115312191 A CN 115312191A CN 202210694485 A CN202210694485 A CN 202210694485A CN 115312191 A CN115312191 A CN 115312191A
Authority
CN
China
Prior art keywords
score
grade
seconds
user
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210694485.3A
Other languages
English (en)
Inventor
孟祥莲
周金磊
刘文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Institute of Technology
Original Assignee
Changzhou Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Institute of Technology filed Critical Changzhou Institute of Technology
Priority to CN202210694485.3A priority Critical patent/CN115312191A/zh
Publication of CN115312191A publication Critical patent/CN115312191A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Biomedical Technology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及一种发病风险预测方法,特别涉及一种老年人轻度认知功能损害发病风险的预测方法,对其进行早期诊断和风险评估具有十分关键的意义,可以实现早起诊断发现进行风险评估的同时,及时的进行治疗和预防;包括计时器模块,计算能力测试模块,执行功能测试模块,命名能力测试模块,注意能力测试模块,语言能力测试模块,抽象能力测试模块,延迟记忆能力测试模块,定向能力测试模块和结果分析模块。

Description

一种老年人轻度认知功能损害发病风险的预测方法
技术领域
本发明涉及一种发病风险预测方法,特别涉及一种老年人轻度认知功能损害发病风险的预测方法。
背景技术
目前全球有超过5500万人患有失智症,预测到2030年将达到7800万人。世界卫生组织(WHO)关于公卫生应对失智症的全球行动计划的目标是到2025年至少50%的国家诊断出估计50%的失智症患者。2016年国家社会服务发展统计公报显示:60岁及以上人口大约2.308亿,占全国人口16.7%。由于老年人群的大量增加和随之产生的大量痴呆患者,尤其是阿尔茨海默病(Alzheimer‘s disease,AD)将给其家人甚至整个社会带来巨大的经济和健康压力。
当前,国内外关于痴呆的防治策略,大多已从基础及临床研究转向痴呆的前临床阶段即轻度认知功能障碍(mild cognitive impairment,MCI)领域。轻度认知障碍是大脑正常老化和痴呆之间的过渡状态,被认为是各种痴呆性、神经变性疾病的前驱阶段。其认知功能受损程度明显高于正常老化,在该阶段初期会伴随轻度的记忆障碍,接着在几年内可能会逐渐发展为严重认知功能损害和功能性障碍。我国社区MCI发生率达18.5%,从临床上看,从轻微的认知损伤到老年性痴呆(特别是AD)的转化比例分别为7.5%~16.5%和5.4%~11.5%,与普通老人相比,只有1%~2%。而在认知功能上,轻微的认知损伤向正常状态的逆转率则有2%~53%。可见,轻度认知损害是一个持续时间短、恶化风险高、病症不稳定的阶段,此阶段为AD的防治的最好时机,因此对其进行早期诊断和风险评估具有十分关键的意义。
发明内容
针对背景技术中提到的问题,本发明的目的是提供一种老年人轻度认知功能损害发病风险的预测方法。
本发明的上述技术目的是通过以下技术方案得以实现的:一种老年人轻度认知功能损害发病风险的预测方法,包括计时器模块,
计时器模块会监听量表答题开始时间,每道题开始时会向计时器模块发送一个初始时间,计时器模块会立刻开始倒计时,设计通过setInterval方法实现,同时暴露出计时结束方法;当组件销毁时会自动清除定时器;当定时器倒计时结束时会通知答题模块进行答题结果保存并自动跳转至下一题,而且通知倒计时动画模块结束倒计时动画;
计算能力测试模块,
计算能力测试模块会将用户填写的每组数据用数组结构保存,当验证结果时会将每个数组项分别进行计算,当数组项计算结果满足目标则加一分,若出现重复,打乱顺序也为重复,则只加一分,若计算结果不满足目标则不加分;计算能力测试限时120秒,共3分;若用户在前30秒内完成试题,可以得到1级评分,若用户在前60秒内完成试题,可得到2级评分,在60秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
执行功能测试模块,
执行能力测试模块会提供一个指令,视用户指令完成度进行得分计算;首先使用摄像机进行图形采集,然后使用ML Kit工具进行人脸检测,通过人眼定位得到人眼数据,再计算EAR值得到人眼睁眼概率,越接近1代表睁眼概率越大,越接近0代表睁眼概率越小;通过检测EAR值来得到眨眼次数,再根据眨眼次数评估用户的指令完成程度根据偏差值得到分数;正常情况下,偏差值为4,当用户眨眼次数超过此偏差值,将计算眨眼次数与此偏差值的差,然后用4减去此差值就得到该部分的最终分数;
执行能力测试限时10秒,共4分;若用户在前5秒内完成试题,可以得到1级评分,若用户在前8秒内完成试题,可得到2级评分,在8秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
命名能力测试模块,
命名能力测试模块会根据用户答题正确数进行分数计算;首先使用数组将用户所选的答案记录下来,然后在答题完成后或是计时器结束后进行答案检测,将正确的答案数记录下来并返回给答案记录器;命名能力测试限时60秒,共3分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
注意能力测试模块,
注意能力测试模块会根据用户答题正确数进行分数计算;首先用户通过单选题的方式选出答案,然后将用户选择的答案放入数组中,待答题结束或是时间截止时进行答案检测,将正确数记录下来返回给答案记录器;注意能力测试限时60秒,共6分,每答对一小题可得到2分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
语言能力测试模块,
语言能力测试模块会根据用户答题正确数进行分数计算;将用户通过单选题选择的答案通过数组记录下来,然后在答题结束时或是时间截止时进行答案检测,将正确答案数记录下来返回给答案记录器;语言能力测试限时60秒,共3分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
抽象能力测试模块,
抽象能力测试模块会根据用户答题正确数进行分数计算;将用户通过单选题选择的答案通过数组记录下来,然后在答题结束时或是时间截止时进行答案检测,将正确答案数记录下来返回给答案记录器;抽象能力测试限时60秒,共3分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
延迟记忆能力测试模块,
延迟记忆能力测试模块会根据用户答题正确数进行分数计算;首先给用户一定时间进行词语记忆,然后给用户立即进行选择,该次答题不算入分数,然后继续其它测试,在完成其它测试后用户将再次进行选择测试,该次选择将记录分数;同时将选择的答案通过数组记录下来,然后在答题结束时或是时间截止时进行答案检测,将正确答案数记录下来返回给答案记录器;延迟记忆能力测试限时10秒,记忆限时180秒,共4分,每选对一题可得一分;若用户在前5秒内完成试题,可以得到1级评分,若用户在前8秒内完成试题,可得到2级评分,在8秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
定向能力测试模块,
定向能力测试模块会根据用户答题正确数进行分数计算;用户需要填写数个数字,如今天的日期相关数据,系统将通过值绑定的方式检测填写的数据的准确程度,将正确的答案数返回给答案记录器;定向能力测试答题限时10秒,且禁止查看系统日期信息,共4分,每答对一题得一分,在5秒内完成试题,可以得到1级评分,若用户在前8秒内完成试题,可得到2级评分,在8秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%。
作为优选,包括结果分析模块,
结果分析模块负责记录整个答题流程的答案记录和分数计算;每部分测试结束后会向结果分析模块传递答题情况消息,结果分析模块会分别将每个答题部分置于同一数组的不同数组项中,构建一个map类型的数据结构;
如[{p1,t1},{p2,t2},{p3,t3},{p4,t4},{p5,t5},{p6,t6},{p7,t7},{p8,t8}],方便后续的统一解析,px为各项答题分值,tx为各项答题结束时根据剩余时间得到的分值权重;当答题结束后,结果分析模块会对数组的每一项进行分值计算,并给出最终预测概率结果;
结果分析主要通过公式(2.1)计算:
Figure BDA0003701930870000071
结合答题时间权重进行结果分析通过公式(2.2)计算:
Figure BDA0003701930870000072
result为计算返回的结果,p1至p8分别为每道题的正确数,target2为第二道题的目标偏差值,
Figure BDA0003701930870000073
为量表分数截断值,t1至t8为每道题的权重占比;
若用户患有基础疾病,结果分析将使用公式(2.3)计算;
Figure BDA0003701930870000074
结合答题时间可使用公式(2.4)计算;
Figure BDA0003701930870000075
result2为计算返回的结果,p1至p8分别为每部分试题的正确数,target2为第二道题的目标偏差值,
Figure BDA0003701930870000076
为量表分数截断值,t1至t8为每道题的权重占比;
若用户教育水平为小学及以下,结果分析将使用公式(2.5)计算;
Figure BDA0003701930870000081
结合答题时间可使用公式(2.6)计算;
Figure BDA0003701930870000082
result3为计算返回的结果,p1至p8分别为每部分试题的正确数,target2为第二道题的目标偏差值,
Figure BDA0003701930870000083
为量表分数截断值,t1至t8为每道题的权重占比;
若用户教育水平为高中及以上,结果分析将使用公式(2.7)计算;
Figure BDA0003701930870000084
结合答题时间可使用公式(2.8)计算;
Figure BDA0003701930870000085
result4为计算返回的结果,p1至p8分别为每部分试题的正确数,target2为第二道题的目标偏差值,
Figure BDA0003701930870000086
为量表分数截断值,t1至t8为每道题的权重占比。
作为优选,算法介绍,执行能力测试需要测试者在一定时间内,完成指定的动作;测试方式为让用户在10秒内眨眼4次,眨4次得4分,每眨多一次少得一分,每眨少一次少得一分;使用Google的ML Kit工具来帮助实现眨眼识别;ML Kit是一款基于dlib封装的机器学习套件,可在安卓或iOS设备上快速部署使用,并且可以离线操作。
作为优选,还包括人脸定位,使用dlib中实现的对象检测器,对象检测器首先需要对图像进行一次采集,并且放大图片细节;将处理好的图像通过人脸分类器可以得到索引检测到的人脸数组,每个数组项包含了人脸的区域信息,以矩形的方式返回,即按左、上、右、下四个区域返回人脸的区域信息;人脸分类器通过方向梯度直方图HOG与支持向量机、图像金字塔以及滑动窗口检测方案相结合训练得出;
人脸分类器实现步骤如下:
(1)首先使用图像金字塔来进行图像分辨率处理,若一张图像的观察距离增大,图像上的小目标无法清晰的看到,二图像上的大目标在一定范围内还可以看到,因此对于大目标图像缩小也不会影响检测,但小目标需要放大以进行检测,图像金字塔是一张图片在不同尺度下大集合,即原图的上采样和下采样集合,金字塔最底端是分辨率最高的图像,顶部是最低分辨率的图像,形成了金字塔状排列;因此在图像采集后会使用高斯金字塔和拉普拉斯金字塔对其分别进行下采样和上采样,然后选择合适的图像进行下一步处理;
(2)使用HOG对图像进行特征提取,通过特征描述方法,将图像中的有用信息提取出来,而在图像中,边缘和角落也包含了丰富的有效信息,若能提取出图像边缘和角落的信息,非常有利于物体检测准确性的提高;而对于图像的边缘及角落周围的梯度特征变化幅度很大,因此在HOG中,使用梯度直方图作为其特征。
作为优选,HOG算法的基本流程是四个步骤:计算图像梯度、计算Cell中的梯度直方图、Block归一化、计算HOG特征,具体如下:
1)图像梯度是由像素点组成,而整张图片就是一个二维离散函数f(x,y);图像f(x,y)在点(x,y)的梯度G(x,y)是一个具有大小和方向的矢量,设Gx和Gy分别为水平方向和垂直方向的梯度,图像梯度的计算公式如(2.9)所示;
Figure BDA0003701930870000101
Figure BDA0003701930870000102
Figure BDA0003701930870000103
Figure BDA0003701930870000104
其中I(a,b)代表坐标为(a,b)像素点初点图像像素值,θ(a,b)表示(a,b)像素点梯度的角度;
2)由于分析每一个像素的梯度过于细节化且需耗费大量时间,因此选择将一张完整的图像划分为多个单元,也就是多个Cell,从更高的角度上进行观察,默认一个Cell为8×8的64个梯度以及梯度角度对,这些对最终会映射到9-bins直方图,而9-bins直方图就是横坐标有9个点的直方图;
3)梯度对于图像的光照亮度较为敏感,因此需要对梯度进行归一化处理以消除光照变化带来的结果影响;有两种解决手段,在HOG中,将Cell组合成大的、空间上连通的区块,也就是Blocks,在OpenCV中,默认Block的大小为16×16个像素点,也就是每四个Cell构成一个Block,Block相较于Cell具有更大的尺寸,受到光照的影响会更小,若一张图像包含4个Cell,那么一个Block中就可以连接形成一个长度为36的向量;归一化就是对向量的每个元素进行处理,将每个元素除以该向量的长度,得到一个归一化向量,即使向量因光照等因素发生变化,对其归一化处理后其归一化向量依然不会变化,可有效去除数值大小的影响;
4)完成所有Block归一化后得到的向量合并后即形成了一个HOG特征,即需要计算所有Block窗口,则需要使用滑动窗口的方法来进行遍历计算,从一张图片的左上角Block开始,依次遍历每个Block,直至最后;
在完成以上步骤后可得到HOG特征,可将其作为SVM的输入进行模型训练即可得到最终模型;因为人脸是近似左右对称的图像,因此SVM的惩罚系数C设为0.5,C越高,越不能容忍误差,容易过拟合,C越小,容易欠拟合,因此不恰当的惩罚系数会造成模型泛化能力下降;为了扩大训练集,会将所有的图像进行镜像处理。
综上所述,本发明的老年人轻度认知功能损害发病风险的预测方法具有以下有益效果:轻度认知损害是一个持续时间短、恶化风险高、病症不稳定的阶段,此阶段为AD的防治的最好时机,本发明对其进行早期诊断和风险评估具有十分关键的意义,可以实现早起诊断发现进行风险评估的同时,及时的进行治疗和预防。
附图说明
图1为本发明的系统功能结构图;
图2为本发明的系统总体架构图;
图3为本发明的登陆注册模块时序图;
图4为本发明的用户信息维护模块时序图;
图5为本发明的量表测试模块时序图;
图6为本发明的执行功能测试模块程序时序图;
图7为本发明的梯度与梯度角度在9-bins映射关系图;
图8为本发明的Cell与Block关系图;
图9为本发明的68个人脸特征点示意图;
图10为本发明的六个脸部眼睛标识示意图;
图11为本发明的EAR值随眨眼变化图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在具体实施时,用户主要是在移动APP中首先进行注册登录,然后进行相关数据填写与神经量表测试,最终对结果进行分析,生成结果展示给用户,具体系统功能结构图如图1所示。
系统主要功能包括登陆注册、用户信息完善及修改、量表测试、预测分析及预览历史等,用户需使用用户名密码登陆系统,之后需填写个人身体信息,如血压、心率等信息,之后可随时进行个人信息维护,个人身体信息将参与神经量表最终结果分析。
系统总体结构图如图2所示;登陆注册模块时序图如图3所示。登陆注册模块主要负责对用户的访问进行鉴权。首先在移动APP中发起POST请求,将用户名和密码等信息通过JSON格式发送至服务端。若为注册,首先服务端会调用UserReg服务,再对JSON信息进行解析,新建一个User对象并放入数据库中,若无异常则返回code为200。若为登录,服务端首先会调用UserLogin服务,在对JSON信息进行解析,之后从数据库中搜索查询,若验证通过则返回code为200,并返回该用户的信息给前端使用。用户表以ID作为主键并设为自增,设置了用户名,密码,性别和年龄字段。
用户信息维护模块时序图如图4所示;用户信息维护模块主要负责对用户个人信息进行填写和修改。当完成登录后,移动APP会跳转至主页,同时会检查用户是否完善好自己的个人信息,若未完善将进行提示,用户可点击提示中的“去填写”按钮跳转至用户信息维护页进行信息填写,也可点“下次”按钮进行忽略。若已完善好个人信息,下次登陆将不会进行提示,用户可通过主页的抽屉导航栏进入个人主页,进入个人主页将会看到已填写好的个人信息数据,同时用户可随时点击该页中的信息修改按钮进行个人信息维护。用户进行个人信息维护时,前端会把需要发送的数据添加到一个JSON串中然后使用POST方法发送至服务端,服务端会解析接受到的JSON串,再修改数据库中对应的数据,若修改成功则返回code为200,若修改失败则会返回错误信息,前端对返回信息进行不同操作,若code为200将提示成功并返回上一页,若存在报错信息则会将报错信息显示出来,提示用户稍后再试。
量表测试模块时序图如图5所示;量表测试模块共分10个小模块,主要为计时器模块,倒计时动画模块,计算能力测试模块、执行功能测试模块、命名能力测试模块、注意能力测试模块、语言能力测试模块、抽象能力测试模块、延迟记忆能力测试模块和定向能力测试模块。
算法介绍:
执行能力测试需要测试者在一定时间内,完成指定的动作。本设计主要测试方式为让用户在10秒内眨眼4次,眨4次得4分,每眨多一次少得一分,每眨少一次少得一分。本设计使用了Google的ML Kit工具来帮助实现眨眼识别。ML Kit是一款基于dlib封装的机器学习套件,可以在安卓或iOS设备上快速部署使用,并且可以离线操作。
人脸定位,本设计使用dlib中实现的对象检测器,对象检测器首先需要对图像进行一次采集,以避免图像的失真情况,并且放大图片细节,方便后续处理。将处理好的图像通过人脸分类器可以得到索引检测到的人脸数组,每个数组项包含了人脸的区域信息,以矩形的方式返回,即按左、上、右、下四个区域返回人脸的区域信息。人脸分类器通过方向梯度直方图HOG(Histogram of Oriented Gradients)与支持向量机(SVM,Support VectorMachine)、图像金字塔以及滑动窗口检测方案相结合训练得出。人脸分类器实现步骤如下:
(1)首先使用图像金字塔来进行图像分辨率处理。若一张图像的观察距离增大,图像上的小目标无法清晰的看到,二图像上的大目标在一定范围内还可以看到,因此对于大目标图像缩小也不会影响检测,但小目标需要放大以进行检测,图像金字塔是一张图片在不同尺度下大集合,即原图的上采样和下采样集合,金字塔最底端是分辨率最高的图像,顶部是最低分辨率的图像,形成了金字塔状排列。因此在图像采集后会使用高斯金字塔和拉普拉斯金字塔对其分别进行下采样和上采样,然后选择合适的图像进行下一步处理。
(2)使用HOG对图像进行特征提取,通过特征描述方法,将图像中的有用信息提取出来,而在图像中,边缘和角落也包含了丰富的有效信息,若能提取出图像边缘和角落的信息,非常有利于物体检测准确性的提高。而对于图像的边缘及角落周围的梯度特征变化幅度很大,因此在HOG中,使用梯度直方图作为其特征。HOG算法的基本流程是四个步骤:计算图像梯度、计算Cell中的梯度直方图、Block归一化、计算HOG特征,具体如下:
1)图像梯度是由像素点组成,而整张图片就是一个二维离散函数f(x,y)。图像f(x,y)在点(x,y)的梯度G(x,y)是一个具有大小和方向的矢量,设Gx和Gy分别为水平方向和垂直方向的梯度,图像梯度的计算公式如(2.9)所示。
Figure BDA0003701930870000161
Figure BDA0003701930870000162
Figure BDA0003701930870000163
Figure BDA0003701930870000164
其中I(a,b)代表坐标为(a,b)像素点初点图像像素值,θ(a,b)表示(a,b)像素点梯度的角度。
2)由于分析每一个像素的梯度过于细节化且需耗费大量时间,因此选择将一张完整的图像划分为多个单元,也就是多个Cell,从更高的角度上进行观察,默认一个Cell为8×8的64个梯度以及梯度角度对,这些对最终会映射到9-bins直方图,而9-bins直方图就是横坐标有9个点的直方图,而其映射关系如图7所示。
梯度角度决定了映射的bins,梯度决定了映射的值,这样可以得到每个Cell的梯度直方图。
3)梯度对于图像的光照亮度较为敏感,因此需要对梯度进行归一化处理以消除光照变化带来的结果影响。通常有两种解决手段,在HOG中,将Cell组合成大的、空间上连通的区块,也就是Blocks,在OpenCV中,默认Block的大小为16×16个像素点,也就是每四个Cell构成一个Block,如图2-8所示。Block相较于Cell具有更大的尺寸,受到光照的影响会更小,若一张图像包含4个Cell,那么一个Block中就可以连接形成一个长度为36的向量。归一化就是对向量的每个元素进行处理,将每个元素除以该向量的长度,得到一个归一化向量,即使向量因光照等因素发生变化,对其归一化处理后其归一化向量依然不会变化,可有效去除数值大小的影响。
4)完成所有Block归一化后得到的向量合并后即形成了一个HOG特征,即需要计算所有Block窗口,则需要使用滑动窗口的方法来进行遍历计算,从一张图片的左上角Block开始,依次遍历每个Block,直至最后。
在完成以上步骤后可得到HOG特征,可将其作为SVM的输入进行模型训练即可得到最终模型。因为人脸是近似左右对称的图像,因此SVM的惩罚系数C设为0.5,C越高,越不能容忍误差,容易过拟合,C越小,容易欠拟合,因此不恰当的惩罚系数会造成模型泛化能力下降。为了扩大训练集,会将所有的图像进行镜像处理。
完成模型训练后,即实现了人脸分类器,之后需要获取不同的脸部特征即人脸特征点检测。人脸特征点通常会标识出脸部的多个区域,如左右眼、眉毛、嘴、鼻子及下巴。dlib中使用的人脸特征检测使用的是级联回归树(ERT,Ensemble of Regression trees,ERT),即使用级联回归因子,基于梯度提高学习的回归树方法。该方法首先需要使用一系列标定好的人脸图片作为训练集,并训练为模型。需进行以下三个步骤:
1)定义特征点。
2)标记面部特征点,获得带标记的训练数据。
3)给定训练数据,训练回归树的集合,直接从图像本身估计面部界标位置,得到模型。
在数据预处理阶段,数据集中首先需要预先手动标记好每张图片中的人脸位置,以及68个特征点的位置信息。载入训练集以及测试集,首先将读取的图片格式转换为rgb格式,通过分离三个颜色通道并将其再次融合得到一张新图片,使用人脸分类器得到图像中的人脸区域。在训练阶段,首先需要定义traniner,用于训练人脸关键点检测器,通过多级级联的回归树进行关键点回归,使用公式如(2.10)所示。
Figure BDA0003701930870000181
其中
Figure BDA0003701930870000182
表示第t级回归器的形状,
Figure BDA0003701930870000183
表示第t级回归器的更新量,更新策略使用GBDT(Gradient Boosting Decision Tree)残差回归树,即每级回归器学习的都是当前形状与ground truth形状的差值。训练时默认采用10级级联,树的叶子节点个数为2个,默认每个级联包含数的树木为500颗,则整个模型中树的总数为5000颗,训练器的正则项默认取0.1,正则项越大,训练样本使用度越好,但过大的正则项同样会导致过拟合。通过对训练样本进行随机变形可扩大样本数量,可有效提高训练模型的进度,但会加大训练耗时。在每级级联中,从图片中随机采样N个像素用来作为训练回归树的特征池,这种稀疏的采样能够保证复杂度相比于从原图像中对每个像素点进行训练的复杂度更低。训练过程利用GBDT建立各级回归树,GBDT把各决策树作为每次弱分类器学习的方法,每棵树都将之前所有树结论及残差作为学习依据,残差即一个加预测值后能得真实值的累加值,每个GBDT的每一个叶子节点上都存储着一个残差回归值,每当输入落到一个节点上时,就将残差加到该输入上,起到回归的作用,最终将所有残差叠加在一起,完成了人脸对齐的目的。训练完成后可得到人脸特征检测模型。
在GBDT中每一颗树之间的关系是串行的,并非是并行的关系,也就是说后一颗树的基础之上。每一颗树的叶子节点上存的是残差,也只有通过叶子节点上保存的残差,才能使形状不断的回归,从而回归到真实现状。GBDT指很多颗树,多个树构成一个GBDT,通过这棵树,将人脸的初始形状回归到其真实形状上去,因此在一开始需预先标好脸部的原始坐标,用GBDT来表示初始形状和真实形状的关系。
对于一颗GBDT树,首先需要建立一个特征池,这个特征池里需要随机挑选一些点点坐标,对应每一幅图像,这些点都对应着不同的像素值,因此在书店节点分裂时,首先会在合格特征池中随机挑选两个点,然后计算每张图片在两个点处点像素值,然后计算每张图这两个点处点像素值的像素差,随机产生一个分裂阈值,根据该值进行判断,若像素差小于该值,节点就向左分裂,否则向右分裂,将所有图片都进行同样处理,且重复这个过程,将分裂效果最好的结果保存下来,直到分裂到叶子节点。
本设计使用人脸检测模型可以检测68个人脸特征点,包括左右眼、眉毛、下巴、嘴及鼻子,如图9所示。
通过人脸分类器可得到人脸的矩形位置,即左、上、右及下四点的坐标。再使用人脸特征检测器来检测坐标内的人脸区域,即可得到人脸的特征点坐标。识别完成后将返回68个二维坐标(x,y)。坐标映射的建立需从脸部右上角开始,按逆时针方向依次画圈,从1开始排列,直到点68。通过这些人脸映射坐标,可以通过索引来访问不同的面部区域,如通过点49至点68来访问嘴巴区域,从点18至点22来访问右眉,从点23至点27访问左眉,从点37至点42访问右眼,从点43至48访问左眼,鼻子使用点28至点35,最后下巴使用点1至17。因此在imutils库的face_utils定义了这样的一个字典,方便使用时直接调用。
使用这个字典可以将索引提取到面部标志数组中,并通过提供一个字符串作为键来提取各种面部特征以方便后续使用。
实时面部标识检测与人眼定位
本设计需要用户通过手机的前置摄像头来进行实时的检测,因此还需实时的从视频流中去抓取帧,因此需要使用imutils.video的VideoStream来解析视频的每一帧,首先使用面部分类器对图像中的人脸进行识别与定位,面部分类器将返回面部上右下左四边坐标,可得到一个矩形区域,再使用面部特征检测器来对该区域进行人脸特征提取,得到68个二维坐标,点37-42对应的坐标标识了人脸中的左眼,点43-48对应的坐标标识了人脸中的右眼,通常可以通过字典索引来获取对应坐标值,如使用下巴的索引“Jawline”。则当检测到面部时就通过字典索引去获取其左眼及右眼的坐标,从而完成实时的面部标识检测与人眼定位。
因为检测的是视频流,因此这个过程在一定时间内需要不停的轮询,即按一定的频率去获取视频流中的图像帧,再去获取该帧中的面部标识坐标,完成人眼定位。
眨眼识别,利用EAR(eye aspectratio)眼睛纵横比来实现眨眼识别,EAR越接近1,代表眼睛睁的程度约大,EAR越接近0,眼睛睁大程度就越小;EAR的计算需要使用眼睛相关的6个脸部标识,如图10所示。
每只眼睛由6个二维坐标(x,y)表示,从眼睛的左角坐标P1开始,然后围绕顺时针顺序,依次为P2,…,P6。
EAR计算如公式(2.11)所示。
Figure BDA0003701930870000221
公式中的分子用于计算人在竖直方向上的识别距离,而分母用于在水平方向上计算人的识别距离,由于存在两套竖直方向的距离,因此,必须使用合适的权重分母。当图像中的人脸发生倾斜或是俯仰,眼睛坐标的绝对位置会发生变化,但通过计算其相对位置坐标还是可以得到正确的EAR值,如公式(2.12)所示。
Figure BDA0003701930870000222
EAR随眨眼动作变化如图11所示;EAR值的变化是一个趋于稳定的曲线,当人眼处于睁开状态时,EAR值处于一个平稳的状态,当EAR值发生快速下降时即可判定为闭眼的过程,当EAR值重新上升再次趋于平缓即可判定为睁眼的过程。
因此,本设计在相机捕捉的每一帧图像中进行处理,同时设置一个目标值,如0.1,当EAR跌至0.1时,就是一次闭眼,再回到0.5就是一次睁眼,系统会检测这两个值的变化,并且确保是按照“眼睛初始是睁着,然后闭上,再睁开”的顺序与逻辑来实现眨眼技术。
神经量表,本设计采用的神经向量表为改进的北京版蒙特利尔神经评估量表(MoCA-BJ),根据其研究表明,MoCA-BJ筛查社区老年人群MCI中最大约登指数为0.859,其对应最佳的截断值为23.5,向上取整数为24,即认为大于等于24分为量表筛查评估正常认知的标准。同时,针对不同受教育程度受试者,设置23分为文盲测试者截断值,24分为初中文化水平测试者截断值,设置25分为高中文化及以上水平测试者截断值,可进一步减少实验误差。根据统计,患有基础慢性疾病者,测试结果具有12.5%的偏差,即在相同认知状况下,患有基础慢性病者会比健康测试者多10%左右的几率患病,因此会取患有基础慢性疾病测试者总分的90%作为最终结果以增加准确度,MoCA原表相关信息见表2-1所示。
表2-1MoCA原表相关信息
Figure BDA0003701930870000231
Figure BDA0003701930870000241
MoCA原表对认知正常者的敏感性和特异性为90%及87%,对MCI患者的敏感性和特异性为90%,对痴呆患者的敏感性为100%。
表2-2MoCA-BJ原表相关信息
Figure BDA0003701930870000242
通过与原版进行比较,改进版蒙特利尔量表具有更高的敏感度和更低的特异度,分别达到97.26%和42.08%。更高的特异度会带来更大的误差,即可能会带来大量误诊,给测试者带来心理压力,甚至造成医疗资源的浪费,更高的敏感度则更适合用来进行社区筛选以帮助更准确的发现高危人群。
量表设计,量表主要有计算、执行功能、命名、注意、语言、抽象、延迟记忆和定向8项能力评分。
计算能力测试通过给定一个场景,让用户通过计算提出尽可能多的解决方案,以进行评测。如:“想象您有很多一元、五元和十元的纸币。现在您购买了一个十三元的东西,需要付给我十三元,请给我3种付款方式。我不会找您零钱,需要您付给我十三元整。”每提供一种方法就会得一分,共限时120秒,该项最多得三分。
执行功能测试将提供用户一个指令,要求用户在规定时间内完成该指令,视指令完成程度进行评分,如:“请将手机举起,与脸部平行,请在十秒内眨眼四次”,若用户未将手机举起,则得0分,若完成前置条件,评分标准为将4作为目标值,计算最终眨眼次数与目标值的偏差值,然后再用目标值减去偏差值则得到最终结果,超出偏差值则得0分,该项最多得4分。
命名能力测试通过在屏幕上显示物品或图形,并让用户选出正确且准确的命名以完成测试。如:“请您告诉我这个物品的名字”,如果是正方形,用户需选择正确的命名,而不能选择“四边形”。评分标准为每答对一个给1分,共限时60秒,该项最多得三分。
注意能力测试通过在屏幕上显示多个不同特征的图形,图形中有不同内容,让用户选出正确的图形内容以达到注意能力评测的效果。如:“请看向这些黑色背景的数字。现在要您选出圆形和正方形中的数字”,每答出一题得两分,共限时60秒,该项最多得6分。
语言能力测试通过在屏幕上显示具有多个特征的图形,让用户选出最符合该图形描述的选项,以达到测试效果。如:显示黑色,五角星,用户需选择正确的描述,而不能选择多边形选项,每答对一题得一分,共限时60秒,该项最多得三分。
抽象能力测试通过提供一对词,让用户选出该对词属于什么类别,知道与从例词开始,如:“请您说说橘子和香蕉属于什么类别”,应该回答具体特征,不可回答宽泛的类别。用户每答对一题得一分,共限时60秒,该项最多得三分。
延迟记忆能力测试通过给用户提供数个单词,提升用户记住这些单词,首先会让其立刻在词云中选出该数个单词,之后在测试结尾会让用户再次选择这些单词,该项最多得4分。
定向能力测试需要用户不看手机时间,立刻填写“现在是几点钟”,“现在是哪年”,“现在是哪月”,“今天是星期几”,每答出一题得一分,限时10秒钟,该项最多得4分。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种老年人轻度认知功能损害发病风险的预测方法,其特征在于,包括计时器模块,
计时器模块会监听量表答题开始时间,每道题开始时会向计时器模块发送一个初始时间,计时器模块会立刻开始倒计时,设计通过setInterval方法实现,同时暴露出计时结束方法;当组件销毁时会自动清除定时器;当定时器倒计时结束时会通知答题模块进行答题结果保存并自动跳转至下一题,而且通知倒计时动画模块结束倒计时动画;
计算能力测试模块,
计算能力测试模块会将用户填写的每组数据用数组结构保存,当验证结果时会将每个数组项分别进行计算,当数组项计算结果满足目标则加一分,若出现重复,打乱顺序也为重复,则只加一分,若计算结果不满足目标则不加分;计算能力测试限时120秒,共3分;若用户在前30秒内完成试题,可以得到1级评分,若用户在前60秒内完成试题,可得到2级评分,在60秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
执行功能测试模块,
执行能力测试模块会提供一个指令,视用户指令完成度进行得分计算;首先使用摄像机进行图形采集,然后使用ML Kit工具进行人脸检测,通过人眼定位得到人眼数据,再计算EAR值得到人眼睁眼概率,越接近1代表睁眼概率越大,越接近0代表睁眼概率越小;通过检测EAR值来得到眨眼次数,再根据眨眼次数评估用户的指令完成程度根据偏差值得到分数;正常情况下,偏差值为4,当用户眨眼次数超过此偏差值,将计算眨眼次数与此偏差值的差,然后用4减去此差值就得到该部分的最终分数;
执行能力测试限时10秒,共4分;若用户在前5秒内完成试题,可以得到1级评分,若用户在前8秒内完成试题,可得到2级评分,在8秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
命名能力测试模块,
命名能力测试模块会根据用户答题正确数进行分数计算;首先使用数组将用户所选的答案记录下来,然后在答题完成后或是计时器结束后进行答案检测,将正确的答案数记录下来并返回给答案记录器;命名能力测试限时60秒,共3分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
注意能力测试模块,
注意能力测试模块会根据用户答题正确数进行分数计算;首先用户通过单选题的方式选出答案,然后将用户选择的答案放入数组中,待答题结束或是时间截止时进行答案检测,将正确数记录下来返回给答案记录器;注意能力测试限时60秒,共6分,每答对一小题可得到2分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
语言能力测试模块,
语言能力测试模块会根据用户答题正确数进行分数计算;将用户通过单选题选择的答案通过数组记录下来,然后在答题结束时或是时间截止时进行答案检测,将正确答案数记录下来返回给答案记录器;语言能力测试限时60秒,共3分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
抽象能力测试模块,
抽象能力测试模块会根据用户答题正确数进行分数计算;将用户通过单选题选择的答案通过数组记录下来,然后在答题结束时或是时间截止时进行答案检测,将正确答案数记录下来返回给答案记录器;抽象能力测试限时60秒,共3分;若用户在前20秒内完成试题,可以得到1级评分,若用户在前35秒内完成试题,可得到2级评分,在35秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
延迟记忆能力测试模块,
延迟记忆能力测试模块会根据用户答题正确数进行分数计算;首先给用户一定时间进行词语记忆,然后给用户立即进行选择,该次答题不算入分数,然后继续其它测试,在完成其它测试后用户将再次进行选择测试,该次选择将记录分数;同时将选择的答案通过数组记录下来,然后在答题结束时或是时间截止时进行答案检测,将正确答案数记录下来返回给答案记录器;延迟记忆能力测试限时10秒,记忆限时180秒,共4分,每选对一题可得一分;若用户在前5秒内完成试题,可以得到1级评分,若用户在前8秒内完成试题,可得到2级评分,在8秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%;
定向能力测试模块,
定向能力测试模块会根据用户答题正确数进行分数计算;用户需要填写数个数字,如今天的日期相关数据,系统将通过值绑定的方式检测填写的数据的准确程度,将正确的答案数返回给答案记录器;定向能力测试答题限时10秒,且禁止查看系统日期信息,共4分,每答对一题得一分,在5秒内完成试题,可以得到1级评分,若用户在前8秒内完成试题,可得到2级评分,在8秒后可得到3级评分;1级评分不减权重,2级评分会对分值进行减权,最终分值会减少2%,3级评分会对分值进行减权,最终分值会减少5%。
2.如权利要求1所述的老年人轻度认知功能损害发病风险的预测方法,其特征在于,包括结果分析模块,
结果分析模块负责记录整个答题流程的答案记录和分数计算;每部分测试结束后会向结果分析模块传递答题情况消息,结果分析模块会分别将每个答题部分置于同一数组的不同数组项中,构建一个map类型的数据结构;
如[{p1,t1},{p2,t2},{p3,t3},{p4,t4},{p5,t5},{p6,t6},{p7,t7},{p8,t8}],方便后续的统一解析,px为各项答题分值,tx为各项答题结束时根据剩余时间得到的分值权重;当答题结束后,结果分析模块会对数组的每一项进行分值计算,并给出最终预测概率结果;
结果分析主要通过公式(2.1)计算:
Figure RE-FDA0003857853520000051
结合答题时间权重进行结果分析通过公式(2.2)计算:
Figure RE-FDA0003857853520000061
result为计算返回的结果,p1至p8分别为每道题的正确数,target2为第二道题的目标偏差值,
Figure RE-FDA0003857853520000062
为量表分数截断值,t1至t8为每道题的权重占比;
若用户患有基础疾病,结果分析将使用公式(2.3)计算;
Figure RE-FDA0003857853520000063
结合答题时间可使用公式(2.4)计算;
Figure RE-FDA0003857853520000064
result2为计算返回的结果,p1至p8分别为每部分试题的正确数,target2为第二道题的目标偏差值,
Figure RE-FDA0003857853520000065
为量表分数截断值,t1至t8为每道题的权重占比;
若用户教育水平为小学及以下,结果分析将使用公式(2.5)计算;
Figure RE-FDA0003857853520000066
结合答题时间可使用公式(2.6)计算;
Figure RE-FDA0003857853520000067
result3为计算返回的结果,p1至p8分别为每部分试题的正确数,target2为第二道题的目标偏差值,
Figure RE-FDA0003857853520000068
为量表分数截断值,t1至t8为每道题的权重占比;
若用户教育水平为高中及以上,结果分析将使用公式(2.7)计算;
Figure RE-FDA0003857853520000069
结合答题时间可使用公式(2.8)计算;
Figure RE-FDA0003857853520000071
result4为计算返回的结果,p1至p8分别为每部分试题的正确数,target2为第二道题的目标偏差值,
Figure RE-FDA0003857853520000072
为量表分数截断值,t1至t8为每道题的权重占比。
3.如权利要求2所述的老年人轻度认知功能损害发病风险的预测方法,其特征在于,算法介绍,
执行能力测试需要测试者在一定时间内,完成指定的动作;测试方式为让用户在10秒内眨眼4次,眨4次得4分,每眨多一次少得一分,每眨少一次少得一分;使用Google的ML Kit工具来帮助实现眨眼识别;ML Kit是一款基于dlib封装的机器学习套件,可在安卓或iOS设备上快速部署使用,并且可以离线操作。
4.如权利要求1所述的老年人轻度认知功能损害发病风险的预测方法,其特征在于,还包括人脸定位,
使用dlib中实现的对象检测器,对象检测器首先需要对图像进行一次采集,并且放大图片细节;将处理好的图像通过人脸分类器可以得到索引检测到的人脸数组,每个数组项包含了人脸的区域信息,以矩形的方式返回,即按左、上、右、下四个区域返回人脸的区域信息;人脸分类器通过方向梯度直方图HOG与支持向量机、图像金字塔以及滑动窗口检测方案相结合训练得出;
人脸分类器实现步骤如下:
(1)首先使用图像金字塔来进行图像分辨率处理,若一张图像的观察距离增大,图像上的小目标无法清晰的看到,二图像上的大目标在一定范围内还可以看到,因此对于大目标图像缩小也不会影响检测,但小目标需要放大以进行检测,图像金字塔是一张图片在不同尺度下大集合,即原图的上采样和下采样集合,金字塔最底端是分辨率最高的图像,顶部是最低分辨率的图像,形成了金字塔状排列;因此在图像采集后会使用高斯金字塔和拉普拉斯金字塔对其分别进行下采样和上采样,然后选择合适的图像进行下一步处理;
(2)使用HOG对图像进行特征提取,通过特征描述方法,将图像中的有用信息提取出来,而在图像中,边缘和角落也包含了丰富的有效信息,若能提取出图像边缘和角落的信息,非常有利于物体检测准确性的提高;而对于图像的边缘及角落周围的梯度特征变化幅度很大,因此在HOG中,使用梯度直方图作为其特征。
5.如权利要求4所述的老年人轻度认知功能损害发病风险的预测方法,其特征在于,HOG算法的基本流程是四个步骤:计算图像梯度、计算Cell中的梯度直方图、Block归一化、计算HOG特征,具体如下:
1)图像梯度是由像素点组成,而整张图片就是一个二维离散函数f(x,y);图像f(x,y)在点(x,y)的梯度G(x,y)是一个具有大小和方向的矢量,设Gx和Gy分别为水平方向和垂直方向的梯度,图像梯度的计算公式如(2.9)所示;
Figure RE-FDA0003857853520000091
Figure RE-FDA0003857853520000092
Figure RE-FDA0003857853520000093
Figure RE-FDA0003857853520000094
其中I(a,b)代表坐标为(a,b)像素点初点图像像素值,θ(a,b)表示(a,b)像素点梯度的角度;
2)由于分析每一个像素的梯度过于细节化且需耗费大量时间,因此选择将一张完整的图像划分为多个单元,也就是多个Cell,从更高的角度上进行观察,默认一个Cell为8×8的64个梯度以及梯度角度对,这些对最终会映射到9-bins直方图,而9-bins直方图就是横坐标有9个点的直方图;
3)梯度对于图像的光照亮度较为敏感,因此需要对梯度进行归一化处理以消除光照变化带来的结果影响;有两种解决手段,在HOG中,将Cell组合成大的、空间上连通的区块,也就是Blocks,在OpenCV中,默认Block的大小为16×16个像素点,也就是每四个Cell构成一个Block,Block相较于Cell具有更大的尺寸,受到光照的影响会更小,若一张图像包含4个Cell,那么一个Block中就可以连接形成一个长度为36的向量;归一化就是对向量的每个元素进行处理,将每个元素除以该向量的长度,得到一个归一化向量,即使向量因光照等因素发生变化,对其归一化处理后其归一化向量依然不会变化,可有效去除数值大小的影响;
4)完成所有Block归一化后得到的向量合并后即形成了一个HOG特征,即需要计算所有Block窗口,则需要使用滑动窗口的方法来进行遍历计算,从一张图片的左上角Block开始,依次遍历每个Block,直至最后;
在完成以上步骤后可得到HOG特征,可将其作为SVM的输入进行模型训练即可得到最终模型;因为人脸是近似左右对称的图像,因此SVM的惩罚系数C设为0.5,C越高,越不能容忍误差,容易过拟合,C越小,容易欠拟合,因此不恰当的惩罚系数会造成模型泛化能力下降;为了扩大训练集,会将所有的图像进行镜像处理。
CN202210694485.3A 2022-06-20 2022-06-20 一种老年人轻度认知功能损害发病风险的预测方法 Pending CN115312191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210694485.3A CN115312191A (zh) 2022-06-20 2022-06-20 一种老年人轻度认知功能损害发病风险的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210694485.3A CN115312191A (zh) 2022-06-20 2022-06-20 一种老年人轻度认知功能损害发病风险的预测方法

Publications (1)

Publication Number Publication Date
CN115312191A true CN115312191A (zh) 2022-11-08

Family

ID=83855222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210694485.3A Pending CN115312191A (zh) 2022-06-20 2022-06-20 一种老年人轻度认知功能损害发病风险的预测方法

Country Status (1)

Country Link
CN (1) CN115312191A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116746930A (zh) * 2023-08-21 2023-09-15 杭州汇听科技有限公司 一种基于深度学习的老年人认知功能评估预警方法及系统
CN116936133A (zh) * 2023-09-18 2023-10-24 四川互慧软件有限公司 一种基于护理晨交班数据的营养状况监测方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116746930A (zh) * 2023-08-21 2023-09-15 杭州汇听科技有限公司 一种基于深度学习的老年人认知功能评估预警方法及系统
CN116746930B (zh) * 2023-08-21 2023-11-03 杭州汇听科技有限公司 一种基于深度学习的老年人认知功能评估预警方法及系统
CN116936133A (zh) * 2023-09-18 2023-10-24 四川互慧软件有限公司 一种基于护理晨交班数据的营养状况监测方法和系统
CN116936133B (zh) * 2023-09-18 2023-12-08 四川互慧软件有限公司 一种基于护理晨交班数据的营养状况监测方法和系统

Similar Documents

Publication Publication Date Title
CN115312191A (zh) 一种老年人轻度认知功能损害发病风险的预测方法
Hannan et al. Dynamics of organizational populations: Density, legitimation, and competition
CN109543526B (zh) 基于深度差异性特征的真假面瘫识别系统
CN110097003A (zh) 基于神经网络的课堂考勤方法、设备、存储介质及装置
CN107742107A (zh) 人脸图像分类方法、装置及服务器
CN110490840A (zh) 一种肾小球病理切片图像的细胞检测方法、装置及设备
CN109300121A (zh) 一种心血管疾病诊断模型的构建方法、系统及该诊断模型
CN110348428A (zh) 眼底图像分类方法、装置及计算机可读存储介质
CN110287932A (zh) 基于深度学习图像语义分割的道路阻断信息提取
CN104200217B (zh) 基于一种复合核函数的高光谱分类方法
CN108765131A (zh) 基于微表情的信贷审核方法、装置、终端及可读存储介质
CN107463920A (zh) 一种消除局部遮挡物影响的人脸识别方法
CN107545245A (zh) 一种年龄估计方法及设备
CN110464366A (zh) 一种情绪识别方法、系统及存储介质
CN107358223A (zh) 一种基于yolo的人脸检测与人脸对齐方法
CN107958235A (zh) 一种人脸图像检测方法、装置、介质和电子设备
CN109615387A (zh) 一种基于人脸识别的消费支付系统及方法
CN109753850A (zh) 面部识别模型的训练方法和训练设备
CN109033953A (zh) 多任务学习深度网络的训练方法、设备及存储介质
CN109063977A (zh) 一种无感式交易风险监测方法及装置
CN104102899A (zh) 视网膜血管识别方法及装置
CN102034107A (zh) 基于鲁棒视觉注意特征与稀疏表示的不良图像判别方法
CN111598049A (zh) 作弊识别方法和装置、电子设备、以及介质
WO2021082433A1 (zh) 一种数字病理图像质控的方法及装置
CN112668486A (zh) 一种预激活残差深度可分离卷积网络面部表情识别方法、装置和载体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination