CN117912089A - 一种眼部几何形态异常检测方法、终端及可读存储介质 - Google Patents
一种眼部几何形态异常检测方法、终端及可读存储介质 Download PDFInfo
- Publication number
- CN117912089A CN117912089A CN202311818346.8A CN202311818346A CN117912089A CN 117912089 A CN117912089 A CN 117912089A CN 202311818346 A CN202311818346 A CN 202311818346A CN 117912089 A CN117912089 A CN 117912089A
- Authority
- CN
- China
- Prior art keywords
- image information
- neural network
- network model
- eye
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005856 abnormality Effects 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 title claims abstract description 26
- 210000001508 eye Anatomy 0.000 claims abstract description 74
- 238000003062 neural network model Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000001815 facial effect Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 230000008961 swelling Effects 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 230000004424 eye movement Effects 0.000 claims description 4
- 210000000744 eyelid Anatomy 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000012216 screening Methods 0.000 abstract description 13
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 230000002159 abnormal effect Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 206010007918 Cellulitis orbital Diseases 0.000 description 2
- 208000003164 Diplopia Diseases 0.000 description 2
- 208000002111 Eye Abnormalities Diseases 0.000 description 2
- 208000010428 Muscle Weakness Diseases 0.000 description 2
- 206010028372 Muscular weakness Diseases 0.000 description 2
- 208000000493 Orbital Cellulitis Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 208000029444 double vision Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000011034 Abnormal eye morphology Diseases 0.000 description 1
- 206010015958 Eye pain Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 208000003937 Paranasal Sinus Neoplasms Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000003889 eye drop Substances 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 201000003004 ptosis Diseases 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/197—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/193—Preprocessing; Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Ophthalmology & Optometry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种眼部几何形态异常检测方法、终端及可读存储介质,所述方法包括:获取被测试人员的面部图像信息,根据所述面部图像信息获取所述被测试人员的眼周图像信息;将所述眼周图像信息输入神经网络模型,所述神经网络模型输出所述被测试人员的眼部几何形态异常的分类结果。本发明通过神经网络模型自动检测眼部的相关特征,仅需要采用普通的摄像设备即可采集受试者的面部图像或面部视频数据,提供了一种高效、便捷、低成本的眼部筛查解决方案。
Description
技术领域
本发明涉及图像检测技术领域,尤其涉及的是一种眼部几何形态异常检测方法、终端及可读存储介质。
背景技术
眼部异常形态的早期检测对于预防、诊断和治疗与眼部相关的疾病至关重要。
例如,肌无力(Myasthenia Gravis)会导致突眼症状,肌无力引起的突眼通常是一侧性的,可以表现为眼球下垂(眼睑下垂)、双视(重影)、眼球运动不协调等症状。眼眶炎症或感染,如眼眶细胞炎、眼眶蜂窝织炎,这类病症常常伴随着眼睑肿胀、眼部红肿和眼部疼痛。鼻窦肿瘤也是眼部几何形态异常的病因之一,亦可伴随眼球运动停滞、视力下降、复视等症状。眼部肿瘤,如非霍奇金淋巴瘤、神经母细胞瘤,它们可以发生在眼眶,进而导致眼部几何形态异常。
然而,现有技术在眼部异常形态的早期检测方面存在明显的缺点,其需要专业的医疗设备和专业医生的参与,进行详细的眼部检查和图像分析,往往比较耗时。
导致了早期疾病诊断的困难以及高昂的医疗费用,且由于需要进行繁琐的眼部检查,需要患者前往医疗机构,经常需要较长的等待时间,不仅造成了患者的不便,也延迟了疾病的诊断和治疗。
发明内容
本发明的目的是提供一种眼部几何形态异常检测方法、终端及可读存储介质,旨在解决现有的眼部几何形态异常检测繁琐、检测结果不准确且成本高昂的问题。
本发明解决技术问题所采用的技术方案如下:
本发明提供一种眼部几何形态异常检测方法,所述眼部几何形态异常检测方法包括:
获取被测试人员的面部图像信息,根据所述面部图像信息获取所述被测试人员的眼周图像信息;
将所述眼周图像信息输入神经网络模型,所述神经网络模型输出所述被测试人员的眼部几何形态异常的分类结果。
进一步地,所述根据所述面部图像信息获取所述被测试人员的眼周图像信息,具体包括:
将所述面部图像信息输出到分割神经网络;
所述分割神经网络从所述面部图像信息中分割出所述被测试人员的眼周图像信息,并输出所述眼周图像信息。
进一步地,所述将所述眼周图像信息输入神经网络模型,所述神经网络模型输出所述被测试人员的眼部几何形态异常的分类结果,具体包括:
将所述眼周图像信息输入神经网络模型,所述神经网络模型的归一层将所述眼周图像信息缩放至统一大小;
所述神经网络模型的特征提取层提取所述眼周图像信息的特征,并输出所述特征到所述神经网络模型的全局平均池化层;
所述全局平均池化层将所述特征进行池化,并输出池化后的特征向量到所述神经网络模型的分类层;
所述分类层根据所述特征向量输出眼部几何形态异常的分类结果。
进一步地,所述神经网络模型的特征提取层提取所述眼周图像信息的特征,并输出所述特征到所述神经网络模型的全局平均池化层,具体包括:
所述特征提取层的扩展层将所述眼周图像信息从低维空间映射到高维空间,以实现所述眼周图像信息的升维;
所述特征提取层的深度可分离卷积层提取升维后的所述眼周图像信息的高维特征;
所述特征提取层的投影层将所述高维特征映射到低维空间,以实现降维,并输出降维后的特征到所述神经网络模型的全局平均池化层。
进一步地,所述面部图像信息包括图片信息和视频信息;
所述眼部几何形态异常包括突眼、眼睑肿胀、眼部红肿和眼球运动不协调。
进一步地,所述神经网络模型通过训练得到,所述训练包括:
获取样本集,并对样本集的各个样本进行数据增强;
将数据增强后的样本集分为训练集、测试集和验证集;
根据所述测试集选取合适的超参数和训练策略;
采用选取的超参数和训练策略,根据所述训练集对神经网络模型进行训练,并采用所述验证集验证训练的模型效果。
进一步地,所述数据增强包括旋转变换、亮度和对比度调整、镜像翻转、平移变换、以及噪声添加和裁剪中的一种或多种。
进一步地,所述根据所述训练集对神经网络模型进行训练,训练的损失函数为:
其中,N是样本数,C是类别数,yi,j表示第j个类别的第i个样本的真实标签,pi是真实类别的预测概率,Loss是损失值。
此外,为实现上述目的,本发明还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的眼部几何形态异常检测程序,所述眼部几何形态异常检测程序被所述处理器执行时控制终端实现如上所述的眼部几何形态异常检测方法的步骤。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质存储有眼部几何形态异常检测程序,所述眼部几何形态异常检测程序被处理器执行时实现如上所述的眼部几何形态异常检测方法的步骤。
本发明采用上述技术方案具有以下效果:
本发明通过神经网络模型自动检测眼部的相关特征,从而进行大致异常的眼部几何形态分类,其仅需要采用普通的摄像设备即可采集受试者的面部图像或面部视频数据,这一方法不仅避免了需要专业和昂贵的医疗设备,还结合了人工智能技术,从而实现了高效的异常眼部几何形态筛查,提供了一种高效、便捷、低成本的筛查解决方案,可应用于各种具备人脸成像功能的设备,如具备摄像装置的智能手机和平板电脑,无需昂贵的医疗设备,这为人群中的大规模疾病筛查提供了实现的可能性,可以实现大规模人群的眼部健康分析。这种创新性的技术不仅能够提供及时的健康信息,还有助于在早期阶段识别可能患有与眼部异常形态相关的疾病的受试者,从而改善治疗效果和降低并发症的风险。。
附图说明
图1是本发明较佳实施例中眼部几何形态异常检测方法的步骤流程图;
图2是本发明较佳实施例中特征提取层的模型结构示意图;
图3是本发明终端的较佳实施例的运行环境示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例一
请参见图1,本申请的实施例一是一种眼部几何形态异常检测方法,包括步骤:
S1、获取被测试人员的面部图像信息,根据所述面部图像信息获取所述被测试人员的眼周图像信息。
其中,本实施例是通过摄像头拍摄测试人员的面部图像信息,其中,图像信息根据实际需要可以包括图片信息和视频信息,以用于对不同症状的眼部几何形态异常进行检测。
获取被测试人员的面部图像信息后,利用现有的公开人脸识别算法,例如Mediapipe、Haar级联检测器、卷积神经网络(CNN)、Single Shot MultiBox Detector(SSD)、You Only Look Once(YOLO)和Faster R-CNN,从面部图像信息中分割得到被测试人员的眼周图像信息。
S2、将所述眼周图像信息输入神经网络模型,所述神经网络模型输出所述被测试人员的眼部几何形态异常的分类结果。
具体而言,本实施例中,眼部几何形态异常种类包括:突眼、眼睑肿胀、眼部红肿和眼球运动不协调。
表1神经网络结构
请参见表1,所述神经网络模型包括归一层、特征提取层、全局平均池化层和分类层。
其中,归一层用于将被测试人员的眼周图像信息缩放至统一大小。
由于拍摄时,用户距离摄像头的距离远近不一致,且用户的眼睛大小也不一致,在后续根据眼周图像信息进行判别时,不一致大小的眼周图像信息可能影响判断的效果。
因此,为了保证获取检测的效果,本实施例中,在获取被测试人员的眼周图像信息后,还采用归一层对被测试人员的眼周图像信息进行预处理,以将被测试人员的眼周图像信息缩放至统一大小,本实施例中,具体是将被测试人员的眼周图像信息缩放为224×224的大小。
特征提取层用于提取被测试人员的眼周图像信息的特征,其可以是ResNet等神经网络,也可以是随机森林和支持向量机等机器学习算法,本领域技术人员可根据实际需要进行选择。
本实施例中,具体是采用神经网络作为特征提取层,请参见图2,特征提取层包括依次连接的扩展层、深度可分离卷积层和投影层。
其中,扩展层即图中的Expansion layer,用于将低维空间映射到高维空间,以实现升维,这是因为在神经网络的计算中,输入的张量(Tensor)越低,神经网络能够提取到的信息就越少,因此,本实施例的扩展层将输入的眼周图像进行升维。
深度可分离卷积层(Depthwise Separable Convolution),即图中的Depthwiselayer,深度可分离卷积层是一种轻量化的卷积神经网络,由于以升维后的张量作为输入,若采用普通的卷积网络进行计算,则计算量过大,普通的卷积神经网络难以进行处理,因此本实施例采用轻量化的深度可分离卷积层进行特征的提取,深度可分离卷积层的特点是计算效率非常高,正好可以与扩展层形成配合。
投影层即图中的Projection layer,用于把高维特征映射到低维空间,以实现降维,从而将深度可分离卷积层提取的特征还原到原本的维度。
全局平均池化层用于将特征提取层输出的所有特征图都进行池化,最终得到一个特定大小的特征向量,从而减小特征的空间大小,同时保留最重要的特征信息,以有效地减少模型的参数数量和计算复杂度,在本实施例中,由于其有效地减少模型的参数数量和计算复杂度,因此能更好的与扩展层和投影层组成的逆残差结构的使用,降低逆残差结构导致的计算量大幅上升产生的副作用。
分类层具体是全连接层,用于根据全局平均池化层输出的特征输出具体的分类结果,值得说明的是,若不采用全局平均池化层,分类层也可以直接根据特征提取层输出的特征输出具体的分类结果。
在本实施例中,具体是4分类任务,故将全连接层的输出类别定义为4,这一层将模型的特征映射到4种不同的分类标签,以确定图像是否显示某种疾病的迹象。
在对神经网络模型训练时,包括以下步骤:
获取样本集,并进行预处理,将预处理后的样本集分为训练集、验证集和测试集。
本实施例中的样本集通过在网络上收集公开的200例人脸面部图像样本,其中,收集的样本为肌无力、眼眶蜂窝织炎、鼻窦肿瘤和正常情况下的人脸面部图像,其根据专业人士判别并进行标注。
之后,根据人脸面部图像获取对应的眼周图像信息作为样本形成样本集。
为了进一步提高模型的性能和鲁棒性,本实施例引入了数据增强技术,对样本集进行数据增强处理,得到数据增强后的样本集,数据增强处理包括旋转变换、亮度和对比度调整、镜像翻转、平移变换、噪声添加和裁剪。
其中,旋转变换,指的是随机旋转图像角度,用于模拟不同拍摄角度和头部姿势;镜像翻转,用于增加数据的多样性;亮度和对比度调整,用于适应不同光照条件;平移变换,用于模拟不同位置的眼周图像;噪声添加,用于提高模型对噪声的鲁棒性;以及裁剪,用于模拟不同尺寸和缩放级别的眼部特征。
这些数据增强技术有助于模型更好地适应不同环境和图像条件,提高了模型的性能和鲁棒性,从而使其更适合用于多种与眼部几何异常形态的疾病的筛查和检测任务。在数据增强后,可以使用扩充后的数据集来训练模型,以获得更准确和可靠的分类模型,为人群中的疾病筛查提供更高的准确性,值得说明的是,以上数据增强方法只是进行举例说明,具体实施的时候,也可以根据实际训练的需要加上其他数据增强方法或者去除一些数据增强方法。
在进行完预处理之后,将样本集按照7:2:1的比例分成训练集、验证集、测试集。
根据训练集对神经网络模型进行训练。
具体而言,模型的训练中的损失函数设置为交叉熵损失函数,交叉熵损失函数通常用于度量模型的输出概率分布与实际多类别标签之间的差异,该损失函数有助于衡量模型对不同类别的分类准确性,在训练过程中,根据预测结果与真实标签之间的误差,通过反向传播算法更新模型的权重参数。如果模型的分类结果与实际标签不一致,交叉熵损失函数会增加,促使模型调整权重以减小误差,这个过程反复进行,直到损失不再减少,即模型收敛。最终,我们可以使用测试数据集来评估神经网络模型在检测瞳孔及眼角等任务中的准确度。
其中,N是样本数,C是类别数,yi,j表示第j个类别的第i个样本的真实标签,pi是真实类别的预测概率,Loss是损失值,该损失函数为计算每个样本的损失并在整个数据集上取平均值。
本实施例中,根据训练集对神经网络模型进行训练具体包括:
采用多个超参数分别对神经网络模型进行训练,得到多个训练后的神经网络模型;
根据测试集对各个训练后的神经网络模型进行测试,以评价最好的神经网络模型对应的超参数作为最优超参数;
根据最优超参数和训练集对神经网络模型进行训练得到最终的神经网络模型。
其中,评价包括准确度评价和召回率评价。
准确度(Accuracy)是准确度定义为模型正确分类的样本数与总样本数的比值,通过比较模型的分类结果与实际标签,以计算出模型的准确度。
准确度计算公式如下:
在本实施例中,模型的准确度计算公式如下:
式中,C为类别数,即本模型的准确度为各个类别的准确度的平均值。
计算召回率(Recall),召回率是指在所有实际正例中,模型成功正确识别为正例的比例。召回率衡量了模型对正例的识别能力。
召回率计算公式如下:
本实施例中,模型的召回率计算公式如下:
即本模型的召回率为各个类别的召回率的平均值。
本发明通过神经网络模型自动检测眼部的相关特征,从而进行大致异常的眼部几何形态分类,其仅需要采用普通的摄像设备即可采集受试者的面部图像或面部视频数据,这一方法不仅避免了需要专业和昂贵的医疗设备,还结合了人工智能技术,从而实现了高效的异常眼部几何形态筛查,提供了一种高效、便捷、低成本的筛查解决方案,可应用于各种具备人脸成像功能的设备,如具备摄像装置的智能手机和平板电脑,无需昂贵的医疗设备,这为人群中的大规模疾病筛查提供了实现的可能性,可以实现大规模人群的眼部健康分析。这种创新性的技术不仅能够提供及时的健康信息,还有助于在早期阶段识别可能患有与眼部异常形态相关的疾病的受试者,从而改善治疗效果和降低并发症的风险。
通过进行大规模的异常的眼部几何形态筛查,本发明可以建立一个庞大的医疗数据库,将采集到的图像和视频数据与数据库中的参考数据进行比对,从而验证和进一步确诊可能的疾病。
此外,本发明的方法具有良好的可扩展性,根据实际的需要,可以适当的增加或减少眼部异常的种类,在将来需要对更多眼部异常的情况进行判断时,可以简易的进行扩展。
实施例二
请参见图3,基于上述方法,本发明还提供了一种终端,所述终端包括:存储器10、处理器20及存储在所述存储器10上并可在所述处理器20上运行的眼部几何形态异常检测程序,所述眼部几何形态异常检测程序被所述处理器20执行时控制终端实现如上所述的眼部几何形态异常检测方法的步骤。
所述存储器10在一些实施例中可以是所述终端的内部存储单元,例如终端的硬盘或内存。所述存储器10在另一些实施例中也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器10还可以既包括所述终端的内部存储单元也包括外部存储设备。所述存储器10用于存储安装于所述终端的应用软件及各类数据,例如所述安装终端的程序代码等。所述存储器10还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器10上存储有眼部几何形态异常检测程序,该眼部几何形态异常检测程序可被处理器20所执行,从而实现本申请中的眼部几何形态异常检测方法。
所述处理器20在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器10中存储的程序代码或处理数据,例如执行所述眼部几何形态异常检测方法等。
实施例三
本实施例提供一种可读存储介质,所述可读存储介质存储有眼部几何形态异常检测程序,所述眼部几何形态异常检测程序被处理器执行时实现如上所述的眼部几何形态异常检测方法的步骤。
综上所述,本发明通过神经网络模型自动检测眼部的相关特征,从而进行大致异常的眼部几何形态分类,其仅需要采用普通的摄像设备即可采集受试者的面部图像或面部视频数据,这一方法不仅避免了需要专业和昂贵的医疗设备,还结合了人工智能技术,从而实现了高效的异常眼部几何形态筛查,提供了一种高效、便捷、低成本的筛查解决方案,可应用于各种具备人脸成像功能的设备,如具备摄像装置的智能手机和平板电脑,无需昂贵的医疗设备,这为人群中的大规模疾病筛查提供了实现的可能性,可以实现大规模人群的眼部健康分析。这种创新性的技术不仅能够提供及时的健康信息,还有助于在早期阶段辅助识别可能患有与眼部异常形态相关的疾病的受试者,从而改善治疗效果和降低并发症的风险。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种眼部几何形态异常检测方法,其特征在于,所述眼部几何形态异常检测方法包括:
获取被测试人员的面部图像信息,根据所述面部图像信息获取所述被测试人员的眼周图像信息;
将所述眼周图像信息输入神经网络模型,所述神经网络模型输出所述被测试人员的眼部几何形态异常的分类结果。
2.根据权利要求1所述的一种眼部几何形态异常检测方法,其特征在于,所述根据所述面部图像信息获取所述被测试人员的眼周图像信息,具体包括:
将所述面部图像信息输出到分割神经网络;
所述分割神经网络从所述面部图像信息中分割出所述被测试人员的眼周图像信息,并输出所述眼周图像信息。
3.根据权利要求1所述的一种眼部几何形态异常检测方法,其特征在于,所述将所述眼周图像信息输入神经网络模型,所述神经网络模型输出所述被测试人员的眼部几何形态异常的分类结果,具体包括:
将所述眼周图像信息输入神经网络模型,所述神经网络模型的归一层将所述眼周图像信息缩放至统一大小;
所述神经网络模型的特征提取层提取所述眼周图像信息的特征,并输出所述特征到所述神经网络模型的全局平均池化层;
所述全局平均池化层将所述特征进行池化,并输出池化后的特征向量到所述神经网络模型的分类层;
所述分类层根据所述特征向量输出眼部几何形态异常的分类结果。
4.根据权利要求3所述的一种眼部几何形态异常检测方法,其特征在于,所述神经网络模型的特征提取层提取所述眼周图像信息的特征,并输出所述特征到所述神经网络模型的全局平均池化层,具体包括:
所述特征提取层的扩展层将所述眼周图像信息从低维空间映射到高维空间,以实现所述眼周图像信息的升维;
所述特征提取层的深度可分离卷积层提取升维后的所述眼周图像信息的高维特征;
所述特征提取层的投影层将所述高维特征映射到低维空间,以实现降维,并输出降维后的特征到所述神经网络模型的全局平均池化层。
5.根据权利要求1所述的一种眼部几何形态异常检测方法,其特征在于,所述面部图像信息包括图片信息和视频信息;
所述眼部几何形态异常包括突眼、眼睑肿胀、眼部红肿和眼球运动不协调。
6.根据权利要求1所述的一种眼部几何形态异常检测方法,其特征在于,所述神经网络模型通过训练得到,所述训练包括:
获取样本集,并对样本集的各个样本进行数据增强;
将数据增强后的样本集分为训练集、测试集和验证集;
根据所述测试集选取合适的超参数和训练策略;
采用选取的超参数和训练策略,根据所述训练集对神经网络模型进行训练,并采用所述验证集验证训练的模型效果。
7.根据权利要求6所述的一种眼部几何形态异常检测方法,其特征在于,所述数据增强包括旋转变换、亮度和对比度调整、镜像翻转、平移变换、以及噪声添加和裁剪中的一种或多种。
8.根据权利要求6所述的一种眼部几何形态异常检测方法,其特征在于,所述根据所述训练集对神经网络模型进行训练,训练的损失函数为:
其中,N是样本数,C是类别数,yi,j表示第j个类别的第i个样本的真实标签,pi是真实类别的预测概率,Loss是损失值。
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的眼部几何形态异常检测程序,所述眼部几何形态异常检测程序被所述处理器执行时控制终端实现如权利要求1-8任一项所述的眼部几何形态异常检测方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质存储有眼部几何形态异常检测程序,所述眼部几何形态异常检测程序被处理器执行时实现如权利要求1-8任一项所述的眼部几何形态异常检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311818346.8A CN117912089A (zh) | 2023-12-26 | 2023-12-26 | 一种眼部几何形态异常检测方法、终端及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311818346.8A CN117912089A (zh) | 2023-12-26 | 2023-12-26 | 一种眼部几何形态异常检测方法、终端及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117912089A true CN117912089A (zh) | 2024-04-19 |
Family
ID=90696042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311818346.8A Pending CN117912089A (zh) | 2023-12-26 | 2023-12-26 | 一种眼部几何形态异常检测方法、终端及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117912089A (zh) |
-
2023
- 2023-12-26 CN CN202311818346.8A patent/CN117912089A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109376636B (zh) | 基于胶囊网络的眼底视网膜图像分类方法 | |
CN111598867B (zh) | 用于检测特定面部综合征的方法、装置及计算机可读存储介质 | |
CN104636580A (zh) | 一种基于人脸的健康监控手机 | |
CN104123543A (zh) | 一种基于人脸识别的眼球运动识别方法 | |
CN113782184A (zh) | 一种基于面部关键点与特征预学习的脑卒中辅助评估系统 | |
CN114038564A (zh) | 一种糖尿病无创风险预测方法 | |
Ghorakavi | TBNet: pulmonary tuberculosis diagnosing system using deep neural networks | |
CN117437493B (zh) | 联合一阶和二阶特征的脑肿瘤mri图像分类方法及系统 | |
Xu et al. | Application of artificial intelligence technology in medical imaging | |
Naz et al. | Ensembled Deep Convolutional Generative Adversarial Network for Grading Imbalanced Diabetic Retinopathy Recognition | |
Hamid et al. | An intelligent strabismus detection method based on convolution neural network | |
Vani et al. | An Enhancing Diabetic Retinopathy Classification and Segmentation based on TaNet. | |
CN113284613A (zh) | 一种基于深度学习的人脸诊断系统 | |
Sengar et al. | An efficient artificial intelligence-based approach for diagnosis of media haze disease | |
Lin et al. | Res-UNet based optic disk segmentation in retinal image | |
CN114418999B (zh) | 基于病变关注金字塔卷积神经网络的视网膜病变检测系统 | |
CN117912089A (zh) | 一种眼部几何形态异常检测方法、终端及可读存储介质 | |
CN115116117A (zh) | 一种基于多模态融合网络的学习投入度数据的获取方法 | |
Fu et al. | Agc-unet: a global context feature fusion method based on u-net for retinal vessel segmentation | |
Jabbar et al. | Liver fibrosis processing, multiclassification, and diagnosis based on hybrid machine learning approaches | |
Wijerathna et al. | Brain Tumor Detection Using Image Processing | |
CN117496323B (zh) | 基于Transformer的多尺度二阶病理图像分类方法及系统 | |
CN117649565B (zh) | 一种模型训练方法、训练装置及医学影像分类方法 | |
AU2021106149A4 (en) | Gaze based interface to assist prospective programmers with the learning environment | |
CN118781414A (zh) | 一种高度近视牵拉性病变分类方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |