CN110334575B - 眼底照片识别方法、装置、设备及存储介质 - Google Patents
眼底照片识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110334575B CN110334575B CN201910352715.6A CN201910352715A CN110334575B CN 110334575 B CN110334575 B CN 110334575B CN 201910352715 A CN201910352715 A CN 201910352715A CN 110334575 B CN110334575 B CN 110334575B
- Authority
- CN
- China
- Prior art keywords
- fundus
- neural network
- target
- picture
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B3/00—Apparatus for testing the eyes; Instruments for examining the eyes
- A61B3/10—Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
- A61B3/12—Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for looking at the eye fundus, e.g. ophthalmoscopes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B3/00—Apparatus for testing the eyes; Instruments for examining the eyes
- A61B3/10—Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
- A61B3/14—Arrangements specially adapted for eye photography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Ophthalmology & Optometry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Surgery (AREA)
- Veterinary Medicine (AREA)
- Artificial Intelligence (AREA)
- Heart & Thoracic Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Eye Examination Apparatus (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种眼底照片识别方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:获取目标眼底照片;将目标眼底照片输入至目标神经网络,获取目标神经网络输出的目标概率信息,目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率;其中,目标神经网络是基于第一训练集和第二训练集训练得到的,第一训练集包括m个不具有目标特征的第一眼底照片以及与m个第一眼底照片一一对应的m个第一标签值,第一标签值用于指示对应的第一眼底照片是否为罹患有目标疾病的患者的眼底照片,第二训练集包括n个具有目标特征的第二眼底照片。本申请实施例提供的技术方案可以解决神经网络训练难度较高的问题。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及眼底照片识别方法、装置、设备及存储介质。
背景技术
眼底照片指的是眼球后部组织的照片,其是眼部疾病以及心脑血管疾病等的重要诊断依据。为了提高疾病诊断的效率以及准确率,可以使用神经网络对眼底照片进行识别,以确定眼底照片对应的患者是否罹患有某些疾病。然而,实际应用中,由于神经网络通常是利用大量的较为常见的眼底照片训练得到的,因此,神经网络对较为常见的眼底照片的识别准确率较高,而对不常见的具有某些特殊特征的眼底照片的识别准确率却较低。
相关技术中,可以收集大量的具有某些特殊特征的不常见的眼底照片,并利用收集到的该大量的不常见的眼底照片训练神经网络,以利用训练好的该神经网络对不常见的眼底照片进行识别,从而提高对不常见的眼底照片的识别准确率。
然而,收集大量的不常见的眼底照片往往难度较大,这导致神经网络的训练难度较高。
发明内容
基于此,有必要针对神经网络训练难度较高的问题,提供一种眼底照片识别方法、装置、设备及存储介质。
第一方面,提供了一种眼底照片识别方法,所述方法包括:
获取目标眼底照片;
将所述目标眼底照片输入至目标神经网络,获取所述目标神经网络输出的目标概率信息,所述目标概率信息用于指示所述目标眼底照片对应的患者罹患目标疾病的概率;
其中,所述目标神经网络是基于第一训练集和第二训练集训练得到的,所述第一训练集包括m个不具有目标特征的第一眼底照片以及与m个所述第一眼底照片一一对应的m个第一标签值,所述第一标签值用于指示对应的第一眼底照片是否为罹患有所述目标疾病的患者的眼底照片,所述第二训练集包括n个具有所述目标特征的第二眼底照片,n为小于m的正整数,m为正整数。
可选的,所述将所述目标眼底照片输入至目标神经网络之前,所述方法还包括:
利用所述第一训练集训练得到第一神经网络和第二神经网络,所述第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,所述第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,所述概率信息用于指示眼底照片对应的患者罹患所述目标疾病的概率;
将所述第一眼底照片输入至所述第一神经网络,得到第一特征图;
利用所述第一特征图和所述第二训练集进行对抗训练,得到第三神经网络;
获取所述目标神经网络,所述目标神经网络包括所述第三神经网络和所述第二神经网络。
可选的,所述利用所述第一特征图和所述第二训练集进行对抗训练,得到第三神经网络,包括:
将所述第二眼底照片输入至初始特征提取神经网络,得到第二特征图;
获取网络损失函数,所述网络损失函数用于表征分辨神经网络分辨所述第一特征图和所述第二特征图的能力;
将所述第一特征图和所述第二特征图输入至所述分辨神经网络,得到所述分辨神经网络对所述第一特征图和所述第二特征图的分辨结果;
根据所述分辨结果调整所述初始特征提取神经网络的参数直至所述网络损失函数收敛,得到所述第三神经网络。
可选的,所述获取所述目标神经网络之后,所述方法还包括:
获取测试集,所述测试集包括p个测试眼底照片和与所述p个测试眼底照片一一对应的p个第二标签值,所述p个测试眼底照片中存在所述第一眼底照片和所述第二眼底照片,所述第二标签值用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片,p为正整数;
将所述p个测试眼底照片输入至所述目标神经网络,得到所述目标神经网络输出的与所述p个测试眼底照片一一对应的p个测试概率信息,所述测试概率信息用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片;
根据每个所述测试眼底照片对应的第二标签值和测试概率信息是否匹配确定所述目标神经网络的识别能力。
可选的,所述目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;
其中,所述第一亮度阈值大于所述第二亮度阈值。
可选的,所述目标疾病为青光眼。
第二方面,提供了一种眼底照片识别装置,所述装置包括:
第一获取模块,用于获取目标眼底照片;
第二获取模块,用于将所述目标眼底照片输入至目标神经网络,获取所述目标神经网络输出的目标概率信息,所述目标概率信息用于指示所述目标眼底照片对应的患者罹患目标疾病的概率;
其中,所述目标神经网络是基于第一训练集和第二训练集训练得到的,所述第一训练集包括m个不具有目标特征的第一眼底照片以及与m个所述第一眼底照片一一对应的m个第一标签值,所述第一标签值用于指示对应的第一眼底照片是否为罹患有所述目标疾病的患者的眼底照片,所述第二训练集包括n个具有所述目标特征的第二眼底照片,n为小于m的正整数,m为正整数。
可选的,所述装置还包括:
第一训练模块,用于利用所述第一训练集训练得到第一神经网络和第二神经网络,所述第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,所述第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,所述概率信息用于指示眼底照片对应的患者罹患所述目标疾病的概率;
第三获取模块,用于将所述第一眼底照片输入至所述第一神经网络,得到第一特征图;
第二训练模块,用于利用所述第一特征图和所述第二训练集进行对抗训练,得到第三神经网络;
第四获取模块,用于获取所述目标神经网络,所述目标神经网络包括所述第三神经网络和所述第二神经网络。
可选的,所述第二训练模块,具体用于:
将所述第二眼底照片输入至初始特征提取神经网络,得到第二特征图;
获取网络损失函数,所述网络损失函数用于表征分辨神经网络分辨所述第一特征图和所述第二特征图的能力;
将所述第一特征图和所述第二特征图输入至所述分辨神经网络,得到所述分辨神经网络对所述第一特征图和所述第二特征图的分辨结果;
根据所述分辨结果调整所述初始特征提取神经网络的参数直至所述网络损失函数收敛,得到所述第三神经网络。
可选的,所述装置还包括:
第五获取模块,用于获取测试集,所述测试集包括p个测试眼底照片和与所述p个测试眼底照片一一对应的p个第二标签值,所述p个测试眼底照片中存在所述第一眼底照片和所述第二眼底照片,所述第二标签值用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片,p为正整数;
第六获取模块,用于将所述p个测试眼底照片输入至所述目标神经网络,得到所述目标神经网络输出的与所述p个测试眼底照片一一对应的p个测试概率信息,所述测试概率信息用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片;
第七获取模块,用于根据每个所述测试眼底照片对应的第二标签值和测试概率信息是否匹配确定所述目标神经网络的识别能力。
可选的,所述目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;
其中,所述第一亮度阈值大于所述第二亮度阈值。
可选的,所述目标疾病为青光眼。
第三方面,提供了一种眼底照片识别设备,所述眼底照片识别设备包括处理器和存储器,所述存储器中存储有指令;
所述处理器被配置为执行所述存储器中存储的指令,所述处理器通过执行所述指令来实现如上述第一方面任一所述的眼底照片识别方法。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在处理器上运行时,使得所述处理器执行如上述第一方面任一所述的眼底照片识别方法。
综上所述,本申请实施例提供的技术方案带来的有益效果至少包括:
通过获取目标眼底照片,并将该目标眼底照片输入至目标神经网络,以获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率,由于该目标神经网络是基于第一训练集和第二训练集训练得到的,且,第一训练集包含多个常见的第一眼底照片,该常见的第一眼底照片不具有目标特征,第二训练集包含多个不常见的第二眼底照片,该不常见的第二眼底照片具有目标特征,因此,基于第一训练集和第二训练集训练得到的目标神经网络可以用来识别不常见的眼底照片,同时,该目标神经网络是由第一训练集和第二训练集共同训练得到的,也即是,训练该目标神经网络所使用的训练样本并不全部都是不常见的第二眼底照片,其还包括常见的第一眼底照片,这就可以减少训练该目标神经网络时所需收集的不常见的眼底照片的数量,从而可以降低训练目标神经网络的难度。
附图说明
图1是本申请实施例提供的一种眼底照片识别方法所涉及到的实施环境的示意图。
图2是本申请实施例提供的一种眼底照片识别方法的流程图。
图3是本申请实施例提供的另一种眼底照片识别方法的流程图。
图4是本申请实施例提供的一种神经网络训练的示意图。
图5是本申请实施例提供的一种眼底照片识别装置的框图。
图6是本申请实施例提供的另一种眼底照片识别装置的框图。
图7是本申请实施例提供的一种服务器的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
眼底指的是眼球后部的组织,包括视网膜、视乳头以及视神经等。眼底照片,顾名思义,就是对眼底进行拍摄得到的照片,在实际应用中,眼底照片也可以被称为眼底图像或眼底相片等。在临床诊疗中,眼底照片是许多疾病的重要诊断依据,例如,青光眼等眼部疾病通常就需要根据患者的眼底照片进行诊断,其中,青光眼是一种以视乳头萎缩及凹陷、视野缺损及视力下降为共同特征的疾病。
由于医生的数量相较于患者的数量而言少得多,而且,医生的疾病诊断能力参差不齐,因此,由医生对眼底照片进行肉眼观察并根据观察结果进行疾病诊断的方式,一方面无法保证疾病诊断的效率,另一方面无法保证疾病诊断的准确率。为了提高疾病诊断的效率和准确率,可以利用神经网络对眼底照片进行识别,以确定眼底照片对应的患者是否罹患有某些疾病。然而,实际应用中,由于神经网络通常是利用大量的较为常见的眼底照片训练得到的,因此,神经网络对较为常见的眼底照片的识别准确率较高,而对不常见的具有某些特殊特征的眼底照片的识别准确率却较低。
相关技术中,可以收集大量的具有某些特殊特征的不常见的眼底照片,例如,可以收集几千万张具有某些特殊特征的不常见的眼底照片,在收集到大量的具有某些特殊特征的不常见的眼底照片之后,可以基于收集到的该大量的不常见的眼底照片,利用梯度下降法等训练方式训练得到一个神经网络,训练得到的该神经网络可以用来对不常见的眼底照片进行识别,这样,就可以提高对不常见的眼底照片的识别准确率。
然而,具有某些特殊特征的不常见的眼底照片在临床诊疗中出现的概率是较低的,因此,收集大量的具有某些特殊特征的不常见的眼底照片不仅需要与大量的医疗机构进行合作,而且需要非常长的时间,这导致收集大量的具有某些特殊特征的不常见的眼底照片的难度较大,继而导致神经网络的训练难度较高。
本申请实施例提供了一种眼底照片识别方法,可以降低神经网络的训练难度。
在本申请实施例提供的眼底照片识别方法中,可以将目标眼底照片输入至目标神经网络,以获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率,由于该目标神经网络是基于第一训练集和第二训练集训练得到的,且,第一训练集包含多个常见的第一眼底照片,该常见的第一眼底照片不具有目标特征,第二训练集包含多个不常见的第二眼底照片,该不常见的第二眼底照片具有目标特征,因此,基于第一训练集和第二训练集训练得到的目标神经网络可以用来识别不常见的眼底照片,同时,该目标神经网络是由第一训练集和第二训练集共同训练得到的,也即是,训练该目标神经网络所使用的训练样本并不全部都是不常见的第二眼底照片,其还包括常见的第一眼底照片,这就可以减少训练该目标神经网络时所需收集的不常见的眼底照片的数量,从而可以降低训练目标神经网络的难度。
下面,将对本申请实施例提供的眼底照片识别方法所涉及到的实施环境进行简要说明。
图1为本申请实施例提供的眼底照片识别方法所涉及到的实施环境的示意图,如图1所示,该实施环境可以包括服务器101和终端102,服务器101和终端102之间可以通过有线网络或无线网络进行通信。
其中,终端102可以为台式电脑、平板电脑、智能手机等,服务器101可以为一台服务器,也可以为由多台服务器组成的服务器集群。
如图1所示,终端102可以将眼底照片发送至服务器101,服务器101中可以存储有目标神经网络,其中,目标神经网络能够基于输入的眼底照片而输出该眼底照片的概率信息,其中,眼底照片的概率信息用于指示眼底照片对应的患者罹患目标疾病的概率。服务器101可以利用该目标神经网络对终端102发送的眼底照片进行识别。
当然,在一些可能的实现方式中,本申请实施例提供的眼底照片识别方法所涉及到的实施环境可以仅包括图1中的服务器101。在实施环境仅包括服务器101的情况下,服务器101中可以存储有多个待识别的眼底照片和上述目标神经网络,服务器101可以利用目标神经网络对自身存储的眼底照片进行识别。
请参考图2,其示出了本申请实施例提供的一种眼底照片识别方法的流程图,该眼底照片识别方法可以应用于图1中的服务器101中。如图2所示,该眼底照片识别方法可以包括以下步骤:
步骤201、服务器获取目标眼底照片。
步骤202、服务器将目标眼底照片输入至目标神经网络,获取目标神经网络输出的目标概率信息。
该目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率。其中,该目标疾病可以为能够基于眼底照片进行诊断的疾病,该目标疾病可以为眼部疾病或心脑血管疾病等,可选的,该目标疾病可以为青光眼。
该目标神经网络是基于第一训练集和第二训练集训练得到的。
该第一训练集包括m个不具有目标特征的第一眼底照片以及与m个第一眼底照片一一对应的m个第一标签值,该第一标签值用于指示对应的第一眼底照片是否为罹患有目标疾病的患者的眼底照片,第二训练集包括n个具有目标特征的第二眼底照片,n为小于m的正整数,m为正整数。
第一眼底照片是常见的眼底照片,也即是,第一眼底照片所拥有的特征在眼底照片中出现的概率较大(大于第一概率阈值)。第二眼底照片是不常见的眼底照片,也即是,第二眼底照片所拥有的某些特征在眼底照片中出现的概率较小(小于第二概率阈值)。其中,第一概率阈值大于或等于第二概率阈值。
目标特征是常见的眼底照片所不具有的特征,目标特征是不常见的眼底照片所具有的特征,换句话说,目标特征在眼底照片中出现的概率较小(小于上述第二概率阈值)。
可选的,该目标特征可以包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征等,其中,该第一亮度阈值大于该第二亮度阈值。
第一训练集中第一眼底照片的数量m远大于第二训练集中第二眼底照片的数量n,在本申请的一个实施例中,m远大于n指的可以是m比n大3个数量级或3个数量级以上,例如,在本申请的一些实施例中,m的值可以为几千万,n的值可以为几万。
综上所述,本申请实施例提供的眼底照片识别方法,通过获取目标眼底照片,并将该目标眼底照片输入至目标神经网络,以获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率,由于该目标神经网络是基于第一训练集和第二训练集训练得到的,且,第一训练集包含多个常见的第一眼底照片,该常见的第一眼底照片不具有目标特征,第二训练集包含多个不常见的第二眼底照片,该不常见的第二眼底照片具有目标特征,因此,基于第一训练集和第二训练集训练得到的目标神经网络可以用来识别不常见的眼底照片,同时,该目标神经网络是由第一训练集和第二训练集共同训练得到的,也即是,训练该目标神经网络所使用的训练样本并不全部都是不常见的第二眼底照片,其还包括常见的第一眼底照片,这就可以减少训练该目标神经网络时所需收集的不常见的眼底照片的数量,从而可以降低训练目标神经网络的难度。
在本申请的一个实施例中,在将目标眼底照片输入至目标神经网络之前,服务器还可以执行以下技术过程:
服务器利用第一训练集训练得到第一神经网络和第二神经网络,其中,第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,该概率信息用于指示眼底照片对应的患者罹患目标疾病的概率。服务器将第一眼底照片输入至第一神经网络,得到第一特征图。服务器利用第一特征图和第二训练集进行对抗训练,得到第三神经网络。服务器获取目标神经网络,其中,该目标神经网络包括第三神经网络和第二神经网络。
可选的,上文所述的利用第一特征图和第二训练集进行对抗训练,得到第三神经网络,可以包括:
服务器将第二眼底照片输入至初始特征提取神经网络,得到第二特征图。服务器获取网络损失函数,该网络损失函数用于表征分辨神经网络分辨第一特征图和第二特征图的能力。服务器将第一特征图和第二特征图输入至该分辨神经网络,得到该分辨神经网络对第一特征图和第二特征图的分辨结果。服务器根据得到的该分辨结果调整初始特征提取神经网络的参数直至该网络损失函数收敛,得到该第三神经网络。
在本申请的一个实施例中,在获取到目标神经网络之后,服务器还可以执行以下技术过程:
服务器获取测试集,其中,该测试集包括p个测试眼底照片和与该p个测试眼底照片一一对应的p个第二标签值,该p个测试眼底照片中存在第一眼底照片和第二眼底照片,该第二标签值用于指示对应的测试眼底照片是否为罹患有目标疾病的患者的眼底照片,p为正整数。服务器将该p个测试眼底照片输入至目标神经网络,得到目标神经网络输出的与该p个测试眼底照片一一对应的p个测试概率信息,该测试概率信息用于指示对应的测试眼底照片是否为罹患有目标疾病的患者的眼底照片。服务器根据每个测试眼底照片对应的第二标签值和测试概率信息是否匹配确定该目标神经网络的识别能力。
请参考图3,其示出了本申请实施例提供的一种眼底照片识别方法的流程图,该眼底照片识别方法可以应用于图1中的服务器101中。如图3所示,该眼底照片识别方法可以包括以下步骤:
步骤301、服务器获取目标眼底照片。
在实施环境包括终端和服务器的情况下,终端可以向服务器发送该目标眼底照片,在步骤301中,服务器可以接收终端发送的该目标眼底照片。在实施环境仅包括服务器的情况下,步骤301中,服务器可以从自身存储的待识别的眼底照片中获取该目标眼底照片。
步骤302、服务器将目标眼底照片输入至目标神经网络,并获取该目标神经网络输出的目标概率信息。
该目标神经网络可以为图像语义分割深度神经网络,例如,该目标神经网络可以为Segnet神经网络。该目标神经网络可以包括相互耦合的第三神经网络和第二神经网络。
1、第三神经网络。
第三神经网络可以为卷积神经网络(英文:Convolutional Neural Network;简称:CNN),其用于对眼底照片进行低维特征提取,并输出该眼底照片的特征图(英文:feature map)。
其中,眼底照片的特征图本质上是一个矩阵,该矩阵中的元素即为第三神经网络所提取到的眼底照片的特征。
2、第二神经网络。
第二神经网络也可以为CNN网络,其可以对眼底照片的特征图进行分类,并输出概率信息,该概率信息用于指示眼底照片对应的患者罹患目标疾病的概率。
可选的,所谓“对眼底照片的特征图进行分类”指的可以是:第二神经网络对眼底照片的低维特征进行高维还原,也即是,第二神经网络对眼底照片的特征图进行放大,得到放大后的特征图,在得到放大后的特征图后,第二神经网络根据放大后的特征图输出概率信息。
在步骤302中,服务器可以将步骤301中获取的目标眼底照片输入至目标神经网络,通过目标神经网络所包含的第三神经网络和第二神经网络对其进行处理,从而输出上述目标概率信息。
在本申请的一个实施例中,在将目标眼底照片输入至目标神经网络之前,服务器可以对该目标神经网络进行训练。下面,本申请实施例将结合图4对训练目标神经网络的技术过程进行简要说明:
1、服务器获取第一训练集和第二训练集。
2、服务器利用第一训练集训练得到第一神经网络和上述第二神经网络。
可选的,服务器可以基于第一训练集,利用梯度下降法等训练方式训练得到该第一神经网络和第二神经网络。
其中,第一神经网络与上文所述的第三神经网络类似,其也可以为CNN神经网络,用于对眼底照片进行低维特征提取,并输出该眼底照片的特征图。
由于第一神经网络是服务器利用第一训练集训练得到的,该第一训练集包含多个常见的不具有目标特征的第一眼底照片,因此,该第一神经网络对常见的眼底照片进行特征提取的准确率较高。
同时,由于第二神经网络和第一神经网络是由服务器利用第一训练集同时训练得到的,因此,该第二神经网络对第一神经网络输出的特征图进行分类的准确率较高,也即是,第二神经网络基于第一神经网络输出的特征图而输出的概率信息的准确率较高。
3、服务器将第一眼底照片输入至第一神经网络,得到第一特征图。
如上所述,第一神经网络能够对眼底照片进行低维特征提取,并输出该眼底照片的特征图,因此,服务器将第一训练集中的第一眼底照片输入至第一神经网络中,可以得到该第一神经网络对该第一眼底照片进行低维特征提取后输出的第一特征图。
4、服务器利用第一特征图和第二训练集进行对抗训练,得到上述第三神经网络。
对抗训练的目的是使第三神经网络对第二训练集中的第二眼底照片进行低维特征提取得到的特征图与第一神经网络对第一训练集中的第一眼底照片进行低维特征提取得到的特征图难以被计算机设备分辨。
由于第三神经网络对第二训练集中的第二眼底照片进行低维特征提取得到的特征图与第一神经网络对第一训练集中的第一眼底照片进行低维特征提取得到的特征图难以被计算机设备分辨,同时,第二神经网络基于第一神经网络输出的特征图而输出的概率信息的准确率较高,因此,第二神经网络基于第三神经网络输出的特征图而输出的概率信息的准确率也较高。
这样,在通过对抗训练得到第三神经网络后,就可以利用第三神经网络和第二神经网络对不常见的眼底照片进行识别了,而且,其识别准确率较高。
在本申请的一个实施例中,服务器进行对抗训练的技术过程可以包括:
A、服务器获取用于对抗训练的初始特征提取神经网络和分辨神经网络。
其中,该初始特征提取神经网络可以为CNN神经网络,其可以对眼底照片进行低维特征提取,并输出眼底照片的特征图。分辨神经网络对初始特征提取神经网络输出的特征图和上文所述的第一特征图进行分辨。
B、服务器将第二眼底照片输入至该初始特征提取神经网络,得到第二特征图。
如上所述,初始特征提取神经网络可以对眼底照片进行低维特征提取,并输出眼底照片的特征图,因此,服务器将第二训练集中的第二眼底照片输入至初始特征提取神经网络中,可以得到该初始特征提取神经网络对该第二眼底照片进行低维特征提取后输出的第二特征图。
C、服务器获取网络损失函数。
其中,该网络损失函数用于表征分辨神经网络分辨第一特征图和第二特征图(也即是初始特征提取神经网络输出的特征图)的能力。
D、服务器将第一特征图和第二特征图输入至分辨神经网络,得到分辨神经网络对第一特征图和第二特征图的分辨结果。
E、服务器根据该分辨结果调整初始特征提取神经网络的参数直至该网络损失函数收敛,从而得到第三神经网络。
在网络损失函数收敛时,说明分辨神经网络已经无法分辨第一特征图和第二特征图了,此时,就完成了对该初始特征提取神经网络的对抗训练,从而得到该第三神经网络。
5、服务器获取目标神经网络。
其中,该目标神经网络包括上述第三神经网络和上述第二神经网络。
在对目标神经网络进行训练的过程中,服务器可以利用大量的常见的第一眼底照片先训练得到第一神经网络和第二神经网络,接着,服务器可以利用第一神经网络和第二训练集中不常见的第二眼底照片经过对抗训练得到第三神经网络,而后,服务器可以将第三神经网络和第二神经网络获取为目标神经网络。由于对抗训练所需的训练样本的数量较少,因此,服务器仅需要数量较少的不常见的第二眼底照片就可以完成对抗训练,得到第三神经网络,这样就可以减少训练目标神经网络时所需收集的不常见的眼底照片的数量,从而可以降低训练目标神经网络的难度。
在本申请的一个实施例中,训练得到该目标神经网络之后,服务器还可以对该目标神经网络的识别能力进行测试,所谓目标神经网络的识别能力指的是目标神经网络对常见的眼底照片和不常见的眼底照片进行识别后输出的概率信息的准确率。下面,本申请实施例将对该测试的技术过程进行简要说明。
1、服务器获取测试集。
其中,该测试集包括p个测试眼底照片和与该p个测试眼底照片一一对应的p个第二标签值。该p个测试眼底照片中存在上述第一眼底照片和上述第二眼底照片。该第二标签值用于指示对应的测试眼底照片是否为罹患有目标疾病的患者的眼底照片,p为正整数。
在本申请的一个实施例中,服务器可以从第一训练集中获取一部分第一眼底照片,并从第二训练集中获取一部分第二眼底照片,以共同组成上述测试集。
2、服务器将该p个测试眼底照片输入至目标神经网络,得到该目标神经网络输出的与该p个测试眼底照片一一对应的p个测试概率信息。
其中,该测试概率信息用于指示对应的测试眼底照片是否为罹患有目标疾病的患者的眼底照片。
3、服务器根据每个测试眼底照片对应的第二标签值和测试概率信息是否匹配确定目标神经网络的识别能力。
可选的,当该p个测试眼底照片中存在q个或q个以上的匹配测试眼底照片时,服务器可以确定目标神经网络的识别能力满足要求,此时,服务器可以将该目标神经网络进行存储,以利用存储的目标神经网络对眼底照片(例如,上文所述的目标眼底照片)进行识别,其中,匹配测试眼底照片指的是对应的第二标签值与对应的测试概率信息相匹配的测试眼底照片,q与p的比值大于目标比值阈值。
可选的,当该p个测试眼底照片中存在的匹配测试眼底照片的个数低于q时,服务器可以确定目标神经网络的识别能力不满足要求,此时,服务器可以重新执行上述训练目标神经网络的技术过程。
通过对目标神经网络的识别能力进行测试,可以保证由识别能力满足要求的目标神经网络对眼底照片进行识别,从而可以保证对眼底照片的识别准确率。
步骤303、服务器根据目标神经网络输出的目标概率信息确定该目标眼底照片对应该的患者是否罹患目标疾病。
综上所述,本申请实施例提供的眼底照片识别方法,通过获取目标眼底照片,并将该目标眼底照片输入至目标神经网络,以获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率,由于该目标神经网络是基于第一训练集和第二训练集训练得到的,且,第一训练集包含多个常见的第一眼底照片,该常见的第一眼底照片不具有目标特征,第二训练集包含多个不常见的第二眼底照片,该不常见的第二眼底照片具有目标特征,因此,基于第一训练集和第二训练集训练得到的目标神经网络可以用来识别不常见的眼底照片,同时,该目标神经网络是由第一训练集和第二训练集共同训练得到的,也即是,训练该目标神经网络所使用的训练样本并不全部都是不常见的第二眼底照片,其还包括常见的第一眼底照片,这就可以减少训练该目标神经网络时所需收集的不常见的眼底照片的数量,从而可以降低训练目标神经网络的难度。
请参考图5,其示出了本申请实施例提供的一种眼底照片识别装置500的框图,该眼底照片识别装置500可以配置于图1中的服务器101中。如图5所示,该眼底照片识别装置500可以包括:第一获取模块501和第二获取模块502。
其中,该第一获取模块501,用于获取目标眼底照片。
该第二获取模块502,用于将该目标眼底照片输入至目标神经网络,获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示该目标眼底照片对应的患者罹患目标疾病的概率。
其中,该目标神经网络是基于第一训练集和第二训练集训练得到的,该第一训练集包括m个不具有目标特征的第一眼底照片以及与m个该第一眼底照片一一对应的m个第一标签值,该第一标签值用于指示对应的第一眼底照片是否为罹患有该目标疾病的患者的眼底照片,该第二训练集包括n个具有该目标特征的第二眼底照片,n为小于m的正整数,m为正整数。
在本申请的一个实施例中,该目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;其中,该第一亮度阈值大于该第二亮度阈值。
在本申请的一个实施例中,该目标疾病为青光眼。
请参考图6,本申请实施例还提供了一种眼底照片识别装置600,该眼底照片识别装置600除了包括眼底照片识别装置500包括的各模块外,还包括第一训练模块503、第三获取模块504、第二训练模块505、第四获取模块506、第五获取模块507、第六获取模块508和第七获取模块509。
其中,该第一训练模块503,用于利用该第一训练集训练得到第一神经网络和第二神经网络,该第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,该第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,该概率信息用于指示眼底照片对应的患者罹患该目标疾病的概率。
该第三获取模块504,用于将该第一眼底照片输入至该第一神经网络,得到第一特征图。
该第二训练模块505,用于利用该第一特征图和该第二训练集进行对抗训练,得到第三神经网络。
该第四获取模块506,用于获取该目标神经网络,该目标神经网络包括该第三神经网络和该第二神经网络。
该第五获取模块507,用于获取测试集,该测试集包括p个测试眼底照片和与该p个测试眼底照片一一对应的p个第二标签值,该p个测试眼底照片中存在该第一眼底照片和该第二眼底照片,该第二标签值用于指示对应的测试眼底照片是否为罹患有该目标疾病的患者的眼底照片,p为正整数。
该第六获取模块508,用于将该p个测试眼底照片输入至该目标神经网络,得到该目标神经网络输出的与该p个测试眼底照片一一对应的p个测试概率信息,该测试概率信息用于指示对应的测试眼底照片是否为罹患有该目标疾病的患者的眼底照片。
该第七获取模块509,用于根据每个该测试眼底照片对应的第二标签值和测试概率信息是否匹配确定该目标神经网络的识别能力。
在本申请的一个实施例中,该第二训练模块505,具体用于:构建用于对抗训练的初始特征提取神经网络和分辨神经网络;将该第二眼底照片输入至该初始特征提取神经网络,得到第二特征图;获取网络损失函数,该网络损失函数用于表征该分辨神经网络分辨该第一特征图和该第二特征图的能力;将该第一特征图和该第二特征图输入至该分辨神经网络,得到该分辨神经网络对该第一特征图和该第二特征图的分辨结果;根据该分辨结果调整该初始特征提取神经网络的参数直至该网络损失函数收敛,得到该第三神经网络。
综上所述,本申请实施例提供的眼底照片识别装置,通过获取目标眼底照片,并将该目标眼底照片输入至目标神经网络,以获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示目标眼底照片对应的患者罹患目标疾病的概率,由于该目标神经网络是基于第一训练集和第二训练集训练得到的,且,第一训练集包含多个常见的第一眼底照片,该常见的第一眼底照片不具有目标特征,第二训练集包含多个不常见的第二眼底照片,该不常见的第二眼底照片具有目标特征,因此,基于第一训练集和第二训练集训练得到的目标神经网络可以用来识别不常见的眼底照片,同时,该目标神经网络是由第一训练集和第二训练集共同训练得到的,也即是,训练该目标神经网络所使用的训练样本并不全部都是不常见的第二眼底照片,其还包括常见的第一眼底照片,这就可以减少训练该目标神经网络时所需收集的不常见的眼底照片的数量,从而可以降低训练目标神经网络的难度。
本申请实施例提供的眼底照片识别装置,可以实现上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
关于眼底照片识别装置的具体限定可以参见上文中对于眼底照片识别方法的限定,在此不再赘述。上述眼底照片识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种眼底照片识别方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取目标眼底照片,将该目标眼底照片输入至目标神经网络,获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示该目标眼底照片对应的患者罹患目标疾病的概率。
其中,该目标神经网络是基于第一训练集和第二训练集训练得到的,该第一训练集包括m个不具有目标特征的第一眼底照片以及与m个该第一眼底照片一一对应的m个第一标签值,该第一标签值用于指示对应的第一眼底照片是否为罹患有该目标疾病的患者的眼底照片,该第二训练集包括n个具有该目标特征的第二眼底照片,n为小于m的正整数,m为正整数。
在一个实施例中,将该目标眼底照片输入至目标神经网络之前,处理器执行计算机程序时还实现以下步骤:
利用该第一训练集训练得到第一神经网络和第二神经网络,该第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,该第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,该概率信息用于指示眼底照片对应的患者罹患该目标疾病的概率;将该第一眼底照片输入至该第一神经网络,得到第一特征图;利用该第一特征图和该第二训练集进行对抗训练,得到第三神经网络;获取该目标神经网络,该目标神经网络包括该第三神经网络和该第二神经网络。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将该第二眼底照片输入至初始特征提取神经网络,得到第二特征图;获取网络损失函数,该网络损失函数用于表征分辨神经网络分辨该第一特征图和该第二特征图的能力;将该第一特征图和该第二特征图输入至该分辨神经网络,得到该分辨神经网络对该第一特征图和该第二特征图的分辨结果;根据该分辨结果调整该初始特征提取神经网络的参数直至该网络损失函数收敛,得到该第三神经网络。
在一个实施例中,获取该目标神经网络之后,处理器执行计算机程序时还实现以下步骤:
获取测试集,该测试集包括p个测试眼底照片和与该p个测试眼底照片一一对应的p个第二标签值,该p个测试眼底照片中存在该第一眼底照片和该第二眼底照片,该第二标签值用于指示对应的测试眼底照片是否为罹患有该目标疾病的患者的眼底照片,p为正整数;将该p个测试眼底照片输入至该目标神经网络,得到该目标神经网络输出的与该p个测试眼底照片一一对应的p个测试概率信息,该测试概率信息用于指示对应的测试眼底照片是否为罹患有该目标疾病的患者的眼底照片;根据每个该测试眼底照片对应的第二标签值和测试概率信息是否匹配确定该目标神经网络的识别能力。
在一个实施例中,该目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;其中,该第一亮度阈值大于该第二亮度阈值。
在一个实施例中,该目标疾病为青光眼。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取目标眼底照片,将该目标眼底照片输入至目标神经网络,获取该目标神经网络输出的目标概率信息,该目标概率信息用于指示该目标眼底照片对应的患者罹患目标疾病的概率。
其中,该目标神经网络是基于第一训练集和第二训练集训练得到的,该第一训练集包括m个不具有目标特征的第一眼底照片以及与m个该第一眼底照片一一对应的m个第一标签值,该第一标签值用于指示对应的第一眼底照片是否为罹患有该目标疾病的患者的眼底照片,该第二训练集包括n个具有该目标特征的第二眼底照片,n为小于m的正整数,m为正整数。
在一个实施例中,将该目标眼底照片输入至目标神经网络之前,计算机程序被处理器执行时还实现以下步骤:
利用该第一训练集训练得到第一神经网络和第二神经网络,该第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,该第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,该概率信息用于指示眼底照片对应的患者罹患该目标疾病的概率;将该第一眼底照片输入至该第一神经网络,得到第一特征图;利用该第一特征图和该第二训练集进行对抗训练,得到第三神经网络;获取该目标神经网络,该目标神经网络包括该第三神经网络和该第二神经网络。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将该第二眼底照片输入至初始特征提取神经网络,得到第二特征图;
获取网络损失函数,该网络损失函数用于表征分辨神经网络分辨该第一特征图和该第二特征图的能力;
将该第一特征图和该第二特征图输入至该分辨神经网络,得到该分辨神经网络对该第一特征图和该第二特征图的分辨结果;
根据该分辨结果调整该初始特征提取神经网络的参数直至该网络损失函数收敛,得到该第三神经网络。
在一个实施例中,获取该目标神经网络之后,计算机程序被处理器执行时还实现以下步骤:
获取测试集,该测试集包括p个测试眼底照片和与该p个测试眼底照片一一对应的p个第二标签值,该p个测试眼底照片中存在该第一眼底照片和该第二眼底照片,该第二标签值用于指示对应的测试眼底照片是否为罹患有该目标疾病的患者的眼底照片,p为正整数;将该p个测试眼底照片输入至该目标神经网络,得到该目标神经网络输出的与该p个测试眼底照片一一对应的p个测试概率信息,该测试概率信息用于指示对应的测试眼底照片是否为罹患有该目标疾病的患者的眼底照片;根据每个该测试眼底照片对应的第二标签值和测试概率信息是否匹配确定该目标神经网络的识别能力。
在一个实施例中,该目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;其中,该第一亮度阈值大于该第二亮度阈值。
在一个实施例中,该目标疾病为青光眼。
本实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种眼底照片识别方法,其特征在于,所述方法包括:
获取目标眼底照片;
将所述目标眼底照片输入至目标神经网络,获取所述目标神经网络输出的目标概率信息,所述目标概率信息用于指示所述目标眼底照片对应的患者罹患目标疾病的概率;
其中,所述目标神经网络是基于第一训练集和第二训练集训练得到的,所述第一训练集包括m个不具有目标特征的第一眼底照片以及与m个所述第一眼底照片一一对应的m个第一标签值,所述第一标签值用于指示对应的第一眼底照片是否为罹患有所述目标疾病的患者的眼底照片,所述第二训练集包括n个具有所述目标特征的第二眼底照片,n为小于m的正整数,m为正整数,其中,所述目标特征在眼底照片中出现的概率小于第二概率阈值;
其中,所述目标神经网络的训练过程包括:
利用所述第一训练集训练得到第一神经网络和第二神经网络,所述第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,所述第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,所述概率信息用于指示眼底照片对应的患者罹患所述目标疾病的概率;
将所述第一眼底照片输入至所述第一神经网络,得到第一特征图;
利用所述第一特征图和所述第二训练集进行对抗训练,得到第三神经网络;
获取所述目标神经网络,所述目标神经网络包括所述第三神经网络和所述第二神经网络;
其中,所述利用所述第一特征图和所述第二训练集进行对抗训练,得到第三神经网络,包括:
将所述第二眼底照片输入至初始特征提取神经网络,得到第二特征图;
获取网络损失函数,所述网络损失函数用于表征分辨神经网络分辨所述第一特征图和所述第二特征图的能力;
将所述第一特征图和所述第二特征图输入至所述分辨神经网络,得到所述分辨神经网络对所述第一特征图和所述第二特征图的分辨结果;
根据所述分辨结果调整所述初始特征提取神经网络的参数直至所述网络损失函数收敛,得到所述第三神经网络。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标神经网络之后,所述方法还包括:
获取测试集,所述测试集包括p个测试眼底照片和与所述p个测试眼底照片一一对应的p个第二标签值,所述p个测试眼底照片中存在所述第一眼底照片和所述第二眼底照片,所述第二标签值用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片,p为正整数;
将所述p个测试眼底照片输入至所述目标神经网络,得到所述目标神经网络输出的与所述p个测试眼底照片一一对应的p个测试概率信息,所述测试概率信息用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片;
根据每个所述测试眼底照片对应的第二标签值和测试概率信息是否匹配确定所述目标神经网络的识别能力。
3.根据权利要求1或2所述的方法,其特征在于,所述目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;
其中,所述第一亮度阈值大于所述第二亮度阈值。
4.根据权利要求1或2所述的方法,其特征在于,所述目标疾病为青光眼。
5.一种眼底照片识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标眼底照片;
第二获取模块,用于将所述目标眼底照片输入至目标神经网络,获取所述目标神经网络输出的目标概率信息,所述目标概率信息用于指示所述目标眼底照片对应的患者罹患目标疾病的概率;
其中,所述目标神经网络是基于第一训练集和第二训练集训练得到的,所述第一训练集包括m个不具有目标特征的第一眼底照片以及与m个所述第一眼底照片一一对应的m个第一标签值,所述第一标签值用于指示对应的第一眼底照片是否为罹患有所述目标疾病的患者的眼底照片,所述第二训练集包括n个具有所述目标特征的第二眼底照片,n为小于m的正整数,m为正整数,其中,所述目标特征在眼底照片中出现的概率小于第二概率阈值;
其中,所述装置还包括:
第一训练模块,用于利用所述第一训练集训练得到第一神经网络和第二神经网络,所述第一神经网络用于对眼底照片进行特征提取,输出眼底照片的特征图,所述第二神经网络用于对眼底照片的特征图进行分类,输出概率信息,所述概率信息用于指示眼底照片对应的患者罹患所述目标疾病的概率;
第三获取模块,用于将所述第一眼底照片输入至所述第一神经网络,得到第一特征图;
第二训练模块,用于利用所述第一特征图和所述第二训练集进行对抗训练,得到第三神经网络;
第四获取模块,用于获取所述目标神经网络,所述目标神经网络包括所述第三神经网络和所述第二神经网络;
其中,所述第二训练模块,具体用于:
将所述第二眼底照片输入至初始特征提取神经网络,得到第二特征图;
获取网络损失函数,所述网络损失函数用于表征分辨神经网络分辨所述第一特征图和所述第二特征图的能力;
将所述第一特征图和所述第二特征图输入至所述分辨神经网络,得到所述分辨神经网络对所述第一特征图和所述第二特征图的分辨结果;
根据所述分辨结果调整所述初始特征提取神经网络的参数直至所述网络损失函数收敛,得到所述第三神经网络。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第五获取模块,用于获取测试集,所述测试集包括p个测试眼底照片和与所述p个测试眼底照片一一对应的p个第二标签值,所述p个测试眼底照片中存在所述第一眼底照片和所述第二眼底照片,所述第二标签值用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片,p为正整数;
第六获取模块,用于将所述p个测试眼底照片输入至所述目标神经网络,得到所述目标神经网络输出的与所述p个测试眼底照片一一对应的p个测试概率信息,所述测试概率信息用于指示对应的测试眼底照片是否为罹患有所述目标疾病的患者的眼底照片;
第七获取模块,用于根据每个所述测试眼底照片对应的第二标签值和测试概率信息是否匹配确定所述目标神经网络的识别能力。
7.根据权利要求5或6所述的装置,其特征在于,所述目标特征包括眼底照片的亮度大于第一亮度阈值的特征、眼底照片的亮度小于第二亮度阈值的特征以及眼底照片包括条纹图像的特征;
其中,所述第一亮度阈值大于所述第二亮度阈值。
8.根据权利要求5或6所述的装置,其特征在于,所述目标疾病为青光眼。
9.一种眼底照片识别设备,其特征在于,所述眼底照片识别设备包括处理器和存储器,所述存储器中存储有指令;
所述处理器被配置为执行所述存储器中存储的指令,所述处理器通过执行所述指令来实现如权利要求1至4任一所述的眼底照片识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在处理器上运行时,使得所述处理器执行如权利要求1至4任一所述的眼底照片识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910352715.6A CN110334575B (zh) | 2019-04-29 | 2019-04-29 | 眼底照片识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910352715.6A CN110334575B (zh) | 2019-04-29 | 2019-04-29 | 眼底照片识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334575A CN110334575A (zh) | 2019-10-15 |
CN110334575B true CN110334575B (zh) | 2022-04-26 |
Family
ID=68139918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910352715.6A Active CN110334575B (zh) | 2019-04-29 | 2019-04-29 | 眼底照片识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334575B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111260635B (zh) * | 2020-01-17 | 2023-05-05 | 广州慧视医疗科技有限公司 | 一种全自动眼底照片获取、眼病预警及个性化管理系统 |
CN113580893B (zh) * | 2020-03-17 | 2022-12-09 | 北京百度网讯科技有限公司 | 电致变色玻璃调节方法、装置和电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417483B2 (en) * | 2017-01-25 | 2019-09-17 | Imam Abdulrahman Bin Faisal University | Facial expression recognition |
CN108771530B (zh) * | 2017-05-04 | 2021-03-30 | 深圳硅基智能科技有限公司 | 基于深度神经网络的眼底病变筛查系统 |
CN109615632B (zh) * | 2018-11-09 | 2023-07-21 | 广东技术师范学院 | 一种基于半监督条件生成式对抗网络的眼底图视盘和视杯分割方法 |
-
2019
- 2019-04-29 CN CN201910352715.6A patent/CN110334575B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110334575A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11213197B2 (en) | Artificial neural network and system for identifying lesion in retinal fundus image | |
US20220076420A1 (en) | Retinopathy recognition system | |
JP7058373B2 (ja) | 医療画像に対する病変の検出及び位置決め方法、装置、デバイス、及び記憶媒体 | |
CN110914835B (zh) | 修改用于深度学习模型的视网膜眼底图像的方法 | |
CN110796161A (zh) | 识别模型训练、眼底特征的识别方法、装置、设备及介质 | |
CN111028218B (zh) | 眼底图像质量判定模型训练方法、装置和计算机设备 | |
CN110334575B (zh) | 眼底照片识别方法、装置、设备及存储介质 | |
CN113642537B (zh) | 一种医学图像识别方法、装置、计算机设备及存储介质 | |
US10832410B2 (en) | Computer system, method, and program for diagnosing subject | |
US11823385B2 (en) | Processing fundus images using machine learning models to generate blood-related predictions | |
CN109390053A (zh) | 眼底图像处理方法、装置、计算机设备和存储介质 | |
EP3716100A1 (en) | Classification device, classification method, program, and information recording medium | |
CN111354463B (zh) | 人体健康测量方法、装置、计算机设备及存储介质 | |
KR102036052B1 (ko) | 인공지능 기반으로 비규격화 피부 이미지의 의료 영상 적합성을 판별 및 변환하는 장치 | |
CN112308035A (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
WO2020068848A1 (en) | Deep learning lyme disease diagnosis | |
CN115330714A (zh) | 一种荧光素眼底血管造影图像的分期和病变诊断系统 | |
CN112132782B (zh) | 一种基于深度神经网络对dme分型进行处理的方法和终端 | |
KR20230085241A (ko) | 인공 시각 장치 성능 향상을 위한 인공 시각 표현 파라미터 자동화 학습시스템 및 방법 | |
CN110992364B (zh) | 视网膜图像识别方法、装置、计算机设备和存储介质 | |
WO2023137904A1 (zh) | 基于眼底图像的病变检测方法、装置、设备及存储介质 | |
KR102580279B1 (ko) | 알츠하이머병 진단에 필요한 정보를 제공하는 방법 및 이를 수행하기 위한 장치 | |
TWI639980B (zh) | 臉部氣色分析方法 | |
Vimal et al. | Progression Detection of Glaucoma Using K-means and GLCM Algorithm | |
Jadhav et al. | Cost-Effective Mobile Cataract Detection System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |