CN110472673A - 参数调整方法、眼底图像处理方法、装置、介质及设备 - Google Patents
参数调整方法、眼底图像处理方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN110472673A CN110472673A CN201910680485.6A CN201910680485A CN110472673A CN 110472673 A CN110472673 A CN 110472673A CN 201910680485 A CN201910680485 A CN 201910680485A CN 110472673 A CN110472673 A CN 110472673A
- Authority
- CN
- China
- Prior art keywords
- image
- label
- loss function
- function value
- optic disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000006870 function Effects 0.000 claims abstract description 140
- 238000000605 extraction Methods 0.000 claims abstract description 38
- 210000003733 optic disk Anatomy 0.000 claims description 103
- 208000010412 Glaucoma Diseases 0.000 claims description 36
- 206010003694 Atrophy Diseases 0.000 claims description 25
- 230000037444 atrophy Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 15
- 238000010801 machine learning Methods 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 description 19
- 238000001514 detection method Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000006854 communication Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000004438 eyesight Effects 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 201000002862 Angle-Closure Glaucoma Diseases 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 206010030348 Open-Angle Glaucoma Diseases 0.000 description 1
- 208000030768 Optic nerve injury Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 208000030533 eye disease Diseases 0.000 description 1
- 210000004220 fundus oculi Anatomy 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003447 ipsilateral effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000004126 nerve fiber Anatomy 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Eye Examination Apparatus (AREA)
Abstract
本公开提供一种图像处理模型的参数调整方法、眼底图像处理方法、图像处理模型的参数调整装置、计算机可读存储介质及电子设备;涉及人工智能技术领域,并涉及机器学习技术。该图像处理模型的参数调整方法包括:对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息;根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值;根据第一损失函数值和第二损失函数值调整图像处理模型的参数。本公开中的图像处理模型的参数调整方法能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围。
Description
技术领域
本公开涉及人工智能技术领域,并涉及机器学习技术,具体而言,涉及一种图像处理模型的参数调整方法、眼底图像处理方法、图像处理模型的参数调整装置、计算机可读存储介质及电子设备。
背景技术
随着机器学习技术的快速发展,人们可以通过用于进行图像处理的模型对图像的特征进行提取,以根据图像特征对图像做出一系列相应的判定,如,确定出图像中包含的信息。
目前,图像处理模型的训练方法通常是通过有监督学习的方式对其进行训练。具体地,可以将图像输入模型并根据模型输出的图像信息与人工标注的图像信息的比对调整模型参数,以提升模型确定出的图像信息的准确率。但是,由于这种传统的模型训练方法通常是针对一种图像元素(如,图像中的人物信息或图像中的商品信息)进行识别训练的,那么,训练得到的模型也通常针对一种图像元素进行识别,因此,通过这种方法训练得到的模型适用范围不够广泛。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种图像处理模型的参数调整方法、眼底图像处理方法、图像处理模型的参数调整装置、计算机可读存储介质及电子设备,在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种图像处理模型的参数调整方法,包括:
对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息;
根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值;
根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值。
在本公开的一种示例性实施例中,根据第一损失函数值和第二损失函数值调整图像处理模型的参数,包括:
根据预测标签和预测图像信息计算正则化损失函数值;
根据第一损失函数值、第二损失函数值以及正则化损失函数值调整图像处理模型的参数。
在本公开的一种示例性实施例中,对输入的图像进行特征提取,包括:
对输入的图像进行卷积,得到目标特征向量;
对目标特征向量进行全局平均池化,得到与图像对应的图像特征。
在本公开的一种示例性实施例中,预测标签包括青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,预测图像信息包括视盘中心位置、视盘宽度和视盘高度中至少一个。
在本公开的一种示例性实施例中,根据预测标签与图像的原始标签确定第一损失函数值,包括:
确定预测标签与图像的原始标签之间的差值,根据差值以及预测标签对应的权重确定第一损失函数值。
在本公开的一种示例性实施例中,根据预测图像信息和图像的原始图像信息确定第二损失函数值,包括:
确定预测图像信息和图像的原始图像信息之间的差值,根据差值以及预测图像信息对应的权重确定第二损失函数值。
根据本公开的第二方面,提供一种眼底图像处理方法,包括:
获取待处理的眼底图像;
将眼底图像输入图像处理模型,根据图像处理模型确定眼底图像对应的标签以得到青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个;
根据图像处理模型对眼底图像进行图像信息识别以得到视盘中心位置信息、视盘宽度信息和视盘高度信息中至少一个;
其中,图像处理模型是根据第一方面提供的一种图像处理模型的参数调整方法调整得到的。
根据本公开的第三方面,提供一种图像处理模型的参数调整装置,包括特征提取单元、损失函数值确定单元以及参数调整单元,其中:
特征提取单元,用于对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息;
损失函数值确定单元,用于根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值;
参数调整单元,用于根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值。
在本公开的一种示例性实施例中,参数调整单元根据第一损失函数值和第二损失函数值调整图像处理模型的参数的方式具体为:
参数调整单元根据预测标签和预测图像信息计算正则化损失函数值;
参数调整单元根据第一损失函数值、第二损失函数值以及正则化损失函数值调整图像处理模型的参数。
在本公开的一种示例性实施例中,特征提取单元对输入的图像进行特征提取的方式具体为:
特征提取单元对输入的图像进行卷积,得到目标特征向量;
特征提取单元对目标特征向量进行全局平均池化,得到与图像对应的图像特征。
在本公开的一种示例性实施例中,预测标签包括青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,预测图像信息包括视盘中心位置、视盘宽度和视盘高度中至少一个。
在本公开的一种示例性实施例中,损失函数值确定单元根据预测标签与图像的原始标签确定第一损失函数值的方式具体为:
损失函数值确定单元确定预测标签与图像的原始标签之间的差值,根据差值以及预测标签对应的权重确定第一损失函数值。
在本公开的一种示例性实施例中,损失函数值确定单元根据预测图像信息和图像的原始图像信息确定第二损失函数值的方式具体为:
损失函数值确定单元确定预测图像信息和图像的原始图像信息之间的差值,根据差值以及预测图像信息对应的权重确定第二损失函数值。
根据本公开的第四方面,提供一种眼底图像处理装置,包括图像获取单元、图像标签确定单元以及图像信息识别单元,其中:
图像获取单元,用于获取待处理的眼底图像;
图像标签确定单元,用于将眼底图像输入图像处理模型,根据图像处理模型确定眼底图像对应的标签以得到青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个;
图像信息识别单元,用于根据图像处理模型对眼底图像进行图像信息识别以得到视盘中心位置信息、视盘宽度信息和视盘高度信息中至少一个;
其中,图像处理模型是根据第一方面提供的一种图像处理模型的参数调整方法调整得到的。
根据本公开的第五方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本公开的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一示例实施方式所提供的图像处理模型的参数调整方法中,对输入的图像(如,眼底图像)进行特征提取,根据提取到的图像特征(如,眼底图像对应的特征向量)确定图像对应的预测标签(如,青光眼标签)以及预测图像信息(如,视盘中心位置);进而,可以根据预测标签与图像的原始标签确定第一损失函数值,其中,第一损失函数值可以理解为预测标签与原始标签之间的差异;另外,根据预测图像信息和图像的原始图像信息确定第二损失函数值,其中,第二损失函数值可以理解为预测图像信息与原始图像信息之间的差异;进而,可以根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值,这样能够不断的对图像处理模型的参数进行调整,以缩短预测标签与原始标签之间的差异以及预测图像信息与原始图像信息之间的差异,进而提升确定图像标签和图像信息的准确率以及确定图像信息的准确率。依据上述方案描述,本公开一方面能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息,进而,还可以根据两个损失函数值对模型参数进行调整,以使得调整后的模型预测出的图像标签和图像信息准确率均较高;另一方面能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的一种图像处理模型的参数调整方法及图像处理模型的参数调整装置的示例性系统架构的示意图;
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本公开的一个实施例的图像处理模型的参数调整方法的流程图;
图4示意性示出了根据本公开的一个实施例的眼底图像处理方法的流程图;
图5示意性示出了根据本公开的一个实施例的眼底图像中的视盘区域的示意图;
图6示意性示出了根据本公开的一个实施例的图像处理模型的框架示意图;
图7示意性示出了根据本公开的一个实施例中的眼底图像处理装置的结构框图;
图8示意性示出了根据本公开的一个实施例中的图像处理模型的参数调整装置的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种图像处理模型的参数调整方法及图像处理模型的参数调整装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的图像处理模型的参数调整方法和眼底图像处理方法一般由服务器105执行,相应地,图像处理模型的参数调整装置和眼底图像处理装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的图像处理模型的参数调整方法和眼底图像处理方法也可以由终端设备101、102、103执行,相应的,图像处理模型的参数调整装置和眼底图像处理装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,服务器105可以对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息,以及根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值,进而,根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值。服务器105还可以获取待处理的眼底图像,以及将眼底图像输入图像处理模型,根据图像处理模型确定眼底图像对应的标签以得到青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,并根据图像处理模型对眼底图像进行图像信息识别以得到视盘中心位置信息、视盘宽度信息和视盘高度信息中至少一个。
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法和装置中限定的各种功能。在一些实施例中,计算机系统200还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
在一些实施例中,计算机系统200还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
在早期的传统机器学习时代,人们需要精心设计网络参数,以缩短神经网络预测的结果与真实结果之间的差异。而在当前的机器学习时代,人们可以使得神经网络根据每次的预测结果与目标结果的比对去自动优化网络参数,在很多场景中已不再需要对网络参数进行精心设计。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
以下对本公开实施例的技术方案进行详细阐述:
青光眼是一系列导致视神经受损,进而造成不可逆性视力丧失的眼底疾病,是全球范围内不可逆性致盲的首要原因,到2020年预计全球范围内患者将会达到8000万。中国流行病调查数据显示,原发性青光眼患病率约为3.8%,预计2020年40岁以上的青光眼患者将达到2100万。由于青光眼在早期没有症状,即没有表现出视野损失等,在初次诊断时,慢性闭角型青光眼和开角型青光眼的患者中有75%的病例已经处于中晚期,造成不可逆性视力损失甚至致盲。相关临床研究表明,青光眼早期及时的治疗,可以有效的将20年后失明的概率降低50%。而且,在有效的治疗下,多数患者可以保有现有视力,所以,早期的青光眼筛查、诊断和治疗是预防视神经损害和失明的关键。
目前,用于筛查青光眼的图像处理模型的训练方法通常是通过有监督学习的方式对其进行训练。具体地,可以将图像输入模型并根据模型输出的图像信息与人工标注的图像信息的比对调整模型参数,以提升模型确定出的图像信息的准确率。但是,由于这种传统的模型训练方法通常是针对一种图像元素(如,图像中的视盘中心位置)进行识别训练的,那么,训练得到的模型也通常针对一种图像元素进行识别,因此,通过这种方法训练得到的模型适用范围不够广泛。
基于上述一个或多个问题,本示例实施方式提供了一种图像处理模型的参数调整方法。该图像处理模型的参数调整方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该图像处理模型的参数调整方法可以包括以下步骤S310至步骤S330:
步骤S310:对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息。
步骤S320:根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值。
步骤S330:根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值。
在本公开的一示例实施方式所提供的图像处理模型的参数调整方法中,对输入的图像(如,眼底图像)进行特征提取,根据提取到的图像特征(如,眼底图像对应的特征向量)确定图像对应的预测标签(如,青光眼标签)以及预测图像信息(如,视盘中心位置);进而,可以根据预测标签与图像的原始标签确定第一损失函数值,其中,第一损失函数值可以理解为预测标签与原始标签之间的差异;另外,根据预测图像信息和图像的原始图像信息确定第二损失函数值,其中,第二损失函数值可以理解为预测图像信息与原始图像信息之间的差异;进而,可以根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值,这样能够不断的对图像处理模型的参数进行调整,以缩短预测标签与原始标签之间的差异以及预测图像信息与原始图像信息之间的差异,进而提升确定图像标签和图像信息的准确率以及确定图像信息的准确率。依据上述方案描述,本公开一方面能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息,进而,还可以根据两个损失函数值对模型参数进行调整,以使得调整后的模型预测出的图像标签和图像信息准确率均较高;另一方面能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S310中,对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息。
本示例实施方式中,输入的图像可以为任一格式的图像,也可以为预设格式(如,jpg格式)的图像,本公开的实施例不作限定。输入的图像可以为眼底图像。
本示例实施方式中,可选的,对输入的图像进行特征提取,包括:
对输入的图像进行卷积,得到目标特征向量;
对目标特征向量进行全局平均池化,得到与图像对应的图像特征;
本示例实施方式中,目标特征向量为卷积结果,与图像对应的图像特征为池化结果。
本示例实施方式中,预测标签包括青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,预测图像信息包括视盘中心位置、视盘宽度和视盘高度中至少一个,本公开的实施例不作限定。此外,预测标签还可以包括除了上述标签外的其他标签,预测图像信息还可以包括除了上述信息之外的其他信息,本公开的实施例不作限定,
其中,青光眼标签可以包括青光眼标签0/1和青光眼标签1/1,视盘萎缩标签可以包括视盘萎缩标签0/1和视盘萎缩标签1/1,视盘倾斜标签可以包括视盘倾斜标签0/1和视盘倾斜标签1/1;其中,青光眼标签0/1用于表示该图像非青光眼图像,青光眼标签1/1用于表示该图像为青光眼图像;视盘萎缩标签0/1用于表示该图像无视盘萎缩,视盘萎缩标签1/1用于表示该图像存在视盘萎缩;视盘倾斜标签0/1表示该图像无视盘倾斜,视盘倾斜标签1/1用于表示该图像存在视盘倾斜。视盘中心位置用于表示视盘中心在输入的图像中的坐标,视盘宽度用于表示视盘矩形框的宽度,视盘高度用于表示视盘矩形框的高度。
本示例实施方式中,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息的方式具体可以为:
通过第一全连接层对提取到的图像特征进行分类预测,以得到图像对应的预测标签;
通过第二全连接层对提取到的图像特征进行回归预测,以得到图像对应的预测图像信息。
其中,第一全连接层和第二全连接层均可以为至少一个,第一全连接层对应模型中的分类任务,分类任务用于为输入的图像分配相对应的标签(如,青光眼标签0/1、视盘萎缩标签0/1和视盘倾斜标签0/1),第二全连接层对应模型中的检测任务,检测任务用于检测输入的图像对应的图像信息(如,视盘中心位置(x,y)、视盘宽度[0-1]和视盘高度[0-1])。
本示例实施方式中,对输入的图像进行卷积的方式具体可以为:通过编码器模型/Inceptioin模型/DenseNet模型/Resnet模型/VGG模型对输入的图像进行卷积,本公开的实施例不作限定。
其中,编码器模型(Encoder)是将信号(如,比特流)或数据进行编制、转换为可用于通讯、传输和存储的信号形式;Inception模型是在同一层内增加多个尺寸的卷积核,实现类似金字塔的结构以提高感受域;DenseNet模型是脱离了加深网络层数和加宽网络结构来提升网络性能的定式思维,从特征的角度考虑,是通过特征重用和旁路设置,大幅度减少了网络参量的结合信息流和特征复用的假设;Resnet模型是一种分类网络,用于进行特征提取;VGG是一种卷积神经网络,用于进行特征提取。
可见,实施该可选的实施方式,能够利用多任务框架提升预测信息广度;另外,通过视盘区域相关联的多任务模型,通过同一拼接得到的图像特征,可以提升对于视盘区域的关注度,提升对于图像语义特征的提取效率,提升模型的预测速度,降低对于计算机资源的占用率。此外,该实施例用于眼底图像的识别时,还能够提升对于青光眼图像分类的准确率。
在步骤S320中,根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值。
本示例实施方式中,原始标签可以包括青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,原始图像信息可以包括视盘中心位置、视盘宽度和视盘高度中至少一个。第一损失函数值用于表征预测标签与原始标签之间的差异,第二损失函数值用于表征预测图像信息和原始图像信息之间的差异。
本示例实施方式中,可选的,根据预测标签与图像的原始标签确定第一损失函数值,包括:
确定预测标签与图像的原始标签之间的差值,根据差值以及预测标签对应的权重确定第一损失函数值。
本示例实施方式,不同的标签对应的权重不同。
可见,实施该可选的实施例,能够为重要性不同的标签赋予不同的权重,随着标签占据的权重越大,损失反传的时候对模型参数影响越大。
本示例实施方式中,可选的,根据预测图像信息和图像的原始图像信息确定第二损失函数值,包括:
确定预测图像信息和图像的原始图像信息之间的差值,根据差值以及预测图像信息对应的权重确定第二损失函数值。
可见,实施该可选的实施例,能够为重要性不同的图像信息赋予不同的权重,随着图像信息占据的权重越大,损失反传的时候对模型参数影响越大。
在步骤S330中,根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值。
本示例实施方式中,可选的,根据第一损失函数值和第二损失函数值调整图像处理模型的参数,包括:
根据预测标签和预测图像信息计算正则化损失函数值;
根据第一损失函数值、第二损失函数值以及正则化损失函数值调整图像处理模型的参数。
本示例实施方式中,用于确定第一损失函数值的第一损失函数为:BCE(predc,labelc)=-labelc·log(predc)-(labelc)log(predc);其中,predc表示分类任务模型预测的预测标签信息,labelc表示原始标签信息。
用于确定第二损失函数值的第二损失函数为: |x|<1,x<-1或x>1,x=predd-labeld;其中,predd表示检测任务模型确定出的预测图像信息,labeld表示原始图像信息。
用于计算正则化损失函数值的正则化损失函数为:其中,θ表示图像处理模型的参数,λ表示图像处理模型的正则化系数。
本示例实施方式中,根据第一损失函数值、第二损失函数值以及正则化损失函数值调整图像处理模型的参数的方式具体可以为:
通过损失函数调整图像处理模型的参数;其中,图像处理模型的参数用于提取输入图像的图像特征,损失函数如下: 其中,μc表示分类任务对应的不同标签的权重,μd表示检测任务对应的不同图像信息的权重。举例来说,青光眼标签对应的权重为0.6,视盘萎缩标签对应的权重为0.2,视盘倾斜标签对应的权重为0.2;视盘中心位置x坐标对应的权重为0.35,视盘中心位置y坐标对应的权重为0.35,视盘宽度信息对应的权重为0.15,视盘高度信息对应的权重为0.15。
此外,对应的值可以为上述的第一损失函数值,对应的值可以为上述的第二损失函数值。
可见,实施该可选的实施方式,能够通过损失函数对图像处理模型的参数进行调整,以使得图像处理模型预测得到的图像信息和图像标签准确度更高。
此外,需要说明的是,依据先验信息,本公开实施例不仅可以应用于青光眼识别还可以用于黄斑区疾病的识别或其他眼部疾病识别,本公开的实施例不作限定。
可见,实施图3所述的图像处理模型的参数调整方法,能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息,进而,还可以根据两个损失函数值对模型参数进行调整,以使得调整后的模型预测出的图像标签和图像信息准确率均较高;以及,能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
此外,本示例实施方式还提供了一种眼底图像处理方法。该眼底图像处理方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该眼底图像处理方法可以包括以下步骤S410至步骤S430:
步骤S410:获取待处理的眼底图像。
步骤S420:将眼底图像输入图像处理模型,根据图像处理模型确定眼底图像对应的标签以得到青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个。
步骤S430:根据图像处理模型对眼底图像进行图像信息识别以得到视盘中心位置信息、视盘宽度信息和视盘高度信息中至少一个。
其中,图像处理模型是根据图3提供的一种图像处理模型的参数调整方法调整得到的。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
本示例实施方式中,对于步骤S410~步骤S420的相关实施例表述请参阅图3对应的实施例,此处不再赘述。
可见,图4所示的眼底图像处理方法,能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息,进而,还可以根据两个损失函数值对模型参数进行调整,以使得调整后的模型预测出的图像标签和图像信息准确率均较高;以及,能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
请参阅图5,图5示意性示出了根据本公开的一个实施例的眼底图像中的视盘区域的示意图。图5中示出了图像5011、图像5012、图像5021、图像5022、图像5031、图像5032、图像5041以及图像5042;其中,图像5011、图像5021、图像5031以及图像5041中的矩形框均为视盘。此外,图像5012为图像5011的视盘扩大图,图像5022为图像5021的视盘扩大图,图像5032为图像5031的视盘扩大图,图像5042为图像5041的视盘扩大图。
具体地,图像5011展示的是非青光眼的眼底图像,参见图像5011和图像5012可知,该图像5011无视盘萎缩且无视盘倾斜;图像5021展示的是青光眼的眼底图像,参见图像5021和图像5022可知,该图像5021无视盘萎缩且无视盘倾斜;图像5031展示的是非青光眼的眼底图像,参见图像5031和图像5032可知,该图像5031有严重视盘萎缩且有视盘倾斜;图像5041展示的是非青光眼的眼底图像,参见图像5041和图像5042可知,该图像5041有轻微视盘萎缩且有视盘倾斜。
其中,需要说明的是,青光眼对眼底图像的影响主要集中于视盘区域。正常的视盘盘沿遵循下方盘沿距离最大,其次是上方,再次鼻侧,最后颞侧的原则;其中,视盘盘沿可以理解为视杯和视盘的边沿区域。此外,基于眼底图像对青光眼的判定依据包括:在视盘颞下方或者颞上方发生盘沿变窄,同时伴有视盘同侧相连的视网膜神经纤维层缺损;视盘发生同心圆样视杯扩大,同时伴有神经纤维层缺损。
此外,图5作为样本图像可以作为图6中的模型输入,在图6中,输入图像601即为图5中的图像5011;其中,该输入图像601也可以为图像5021、图像5031或图像5041,本公开的实施例不作限定。
结合图5所示的眼底图像中的视盘区域的示意图,请参阅图6,图6示意性示出了根据本公开的一个实施例的图像处理模型的框架示意图。如图6所示,该图像处理模型的框架包括输入图像601、卷积层602、全局平均池化层603、分类任务对应的全连接层604、检测任务对应的全连接层605、分类任务对应的分类器606以及检测任务对应的分类器607。
具体地,终端设备或服务器可以将输入图像601输入卷积层602,根据卷积层602对输入图像601进行卷积,以得到第一特征向量;进而,将目标特征向量输入全局平均池化层603,以使得全局平均池化层603对目标特征向量进行全局平均池化,以得到第二特征向量;进而,将第二特征向量输入分类任务对应的全连接层604和检测任务对应的全连接层605,以使得分类任务对应的全连接层604和检测任务对应的全连接层605分别对第二特征向量进行分类预测和回归预测,以得到分类任务对应的分类预测结果和检测任务对应的回归预测结果;进而,通过分类任务对应的分类器606对分类任务对应的分类预测结果进行分类可以确定出输入图像601对应的图像标签(如,青光眼标签0/1、视盘萎缩标签0/1和视盘倾斜标签0/1),通过检测任务对应的分类器607对检测任务对应的回归预测结果进行检测可以确定出输入图像601对应的图像信息(如,视盘中心位置(x,y)、视盘宽度[0-1]和视盘高度[0-1])。
其中,分类任务可以理解为根据图像对应的特征向量分配与其对应的标签,检测任务可以理解为根据图像对应的特征向量确定与其对应的图像信息。
此外,需要说明的是,分类任务对应的全连接层604和检测任务对应的全连接层605之间无先后顺序之分,终端设备或服务器可以同时执行也可以先执行分类任务对应的全连接层604再执行检测任务对应的全连接层605,或者先执行检测任务对应的全连接层605再执行分类任务对应的全连接层604,本公开的实施例不作限定。
可见,结合图5所示的眼底图像中的视盘区域的示意图和图6所示的图像处理模型的框架示意图实施本公开的实施例,能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息;以及,能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
进一步的,本示例实施方式中,还提供了一种图像处理模型的参数调整装置。该图像处理模型的参数调整装置可以应用于服务器或终端设备。参考图7所示,该图像处理模型的参数调整装置可以包括特征提取单元801、损失函数值确定单元702以及参数调整单元703,其中:
特征提取单元701,用于对输入的图像进行特征提取,根据提取到的图像特征确定图像对应的预测标签以及预测图像信息;
损失函数值确定单元702,用于根据预测标签与图像的原始标签确定第一损失函数值,并根据预测图像信息和图像的原始图像信息确定第二损失函数值;
参数调整单元703,用于根据第一损失函数值和第二损失函数值调整图像处理模型的参数,直到图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,损失函数包括第一损失函数值和第二损失函数值。
其中,预测标签至少包括青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,预测图像信息至少包括视盘中心位置、视盘宽度和视盘高度中至少一个。
可见,实施图7所示的图像处理模型的参数调整装置,能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息,进而,还可以根据两个损失函数值对模型参数进行调整,以使得调整后的模型预测出的图像标签和图像信息准确率均较高;以及,能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
在本公开的一种示例性实施例中,参数调整单元703根据第一损失函数值和第二损失函数值调整图像处理模型的参数的方式具体为:
参数调整单元703根据预测标签和预测图像信息计算正则化损失函数值;
参数调整单元703根据第一损失函数值、第二损失函数值以及正则化损失函数值调整图像处理模型的参数。
可见,实施该示例性实施例,能够通过损失函数对图像处理模型的参数进行调整,以使得图像处理模型预测得到的图像信息和图像标签准确度更高。
在本公开的一种示例性实施例中,特征提取单元701对输入的图像进行特征提取的方式具体为:
特征提取单元701对输入的图像进行卷积,得到目标特征向量;
特征提取单元701对目标特征向量进行全局平均池化,得到与图像对应的图像特征。
可见,实施该示例性实施例,能够利用多任务框架提升预测信息广度;另外,通过视盘区域相关联的多任务模型,通过同一拼接得到的图像特征,可以提升对于视盘区域的关注度,提升对于图像语义特征的提取效率,提升模型的预测速度,降低对于计算机资源的占用率。此外,该实施例用于眼底图像的识别时,还能够提升对于青光眼图像分类的准确率。
在本公开的一种示例性实施例中,损失函数值确定单元702根据预测标签与图像的原始标签确定第一损失函数值的方式具体为:
损失函数值确定单元702确定预测标签与图像的原始标签之间的差值,根据差值以及预测标签对应的权重确定第一损失函数值。
可见,实施该可选的实施例,能够为重要性不同的标签赋予不同的权重,随着标签占据的权重越大,损失反传的时候对模型参数影响越大。
在本公开的一种示例性实施例中,损失函数值702确定单元根据预测图像信息和图像的原始图像信息确定第二损失函数值的方式具体为:
损失函数值确定单元702确定预测图像信息和图像的原始图像信息之间的差值,根据差值以及预测图像信息对应的权重确定第二损失函数值。
可见,实施该可选的实施例,能够为重要性不同的图像信息赋予不同的权重,随着图像信息占据的权重越大,损失反传的时候对模型参数影响越大。
更进一步的,本示例实施方式中,还提供了一种眼底图像处理装置。该眼底图像处理装置可以应用于一服务器或终端设备。参考图8所示,该眼底图像处理装置可以包括图像获取单元801、图像标签确定单元802以及图像信息识别单元803,其中:
图像获取单元801,用于获取待处理的眼底图像;
图像标签确定单元802,用于将眼底图像输入图像处理模型,根据图像处理模型确定眼底图像对应的标签以得到青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个;
图像信息识别单元803,用于根据图像处理模型对眼底图像进行图像信息识别以得到视盘中心位置信息、视盘宽度信息和视盘高度信息中至少一个;
其中,图像处理模型是根据图3提供的一种图像处理模型的参数调整方法调整得到的。
可见,实施该示例性实施例,能够在一定程度上克服图像处理模型适用范围不够广泛的问题,进而扩大图像处理模型的适用范围,以使得训练后的模型不仅能够预测图像标签还能够预测图像信息,进而,还可以根据两个损失函数值对模型参数进行调整,以使得调整后的模型预测出的图像标签和图像信息准确率均较高;以及,能够根据一次图像语义提取同时确定出预测标签和预测图像信息,相较传统的预测标签和预测图像信息分别需要对应一次语义提取,本公开实施例能够减少对于计算机资源的占用,并提升模型对于输入的图像的注意力,改善图像信息及图像标签的预测效果。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
由于本公开的示例实施例的图像处理模型的参数调整装置的各个功能模块与上述图像处理模型的参数调整方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的图像处理模型的参数调整方法的实施例。
由于本公开的示例实施例的眼底图像处理装置的各个功能模块与上述眼底图像处理方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的眼底图像处理方法的实施例。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种图像处理模型的参数调整方法,其特征在于,包括:
对输入的图像进行特征提取,根据提取到的图像特征确定所述图像对应的预测标签以及预测图像信息;
根据所述预测标签与所述图像的原始标签确定第一损失函数值,并根据所述预测图像信息和所述图像的原始图像信息确定第二损失函数值;
根据所述第一损失函数值和所述第二损失函数值调整所述图像处理模型的参数,直到所述图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,所述损失函数包括所述第一损失函数值和所述第二损失函数值。
2.根据权利要求1所述的方法,其特征在于,根据所述第一损失函数值和所述第二损失函数值调整所述图像处理模型的参数,包括:
根据所述预测标签和所述预测图像信息计算正则化损失函数值;
根据所述第一损失函数值、所述第二损失函数值以及所述正则化损失函数值调整所述图像处理模型的参数。
3.根据权利要求1所述的方法,其特征在于,对输入的图像进行特征提取,包括:
对输入的图像进行卷积,得到目标特征向量;
对所述目标特征向量进行全局平均池化,得到与所述图像对应的图像特征。
4.根据权利要求1所述的方法,其特征在于,所述预测标签包括青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个,所述预测图像信息包括视盘中心位置、视盘宽度和视盘高度中至少一个。
5.根据权利要求1所述的方法,其特征在于,根据所述预测标签与所述图像的原始标签确定第一损失函数值,包括:
确定所述预测标签与所述图像的原始标签之间的差值,根据所述差值以及所述预测标签对应的权重确定第一损失函数值。
6.根据权利要求1所述的方法,其特征在于,根据所述预测图像信息和所述图像的原始图像信息确定第二损失函数值,包括:
确定所述预测图像信息和所述图像的原始图像信息之间的差值,根据所述差值以及所述预测图像信息对应的权重确定第二损失函数值。
7.一种眼底图像处理方法,其特征在于,包括:
获取待处理的眼底图像;
将所述眼底图像输入图像处理模型,根据所述图像处理模型确定所述眼底图像对应的标签以得到青光眼标签、视盘萎缩标签和视盘倾斜标签中至少一个;
根据所述图像处理模型对所述眼底图像进行图像信息识别以得到视盘中心位置信息、视盘宽度信息和视盘高度信息中至少一个;
其中,所述图像处理模型是根据权利要求1~6任一项所述的方法调整得到的。
8.一种图像处理模型的参数调整装置,其特征在于,包括:
特征提取单元,用于对输入的图像进行特征提取,根据提取到的图像特征确定所述图像对应的预测标签以及预测图像信息;
损失函数值确定单元,用于根据所述预测标签与所述图像的原始标签确定第一损失函数值,并根据所述预测图像信息和所述图像的原始图像信息确定第二损失函数值;
参数调整单元,用于根据所述第一损失函数值和所述第二损失函数值调整所述图像处理模型的参数,直到所述图像处理模型对应的损失函数值处于对应的预设函数值范围;其中,所述损失函数包括所述第一损失函数值和所述第二损失函数值。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910680485.6A CN110472673B (zh) | 2019-07-26 | 2019-07-26 | 参数调整方法、眼底图像处理方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910680485.6A CN110472673B (zh) | 2019-07-26 | 2019-07-26 | 参数调整方法、眼底图像处理方法、装置、介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110472673A true CN110472673A (zh) | 2019-11-19 |
CN110472673B CN110472673B (zh) | 2024-04-12 |
Family
ID=68509736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910680485.6A Active CN110472673B (zh) | 2019-07-26 | 2019-07-26 | 参数调整方法、眼底图像处理方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110472673B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028218A (zh) * | 2019-12-10 | 2020-04-17 | 上海志唐健康科技有限公司 | 眼底图像质量判定模型训练方法、装置和计算机设备 |
CN112330684A (zh) * | 2020-11-23 | 2021-02-05 | 腾讯科技(深圳)有限公司 | 对象分割方法、装置、计算机设备及存储介质 |
CN113435232A (zh) * | 2020-03-23 | 2021-09-24 | 北京京东乾石科技有限公司 | 一种物体的检测方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107516080A (zh) * | 2017-08-22 | 2017-12-26 | 京东方科技集团股份有限公司 | 视网膜病变影像的眼球定位方法、装置及电子设备 |
CN108122234A (zh) * | 2016-11-29 | 2018-06-05 | 北京市商汤科技开发有限公司 | 卷积神经网络训练及视频处理方法、装置和电子设备 |
CN108229276A (zh) * | 2017-03-31 | 2018-06-29 | 北京市商汤科技开发有限公司 | 神经网络训练及图像处理方法、装置和电子设备 |
CN108717693A (zh) * | 2018-04-24 | 2018-10-30 | 浙江工业大学 | 一种基于rpn的视盘定位方法 |
CN109117831A (zh) * | 2018-09-30 | 2019-01-01 | 北京字节跳动网络技术有限公司 | 物体检测网络的训练方法和装置 |
CN109191453A (zh) * | 2018-09-14 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 用于生成图像类别检测模型的方法和装置 |
CN109753978A (zh) * | 2017-11-01 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 图像分类方法、装置以及计算机可读存储介质 |
US20190147320A1 (en) * | 2017-11-15 | 2019-05-16 | Uber Technologies, Inc. | "Matching Adversarial Networks" |
CN109902767A (zh) * | 2019-04-11 | 2019-06-18 | 网易(杭州)网络有限公司 | 模型训练方法、图像处理方法及装置、设备和介质 |
CN109902678A (zh) * | 2019-02-12 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 模型训练方法、文字识别方法、装置、电子设备及计算机可读介质 |
-
2019
- 2019-07-26 CN CN201910680485.6A patent/CN110472673B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108122234A (zh) * | 2016-11-29 | 2018-06-05 | 北京市商汤科技开发有限公司 | 卷积神经网络训练及视频处理方法、装置和电子设备 |
CN108229276A (zh) * | 2017-03-31 | 2018-06-29 | 北京市商汤科技开发有限公司 | 神经网络训练及图像处理方法、装置和电子设备 |
CN107516080A (zh) * | 2017-08-22 | 2017-12-26 | 京东方科技集团股份有限公司 | 视网膜病变影像的眼球定位方法、装置及电子设备 |
CN109753978A (zh) * | 2017-11-01 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 图像分类方法、装置以及计算机可读存储介质 |
US20190147320A1 (en) * | 2017-11-15 | 2019-05-16 | Uber Technologies, Inc. | "Matching Adversarial Networks" |
CN108717693A (zh) * | 2018-04-24 | 2018-10-30 | 浙江工业大学 | 一种基于rpn的视盘定位方法 |
CN109191453A (zh) * | 2018-09-14 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 用于生成图像类别检测模型的方法和装置 |
CN109117831A (zh) * | 2018-09-30 | 2019-01-01 | 北京字节跳动网络技术有限公司 | 物体检测网络的训练方法和装置 |
CN109902678A (zh) * | 2019-02-12 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 模型训练方法、文字识别方法、装置、电子设备及计算机可读介质 |
CN109902767A (zh) * | 2019-04-11 | 2019-06-18 | 网易(杭州)网络有限公司 | 模型训练方法、图像处理方法及装置、设备和介质 |
Non-Patent Citations (2)
Title |
---|
HUAZHU FU; JUN CHENG; YANWU XU; DAMON WING KEE WONG; JIANG LIU; XIAOCHUN CAO: "Joint Optic Disc and Cup Segmentation Based on Multi-Label Deep Network and Polar Transformation", IEEE TRANSACTIONS ON MEDICAL IMAGING, 9 January 2018 (2018-01-09) * |
黄锦丽: "基于深度学习的青光眼杯盘检测技术研究", 中国优秀硕士学位论文全文数据库 (医药卫生科技辑), 15 January 2019 (2019-01-15) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028218A (zh) * | 2019-12-10 | 2020-04-17 | 上海志唐健康科技有限公司 | 眼底图像质量判定模型训练方法、装置和计算机设备 |
CN111028218B (zh) * | 2019-12-10 | 2023-08-08 | 上海志唐健康科技有限公司 | 眼底图像质量判定模型训练方法、装置和计算机设备 |
CN113435232A (zh) * | 2020-03-23 | 2021-09-24 | 北京京东乾石科技有限公司 | 一种物体的检测方法、装置、设备及存储介质 |
CN112330684A (zh) * | 2020-11-23 | 2021-02-05 | 腾讯科技(深圳)有限公司 | 对象分割方法、装置、计算机设备及存储介质 |
CN112330684B (zh) * | 2020-11-23 | 2022-09-13 | 腾讯科技(深圳)有限公司 | 对象分割方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110472673B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111524106B (zh) | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 | |
CN110490239A (zh) | 图像质控网络的训练方法、质量分类方法、装置及设备 | |
CN109508669A (zh) | 一种基于生成式对抗网络的人脸表情识别方法 | |
CN106951867A (zh) | 基于卷积神经网络的人脸识别方法、装置、系统及设备 | |
WO2020182121A1 (zh) | 表情识别方法及相关装置 | |
Hoque et al. | Real time bangladeshi sign language detection using faster r-cnn | |
CN110490242A (zh) | 图像分类网络的训练方法、眼底图像分类方法及相关设备 | |
CN110472673A (zh) | 参数调整方法、眼底图像处理方法、装置、介质及设备 | |
CN110349147A (zh) | 模型的训练方法、眼底黄斑区病变识别方法、装置及设备 | |
Qiao et al. | Application of SVM based on genetic algorithm in classification of cataract fundus images | |
CN111160350A (zh) | 人像分割方法、模型训练方法、装置、介质及电子设备 | |
CN109583331B (zh) | 基于深度学习的人手腕脉口位置精准定位方法 | |
CN110008961A (zh) | 文字实时识别方法、装置、计算机设备及存储介质 | |
CN111291863B (zh) | 换脸鉴别模型的训练方法、换脸鉴别方法、装置和设备 | |
WO2022179548A1 (zh) | 脑电信号分类方法、装置、设备、存储介质及程序产品 | |
Ocquaye et al. | Dual exclusive attentive transfer for unsupervised deep convolutional domain adaptation in speech emotion recognition | |
CN109034090A (zh) | 一种基于肢体动作的情感识别系统及方法 | |
CN110046544A (zh) | 基于卷积神经网络的数字手势识别方法 | |
CN110288513A (zh) | 用于改变人脸属性的方法、装置、设备和存储介质 | |
CN112418302A (zh) | 一种任务预测方法及装置 | |
CN110298850A (zh) | 眼底图像的分割方法和装置 | |
CN110465089A (zh) | 基于图像识别的地图探索方法、装置、介质及电子设备 | |
Mohamed et al. | Intelligent Hand Gesture Recognition System Empowered With CNN | |
CN110473176A (zh) | 图像处理方法及装置、眼底图像处理方法、电子设备 | |
Yang et al. | Retinal vessel segmentation based on an improved deep forest |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |