CN112598028A

CN112598028A - 眼底图像配准模型训练方法、眼底图像配准方法和装置

Info

Publication number: CN112598028A
Application number: CN202011436299.7A
Authority: CN
Inventors: 何兰青; 熊健皓; 赵昕; 和超; 张大磊
Original assignee: Shanghai Eaglevision Medical Technology Co Ltd
Current assignee: Shanghai Eaglevision Medical Technology Co Ltd
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2021-04-02
Anticipated expiration: 2040-12-10
Also published as: CN112598028B

Abstract

本发明实施例提供了一种眼底图像配准模型训练方法、眼底图像配准方法和装置。所述眼底图像配准模型训练方法包括将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。从而得到可以输出眼底图像配准参数，对眼底图像进行配准的模型，且具有较好的准确率。

Description

眼底图像配准模型训练方法、眼底图像配准方法和装置

技术领域

本发明涉及影像处理技术领域，特别是涉及一种眼底图像配准模型训练的方法、一种眼底图像配准模型训练装置、一种眼底图像的配准方法、以及一种眼底图像配准装置。

背景技术

眼底图像是眼科中通过眼底照相机获取的一种标准的客观诊断影像，其中，眼底是位于内眼后部组织结构(视网膜、脉络膜、视神经和黄斑等)的统称。糖尿病、青光眼、高血压、冠心病等疾病通常可以引起眼底视网膜的病变，从而通常可以可以将眼底图像作为诊断糖尿病、青光眼、高血压、冠心病等疾病的依据之一。

为了基于眼底图像对患者的病情进行诊断，通常需要对眼底图像进行配准，以使眼底图像可以采用较为规范的方式进行展示，便于医生对眼底图像进行更加准确的判断。也可以通过配准的方式，识别若干张眼底图像是否属于同一名患者。

但是，现有技术中的眼底图像配准方法通常需要依赖眼底图像中如视盘、黄斑等特征，在眼底图像存在成像异常的情况下，容易导致误检或者漏检。例如，如图1所示，图1(a)中眼底图像存在漏光，图1(b)中眼底图像缺少视盘，在现有技术中，图1(a)与图1(b)通常容易由于缺少特征，导致无法进行配准。此外，现有的眼底图像配准方法在确定视盘、黄斑等特征所在位置之后，也可能存在由于预设的配准规则泛用性差，导致配准效果较差的情况。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据查询方法和相应的一种数据查询装置。

为了解决上述问题，本发明实施例公开了一种眼底图像配准模型的训练方法，包括：

将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；

对所述第一模型配准参数进行扰动，生成扰动配准参数；

根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；

根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

可选地，所述根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值的步骤，包括：

分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行配准，得到第一配准图像以及第二配准图像；

根据所述第一配准图像以及第二配准图像，确定针对所述第一待训练模型的奖励值。

可选地，所述第一模型配准参数包括缩放变换参数、旋转变换参数、平移变换参数中的至少一种；

所述分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行配准，得到第一配准图像以及第二配准图像的步骤，包括：

分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行缩放、旋转、平移中的至少一种相似变换，得到第一配准图像以及第二配准图像。

可选地，所述根据所述第一配准图像以及第二配准图像，确定针对所述第一待训练模型的奖励值的步骤，包括：

将所述第一配准图像以及第二配准图像分别输入预设的任务模型中，获取所述任务模型输出的第一输出值以及第二输出值；

根据所述第一输出值以及所述第二输出值，确定针对所述第一待训练模型的奖励值。

可选地，在所述将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数的步骤之前，所述方法还包括：

将所述原始眼底图像输入第二待训练模型中，获取所述第二待训练模型输出的第二模型配准参数；

采用所述第二模型配准参数以及所述原始眼底图像对应的标准配准参数，确定所述第二待训练模型的损失值；

根据所述损失值，调整所述第二待训练模型中的模型参数，直至所述第二模型配准参数满足第一预设条件时，将所述第二待训练模型作为第一待训练模型。

可选地，还包括原始眼底图像组和第一待训练模型组；原始眼底图像组I中包括N张原始眼底图像I(i)，第一待训练模型组M中包括N个第一待训练模型M(i)，i∈[1,N]，且i为正整数；且在所述第一待训练模型组M中，所述第一待训练模型M(i)的至少一个中间层相互连接；

所述将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数的步骤，包括：

将原始眼底图像组中的原始眼底图像I(i)输入所述第一待训练模型组中的第一待训练模型M(i)中；

获取所述第一待训练模型组M输出的第一模型配准参数组。

本发明实施例还公开了一种眼底图像的配准方法，包括：

将待配准眼底图像输入眼底图像配准模型中；其中，所述眼底图像配准模型采用将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型的方式得到；

获取所述眼底图像配准模型输出的图像配准参数；

采用所述图像配准参数，对所述待配准眼底图像进行配准，得到配准后的眼底图像。

本发明实施例还公开了一种眼底图像配准模型的训练装置，包括：

第一参数获取模块，用于将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；

扰动模块，用于对所述第一模型配准参数进行扰动，生成扰动配准参数；

奖励值确定模块，用于根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；

第一调整模块，用于根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

可选地，所述奖励值确定模块包括：

图像配准子模块，用于分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行配准，得到第一配准图像以及第二配准图像；

奖励值确定子模块，用于根据所述第一配准图像以及第二配准图像，确定针对所述第一待训练模型的奖励值。

所述图像配准子模块包括：

图像配准单元，用于分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行缩放、旋转、平移中的至少一种相似变换，得到第一配准图像以及第二配准图像。

可选地，所述奖励值确定子模块包括：

输出获取单元，用于将所述第一配准图像以及第二配准图像分别输入预设的任务模型中，获取所述任务模型输出的第一输出值以及第二输出值；

奖励值确定单元，用于根据所述第一输出值以及所述第二输出值，确定针对所述第一待训练模型的奖励值。

可选地，所述装置还包括：

第二参数获取模块，用于将所述原始眼底图像输入第二待训练模型中，获取所述第二待训练模型输出的第二模型配准参数；

损失值确定模块，用于采用所述第二模型配准参数以及所述原始眼底图像对应的标准配准参数，确定所述第二待训练模型的损失值；

第二调整模块，用于根据所述损失值，调整所述第二待训练模型中的模型参数，直至所述第二模型配准参数满足第一预设条件时，将所述第二待训练模型作为第一待训练模型。

所述第一参数获取模块包括：

输入子模块，用于将原始眼底图像组中的原始眼底图像I(i)输入所述第一待训练模型组中的第一待训练模型M(i)中；

参数组获取子模块，用于获取所述第一待训练模型组M输出的第一模型配准参数组。

本发明实施例还公开了一种眼底图像的配准装置，包括：

图像输入模块，用于将待配准眼底图像输入眼底图像配准模型中；其中，所述眼底图像配准模型采用将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型的方式得到；

第三参数获取模块，用于获取所述眼底图像配准模型输出的图像配准参数；

配准模块，用于采用所述图像配准参数，对所述待配准眼底图像进行配准，得到配准后的眼底图像。

本发明实施例还公开了一种电子设备，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述电子设备执行如本发明实施例所述的一个或多个的方法。

本发明实施例还公开了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行如本发明实施例所述的一个或多个的方法。

本发明实施例包括以下优点：

通过本发明实施例的眼底图像配准模型的训练方法，将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的配准参数；并对所述配准参数进行扰动，生成扰动配准参数；根据所述配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；从而可以基于所述配准参数以及所述扰动配准参数，确定所述第一待训练模型的优化方向，并根据所述奖励值，调整所述第一待训练模型中的模型参数，提高第一待训练中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。从而得到可以输出眼底图像配准参数，对眼底图像进行配准的模型，且具有较好的准确率。

附图说明

图1是本发明实施例的一种眼底图像的示意图；

图2是本发明实施例的一种眼底图像配准模型的训练方法实施例的步骤流程图；

图3是本发明实施例另一种眼底图像配准模型的训练方法实施例的步骤流程图；

图4是本发明实施例的一种第二待训练模型的训练方法的示意图；

图5是本发明实施例的一种第一待训练模型的训练方法的示意图；

图6是本发明实施例的一种眼底图像配准模型的训练方法实施例的步骤流程图；

图7是本发明的一种原始眼底图像组的示意图；

图8是本发明实施例的一种眼底图像的配准方法实施例的步骤流程图；

图9是本发明实施例的一种眼底图像配准模型的训练装置实施例的结构框图；

图10是本发明实施例的一种眼底图像的配准装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图2，示出了本发明的一种眼底图像配准模型的训练方法实施例的步骤流程图，具体可以包括如下步骤：

步骤201，将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；

在本发明实施例中，眼底图像的配准方式可以为对所述眼底图像进行缩放、旋转、平移等相似变换。由此，可以采用配准参数，记录所述眼底图像的相似变换方式。则对于一眼底图像来说，如果可以确定一与该眼底图像相对应的配准参数，就可以相应地得知应如何对该眼底图像进行相似变换，完成对该眼底图像的配准。从而本发明实施例可以训练一可以针对眼底图像输出配准参数的模型，以对眼底图像进行配准。

在本发明实施例中，为了对模型进行训练，可以采用一第一待训练模型，并将原始眼底图像输入第一待训练模型中，并获取所述第一待训练模型输出的第一模型配准参数。

其中，所述第一待训练模型可以为卷积神经网络模型(Convolutional NeuralNetworks,CNN)。

步骤202，对所述第一模型配准参数进行扰动，生成扰动配准参数；

在本发明实施例中，为了提高第一待训练模型输出的第一模型配准参数的准确率，可以对所述第一模型配准参数进行扰动，生成扰动配准参数。从而可以基于所述第一模型配准参数以及所述扰动配准参数，确定所述第一待训练模型的优化方向。

在具体实现中，对所述第一模型配准参数进行扰动的方式可以为对所述第一模型配准参数添加随机变化的数值，且该数据可以为正数，也可以为负数，从而所述第一模型配准参数可以具有不同的扰动方向。

步骤203，根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；

在本发明实施例中，可以根据所述第一模型配准参数以及所述扰动配准参数，确定所述第一待训练模型的奖励值，以确定扰动后的所述扰动配准参数相对于未扰动的所述第一模型配准参数是否更优。

在具体实现中，可以采用所述第一模型配准参数以及所述扰动配准参数，分别对所述原始眼底图像进行配准，并基于配准后的所述眼底图像的配准效果，对所述第一模型配准参数以及所述扰动配准参数进行评价，并得到所述奖励值。

例如，可以确定基于第一模型配准参数进行配准的眼底图像与人工对所述原始眼底图像进行配准的眼底图像之间的相似度，以及确定基于扰动配准参数进行配准的眼底图像与人工对所述原始眼底图像进行配准的眼底图像之间的相似度，并基于相似度确定奖励值，以确定扰动配准参数相对于第一模型配准参数是否更优。在扰动配准参数对应的准确度相对于第一模型配准参数对应的准确度更高的情况下，可以认为扰动配准参数相对于第一模型配准参数更优，并得到较高的奖励值。在动配准参数对应的准确度相对于第一模型配准参数对应的准确度更低的情况下，可以认为扰动配准参数相对于第一模型配准参数较差，并得到较低的奖励值。

又例如，可以将基于第一模型配准参数进行配准的眼底图像以及基于扰动配准参数进行配准的眼底图像分别用于图像识别任务中，并基于图像识别任务输出结果的准确度，确定奖励值，以确定扰动配准参数相对于第一模型配准参数是否更优。在扰动配准参数对应的准确度相对于第一模型配准参数对应的准确度更高的情况下，可以认为扰动配准参数相对于第一模型配准参数更优，并得到较高的奖励值。在动配准参数对应的准确度相对于第一模型配准参数对应的准确度更低的情况下，可以认为扰动配准参数相对于第一模型配准参数较差，并得到较低的奖励值。

在具体实现中，所述原始眼底图像可以对应具有标准配准参数。所述标准配准参数可以基于人工标注等方式得到，本发明对此不做限制。也可以将所述第一模型配准参数以及所述扰动配准参数分别与标准配准参数进行比较，根据所述第一模型配准参数以及所述扰动配准参数与所述标准配准参数之间的相似度，确定奖励值，以确定扰动配准参数相对于第一模型配准参数是否具有更优。在扰动配准参数对应的准确度相对于第一模型配准参数对应的准确度更高的情况下，可以认为扰动配准参数相对于第一模型配准参数更优，并得到较高的奖励值。在动配准参数对应的准确度相对于第一模型配准参数对应的准确度更低的情况下，可以认为扰动配准参数相对于第一模型配准参数较差，并得到较低的奖励值。

由此，可以根据所述奖励值，确定所述扰动配准参数的扰动方向是否为较好的优化方向，并对所述第一待训练模型进行优化。

步骤204，根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

在本发明实施例中，可以根据所述奖励值，对所述第一待训练模型中的模型参数调整，以提高所述第一待训练模型的配准效果。

在具体实现中，可以根据所述奖励值，确定所述扰动配准参数的配准效果是否优于所述配准参数的配准效果。在所述扰动配准参数的配准效果优于所述配准参数的配准效果时，可以对所述第一待训练模型的模型参数进行调整，使所述第一待训练模型可以输出更加接近所述扰动模型参数的配准效果的模型参数。

在本发明实施例中，在对所述第一待训练模型调整参数完毕后，可以继续执行步骤201～203，之后，可以判断所述奖励值是否符合第一预设条件。在所述奖励值满足第一预设条件时，可以认为所述第一待训练模型输出的配准参数可以达到较优的配准效果，所述第一待训练模型训练完成，并将所述第一待训练模型作为眼底图像配准模型。在所述奖励值不满足第一预设条件时，可以认为所述第一待训练模型输出的第一模型配准参数未达到较优的配准效果，则此时需要继续根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件。

其中，所述第一预设条件可以为所述奖励值小于预设阈值，也可以为所述奖励值基本不再变化，也可以为在预设次数的训练过程中，所述奖励值皆小于预设阈值，也可以为在预设次数的训练过程中，大于预设数量的奖励值皆小于预设阈值等，本发明对此不做限制。

参照图3，示出了本发明的另一种眼底图像配准模型的训练方法实施例的步骤流程图，具体可以包括如下步骤：

步骤301，将所述原始眼底图像输入第二待训练模型中，获取所述第二待训练模型输出的第二模型配准参数；

在本发明实施例中，在采用强化学习的训练方式，即将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数，对所述第一模型配准参数进行扰动，生成扰动配准参数，根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值，根据所述奖励值，调整所述第一待训练模型中的模型参数的训练方式对第一待训练模型进行训练之前，可以先对模型进行预训练，使模型具有一定的准确率之后，再采用强化学习的方式对模型进行训练，从而可以进一步提高模型的训练效率，降低后续强化学习过程的模型收敛难度。

为了对模型进行预训练，可以将所述原始眼底图像输入一第二待训练模型中，并获取所述第二待训练模型输出的第二模型配准参数。

其中，所述第二待训练模型可以为卷积神经网络模型(Convolutional NeuralNetworks,CNN)。

步骤302，采用所述第二模型配准参数以及所述原始眼底图像对应的标准配准参数，确定所述第二待训练模型的损失值；

在本发明实施例中，所述原始眼底图像可以具有标准配准参数。采用所述标准配准参数对所述原始眼底图像进行配准，可以获得较好的配准效果。

其中，所述标准配准参数可以采用人工标注的方式得到，也可以采用已经训练完成的其他模型对所述原始眼底图像进行处理得到，本发明对此不做限制。

在本发明实施例中，可以采用监督学习的方式，对所述第二待训练模型进行训练。由此，在得到所述第二待训练模型输出的第二模型配准参数之后，可以将所述第二模型配准参数与标准配准参数进行比较，并根据所述第二模型配准参数与标准配准参数，确定所述第二待训练模型的损失值。

在具体实现中，可以采用所述第二模型配准参数以及所述标准配准参数，计算回归损失函数。所述回归损失函数可以为L2 Loss、Smooth L1 Loss等，本发明对此不做限制。

步骤303，根据所述损失值，调整所述第二待训练模型中的模型参数，直至所述第二模型配准参数满足第一预设条件时，将所述第二待训练模型作为第一待训练模型。

在本发明实施例中，在确定所述第二待训练模型的损失值之后，可以根据所述损失值，调整所述第二待训练模型中的模型参数，以提高所述第二待训练模型的配准效果。

在具体实现中，可以采用如下公式，计算所述第二待训练模型中的模型参数ω的修正量Δω：

其中，γ为常量，L为根据所述第二模型配准参数与标准配准参数确定的损失值。

在本发明实施例中，在对所述第二待训练模型调整参数完毕后，可以继续执行步骤301～302，之后，可以判断所述从第二待训练模型输出的所述第二模型配准参数是否符合第二预设条件，在所述第二模型配准参数满足第二预设条件时，可以认为所述第二待训练模型输出的第二模型配准参数可以满足预训练的要求，具有对眼底图像进行配准的能力，且不会对人为规定规则下的配准参数产生过拟合的情况。则此时可以认为所述第二待训练模型训练完成，并将所述第二待训练模型作为第一待训练模型，以在后续继续采用强化学习的方式，对所述第一待训练模型进行训练。在所述奖励值不满足第二预设条件时，可以认为所述第二待训练模型还没具备对眼底图像进行配准的能力，则此时需要继续根据所述损失值，调整所述第二待训练模型中的模型参数，直至所述第二模型配准参数满足第二预设条件。

其中，所述第二预设条件基于根据所述第二模型配准参数与标准配准参数确定的损失值进行判断，也可以基于所述第二模型配准参数的配准效果进行判断，本发明对此不做限制。

例如，所述第二预设条件可以为所述损失值小于预设阈值，也可以为所述损失值基本不再变化，也可以为基于所述第二模型配准参数配准的眼底图像中，较为明显的特征如视盘、黄斑等在眼底图像中的位置呈现规律性等，本发明对此不做限制。

作为本发明的一种示例，图4为本发明实施例的一种第二待训练模型的训练方法的示意图。可以将原始眼底图像401输入第二待训练模型402中，所述第二待训练模型402可以输出第二模型配准参数403。其后，可以对采用所述第二模型配准参数403与预标注好的标准配准参数404，计算损失值405，并基于所述损失值405对所述第二待训练模型中的模型参数进行配准。其后，可以继续执行生成损失值的步骤，直至所述第二模型配准参数403满足第二预设条件，所述第二待训练模型训练完成，生成第一待训练模型。

步骤304，将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；

在本发明的一种实施例中，所述第一模型配准参数包括缩放变换参数、旋转变换参数、平移变换参数中的至少一种。

在本发明实施例中，眼底图像的配准方式可以为对所述眼底图像进行缩放、旋转、平移等相似变换。由此，所述第一模型配准参数可以包括缩放变换参数、旋转变换参数、以及平移变换参数中的至少一种，从而可以根据第一模型配准参数，得知应如何对所述眼底图像进行相似变换。

具体而言，可以采用如下公式表示对所述眼底图像进行缩放：

其中，

可以代表图像中任一像素点所处的位置，对眼底图像进行缩放，可以认为是对像素点所处位置

乘以一矩阵

得到缩放后像素点所处位置

由此可以认为，在得知矩阵S中s的值的情况下，即可以得知如何对所述眼底图像进行缩放处理。

可以采用如下公式表示对所述眼底图像进行旋转：

其中，

可以代表图像中任一像素点所处的位置，对眼底图像进行旋转，可以认为是对像素点所处位置

乘以一矩阵

得到旋转后像素点所处位置

由此可以认为，在得知矩阵R中θ的值的情况下，即可以得知如何对所述眼底图像进行旋转处理。

可以采用如下公式表示对所述眼底图像进行平移：

其中，

可以代表图像中任一像素点所处的位置，对眼底图像进行平移，可以认为是对像素点所处位置

乘以一矩阵

得到平移后像素点所处位置

由此可以认为，在得知矩阵T中tx以及ty的值的情况下，即可以得知如何对所述眼底图像进行平移处理。

由此，在得知s、θ、tx以及ty的情况下，即可以得知如何对所述眼底图像进行包括缩放、旋转、平移中的至少一种的相似变换。从而可以将矩阵S中的s作为缩放变换参数，将矩阵R中的θ作为旋转变换参数，将矩阵T中tx以及ty作为平移变换参数，得到包含缩放变换参数、旋转变换参数、平移变换参数中的至少一种的第一模型配准参数，并可以将第一模型配准参数记为(s,tx,ty,θ)。

在具体实现中，所述第一待训练模型可以将眼底图像作为输入，输出一组数值。通常来说，模型输出的数值的取值范围可以为(-∞,+∞)，而由于眼底图像进行相似变换所采用的s、θ、tx以及ty通常有各自较为合理的取值范围，因此，还可以采用如Sigmoid、ReLU6等函数，将模型输出的数值映射至合理的有限取值范围内。例如，θ的取值范围通常可以为(-π,π)或更小。则可以采用Sigmoid函数对第一待训练模型的输出进行处理，并乘以小于或等于π的数值，使得模型的输出可以处于θ的取值范围内。

步骤305，对所述第一模型配准参数进行扰动，生成扰动配准参数；

在具体实现中，对所述第一模型配准参数进行扰动的方式可以为对所述第一模型配准参数中的缩放变换参数、旋转变换参数、以及平移变换参数的至少一种添加随机变化的数值，且该数值可以为正数，也可以为负数，从而所述第一模型配准参数可以具有不同的扰动方向。作为本发明的一种示例，可以对所述第一模型配准参数(s,tx,ty,θ)添加随机扰动值Δ＝(Δs,Δtx,Δty,Δθ)，其中，随机扰动值可以为正数，也可以为负数；Δs,Δtx,Δty,Δθ之间的数值可以相同，也可以不同；也可以存在Δs,Δtx,Δty,Δθ中至少一种为0，本发明对此不做限制。

步骤306，根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；

在本发明实施例中，可以根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值，以确定扰动后的所述扰动配准参数相对于未扰动的所述第一模型配准参数是否更优。其后可以根据所述奖励值，确定所述扰动配准参数的扰动方向是否为较好的优化方向，并对所述第一待训练模型进行优化。

在本发明的一种实施例中，所述根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值的步骤，包括：

S11，分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行配准，得到第一配准图像以及第二配准图像；

在本发明实施例中，为了确定扰动后的所述扰动配准参数相对于未扰动的所述第一模型配准参数是否更优，可以基于所述原始眼底图像的配准效果，确定针对所述第一待训练模型的奖励值。由此，可以分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行配准，得到第一配准图像以及第二配准图像。

在本发明的一种实施例中，所述分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行配准，得到第一配准图像以及第二配准图像的步骤，包括：

S111，分别采用所述第一模型配准参数以及所述扰动配准参数，对所述原始眼底图像进行缩放、旋转、平移中的至少一种相似变换，得到第一配准图像以及第二配准图像。

在本发明实施例中，可以采用所述第一模型配准参数中的缩放变换参数、旋转变换参数、平移变换参数中的至少一种，相应地对所述原始眼底图像进行缩放、旋转、平移中的至少一种相似变换，得到第一配准图像。并可以采用所述扰动配准参数中的缩放变换参数、旋转变换参数、平移变换参数中的至少一种，相应地对所述原始眼底图像进行缩放、旋转、平移中的至少一种相似变换，得到第二配准图像。

在具体实现中，对于缩放变换，可以将缩放变换参数的值作为矩阵

中s的值，并采用矩阵S对所述原始眼底图像进行相似变换处理，得到经过缩放变换的眼底图像。

对于旋转变换，可以将旋转变换参数的值作为矩阵

中θ的值，并采用矩阵R对所述原始眼底图像进行相似变换处理，得到经过旋转变换的眼底图像。

对于平移变换，可以将平移变换参数的值作为矩阵

中tx以及ty的值，并采用矩阵T对所述原始眼底图像进行相似变换处理，得到经过平移变换的眼底图像。

S12，根据所述第一配准图像以及第二配准图像，确定针对所述第一待训练模型的奖励值。

在本发明实施例中，可以根据所述第一配准图像以及第二配准图像的配准效果，确定针对所述第一待训练模型的奖励值，以确定扰动后的所述扰动配准参数对于所述第一待训练模型来说是否为较好的优化方向。

在具体实现中，可以将第一配准图像以及第二配准配准分别用于基于眼底图像进行处理的任务中，并基于任务输出结果的准确度，确定奖励值，以确定扰动配准参数相对于第一模型配准参数是否更优。在扰动配准参数对应的准确度相对于第一模型配准参数对应的准确度更高的情况下，可以认为扰动配准参数相对于第一模型配准参数更优，并得到较高的奖励值。在动配准参数对应的准确度相对于第一模型配准参数对应的准确度更低的情况下，可以认为扰动配准参数相对于第一模型配准参数较差，并得到较低的奖励值。

在本发明的一种实施例中，所述根据所述第一配准图像以及第二配准图像，确定针对所述第一待训练模型的奖励值的步骤，包括：

S21，将所述第一配准图像以及第二配准图像分别输入预设的任务模型中，获取所述任务模型输出的第一输出值以及第二输出值；

在本发明实施例中，可以预设一任务模型，所述任务模型可以用于基于眼底图像处理任务。例如，判断眼底图像是否存在某种病变，判断眼底图像对应的性别，对眼底图像进行图像分割等。

在具体实现中，为了便于基于任务模型的输出结果，对配准参数进行评价，生成奖励值，可以采用输出结果包含可比较的数值的模型，作为任务模型。例如，可以输出模型属于某一分类的概率的分类模型，可以输出平均交并比的图像分割模型等。

在本发明实施例中，可以就所述任务模型的输出结果，对配准参数进行评价。在所述任务模型可以输出准确率更高的结果的情况下，可以认为该配准参数具有更优的配准效果。从而可以基于所述任务模型的输出结果，确定扰动配准参数相对于第一模型配准参数是否更优，并确定针对所述第一待训练模型的奖励值。

由此，可以将所述第一配准图像输入预设的任务模型中，获取所述任务模型输出的第一输出值，并将所述第二配准图像输入预设的任务模型，获取所述任务模型输出的第二输出值，以根据所述第一输出值以及第二输出值确定扰动配准参数相对于第一模型配准参数是否更优。作为本发明的一种示例，在所述任务模型为分类模型的情况下，所述第一输出值以及所述第二输出值可以为输入的图像属于某一分类的概率。在所述任务模型为图像分割模型的情况下，所述第一输出值以及所述第二输出值可以为输入的图像对应的平均交并比(Mean Intersection over Union,MIoU)。

S22，根据所述第一输出值以及所述第二输出值，确定针对所述第一待训练模型的奖励值。

在本发明实施例中，可以根据所述第一输出值以及所述第二输出值，确定针对所述第一待训练模型的奖励值，以根据所述奖励值，确定所述扰动配准参数的扰动方向是否为所述第一待训练模型较好的优化方向。

在具体实现中，在奖励值越大的情况下，所述扰动配准参数的扰动方向是所述第一待训练模型较好的优化方向，在奖励值越小的情况下，所述扰动配准参数的扰动方向不是所述第一待训练模型较好的优化方向。

由此，可以先确定所述第二输出值是否优于所述第一输出值。例如，在分类任务中，如果任务模型输出的图像属于某一分类的概率更大，则可以认为所述任务模型输出的结果更优。在图像分割任务中，如果所述平均交并比越大，则可以认为所述任务模型输出的结果更优。

在所述第二输出值优于所述第一输出值的情况下，可以将第一输出值以及所述第二输出值之差的绝对值作为所述奖励值。在所述第二输出值不优于所述第一输出值的情况下，可以将第一输出值以及所述第二输出值之差的绝对值的负值作为所述奖励值。从而可以根据奖励值得知所述扰动配准参数的扰动方向是否为所述第一待训练模型较好的优化方向，并可以根据奖励值对所述第一待训练模型进行模型参数调整。

作为本发明的一种示例，在所述任务模型为二分类任务模型的情况下，所述原始眼底图像可以预设有对应的标签。所述标签用于标注所述原始眼底图像所属的分类。原始烟蒂头图像所属的分类可以包括阳性样本以及阴性样本。其中，所述标签可以由人工进行标注，也可以由其他已经训练完成的模型进行标注，本发明对此不做限制。

所述任务模型可以针对输入的所述原始眼底图像，输出取值范围为0～1之间的分数。当分数越接近0，则可以认为输入的原始眼底图像有更高的概率属于阴性样本。当分数越接近1，则可以认为输入的图像有更高的概率属于阳性样本。

由此，若原始眼底图像的标签为阳性样本的情况下，可以采用如下公式计算奖励值Reward：

Reward＝S'-S

其中，S'为第二输出值，S为第一输出值。

若原始眼底图像的标签为阴性样本的情况下，可以采用如下公式计算奖励值Reward：

Reward＝S-S'

其中，S'为第二输出值，S为第一输出值。

步骤307，根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

在具体实现中，可以根据所述奖励值，确定是否需要向所述扰动配准参数的扰动方向，对所述第一待训练模型进行优化。在所述奖励值为正数的情况下，可以得知扰动配准参数的扰动方向是所述第一待训练模型较好的优化方向，可以对所述第一待训练模型中的模型参数进行调整。且奖励值越大，则所述第一待训练模型需要向所述扰动配准参数的扰动方向对模型参数作出更多调整。奖励值越小，则所述第一待训练模型需要向所述扰动配准参数的扰动方向对模型参数作出较少调整。在所述奖励值为负数的情况下，可以得知所述扰动配准参数的扰动方向不是第一待训练模型较好的优化方向，则此时所述第一待训练模型可以不对模型参数进行调整，或者在扰动方向的相反方向上对模型参数作出一定的调整。

作为本发明的一种示例，可以采用如下公式，计算所述第一待训练模型中模型参数ω的修正量Δω：

其中，γ为常量，Reward为奖励值，Δ为对第一模型配准参数添加的随机扰动值。

由此，可以计算得到模型参数ω的修正量，并采用修正量Δω，对所述第一待训练模型中的模型参数ω进行调整。

在本发明实施例中，在对所述第一待训练模型调整参数完毕后，可以继续执行步骤304～306，之后，可以判断所述奖励值是否符合第一预设条件。在所述奖励值满足第一预设条件时，可以认为所述第一待训练模型输出的配准参数可以达到较优的配准效果，所述第一待训练模型训练完成，并将所述第一待训练模型作为眼底图像配准模型。在所述奖励值不满足第一预设条件时，可以认为所述第一待训练模型输出的第一模型配准参数未达到较优的配准效果，则此时需要继续根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件。

作为本发明的一种示例，在预设次数的训练中，存在大于预设数量的训练得到的奖励值为负数的情况下，可以认为此时对所述第一待训练模型的输出进行扰动，已经较难继续找到所述第一待训练模型的优化方向，则所述第一待训练模型已经训练完成，可以将第一待训练模型作为眼底图像配准模型。

作为本发明的一种示例，图5为本发明实施例的一种第一待训练模型的训练方法的示意图。可以将原始眼底图像501输入第一待训练模型502中，所述第一待训练模型502输出第一模型配准参数503。其后，可以对第一模型配准参数503中所包含的参数(s,tx,ty,θ)添加随机扰动值Δ＝(Δs,Δtx,Δty,Δθ)，从而得到扰动后的扰动配准参数504，其后，可以采用第一模型配准参数503对所述原始眼底图像501进行配准，得到第一配准图像505，同时可以采用扰动配准参数504对所述原始眼底图像进行配准，得到第二配准图像506。其后，可以将第一配准图像505输入任务模型507中，并得到所述任务模型507输出的第一输出值508，同时可以将第二配准图像506输入所述任务模型507中，得到所述任务模型507输出的第二输出值509。其后可以根据所述第一输出值与第二输出值确定针对所述第一待训练模型502的奖励值410。所述第一待训练模型502可以根据所述奖励值410，对所述第一待训练模型502中的模型参数进行调整。其后，可以继续执行生成奖励值410的步骤，直至所述奖励值410满足第一预设条件，所述第一待训练模型训练完成，生成眼底图像配准模型。

通过本发明实施例的眼底图像配准模型的训练方法，先将所述原始眼底图像输入第二待训练模型中，获取所述第二待训练模型输出的第二模型配准参数；采用所述第二模型配准参数以及所述原始眼底图像对应的标准配准参数，确定所述第二待训练模型的损失值；根据所述损失值，调整所述第二待训练模型中的模型参数，直至所述第二模型配准参数满足第一预设条件时，将所述第二待训练模型作为第一待训练模型，从而模型先进行预训练，使模型具有一定的图像配准能力，且不会对人定规则下的配准参数过拟合，并提高后续模型训练收敛效率。其后在将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的配准参数；并对所述配准参数进行扰动，生成扰动配准参数；根据所述配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；从而可以基于所述配准参数以及所述扰动配准参数，确定所述第一待训练模型的优化方向，并根据所述奖励值，调整所述第一待训练模型中的模型参数，提高第一待训练中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。从而得到可以输出眼底图像配准参数，对眼底图像进行配准的模型，且具有较好的准确率。

参照图6，示出了本发明实施例的一种眼底图像配准模型的训练方法实施例的步骤流程图，具体可以包括如下步骤：

在本发明实施例中，在眼底图像识别任务中，还可以存在识别一组眼底图像是否为同一身份患者的眼底图像，或者，同时对左右眼眼底图像进行分析等任务。在该类任务中，眼底图像之间通常可以具有一定向关联性，且配准过程也存在一定的关联性。此时，所述眼底图像配准模型也可以相应地拼接为成组的结构。

由此，在训练过程中，在原始眼底图像组I中包括N张原始眼底图像I(i)的情况下，也可以相应地将所述N个第一待训练模型M(i)组为第一待训练模型组M。其中，i∈[1,N]，且i为正整数。且在所述第一待训练模型组M中，所述第一待训练模型M(i)的至少一个中间层相互连接，从而所述第一待训练模型组中的第一待训练模型之间可以进行一定程度的信息交换，提高对眼底图像组的配准效果。

步骤601，将原始眼底图像组中的原始眼底图像I(i)输入所述第一待训练模型组中的第一待训练模型M(i)中；

在本发明实施例中，针对原始眼底图像中的原始眼底图像I(i)，可以将其输入所述第一待训练模型组中的第一待训练模型M(i)中，从而使每一所述原始眼底图像都可以输入一相应的第一待训练模型中。

例如，对于原始眼底图像I(1)，其可以相应地输入第一待训练模型M(1)中，对于原始眼底图像I(2)，其可以相应地输入第一待训练模型M(2)中，对于原始眼底图像I(3)，其可以相应地输入第一待训练模型M(3)中。

步骤602，获取所述第一待训练模型组M输出的第一模型配准参数组；

在本发明实施例中，第一待训练模型组M获取得到原始图像组I后，可以输出成组的第一模型配准参数，即第一模型配准参数组。便于后续对所述第一待训练模型组进行训练。

在具体实现中，可以在输出第一模型配准参数组的过程中，对于第一待训练模型，可以对其中间层输出的数据进行重构(reshape)，使得第一待训练模型之间的中间层输出可以在通道维度上进行合并(concatenate)，从而使第一待训练模型组可以整体地输出所述第一模型配准参数组。

在具体实现中，也可以采用孪生网络(Siamese Network)的结构构建第一待训练模型组。训练所述第一待训练模型组的过程中，可以将模型参数在孪生网络中进行共享，使所述第一待训练模型组中的第一待训练模型可以具有相同的模型参数，同时也可以将所述第一待训练模型的中间层输出的数据进行重构，使得第一待训练模型之间的中间层输出可以在通道维度上进行合并，从而使第一待训练模型组可以整体地输出所述第一模型配准参数组。

步骤603，对所述第一模型配准参数进行扰动，生成扰动配准参数；

在本发明实施例中，对于第一待训练模型组，其通常可以对第一待训练模型组中每一所述第一待训练模型输出的参数进行扰动，分别生成扰动配准参数。从而可以基于所述第一模型配准参数以及所述扰动配准参数，确定所述第一待训练模型的优化方向。

步骤604，根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；

在本发明实施例中，针对所述第一待训练模型组中的一第一待训练模型，可以根据所述第一模型配准参数以及所述扰动配准参数，确定该第一待训练模型的奖励值，以确定扰动后的所述扰动配准参数相对于未扰动的所述第一模型配准参数是否更优。

步骤605，根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

在具体实现中，对于采用孪生网络结构的第一待训练模型组来说，在确定调整后的模型参数之后，可以将所述模型参数在孪生网络结构中进行共享，使所述第一待训练模型可以具有相同的模型参数。

在本发明实施例中，在对所述第一待训练模型调整参数完毕后，可以继续执行步骤601～603，之后，可以判断所述奖励值是否符合第一预设条件。在所述奖励值满足第一预设条件时，可以认为所述第一待训练模型输出的配准参数可以达到较优的配准效果，所述第一待训练模型训练完成，并将所述第一待训练模型作为眼底图像配准模型。在所述奖励值不满足第一预设条件时，可以认为所述第一待训练模型输出的第一模型配准参数未达到较优的配准效果，则此时需要继续根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件。

作为本发明的一种示例，图7为本发明的一种原始眼底图像组的示意图。其中图7(a)与图7(b)皆为同一眼睛的眼底图像，但是图7(a)中血管信息丢失严重，通过本发明实施例的眼底图像配准模型的训练方法，可以在图片具有较大噪声的情况下，训练第一待训练模型组学习眼底图像中具有最大共同信息的区域，从而有效地降低图像中噪声的干扰，并正确地的判断两张图像为同一眼睛的阳性样本，从而最终得到的眼底图像配准模型组也可以具有较好的配准效果。

通过本发明实施例的眼底图像配准模型的训练方法，将原始眼底图像组中的原始眼底图像I(i)输入所述第一待训练模型组中的第一待训练模型M(i)中；获取所述第一待训练模型组M输出的第一模型配准参数组；并对所述配准参数进行扰动，生成扰动配准参数；根据所述配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；从而可以基于所述配准参数以及所述扰动配准参数，确定所述第一待训练模型的优化方向，并根据所述奖励值，调整所述第一待训练模型中的模型参数，提高第一待训练中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。从而得到可以输出眼底图像配准参数，对眼底图像进行配准的模型，且具有较好的准确率。

参照图8，示出了本发明实施例的一种眼底图像的配准方法实施例的步骤流程图，具体可以包括如下步骤：

步骤801，将待配准眼底图像输入眼底图像配准模型中；其中，所述眼底图像配准模型采用将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型的方式得到；

在本发明实施例中，当需要对眼底图像进行配准时，可以将待配准眼底图像输入眼底图像配准模型中，从而可以采用模型对所述眼底图像进行配准。

其中，所述眼底图像配准参数模型可以采用如下方式得到：将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

通过对所述第一待训练模型输出的第一模型配准参数进行扰动，并基于第一模型配准参数以及扰动配准参数确定奖励值，从而可以通过扰动的方式确定第一待训练模型较好的优化方向，并提高第一待训练模型的配准效果，最终可以得到具有较好准确的眼底图像配准模型。

步骤802，获取所述眼底图像配准模型输出的图像配准参数；

在本发明实施例中，所述眼底图像配准模型可以根据输入的待配准眼底图像，输出图像配准参数。其中，所述图像配准参数可以包括缩放变换参数、旋转变换参数、平移变换参数中的至少一种。

步骤803，采用所述图像配准参数，对所述待配准眼底图像进行配准，得到配准后的眼底图像。

在本发明实施例中，可以采用所述图像配准参数，对所述待配准眼底图像进行配准，得到配准后的眼底图像。便于工作人员采用配准后的眼底图像，对患者进行病情诊断。

在具体实现中，对所述待配准眼底图像进行配准，相当于对所述待配准眼底图像进行相似变换。可以采用所述图像配准参数，对所述待配准眼底图像进行缩放、旋转、平移中的至少一种相似变换，使所述待配准眼底图像中较为明显的特征如视盘、黄斑等可以采用标准的方式进行展示。

通过本发明实施例的眼底图像的配准方法，将待配准眼底图像输入眼底图像配准模型中；获取所述眼底图像配准模型输出的图像配准参数；采用所述图像配准参数，对所述待配准眼底图像进行配准，得到配准后的眼底图像。其中，所述眼底图像配准模型采用将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型的方式得到。从而可以采用模型对所述眼底图像进行配准，实现了自动化的配准，且具有较好的配准效果。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图9，示出了本发明的一种眼底图像配准模型的训练装置实施例的结构框图，具体可以包括如下模块：

第一参数获取模块901，用于将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；

扰动模块902，用于对所述第一模型配准参数进行扰动，生成扰动配准参数；

奖励值确定模块903，用于根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；

第一调整模块904，用于根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型。

在本发明的一种实施例中，所述奖励值确定模块包括：

在本发明的一种实施例中，所述第一模型配准参数包括缩放变换参数、旋转变换参数、平移变换参数中的至少一种；

所述图像配准子模块包括：

在本发明的一种实施例中，所述奖励值确定子模块包括：

在本发明的一种实施例中，所述装置还包括：

在本发明的一种实施例中，还包括原始眼底图像组和第一待训练模型组；原始眼底图像组I中包括N张原始眼底图像I(i)，第一待训练模型组M中包括N个第一待训练模型M(i)，i∈[1,N]，且i为正整数；且在所述第一待训练模型组M中，所述第一待训练模型M(i)的至少一个中间层相互连接；

所述第一参数获取模块包括：

参照图10，示出了本发明的一种眼底图像的配准装置实施例的结构框图，具体可以包括如下模块：

图像输入模块1001，用于将待配准眼底图像输入眼底图像配准模型中；其中，所述眼底图像配准模型采用将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数；对所述第一模型配准参数进行扰动，生成扰动配准参数；根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值；根据所述奖励值，调整所述第一待训练模型中的模型参数，直至所述奖励值满足第一预设条件时，将所述第一待训练模型作为眼底图像配准模型的方式得到；

第三参数获取模块1002，用于获取所述眼底图像配准模型输出的图像配准参数；

配准模块1003，用于采用所述图像配准参数，对所述待配准眼底图像进行配准，得到配准后的眼底图像。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本发明实施例还提供了一种电子设备，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述电子设备执行本发明实施例所述的方法。

本发明实施例还提供了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行本发明实施例所述的方法。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种眼底图像配准模型训练的方法、一种眼底图像配准模型训练装置、一种眼底图像的配准方法、以及一种眼底图像配准装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种眼底图像配准模型的训练方法，其特征在于，包括：

对所述第一模型配准参数进行扰动，生成扰动配准参数；

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一模型配准参数以及所述扰动配准参数，确定针对所述第一待训练模型的奖励值的步骤，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一模型配准参数包括缩放变换参数、旋转变换参数、平移变换参数中的至少一种；

4.根据权利要求2所述的方法，其特征在于，所述根据所述第一配准图像以及第二配准图像，确定针对所述第一待训练模型的奖励值的步骤，包括：

5.根据权利要求1所述的方法，其特征在于，在所述将原始眼底图像输入第一待训练模型中，获取所述第一待训练模型输出的第一模型配准参数的步骤之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，还包括原始眼底图像组和第一待训练模型组；原始眼底图像组I中包括N张原始眼底图像I(i)，第一待训练模型组M中包括N个第一待训练模型M(i)，i∈[1,N]，且i为正整数；且在所述第一待训练模型组M中，所述第一待训练模型M(i)的至少一个中间层相互连接；

获取所述第一待训练模型组M输出的第一模型配准参数组。

7.一种眼底图像的配准方法，其特征在于，包括：

获取所述眼底图像配准模型输出的图像配准参数；

8.一种眼底图像配准模型的训练装置，其特征在于，包括：

9.一种眼底图像的配准装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述电子设备执行如权利要求1-6或7所述的一个或多个的方法。

11.一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行如权利要求1-6或7所述的一个或多个的方法。