CN113487575B

CN113487575B - 用于训练医学影像检测模型的方法及装置、设备、可读存储介质

Info

Publication number: CN113487575B
Application number: CN202110791799.0A
Authority: CN
Inventors: 李静雯; 闵栋
Original assignee: China Academy of Information and Communications Technology CAICT
Current assignee: China Academy of Information and Communications Technology CAICT
Priority date: 2021-07-13
Filing date: 2021-07-13
Publication date: 2024-01-16
Anticipated expiration: 2041-07-13
Also published as: CN113487575A

Abstract

本申请涉及网络模型技术领域，公开一种用于训练医学影像检测模型的方法，包括：获取多个医学影像；利用预设的医学影像预测模型获取各医学影像对应的预测样本数据；医学影像预测模型用于输出医学影像对应的预测样本数据；从预测样本数据中随机抽取出训练样本数据；利用训练样本数据对预设的医学影像检测模型进行更新训练；医学影像检测模型用于输出对医学影像的检测结果。通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，从而提高了训练样本的获取效率。本申请还公开一种用于训练医学影像检测模型的装置、设备和可读存储介质。

Description

用于训练医学影像检测模型的方法及装置、设备、可读存储介质

技术领域

本申请涉及网络模型技术领域，例如涉及一种用于训练医学影像检测模型的方法及装置、设备、可读存储介质。

背景技术

随着医疗诊断技术的不断成熟，X射线(X-Ray)、超声、计算机断层扫描(ComputedTomograpb，CT)和核磁共振等医疗影像技术实现了人体组织及器官的可视化，提高医疗诊断水平的同时也提高了人民的生命健康和生活质量。随着科技水平的不断进步，出现了基于深度学习的医学影像检测模型，可以对医学影像进行定量分析，帮助医生提高诊断的准确性及诊断效率。由于深度学习是数据驱动型的学习方法，严重依赖训练样本，但是训练样本需要人工进行标记，导致用于训练医学影像检测模型的训练样本的获取效率较低。

发明内容

为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。

本公开实施例提供了一种用于训练医学影像检测模型的方法及装置、设备、可读存储介质，以提高用于训练医学影像检测模型的训练样本的获取效率。

在一些实施例中，用于训练医学影像检测模型的方法，包括：获取多个医学影像；将各所述医学影像分别输入预设的医学影像预测模型，获得各所述医学影像对应的预测样本数据；所述医学影像预测模型用于输出医学影像对应的预测样本数据；从所述预测样本数据中随机抽取出训练样本数据；利用所述训练样本数据对预设的医学影像检测模型进行更新训练；所述医学影像检测模型用于输出对医学影像的检测结果。

在一些实施例中，用于训练医学影像检测模型的装置，包括：医学影像获取模块，获取多个医学影像；预测样本获取模块，将各所述医学影像分别输入预设的医学影像预测模型，获得各所述医学影像对应的预测样本数据；所述医学影像预测模型用于输出医学影像对应的预测样本数据；抽取模块，从所述预测样本数据中随机抽取出训练样本数据；训练模块，利用所述训练样本数据对预设的医学影像检测模型进行更新训练；所述医学影像检测模型用于输出对医学影像的检测结果。

在一些实施例中，用于训练医学影像检测模型的装置，包括处理器和存储有程序指令的存储器，所述处理器被配置为在运行所述程序指令时，执行上述用于训练医学影像检测模型的方法。

在一些实施例中，设备包括上述用于训练医学影像检测模型的装置。

在一些实施例中，可读存储介质存储有程序指令，所述程序指令在运行时，执行上述用于训练医学影像检测模型的方法。

本公开实施例提供的用于训练医学影像检测模型的方法及装置、设备、可读存储介质，可以实现以下技术效果：将获取到的医学影像输入预设的医学影像预测模型，获得预测样本数据，从预测样本数据中随机抽取出训练样本数据，并利用训练样本数据对医学影像监测模型进行更新训练。通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，不需要人工通过标记医学影像来得到训练样本，从而提高了训练样本的获取效率。

以上的总体描述和下文中的描述仅是示例性和解释性的，不用于限制本申请。

附图说明

一个或多个实施例通过与之对应的附图进行示例性说明，这些示例性说明和附图并不构成对实施例的限定，附图中具有相同参考数字标号的元件示为类似的元件，附图不构成比例限制，并且其中：

图1是本公开实施例提供的一个用于训练医学影像检测模型的方法的示意图；

图2是本公开实施例提供的一个用于训练医学影像检测模型的装置的示意图；

图3是本公开实施例提供的另一个用于训练医学影像检测模型的装置的示意图。

具体实施方式

为了能够更加详尽地了解本公开实施例的特点与技术内容，下面结合附图对本公开实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本公开实施例。在以下的技术描述中，为方便解释起见，通过多个细节以提供对所披露实施例的充分理解。然而，在没有这些细节的情况下，一个或多个实施例仍然可以实施。在其它情况下，为简化附图，熟知的结构和装置可以简化展示。

本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开实施例的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。

除非另有说明，术语“多个”表示两个或两个以上。

本公开实施例中，字符“/”表示前后对象是一种“或”的关系。例如，A/B表示：A或B。

术语“和/或”是一种描述对象的关联关系，表示可以存在三种关系。例如，A和/或B，表示：A或B，或，A和B这三种关系。

术语“对应”可以指的是一种关联关系或绑定关系，A与B相对应指的是A与B之间是一种关联关系或绑定关系。

结合图1所示，本公开实施例提供一种用于训练医学影像检测模型的方法，包括：

步骤S101，获取多个医学影像；

步骤S102，利用预设的医学影像预测模型获取各医学影像对应的预测样本数据；医学影像预测模型用于输出医学影像对应的预测样本数据；

步骤S103，从预测样本数据中随机抽取出训练样本数据；

步骤S104，利用训练样本数据对预设的医学影像检测模型进行更新训练；医学影像检测模型用于输出对医学影像的检测结果。

采用本公开实施例提供的用于训练医学影像检测模型的方法，将获取到的医学影像输入预设的医学影像预测模型，获得预测样本数据，从预测样本数据中随机抽取出训练样本数据，并利用训练样本数据对医学影像监测模型进行更新训练。通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，不需要人工通过标记医学影像来得到训练样本，从而提高了训练样本的获取效率。

可选地，医学影像预测模型和医学影像检测模型均为基于马尔科夫决策过程(Markov decision process)建立的卷积神经网络模型。

可选地，医学影像检测模型的网络模型结构与医学影像预测模型的网络模型结构相同。例如，医学影像检测模型与医学影像预测模型的网络模型结构从前往后依次是步长为2、卷积核为3×3×3×32的第一卷积层；步长为1、卷积核为3×3×32的第一深度卷积层；步长为1、卷积核为1×1×32×64的第二卷积层；步长为2、卷积核为3×3×64的第二深度卷积层；步长为1、卷积核为1×1×64×128的第三卷积层；步长为1、卷积核为3×3×128的第三深度卷积层；步长为1、卷积核为1×1×128×128的第四卷积层；步长为2、卷积核为3×3×128的第四深度卷积层；步长为1、卷积核为1×1×128×256的第五卷积层；步长为1、卷积核为3×3×256的第五深度卷积层；步长为1、卷积核为1×1×256×256的第六卷积层；步长为2、卷积核为3×3×256的第六深度卷积层；步长为1、卷积核为1×1×256×512的第七卷积层；步长为1、卷积核为14×14的平均池化层；步长为1、卷积核为1024×9的全连接层。将医学影像从医学影像预测模型的第一卷积层输入，从全连接层输出该医学影像对应的预测样本数据。

可选地，医学影像预测模型通过以下方式获得各医学影像对应的预测样本数据，包括：获取医学影像对应的医学影像信息；获取医学影像信息的边界框坐标；根据医学影像信息的边界框坐标获取医学影像对应的当前状态值；在预设的动作集合中随机选取一个动作值，将选取的动作值确定为当前状态值对应的动作值；将医学影像信息的边界框坐标根据当前状态值对应的动作值进行改变，获得模型检测区域边界框坐标；根据模型检测区域边界框坐标获取当前状态值对应的下一状态值；根据当前状态值对应的动作值获取当前状态值对应的奖励值；当前状态值对应的奖励值用于表征当前状态值采取当前状态值对应的动作值获得的奖励值；将医学影像对应的当前状态值、当前状态值对应的动作值、当前状态值对应的奖励值和当前状态值对应的下一状态值确定为医学影像对应的预测样本数据。

可选地，获取医学影像对应的医学影像信息，包括：在预设的医学影像集中匹配出医学影像对应的医学影像信息；其中，医学影像集存储有医学影像与医学影像信息之间的对应关系，医学影像集D＝{(p_n,g_n),n＝1,...,m}，p_n为第n个医学影像，g_n为第n个医学影像对应的医学影像信息，m为医学影像的数量。

可选地，医学影像信息为医学影像中待检测区域的像素点，例如，在医学影像为眼睛OCT(Optical Coherence Tomography，光学相干断层扫描)影像的情况下，医学影像信息为微动脉瘤区域的像素点；在医学影像为胸腔CT(Computed Tomography，电子计算机断层扫描)影像的情况下，医学影像信息为肺结节区域的像素点。

在一些实施例中，将医学影像输入到医学影像预测模型，医学影像预测模型输出该医学影像对应的四个元素，四个元素分别为医学影像对应的当前状态值、当前状态值对应的动作值、当前状态值对应的奖励值和当前状态值对应的下一状态值，将四个元素之间建立对应关系以作为一个元组，将该元组确定为预测样本数据，并将预测样本数据储存到经验回放池中，从而在经验回放池中随机抽取预测样本数据，并将抽取的预测样本数据确定为训练样本数据以对医学影像检测模型进行更新训练。训练样本数据包括医学影像对应的当前状态值、当前状态值对应的动作值、当前状态值对应的奖励值和当前状态值对应的下一状态值。这样，通过医学影像预测模型获取的医学影像对应的预测样本数据不断被储存到经验回放池中用于医学影像检测模型的更新训练，不需要人工对医学影像进行标记，提高了训练样本的获取效率，并减少训练医学影像检测模型时对标注样本的依赖。

可选地，获取医学影像信息的边界框坐标，包括：在医学影像中建立笛卡尔坐标系；以医学影像的任一角的顶点作为原点，将相交于原点的两条边界线分别作为x轴和y轴；获取医学影像信息各像素点的坐标值；将医学影像信息各像素点的坐标值中x轴的最小值作为医学影像信息的边界框坐标的左上角横坐标；将医学影像信息各像素点的坐标值中x轴的最大值作为医学影像信息的边界框坐标的右下角横坐标；将医学影像信息各像素点的坐标值中y轴的最小值作为医学影像信息的边界框坐标的右下角纵坐标；将医学影像信息各像素点的坐标值中y轴的最大值作为医学影像信息的边界框坐标的左上角纵坐标。

可选地，根据医学影像信息的边界框坐标获取医学影像对应的当前状态值，包括：通过计算s_t＝x(d)获取医学影像对应的当前状态值；其中，s_t为医学影像对应的当前状态值，x()为预设的状态空间矩阵函数，d＝[b_x,b_y,b_w,b_h]为医学影像信息的边界框坐标，b_x为医学影像信息的边界框坐标的左上角横坐标，b_y为医学影像信息的边界框坐标的左上角纵坐标，b_w为医学影像信息的边界框坐标的右下角横坐标，b_h为医学影像信息的边界框坐标的右下角纵坐标。

可选地，预设的动作集其中，均为平移动作，V为触发动作，/>表示将医学影像信息的边界框坐标的左上角横坐标正向平移，/>表示将医学影像信息的边界框坐标的左上角横坐标负向平移，/>表示将医学影像信息的边界框坐标的左上角纵坐标正向平移，/>表示将医学影像信息的边界框坐标的左上角纵坐标负向平移，/>表示将医学影像信息的边界框坐标的左上角横坐标正向平移，/>表示将医学影像信息的边界框坐标的左上角横坐标负向平移，/>表示将医学影像信息的边界框坐标的左上角纵坐标正向平移，/>表示将医学影像信息的边界框坐标的左上角纵坐标负向平移。

可选地，当前状态值对应的动作值为平移动作或触发动作，根据动作值获取当前状态值对应的奖励值，包括：将医学影像信息的所有像素点确定为医学影像信息像素点集；将医学影像信息的边界框坐标内的所有像素点确定为当前像素点集；将模型检测区域边界框坐标内的所有像素点确定为下一像素点集；在当前状态值对应的动作值为触发动作的情况下，通过计算获取当前状态值对应的奖励值；在当前状态值对应的动作值为平移动作的情况下，通过计算r(s_t,a,s_t+1)＝sign(h(s_t+1,g)-h(s_t,g))获取当前状态值对应的奖励值；其中，r(s_t,a,s_t+1)为当前状态值对应的奖励值，s_t为当前状态值，a为当前状态值对应的动作值，s_t+1为当前状态值对应的下一状态值，η为第一预设常数，τ为第二预设常数，第一预设常数与第二预设常数皆大于0且小于1，h(s_t+1,g)为下一像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值，g为医学影像信息，h(s_t,g)为当前像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值。

可选地，通过计算获取下一像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值；其中，h(s_t+1,g)为下一像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值，V_s+1为下一像素点集，V_g为医学影像信息像素点集。

可选地，通过计算获取当前像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值；其中，h(s_t,g)为当前像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值，V_s为当前像素点集，V_g为医学影像信息像素点集。

可选地，根据模型检测区域边界框坐标获取当前状态值对应的下一状态值，包括：通过计算s_t+1＝x(d')获取当前状态值对应的下一状态值；其中，s_t+1为当前状态值对应的下一状态值，x()为预设的状态空间矩阵函数，d'＝[b'_x,b'_y,b'_w,b'_h]为模型检测区域边界框坐标的边界框坐标，b'_x为模型检测区域边界框坐标的边界框坐标的左上角横坐标，b'_y为模型检测区域边界框坐标的边界框坐标的左上角纵坐标，b'_w为模型检测区域边界框坐标的边界框坐标的右下角横坐标，b'_h为模型检测区域边界框坐标的边界框坐标的右下角纵坐标。

可选地，利用训练样本数据对预设的医学影像检测模型进行更新训练，包括：将训练样本数据中的医学影像对应的当前状态值输入医学影像预测模型，获得第一动作评估值；将训练样本数据中的当前状态值输入医学影像检测模型，获得第二动作评估值；根据第一动作评估值、第二动作评估值和训练样本数据中的当前状态值对应的奖励值对损失函数进行迭代更新；根据迭代后的损失函数对医学影像预测模型的网络模型参数进行更新；将更新后的医学影像预测模型的网络模型参数确定为更新后的医学影像检测模型的网络模型参数，以更新训练医学影像检测模型。

可选地，第一动作评估值为医学影像预测模型输出的状态-动作Q值。可选地，第二动作评估值为医学影像检测模型输出的状态-动作Q值。

可选地，采用随机梯度下降算法对损失函数进行优化。

可选地，损失函数为L(θ)＝E[(r'+γQ-Q')²]；其中，L(θ)为损失值，E()为预设的均方差函数，r'为训练样本数据中的当前状态值对应的奖励值，γ为预设的折扣率，γ大于0且小于1，Q为第二动作评估值，Q'为第一动作评估值。

可选地，利用训练样本数据对预设的医学影像检测模型进行更新训练后，还包括：将待检测医学影像输入更新后的医学影像检测模型，获得待检测医学影像对应动作集合中各动作值的第三动作评估值；获取输出的第三动作评估值中的最大值；将第三动作评估值中的最大值对应的动作值确定为检测结果；在检测结果包含触发动作的情况下，确定医学影像检测模型检测到待检测医学影像对应的医学影像信息；在检测结果不包含触发动作的情况下，确定医学影像检测模型未检测到待检测医学影像对应的医学影像信息。

第三动作评估值为医学影像检测模型输出的状态-动作Q值。

通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，不需要人工通过标记医学影像来得到训练样本，提高了训练样本的获取效率，进而利用训练后的医学影像检测模型检测医学影像中是否具有医学影像信息，辅助医生查看医学影像，减少医生对医学影像的重复性工作，缓解医疗资源不足的问题，并且，该医学影像检测模型通过平移动作移动医学影像信息的边界框坐标，便于检测不同形状和不同大小的医学影像信息，扩大使用范围，使得该医学影像检测模型具有更好的鲁棒性。

可选地，通过计算a^*＝argmaxQ^*获取第三动作评估值中的最大值对应的动作值；其中，a^*为第三动作评估值中的最大值对应的动作值，Q^*为第三动作评估值。

结合图2所示，本公开实施例提供一种用于训练医学影像检测模型的装置，包括医学影像获取模块201，预测样本获取模块202，抽取模块203和训练模块204。医学影像获取模块201被配置为获取多个医学影像。预测样本获取模块202被配置为利用预设的医学影像预测模型获取各医学影像对应的预测样本数据；医学影像预测模型用于输出医学影像对应的预测样本数据。抽取模块203被配置为从预测样本数据中随机抽取出训练样本数据。训练模块204被配置为利用训练样本数据对预设的医学影像检测模型进行更新训练；医学影像检测模型用于输出对医学影像的检测结果。

采用本公开实施例提供的用于训练医学影像检测模型的装置，将获取到的医学影像输入预设的医学影像预测模型，获得预测样本数据，从预测样本数据中随机抽取出训练样本数据，并利用训练样本数据对医学影像监测模型进行更新训练。通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，不需要人工通过标记医学影像来得到训练样本，从而提高了训练样本的获取效率。

可选地，预测样本获取模块被配置为通过以下方式获得各医学影像对应的预测样本数据，包括：获取医学影像对应的医学影像信息；获取医学影像信息的边界框坐标；根据医学影像信息的边界框坐标获取医学影像对应的当前状态值；在预设的动作集合中随机选取一个动作值，将选取的动作值确定为当前状态值对应的动作值；将医学影像信息的边界框坐标根据当前状态值对应的动作值进行改变，获得模型检测区域边界框坐标；根据模型检测区域边界框坐标获取当前状态值对应的下一状态值；根据当前状态值对应的动作值获取当前状态值对应的奖励值；当前状态值对应的奖励值用于表征当前状态值采取当前状态值对应的动作值获得的奖励值；将医学影像对应的当前状态值、当前状态值对应的动作值、当前状态值对应的奖励值和当前状态值对应的下一状态值确定为医学影像对应的预测样本数据。

可选地，预测样本获取模块被配置为通过以下方式根据医学影像信息的边界框坐标获取医学影像对应的当前状态值，包括：通过计算s_t＝x(d)获取医学影像对应的当前状态值；其中，s_t为医学影像对应的当前状态值，x()为预设的状态空间矩阵函数，d＝[b_x,b_y,b_w,b_h]为医学影像信息的边界框坐标，b_x为医学影像信息的边界框坐标的左上角横坐标，b_y为医学影像信息的边界框坐标的左上角纵坐标，b_w为医学影像信息的边界框坐标的右下角横坐标，b_h为医学影像信息的边界框坐标的右下角纵坐标。

可选地，当前状态值对应的动作值为平移动作或触发动作，预测样本获取模块被配置为通过以下方式根据动作值获取当前状态值对应的奖励值，包括：将医学影像信息的所有像素点确定为医学影像信息像素点集；将医学影像信息的边界框坐标内的所有像素点确定为当前像素点集；将模型检测区域边界框坐标内的所有像素点确定为下一像素点集；在当前状态值对应的动作值为触发动作的情况下，通过计算获取当前状态值对应的奖励值；在当前状态值对应的动作值为平移动作的情况下，通过计算r(s_t,a,s_t+1)＝sign(h(s_t+1,g)-h(s_t,g))获取当前状态值对应的奖励值；其中，r(s_t,a,s_t+1)为当前状态值对应的奖励值，s_t为当前状态值，a为当前状态值对应的动作值，η为第一预设常数，τ为第二预设常数，第一预设常数与第二预设常数皆为大于0且小于1的常数，s_t+1为当前状态值对应的下一状态值，h(s_t+1,g)为下一像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值，g为医学影像信息，h(s_t,g)为当前像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值。

可选地，训练模块被配置为通过以下方式利用训练样本数据对预设的医学影像检测模型进行更新训练，包括：将训练样本数据中的医学影像对应的当前状态值输入医学影像预测模型，获得第一动作评估值；将训练样本数据中的当前状态值输入医学影像检测模型，获得第二动作评估值；根据第一动作评估值、第二动作评估值和训练样本数据中的当前状态值对应的奖励值对损失函数进行迭代更新；根据迭代后的损失函数对医学影像预测模型的网络模型参数进行更新；将更新后的医学影像预测模型的网络模型参数确定为更新后的医学影像检测模型的网络模型参数，以更新训练医学影像检测模型。

可选地，损失函数为L(θ)＝E[(r'+γQ-Q')²]；其中，L(θ)为损失值，E()为预设的均方差函数，r'为训练样本数据中的当前状态值对应的奖励值，γ为预设的折扣率，γ为大于0且小于1的常数，Q为第二动作评估值，Q'为第一动作评估值。

可选地，用于训练医学影像检测模型的装置还包括检测模型，检测模型被配置为：将待检测医学影像输入更新后的医学影像检测模型，获得待检测医学影像对应动作集合中各动作值的第三动作评估值；获取输出的第三动作评估值中的最大值；将第三动作评估值中的最大值对应的动作值确定为检测结果；在检测结果包含触发动作的情况下，确定医学影像检测模型检测到待检测医学影像对应的医学影像信息；在检测结果不包含触发动作的情况下，确定医学影像检测模型未检测到待检测医学影像对应的医学影像信息。

结合图3所示，本公开实施例提供一种用于训练医学影像检测模型的装置，包括处理器(processor)300和存储器(memory)301。可选地，该装置还可以包括通信接口(Communication Interface)302和总线303。其中，处理器300、通信接口302、存储器301可以通过总线303完成相互间的通信。通信接口302可以用于信息传输。处理器300可以调用存储器301中的逻辑指令，以执行上述实施例的用于训练医学影像检测模型的方法。

此外，上述的存储器301中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

存储器301作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令/模块。处理器300通过运行存储在存储器301中的程序指令/模块，从而执行功能应用以及数据处理，即实现上述实施例中用于训练医学影像检测模型的方法。

存储器301可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储器301可以包括高速随机存取存储器，还可以包括非易失性存储器。

本公开实施例提供了一种设备，包含上述的用于训练医学影像检测模型的装置。可选地，设备包括计算机、笔记本电脑、智能手机、平板电脑、服务器等。该设备将获取到的医学影像输入预设的医学影像预测模型，获得预测样本数据，从预测样本数据中随机抽取出训练样本数据，并利用训练样本数据对医学影像监测模型进行更新训练。通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，不需要人工通过标记医学影像来得到训练样本，从而提高了训练样本的获取效率。

本公开实施例提供了一种可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行上述用于训练医学影像检测模型的方法。

采用本公开实施例提供的可读存储介质，将获取到的医学影像输入预设的医学影像预测模型，获得预测样本数据，从预测样本数据中随机抽取出训练样本数据，并利用训练样本数据对医学影像监测模型进行更新训练。通过医学影像预测模型获得医学影像对应的预测样本数据，进而通过预测样本数据获取用于训练医学影像检测模型的训练样本数据，不需要人工通过标记医学影像来得到训练样本，从而提高了训练样本的获取效率。

本公开实施例提供了一种计算机程序产品，所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述用于训练医学影像检测模型的方法。

上述的可读存储介质可以是暂态计算机可读存储介质，也可以是非暂态计算机可读存储介质。

本公开实施例的技术方案可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括一个或多个指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质，包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质，也可以是暂态存储介质。

以上描述和附图充分地示出了本公开的实施例，以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求，否则单独的部件和功能是可选的，并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且，本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的，除非上下文清楚地表明，否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地，如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外，当用于本申请中时，术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素，和/或组件的存在，但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下，由语句“包括一个…”限定的要素，并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中，每个实施例重点说明的可以是与其他实施例的不同之处，各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言，如果其与实施例公开的方法部分相对应，那么相关之处可以参见方法部分的描述。

本领域技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能，但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本文所披露的实施例中，所揭露的方法、产品(包括但不限于装置、设备等)，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，可以仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外，在本公开实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中，不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生，有时不同的操作或步骤之间不存在特定的顺序。例如，两个连续的操作或步骤实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

Claims

1.一种用于训练医学影像检测模型的方法，其特征在于，包括：

获取多个医学影像；

利用预设的医学影像预测模型获取各所述医学影像对应的预测样本数据；所述医学影像预测模型用于输出医学影像对应的预测样本数据；

从所述预测样本数据中随机抽取出训练样本数据；

利用所述训练样本数据对预设的医学影像检测模型进行更新训练；所述医学影像检测模型用于输出对医学影像的检测结果；

所述医学影像预测模型通过以下方式获得各医学影像对应的预测样本数据，包括：

获取所述医学影像对应的医学影像信息；

获取所述医学影像信息的边界框坐标；

根据所述医学影像信息的边界框坐标获取所述医学影像对应的当前状态值；

在预设的动作集合中随机选取一个动作值，将选取的动作值确定为所述当前状态值对应的动作值；

将所述医学影像信息的边界框坐标根据所述当前状态值对应的动作值进行改变，获得模型检测区域边界框坐标；

根据所述模型检测区域边界框坐标获取所述当前状态值对应的下一状态值；

根据所述当前状态值对应的动作值获取所述当前状态值对应的奖励值；所述当前状态值对应的奖励值用于表征所述当前状态值采取所述当前状态值对应的动作值获得的奖励值；

将所述医学影像对应的当前状态值、所述当前状态值对应的动作值、所述当前状态值对应的奖励值和所述当前状态值对应的下一状态值确定为所述医学影像对应的预测样本数据。

2.根据权利要求1所述的方法，其特征在于，根据所述医学影像信息的边界框坐标获取所述医学影像对应的当前状态值，包括：

通过计算s_t＝x(d)获取所述医学影像对应的当前状态值；其中，s_t为所述医学影像对应的当前状态值，x()为预设的状态空间矩阵函数，d＝[b_x,b_y,b_w,b_h]为所述医学影像信息的边界框坐标，b_x为所述医学影像信息的边界框坐标的左上角横坐标，b_y为所述医学影像信息的边界框坐标的左上角纵坐标，b_w为所述医学影像信息的边界框坐标的右下角横坐标，b_h为所述医学影像信息的边界框坐标的右下角纵坐标。

3.根据权利要求1所述的方法，其特征在于，所述当前状态值对应的动作值为平移动作或触发动作，根据所述动作值获取所述当前状态值对应的奖励值，包括：

将所述医学影像信息的所有像素点确定为医学影像信息像素点集；

将所述医学影像信息的边界框坐标内的所有像素点确定为当前像素点集；

将所述模型检测区域边界框坐标内的所有像素点确定为下一像素点集；

在所述当前状态值对应的动作值为触发动作的情况下，通过计算获取当前状态值对应的奖励值；在所述当前状态值对应的动作值为平移动作的情况下，通过计算r(s_t,a,s_t+1)＝sign(h(s_t+1,g)-h(s_t,g))获取当前状态值对应的奖励值；其中，r(s_t,a,s_t+1)为当前状态值对应的奖励值，s_t为所述当前状态值，a为所述当前状态值对应的动作值，s_t+1为所述所述当前状态值对应的下一状态值，η为第一预设常数，τ为第二预设常数，第一预设常数与第二预设常数皆大于0且小于1，h(s_t+1,g)为所述下一像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值，g为所述医学影像信息，h(s_t,g)为所述当前像素点集与医学影像信息像素点集之间的交集像素点数量与并集像素点数量的比值。

4.根据权利要求1所述的方法，其特征在于，利用所述训练样本数据对预设的医学影像检测模型进行更新训练，包括：

将所述训练样本数据中的医学影像对应的当前状态值输入所述医学影像预测模型，获得第一动作评估值；将所述训练样本数据中的当前状态值输入所述医学影像检测模型，获得第二动作评估值；

根据所述第一动作评估值、所述第二动作评估值和所述训练样本数据中的当前状态值对应的奖励值对损失函数进行迭代更新；

根据迭代后的损失函数对所述医学影像预测模型的网络模型参数进行更新；

将更新后的医学影像预测模型的网络模型参数确定为更新后的医学影像检测模型的网络模型参数，以更新训练所述医学影像检测模型。

5.根据权利要求4所述的方法，其特征在于，损失函数为L(θ)＝E[(r'+γQ-Q')²]；其中，L(θ)为损失值，E()为预设的均方差函数，r'为所述训练样本数据中的当前状态值对应的奖励值，γ为预设的折扣率，γ大于0且小于1，Q为所述第二动作评估值，Q'为所述第一动作评估值。

6.根据权利要求1至5任一项所述的方法，其特征在于，利用所述训练样本数据对预设的医学影像检测模型进行更新训练后，还包括：

将待检测医学影像输入更新后的医学影像检测模型，获得所述待检测医学影像对应动作集合中各动作值的第三动作评估值；

获取输出的所述第三动作评估值中的最大值；

将所述第三动作评估值中的最大值对应的动作值确定为检测结果；

在所述检测结果包含触发动作的情况下，确定所述医学影像检测模型检测到所述待检测医学影像对应的医学影像信息；在所述检测结果不包含触发动作的情况下，确定所述医学影像检测模型未检测到所述待检测医学影像对应的医学影像信息。

7.一种用于训练医学影像检测模型的装置，其特征在于，包括：

医学影像获取模块，被配置为获取多个医学影像；

预测样本获取模块，被配置为利用预设的医学影像预测模型获取各所述医学影像对应的预测样本数据；所述医学影像预测模型用于输出医学影像对应的预测样本数据；

抽取模块，被配置为从所述预测样本数据中随机抽取出训练样本数据；

训练模块，被配置为利用所述训练样本数据对预设的医学影像检测模型进行更新训练；所述医学影像检测模型用于输出对医学影像的检测结果；

所述医学影像预测模型获取各所述医学影像对应的预测样本数据，包括：

获取所述医学影像对应的医学影像信息；

获取所述医学影像信息的边界框坐标；

8.一种用于训练医学影像检测模型的装置，包括处理器和存储有程序指令的存储器，其特征在于，所述处理器被配置为在运行所述程序指令时，执行如权利要求1至6任一项所述的用于训练医学影像检测模型的方法。

9.一种设备，其特征在于，包括如权利要求7所述的用于训练医学影像检测模型的装置。

10.一种可读存储介质，存储有程序指令，其特征在于，所述程序指令在运行时，执行如权利要求1至6任一项所述的用于训练医学影像检测模型的方法。