CN117173491A - 医学图像的标注方法、装置、电子设备及存储介质 - Google Patents

医学图像的标注方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117173491A
CN117173491A CN202311378541.3A CN202311378541A CN117173491A CN 117173491 A CN117173491 A CN 117173491A CN 202311378541 A CN202311378541 A CN 202311378541A CN 117173491 A CN117173491 A CN 117173491A
Authority
CN
China
Prior art keywords
medical image
label information
preset
target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311378541.3A
Other languages
English (en)
Other versions
CN117173491B (zh
Inventor
吴婉雯
王羽嗣
刘绍毅
周可
王云忠
刘思德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Side Medical Technology Co ltd
Original Assignee
Guangzhou Side Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Side Medical Technology Co ltd filed Critical Guangzhou Side Medical Technology Co ltd
Priority to CN202311378541.3A priority Critical patent/CN117173491B/zh
Publication of CN117173491A publication Critical patent/CN117173491A/zh
Application granted granted Critical
Publication of CN117173491B publication Critical patent/CN117173491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种医学图像的标注方法、装置、电子设备及存储介质,涉及图像处理技术领域,其中方法包括:在获取到未标注医学图像的情况下,执行以下至少一项操作:基于未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各预设标签信息对应的决策值进行迭代更新;基于各更新决策值,确定未标注医学图像的第一目标标签信息;或者,将未标注医学图像输入目标医学图像识别模型,得到目标医学图像识别模型输出的与未标注医学图像关联的第一标签信息;基于第一标签信息及来自用户的第二输入,确定未标注医学图像的第二目标标签信息。通过上述方法,提高了医学图像的标注效率,减少了对人力资源的需求。

Description

医学图像的标注方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种医学图像的标注方法、装置、电子设备及存储介质。
背景技术
目前,人工智能技术在医学图像识别方向已获取重大的突破,尤其是利用基于深度学习的卷积神经网络模型;它可以自主提取并学习图片特征,在医学图像识别方向发挥着独特的优势。
在利用神经网络模型对医学图像进行识别前,神经网络模型需要大量的训练样本来进行训练。但在相关技术中,医学图像数据库中存储的图像存在质量参差不齐、包含大量冗杂图片的问题,这意味着,构建模型的训练样本集需要大量的人力资源对医学图像进行筛选及标注;另外,由于医学图像的专业性,该工作要求工作人员不仅掌握神经网络的相关知识,还掌握一定医学相关知识;而目前这一类人才是相对缺乏的。
因此,如何快速地对医学图像样本进行标注,减少对人力资源的需求以及降低对标注人员的标准,是目前亟待解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种医学图像的标注方法、装置、电子设备及存储介质。
本发明提供一种医学图像的标注方法,包括:
在获取到未标注医学图像的情况下,执行以下至少一项操作:
基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,其中,所述第一输入表示当前迭代轮次下预设标签信息是否正确,所述决策值用于表征在当前迭代轮次下预设标签信息与所述未标注医学图像的关联程度;基于各更新决策值,确定所述未标注医学图像的第一目标标签信息,所述第一目标标签信息为更新决策值达到目标阈值时所对应的预设标签信息;
将所述未标注医学图像输入目标医学图像识别模型,得到所述目标医学图像识别模型输出的与所述未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,所述第二输入表示所述第一标签信息是否正确。
可选地,所述预设标签信息包括所述未标注医学图像的图像类别以及至少一个预设标签。
可选地,所述基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,包括:
步骤A:从预设的标签信息集合中随机获取一个预设标签信息;
步骤B:基于所述第一输入,确定在当前迭代轮次下预设标签信息的瞬时奖励评分,所述瞬时奖励评分用于表征用户针对当前迭代轮次预设标签信息的准确性评分;
步骤C:基于所述瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值;
步骤D:迭代执行步骤A-步骤C,对各所述预设标签信息对应的决策值进行迭代更新。
可选地,所述基于所述瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值,包括:
将当前迭代轮次下预设标签信息的瞬时奖励评分减去上一迭代轮次下预设标签信息的瞬时奖励评分,得到反馈值;
基于所述反馈值,确定当前迭代轮次预设标签信息对应的更新决策值。
可选地,所述标签信息集合,通过以下方式构建:
基于当前的标注功能,建立标签数据库;所述标注功能用于表征对当前所述未标注医学图像进行标注时,所述预设标签信息所属的医学领域;所述标签数据库中包括至少一个预设标签,各所述预设标签与所述标注功能相关联;
从预设数据库中获取至少一个第一医学图像,针对每一个第一医学图像,基于所述第一医学图像的图像特征,确定所述第一医学图像的图像类别;各所述第一医学图像的图像类别与所述标注功能相关联;
从所述标签数据库中为所述第一医学图像随机分配至少一个预设标签;
基于所述图像类别及各所述预设标签,生成所述第一医学图像的至少一个预设标签信息;
基于每一个第一医学图像的各预设标签信息,构建所述标签信息集合。
可选地,所述基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,包括:
在所述第二输入表示所述第一标签信息正确的情况下,将所述第一标签信息确定为所述第二目标标签信息;
在所述第二输入表示所述第一标签信息不正确的情况下,接收来自用户的第三输入,所述第三输入携带针对所述第一标签信息的更新信息;基于所述更新信息对所述第一标签信息进行更新,得到所述第二目标标签信息。
可选地,所述第三输入还携带目标标注信息,所述目标标注信息表征所述用户对所述未标注医学图像的标注结果。
本发明还提供一种医学图像的标注装置,包括:
执行模块,用于在获取到未标注医学图像的情况下,执行以下至少一项操作:
基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,其中,所述第一输入表示当前迭代轮次下预设标签信息是否正确,所述决策值用于表征在当前迭代轮次下预设标签信息与所述未标注医学图像的关联程度;基于各更新决策值,确定所述未标注医学图像的第一目标标签信息,所述第一目标标签信息为更新决策值达到目标阈值时所对应的预设标签信息;
将所述未标注医学图像输入目标医学图像识别模型,得到所述目标医学图像识别模型输出的与所述未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,所述第二输入表示所述第一标签信息是否正确。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述医学图像的标注方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述医学图像的标注方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述医学图像的标注方法。
本发明提供的医学图像的标注方法、装置、电子设备及存储介质,在获取到未标注医学图像的情况下,执行以下至少一项操作:基于未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各预设标签信息对应的决策值进行迭代更新,其中,第一输入表示当前迭代轮次下预设标签信息是否正确,决策值用于表征在当前迭代轮次下预设标签信息与未标注医学图像的关联程度;基于各更新决策值,确定未标注医学图像的第一目标标签信息,第一目标标签信息为更新决策值达到目标阈值的预设标签信息;通过上述方法,可以在不需要建立复杂的神经网络模型的前提下,利用强化学习的原理对医学图像进行标注,在不断地循环迭代及试错的过程中,达到将医学图像正确标注的效果;
或者,将未标注医学图像输入目标医学图像识别模型,得到目标医学图像识别模型输出的与未标注医学图像关联的第一标签信息,其中,目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;然后基于第一标签信息及来自用户的第二输入,确定未标注医学图像的第二目标标签信息,第二输入表示所述第一标签信息是否正确;通过上述方法,在神经网络模型的基础上,利用主动学习的原理,使医学图像识别模型自主挑选有标注价值的医疗图片,即,基于来自用户的第二输入,判断第一标签信息是否正确,从而将正确的第一标签信息直接确定为第二目标标签信息,将不正确的第一标签信息挑选出来让标注人员对此进行重点标注。综上所述,在获取到未标注医学图像的情况下,通过执行上述至少一项操作,提高了医学图像的标注效率,减少了对人力资源的需求,而且,还能降低对同时拥有两个领域知识的稀缺人才的需求。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的医学图像的标注方法的流程示意图之一;
图2是本发明提供的评分界面的示意图之一;
图3是本发明提供的评分界面的示意图之二;
图4是本发明提供的更新标签信息的界面示意图;
图5是本发明提供的更新病灶边界信息的界面示意图;
图6是本发明提供的医学图像的标注方法的流程示意图之二;
图7是本发明提供的医学图像的标注装置的结构示意图;
图8是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图6对本发明提供的医学图像的标注方法进行具体描述。图1是本发明提供的医学图像的标注方法的流程示意图之一,参见图1所示,该方法包括步骤101,其中:
步骤101、在获取到未标注医学图像的情况下,执行以下至少一项操作:
基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,其中,所述第一输入表示当前迭代轮次下预设标签信息是否正确,所述决策值用于表征在当前迭代轮次下预设标签信息与所述未标注医学图像的关联程度;基于各更新决策值,确定所述未标注医学图像的第一目标标签信息,所述第一目标标签信息为更新决策值达到目标阈值时所对应的预设标签信息;
将所述未标注医学图像输入目标医学图像识别模型,得到所述目标医学图像识别模型输出的与所述未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,所述第二输入表示所述第一标签信息是否正确。
首先需要说明的是,本发明的执行主体可以是能够实现医学图像标注的任何电子设备,例如可以为智能手机、智能手表、台式电脑、手提电脑等任何一种。
在本发明实施例中,医学图像例如可以是器官部位图像、病灶图像、内镜图像等。
在获取到未标注医学图像的情况下,至少执行以下之一:
第一部分,是利用强化学习的原理构建对医学图像进行标注的功能,在不需要建立复杂的神经网络模型的前提下,通过不断循环迭代、试错,达到将医学图像正确标注的效果。
具体地,首先需要获取未标注医学图像关联的至少一个预设标签信息,以及来自用户的第一输入,其中,第一输入表示当前迭代轮次下预设标签信息是否正确。
可选地,所述预设标签信息包括所述未标注医学图像的图像类别以及至少一个预设标签。
预设标签信息可以表示为(类别,预设标签),并且预设标签信息对应有决策值Q,其中,Q用于表征在当前迭代轮次下预设标签信息与未标注医学图像的关联程度。
例如,未标注医学图像的预设标签信息可以是(类别1,贲门)Q=60;(类别2,贲门+胃底)Q=80等。
在实际应用中,在第一输入表示当前迭代轮次下预设标签信息正确的情况下,需要增大预设标签信息对应的决策值;在第一输入表示当前迭代轮次下预设标签信息不正确的情况下,需要减小预设标签信息对应的决策值,从而实现对决策值进行更新。
例如,针对未标注医学图像A,其关联的预设标签信息包括:(类别1,贲门)Q=60、(类别1,贲门+胃底)Q=70、(类别2,贲门)Q=20、(类别2,贲门+胃底)Q=90。
首先,获取图像A关联的预设标签信息(类别1,贲门)Q=60,以及来自用户的第一输入,第一输入表示当前迭代轮次下预设标签信息正确,则增大预设标签信息对应的决策值,即(类别1,贲门)Q=70。
通过上述方法,对图像A的各预设标签信息对应的决策值进行迭代更新;然后基于各更新决策值,将更新决策值达到目标阈值时所对应的预设标签信息确定为图像A的第一目标标签信息。
第二部分,是在神经网络模型,例如卷积神经网络模型(Convolutional NeuralNetworks,CNN)的基础上,利用主动学习的原理,使模型输出医学图像的标签信息,然后结合标注人员的专业知识,确定未标注医学图像的第二目标标签信息。
具体地,首先利用已标注的医学图像样本对初始医学图像识别模型进行训练得到目标医学图像识别模型,其中,医学图像识别模型可以是CNN模型、循环神经网络(Recurrent Neural Network,RNN)、Transformer模型等。
然后将未标注医学图像输入目标医学图像识别模型,得到目标医学图像识别模型输出的第一标签信息,例如(类别1,贲门)。
然后基于来自用户的第二输入,判断第一标签信息是否正确,从而将正确的第一标签信息直接确定为第二目标标签信息,将不正确的第一标签信息挑选出来让标注人员对此进行重点标注。
本发明提供的医学图像的标注方法,在获取到未标注医学图像的情况下,执行以下至少一项操作:基于未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各预设标签信息对应的决策值进行迭代更新,其中,第一输入表示当前迭代轮次下预设标签信息是否正确,决策值用于表征在当前迭代轮次下预设标签信息与未标注医学图像的关联程度;基于各更新决策值,确定未标注医学图像的第一目标标签信息,第一目标标签信息为更新决策值达到目标阈值的预设标签信息;通过上述方法,可以在不需要建立复杂的神经网络模型的前提下,利用强化学习的原理对医学图像进行标注,在不断地循环迭代及试错的过程中,达到将医学图像正确标注的效果;
或者,将未标注医学图像输入目标医学图像识别模型,得到目标医学图像识别模型输出的与未标注医学图像关联的第一标签信息,其中,目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;然后基于第一标签信息及来自用户的第二输入,确定未标注医学图像的第二目标标签信息,第二输入表示所述第一标签信息是否正确;通过上述方法,在神经网络模型的基础上,利用主动学习的原理,使医学图像识别模型自主挑选有标注价值的医疗图片,即,基于来自用户的第二输入,判断第一标签信息是否正确,从而将正确的第一标签信息直接确定为第二目标标签信息,将不正确的第一标签信息挑选出来让标注人员对此进行重点标注。综上所述,在获取到未标注医学图像的情况下,通过执行上述至少一项操作,提高了医学图像的标注效率,减少了对人力资源的需求,而且,还能降低对同时拥有两个领域知识的稀缺人才的需求。
可选地,所述基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,具体可以通过以下步骤实现:
步骤A:从预设的标签信息集合中随机获取一个预设标签信息;
步骤B:基于所述第一输入,确定在当前迭代轮次下预设标签信息的瞬时奖励评分,所述瞬时奖励评分用于表征用户针对当前迭代轮次预设标签信息的准确性评分;
步骤C:基于所述瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值;
步骤D:迭代执行步骤A-步骤C,对各所述预设标签信息对应的决策值进行迭代更新。
在本实施例中,每个未标注医学图像都关联有至少一个预设标签信息,各预设标签信息都包含于预设的标签信息集合中。
因此,在从预设的标签信息集合中随机获取一个预设标签信息之前,需要构建标签信息集合。可选地,标签信息集合可以通过以下步骤构建:
步骤1)、基于当前的标注功能,建立标签数据库;所述标注功能用于表征对当前所述未标注医学图像进行标注时,所述预设标签信息所属的医学领域;所述标签数据库中包括至少一个预设标签,各所述预设标签与所述标注功能相关联。
在本发明实施例中,标签数据库的建立与当前的标注功能相关联。例如,当前需要对未标注图像标注与“胃部解剖位置”相关联的预设标签信息,则标签数据库中的预设标签就与“胃部解剖位置”相关联。预设标签例如可以是“贲门”、“胃底”、“胃体”等。
需要说明的是,标签数据库中的各预设标签来源于具有权威的医学专业的书籍、指南等。
步骤2)、从预设数据库中获取至少一个第一医学图像,针对每一个第一医学图像,基于所述第一医学图像的图像特征,确定所述第一医学图像的图像类别;各所述第一医学图像的图像类别与所述标注功能相关联;
在本发明实施例中,预设数据库中的第一医学图像,与此次所服务的对象或所起到的功能(即,当前的标注功能)相关联。例如,在当前的标注功能是用于识别胃的解剖部位的场景的情况下,预设数据库中的第一医学图像包括胃底、贲门、胃体等。又例如,在当前的标注功能是用于识别胃常见病灶的场景的情况下,预设数据库中的第一医学图像为存在病灶的图像。
图像特征例如图像的颜色、图像中器官、解剖部位的皱襞走向等。
例如,食管和胃腔,正常食管黏膜呈粉红色,与橘红色的胃黏膜相比色调要淡得多;因此基于医学图像的像素值,可以判断医学图像的图像类别。
又例如,正常的胃黏膜都呈现橘红色,但是胃腔里不同的解剖部位都具有不同的黏膜皱襞走向,如贲门闭合时黏膜皱襞呈梅花状,幽门闭合时呈放射状,胃底黏膜皱襞排列杂乱呈脑回状,胃体黏膜皱襞呈纵行等,基于图像中器官的皱襞走向,可以判断医学图像的图像类别。可选地,一张医学图像可能出现不止一个部位时,为了标注更精确,可能需要复合标签,如(类别1,胃底+贲门)。
步骤3)、从所述标签数据库中为所述第一医学图像随机分配至少一个预设标签。
在本发明实施例中,根据第一医学图像的具体器官部位,从标签数据库中确定预设标签,例如,第一医学图像为胃解剖部位,则预设标签可以包括贲门、胃底、胃体上部、胃体下部等。
步骤4)、基于所述图像类别及各所述预设标签,生成所述第一医学图像的至少一个预设标签信息。
在本发明实施例中,在为第一医学图像随机分配至少一个预设标签之后,基于图像类别及各预设标签,可以生成第一医学图像关联的多个预设标签信息。表1示出了第一医学图像关联的所有预设标签信息,其中,Q表示决策值。
表1
步骤5)、基于每一个第一医学图像的各预设标签信息,构建所述标签信息集合。
需要说明的是,由每一个第一医学图像的各预设标签信息构建的标签信息集合中有每一个未标注医学图像关联的所有预设标签信息,通过用户对标签信息集合中所有预设标签信息的决策值进行迭代更新,可以在不断地循环迭代及试错的过程中,达到将医学图像正确标注的效果。
在构建好预设的标签信息集合后,针对任一未标注医学图像,首先从标签信息集合中随机获取一个预设标签信息,例如(类别1-贲门)Q=60。
然后,接收用户针对该预设标签信息的第一输入,确定在当前迭代轮次下预设标签信息的瞬时奖励评分。
例如,在当前迭代轮次下预设标签信息正确的情况下,瞬时奖励评分为+10;在预设标签信息不正确的情况下,瞬时奖励评分为-10。
然后,基于瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值,具体可以通过以下步骤实现:
步骤[1]、将当前迭代轮次下预设标签信息的瞬时奖励评分减去上一迭代轮次下预设标签信息的瞬时奖励评分,得到反馈值;
步骤[2]、基于所述反馈值,确定当前迭代轮次预设标签信息对应的更新决策值。
也就是说,负的反馈值,代表当前迭代轮次的识别结果不好,就需要降低决策值;正的反馈值,代表当前迭代轮次的识别结果比之前的好,就升高决策值。
最后,迭代执行步骤A-步骤C,对各预设标签信息对应的决策值进行迭代更新,从而将更新决策值达到目标阈值(例如Q=100)的预设标签信息确定为医学图像关联的第一目标标签信息。
下面结合具体实施例进行进一步详细说明:
标注人员只需将所有未标注医学图像全部导入执行主体,并设定相关标签的名称,执行主体则随机分配每张图片的预设标签信息;标注人员根据其专业知识,针对该医学图像,对执行主体随机分配的预设标签信息进行打分,例如,针对完全准确的预设标签信息,选择“100分”;针对不准确的预设标签信息,则选择“0分”;循环多次,直至所有未标注医学图像均有决策值均达到100的预设标签信息,并将该预设标签信息确定为医学图像关联的第一目标标签信息,纳入已标注的数据库。
图2是本发明提供的评分界面的示意图之一,如图2所示,针对医学图像,若预设标签信息正确,用户可以点击“正确”按钮组件,表示评分为“100分”;若预设标签信息不正确,用户可以点击“错误”按钮组件,表示评分为“0分”。
可选地,所述基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,具体可以通过以下步骤实现:
情形一、在所述第二输入表示所述第一标签信息正确的情况下,将所述第一标签信息确定为所述第二目标标签信息。
情形二、在所述第二输入指示所述第一标签信息不正确的情况下,接收来自用户的第三输入,所述第三输入携带针对所述第一标签信息的更新信息;基于所述更新信息对所述第一标签信息进行更新,得到所述第二目标标签信息。
也就是说,在第二输入表示第一标签信息不正确的情况下,则表示需要人工对医学图像进行标注,实现对第一标签信息的更新。
可选地,所述第三输入还携带目标标注信息,所述目标标注信息表征所述用户对所述未标注医学图像的标注结果。
在本发明实施例中,目标标注信息包括部位识别信息、部位描边信息、病灶描边信息等,用户可以基于模型的功能(例如,识别解剖部位、病灶图片或描绘部位、病灶的边界)选择性的对医学图像标注部位识别信息、部位描边信息、病灶描边信息等。
下面结合具体实施例进行进一步详细说明:
步骤1、首先从数据库(未标注)内随机选择一部分作为样本图片,经人工处理后图片构建成已标注的图片数据集;利用已标注的图片数据集建立医学图像初始识别模型。
步骤2、从医学图像数据库(未标注)内随机抽取一部分的图像,构成训练数据集,并输入至初始模型,进行识别或描边。其中,描边是指对图像中病灶的边界进行描绘,形成病灶区域。
步骤3、对步骤2的模型识别结果进行评分。
步骤4、将步骤3所获取的评分与预设的达标标准相对比,若该图片的分数低于达标标准,则将该分数相对应的图片从内镜图像数据库(未标注)中移出到需人工标注的图片数据库内,构建需人工标注的数据库。
通过上述方法,可以从大量的冗杂、质量参差不齐的图片中选取最有价值的图片进行人工标记。
步骤5、根据该模型的功能(例如,识别解剖部位、病灶图片或描绘部位、病灶的边界)对步骤4构建的“需人工标注的图片数据库”内的图片进行人工标记,或根据模型输出的结果进行修改。
需要说明的是,在对图片进行标注的同时,执行主体的显示界面可同时显示步骤2中模型对图片的识别结果或描边结果。人工标注后的图片自动纳入已标注图片数据集;
步骤6、利用更新后的已标注图片数据集继续对模型不断进行训练和测试,提高该模型医学图像识别的准确性。
例如,标注人员将未标注的医学图像全部导入执行主体,执行主体根据模型识别结果输出第一标签信息;标注人员根据其专业知识,针对该图片,对第一标签信息进行打分,完全准确则选择“100分”,若不准确,则选择“0分”;执行主体将识别结果未达标的图片提取出来,以便进行人工标注,标注后的图片与达标的已标注图片纳入已标注的数据库,用于迭代初始模型。
需要说明的是,在对第一标签信息打分时,还可以对病灶边界信息的准确性(即描绘边界的准确性)进行打分,例如,评分为优(100)、良(80)、中(60)、差(40)。
图3是本发明提供的评分界面的示意图之二,如图3所示,是对病灶边界信息的准确性进行评分的界面示意图。
图4是本发明提供的更新标签信息的界面示意图,如图4所示,是对第一标签信息进行修改的界面示意图。在图4中,用户点击“模型识别标签”按钮组件,可以显示目标图像识别模型输出的第一标签信息;用户点击“人工修改标注的标签”按钮组件,可以实现对第一标签信息进行更新。
图5是本发明提供的更新病灶边界信息的界面示意图,如图5所示,用户点击“基于模型”按钮组件,可以得到目标图像识别模型输出的病灶边界信息,用户可在此基础上进行修改;用户点击“重新描边”按钮组件,可以实现对病灶边界信息进行修改。
其中,“模型描边结果”区域,用于显示目标图像识别模型输出的病灶边界信息,“人工修改描边”区域,用于显示更新后的病灶边界信息。
图6是本发明提供的医学图像的标注方法的流程示意图之二,参见图6所示,该方法包括步骤601至步骤608,其中:
步骤601、获取未标注医学图像。
需要说明的是,以下步骤602-606与步骤607-608的执行顺序不分先后。
步骤602、从预设的标签信息集合中随机获取一个预设标签信息。
步骤603、基于第一输入,确定在当前迭代轮次下预设标签信息的瞬时奖励评分,其中,瞬时奖励评分用于表征用户针对当前迭代轮次预设标签信息的准确性评分。
步骤604、将当前迭代轮次下预设标签信息的瞬时奖励评分减去上一迭代轮次下预设标签信息的瞬时奖励评分,得到反馈值;
步骤605、基于反馈值,确定当前迭代轮次预设标签信息对应的更新决策值,迭代执行步骤602-步骤605,对各预设标签信息对应的决策值进行迭代更新。
步骤606、将更新决策值达到目标阈值的预设标签信息确定为未标注医学图像的第一目标标签信息。
步骤607、将未标注医学图像输入目标医学图像识别模型,得到目标医学图像识别模型输出的与未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的。
步骤608、在来自用户的第二输入表示第一标签信息正确的情况下,将第一标签信息确定为所述第二目标标签信息;在来自用户的第二输入表示第一标签信息不正确的情况下,接收来自用户的第三输入,其中,第三输入携带针对第一标签信息的更新信息;基于更新信息对第一标签信息进行更新,得到第二目标标签信息。
下面对本发明提供的医学图像的标注装置进行描述,下文描述的医学图像的标注装置与上文描述的医学图像的标注方法可相互对应参照。图7是本发明提供的医学图像的标注装置的结构示意图,如图7所示,该医学图像的标注装置700包括:执行模块701,其中:
执行模块701,用于在获取到未标注医学图像的情况下,执行以下至少一项操作:
基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,其中,所述第一输入表示当前迭代轮次下预设标签信息是否正确,所述决策值用于表征在当前迭代轮次下预设标签信息与所述未标注医学图像的关联程度;基于各更新决策值,确定所述未标注医学图像的第一目标标签信息,所述第一目标标签信息为更新决策值达到目标阈值时所对应的预设标签信息;
将所述未标注医学图像输入目标医学图像识别模型,得到所述目标医学图像识别模型输出的与所述未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,所述第二输入表示所述第一标签信息是否正确。
本发明提供的医学图像的标注装置,在获取到未标注医学图像的情况下,执行以下至少一项操作:基于未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各预设标签信息对应的决策值进行迭代更新,其中,第一输入表示当前迭代轮次下预设标签信息是否正确,决策值用于表征在当前迭代轮次下预设标签信息与未标注医学图像的关联程度;基于各更新决策值,确定未标注医学图像的第一目标标签信息,第一目标标签信息为更新决策值达到目标阈值的预设标签信息;通过上述方法,可以在不需要建立复杂的神经网络模型的前提下,利用强化学习的原理对医学图像进行标注,在不断地循环迭代及试错的过程中,达到将医学图像正确标注的效果;
或者,将未标注医学图像输入目标医学图像识别模型,得到目标医学图像识别模型输出的与未标注医学图像关联的第一标签信息,其中,目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;然后基于第一标签信息及来自用户的第二输入,确定未标注医学图像的第二目标标签信息,第二输入表示所述第一标签信息是否正确;通过上述方法,在神经网络模型的基础上,利用主动学习的原理,使医学图像识别模型自主挑选有标注价值的医疗图片,即,基于来自用户的第二输入,判断第一标签信息是否正确,从而将正确的第一标签信息直接确定为第二目标标签信息,将不正确的第一标签信息挑选出来让标注人员对此进行重点标注。综上所述,在获取到未标注医学图像的情况下,通过执行上述至少一项操作,提高了医学图像的标注效率,减少了对人力资源的需求,而且,还能降低对同时拥有两个领域知识的稀缺人才的需求。
可选地,所述预设标签信息包括所述未标注医学图像的图像类别以及至少一个预设标签。
可选地,所述执行模块701,进一步用于:
步骤A:从预设的标签信息集合中随机获取一个预设标签信息;
步骤B:基于所述第一输入,确定在当前迭代轮次下预设标签信息的瞬时奖励评分,所述瞬时奖励评分用于表征用户针对当前迭代轮次预设标签信息的准确性评分;
步骤C:基于所述瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值;
步骤D:迭代执行步骤A-步骤C,对各所述预设标签信息对应的决策值进行迭代更新。
可选地,所述执行模块701,进一步用于:
将当前迭代轮次下预设标签信息的瞬时奖励评分减去上一迭代轮次下预设标签信息的瞬时奖励评分,得到反馈值;
基于所述反馈值,确定当前迭代轮次预设标签信息对应的更新决策值。
可选地,所述标签信息集合,通过以下方式构建:
从预设数据库中获取至少一个第一医学图像,针对每一个第一医学基于当前的标注功能,建立标签数据库;所述标注功能用于表征对当前所述未标注医学图像进行标注时,所述预设标签信息所属的医学领域;所述标签数据库中包括至少一个预设标签,各所述预设标签与所述标注功能相关联;
从预设数据库中获取至少一个第一医学图像,针对每一个第一医学图像,基于所述第一医学图像的图像特征,确定所述第一医学图像的图像类别;各所述第一医学图像的图像类别与所述标注功能相关联;
从所述标签数据库中为所述第一医学图像随机分配至少一个预设标签;
基于所述图像类别及各所述预设标签,生成所述第一医学图像的至少一个预设标签信息;
基于每一个第一医学图像的各预设标签信息,构建所述标签信息集合。
可选地,所述执行模块701,进一步用于:
在所述第二输入表示所述第一标签信息正确的情况下,将所述第一标签信息确定为所述第二目标标签信息;
在所述第二输入表示所述第一标签信息不正确的情况下,接收来自用户的第三输入,所述第三输入携带针对所述第一标签信息的更新信息;基于所述更新信息对所述第一标签信息进行更新,得到所述第二目标标签信息。
可选地,所述第三输入还携带目标标注信息,所述目标标注信息表征所述用户对所述未标注医学图像的标注结果。
图8是本发明提供的电子设备的结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如上述图1所示的医学图像的标注方法。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述如图1所示的医学图像的标注方法。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述如图1所示的医学图像的标注方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种医学图像的标注方法,其特征在于,包括:
在获取到未标注医学图像的情况下,执行以下至少一项操作:
基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,其中,所述第一输入表示当前迭代轮次下预设标签信息是否正确,所述决策值用于表征在当前迭代轮次下预设标签信息与所述未标注医学图像的关联程度;基于各更新决策值,确定所述未标注医学图像的第一目标标签信息,所述第一目标标签信息为更新决策值达到目标阈值时所对应的预设标签信息;
将所述未标注医学图像输入目标医学图像识别模型,得到所述目标医学图像识别模型输出的与所述未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,所述第二输入表示所述第一标签信息是否正确。
2.根据权利要求1所述的医学图像的标注方法,其特征在于,所述预设标签信息包括所述未标注医学图像的图像类别以及至少一个预设标签。
3.根据权利要求1或2所述的医学图像的标注方法,其特征在于,所述基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,包括:
步骤A:从预设的标签信息集合中随机获取一个预设标签信息;
步骤B:基于所述第一输入,确定在当前迭代轮次下预设标签信息的瞬时奖励评分,所述瞬时奖励评分用于表征用户针对当前迭代轮次预设标签信息的准确性评分;
步骤C:基于所述瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值;
步骤D:迭代执行步骤A-步骤C,对各所述预设标签信息对应的决策值进行迭代更新。
4.根据权利要求3所述的医学图像的标注方法,其特征在于,所述基于所述瞬时奖励评分,确定当前迭代轮次预设标签信息对应的更新决策值,包括:
将当前迭代轮次下预设标签信息的瞬时奖励评分减去上一迭代轮次下预设标签信息的瞬时奖励评分,得到反馈值;
基于所述反馈值,确定当前迭代轮次预设标签信息对应的更新决策值。
5.根据权利要求3所述的医学图像的标注方法,其特征在于,所述标签信息集合,通过以下方式构建:
基于当前的标注功能,建立标签数据库;所述标注功能用于表征对当前所述未标注医学图像进行标注时,所述预设标签信息所属的医学领域;所述标签数据库中包括至少一个预设标签,各所述预设标签与所述标注功能相关联;
从预设数据库中获取至少一个第一医学图像,针对每一个第一医学图像,基于所述第一医学图像的图像特征,确定所述第一医学图像的图像类别;各所述第一医学图像的图像类别与所述标注功能相关联;
从所述标签数据库中为所述第一医学图像随机分配至少一个预设标签;
基于所述图像类别及各所述预设标签,生成所述第一医学图像的至少一个预设标签信息;
基于每一个第一医学图像的各预设标签信息,构建所述标签信息集合。
6.根据权利要求1所述的医学图像的标注方法,其特征在于,所述基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,包括:
在所述第二输入表示所述第一标签信息正确的情况下,将所述第一标签信息确定为所述第二目标标签信息;
在所述第二输入表示所述第一标签信息不正确的情况下,接收来自用户的第三输入,所述第三输入携带针对所述第一标签信息的更新信息;基于所述更新信息对所述第一标签信息进行更新,得到所述第二目标标签信息。
7.根据权利要求6所述的医学图像的标注方法,其特征在于,所述第三输入还携带目标标注信息,所述目标标注信息表征所述用户对所述未标注医学图像的标注结果。
8.一种医学图像的标注装置,其特征在于,包括:
执行模块,用于在获取到未标注医学图像的情况下,执行以下至少一项操作:
基于所述未标注医学图像关联的至少一个预设标签信息及来自用户的第一输入,对各所述预设标签信息对应的决策值进行迭代更新,其中,所述第一输入表示当前迭代轮次下预设标签信息是否正确,所述决策值用于表征在当前迭代轮次下预设标签信息与所述未标注医学图像的关联程度;基于各更新决策值,确定所述未标注医学图像的第一目标标签信息,所述第一目标标签信息为更新决策值达到目标阈值时所对应的预设标签信息;
将所述未标注医学图像输入目标医学图像识别模型,得到所述目标医学图像识别模型输出的与所述未标注医学图像关联的第一标签信息,其中,所述目标医学图像识别模型是基于医学图像样本对初始医学图像识别模型进行训练得到的;基于所述第一标签信息及来自用户的第二输入,确定所述未标注医学图像的第二目标标签信息,所述第二输入表示所述第一标签信息是否正确。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述医学图像的标注方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述医学图像的标注方法。
CN202311378541.3A 2023-10-24 2023-10-24 医学图像的标注方法、装置、电子设备及存储介质 Active CN117173491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311378541.3A CN117173491B (zh) 2023-10-24 2023-10-24 医学图像的标注方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311378541.3A CN117173491B (zh) 2023-10-24 2023-10-24 医学图像的标注方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117173491A true CN117173491A (zh) 2023-12-05
CN117173491B CN117173491B (zh) 2024-02-23

Family

ID=88937711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311378541.3A Active CN117173491B (zh) 2023-10-24 2023-10-24 医学图像的标注方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117173491B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659692A (zh) * 2019-09-26 2020-01-07 重庆大学 基于强化学习和深度神经网络的病理图像自动标注方法
CN112287994A (zh) * 2020-10-26 2021-01-29 北京嘀嘀无限科技发展有限公司 伪标签处理方法、装置、设备及计算机可读存储介质
US20210034966A1 (en) * 2019-07-29 2021-02-04 Beijing Xiaomi Intelligent Technology Co., Ltd. Method and device for natural language processing and storage medium
CN113076950A (zh) * 2021-04-01 2021-07-06 安徽酷哇机器人有限公司 一种基于深度强化学习的图像数据自动化标注方法及系统
CN116312986A (zh) * 2023-03-14 2023-06-23 南通奇铭影像科技有限公司 三维医学影像标注方法、装置、电子设备及可读存储介质
CN116682399A (zh) * 2023-06-13 2023-09-01 上海君依悦远健康科技有限公司 一种音乐生成方法、系统、电子设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210034966A1 (en) * 2019-07-29 2021-02-04 Beijing Xiaomi Intelligent Technology Co., Ltd. Method and device for natural language processing and storage medium
CN110659692A (zh) * 2019-09-26 2020-01-07 重庆大学 基于强化学习和深度神经网络的病理图像自动标注方法
CN112287994A (zh) * 2020-10-26 2021-01-29 北京嘀嘀无限科技发展有限公司 伪标签处理方法、装置、设备及计算机可读存储介质
CN113076950A (zh) * 2021-04-01 2021-07-06 安徽酷哇机器人有限公司 一种基于深度强化学习的图像数据自动化标注方法及系统
CN116312986A (zh) * 2023-03-14 2023-06-23 南通奇铭影像科技有限公司 三维医学影像标注方法、装置、电子设备及可读存储介质
CN116682399A (zh) * 2023-06-13 2023-09-01 上海君依悦远健康科技有限公司 一种音乐生成方法、系统、电子设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KAIYU LI ET AL.: "CrowdRL: An End-to-End Reinforcement Learning Framework for Data Labelling", 2021 IEEE 37TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE), pages 289 - 300 *

Also Published As

Publication number Publication date
CN117173491B (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN110750959B (zh) 文本信息处理的方法、模型训练的方法以及相关装置
CN111933251B (zh) 一种医学影像标注方法及系统
US10579737B2 (en) Natural language image editing annotation framework
CN108009589A (zh) 样本数据处理方法、装置和计算机可读存储介质
US20230119593A1 (en) Method and apparatus for training facial feature extraction model, method and apparatus for extracting facial features, device, and storage medium
CN108984683A (zh) 结构化数据的提取方法、系统、设备及存储介质
CN107194158A (zh) 一种基于图像识别的疾病辅助诊断方法
CN111986785B (zh) 医学影像标注方法和装置、设备及存储介质
CN104463101A (zh) 用于文字性试题的答案识别方法及系统
JP6486853B2 (ja) 分類ラベル付与装置、分類ラベル付与方法、およびプログラム
CN108236784A (zh) 模型的训练方法和装置、存储介质、电子装置
CN106202030A (zh) 一种基于异构标注数据的快速序列标注方法及装置
CN111695431A (zh) 一种人脸识别方法、装置、终端设备及存储介质
US20210312243A1 (en) Method for synthesizing image based on conditional generative adversarial network and related device
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN111353978B (zh) 一种识别心脏解剖学结构的方法及装置
CN111080592A (zh) 一种基于深度学习的肋骨提取方法及装置
CN109427052B (zh) 基于深度学习处理眼底图像的相关方法及设备
CN113033581A (zh) 髋关节图像中骨骼解剖关键点定位方法、电子设备及介质
CN115050039A (zh) 自动化试卷分析方法、系统、电子设备、存储介质
CN113192028B (zh) 人脸图像的质量评价方法、装置、电子设备及存储介质
CN114419087A (zh) 病灶图像生成方法、装置、电子设备及存储介质
CN117173491B (zh) 医学图像的标注方法、装置、电子设备及存储介质
CN112132841B (zh) 医疗图像切割方法及装置
CN111767424B (zh) 图像处理方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant