CN110335250A - 网络训练方法、装置、检测方法、计算机设备和存储介质 - Google Patents

网络训练方法、装置、检测方法、计算机设备和存储介质 Download PDF

Info

Publication number
CN110335250A
CN110335250A CN201910471489.3A CN201910471489A CN110335250A CN 110335250 A CN110335250 A CN 110335250A CN 201910471489 A CN201910471489 A CN 201910471489A CN 110335250 A CN110335250 A CN 110335250A
Authority
CN
China
Prior art keywords
sample image
positive sample
target area
image
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910471489.3A
Other languages
English (en)
Inventor
高耀宗
周翔
詹翊强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai United Imaging Healthcare Co Ltd
Shanghai United Imaging Intelligent Healthcare Co Ltd
Original Assignee
Shanghai United Imaging Intelligent Healthcare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai United Imaging Intelligent Healthcare Co Ltd filed Critical Shanghai United Imaging Intelligent Healthcare Co Ltd
Priority to CN201910471489.3A priority Critical patent/CN110335250A/zh
Publication of CN110335250A publication Critical patent/CN110335250A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Radiology & Medical Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种网络训练方法、装置、检测方法、计算机设备和存储介质,对检测网络进行训练时,通过负样本影像和预先标注好的第二正样本影像训练得到初始检测网络,并通过该初始检测网络对第一正样本影像中的目标区域进行标注,得到第一正样本影像对应的目标区域标注数据,然后将第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像一起对初始检测网络进行训练,得到目标检测网络,该方法可以将大量未对目标区域进行标注的医学影像转换为对目标区域进行了标注的影像,基于这些转换的影像,继续对检测网络进行训练得到目标检测网络,这样丰富了检测网络训练数据的数量,极大提高了目标检测网络的检出率和准确性,降低了假阳性。

Description

网络训练方法、装置、检测方法、计算机设备和存储介质
技术领域
本申请涉及医疗技术领域,特别是涉及一种网络训练方法、装置、检测方法、计算机设备和存储介质。
背景技术
早期肺癌筛查可以通过低剂量CT影像对肺癌高危人群进行筛查,检测出早期肺癌(即肺结节)并提早进行治疗干预,降低肺癌致死率。为了提高CT肺结节筛查的效率,增加肺结节的检出率,可以借助计算机辅助检测(Computer Aided Detection,CADe)系统进行肺结节筛查。
目前肺结节CADe系统大多采用的是深度学习技术进行开发,如Faster RCNN(快速区域卷积神经网络)的框架。示例地,输入一例胸部CT影像,FasterRCNN通过前向卷积神经网络预测得到用于定位肺结节的特征图。在特征图的每个位置,Faster RCNN定义了几个不同大小,不同长宽比的Anchor box(候选定位框),并通过和金标注肺结节定位框进行比对,可以将Anchor box分为正样本的Anchor box(与金标准定位框重合度超过某一阈值),以及负样本的Anchor box(与金标准定位框重合度低于某一阈值)。在训练阶段,Faster RCNN通过卷积操作从特征图中预测每个Anchor box为正样本Anchor box的概率,并预测每个正样本Anchor box距离肺结节定位框的中心偏移以及大小偏差。通过这两个信息,Faster RCNN可以在图像中定位到每个肺结节的位置与大小。
但是,上述肺结节CADe系统的训练数据难以大批量获取,较少的标注训练数据,导致肺结节CADe系统的检出率比较低,或者假阳性比较高。
发明内容
基于此,有必要针对上述肺结节CADe系统的训练数据难以大批量获取,较少的标注训练数据,导致肺结节CADe系统的检出率比较低,或者假阳性比较高的技术问题,提供一种网络训练方法、装置、检测方法、计算机设备和存储介质。
第一方面,本申请实施例提供一种网络训练方法,该方法包括:
获取第一正样本影像、第二正样本影像和负样本影像;第一正样本影像包括未标注的目标区域;第二正样本影像包括已标注的目标区域;负样本影像未包括目标区域;
将第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果;初始检测网络为根据负样本影像和第二正样本影像训练得到的网络;
根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
在其中一个实施例中,上述根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络,包括:
根据各第一正样本影像中目标区域的标注结果、各第一正样本影像确定第一正样本影像的训练数据;
根据第一正样本影像的训练数据、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
在其中一个实施例中,上述根据各第一正样本影像中目标区域的标注结果、各第一正样本影像确定第一正样本影像的训练数据,包括:将大于等于第一预设概率阈值的目标区域的标注结果、和各目标区域对应的第一正样本影像确定为第一正样本影像的训练数据。
在其中一个实施例中,上述第一正样本影像和负样本影像的总数量大于第二正样本影像数量。
在其中一个实施例中,获取第一正样本影像和负样本影像,包括:
获取多个医学影像的临床阅片报告;
根据各临床阅片报告确定各医学影像中是否存在目标区域;
将存在目标区域的医学影像确定为第一正样本影像、将不存在目标区域的医学影像确定为负样本影像。
第二方面,本申请实施例提供一种检测方法,该方法包括:
获取待检测医学影像;
将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果;目标检测网络为根据上述第一方面实施例任一项权利要求方法训练的网络。
在其中一个实施例中,上述将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果,包括:
将待检测医学影像输入至目标检测网络中,得到待检测医学影像的多个目标区域的标注框;
将大于等于第二预设概率阈值的目标区域的标注框,确定为待检测医学影像的目标区域检测结果。
第三方面,本申请实施例提供一种网络训练装置,装置包括:
样本获取模块,用于获取第一正样本影像、第二正样本影像和负样本影像;第一正样本影像包括未标注的目标区域;第二正样本影像包括已标注的目标区域;负样本影像未包括目标区域;
标注模块,用于将第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果;根据负样本影像和第二正样本影像训练得到初始检测网络;
目标网络训练模块,用于根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
第四方面,本申请实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面和第二方面实施例提供的任一项方法的步骤。
第五方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面和第二方面实施例提供的任一项方法的步骤。
本申请实施例提供的一种网络训练方法、装置、检测方法、计算机设备和存储介质,对检测网络进行训练时,先通过负样本影像和预先标注好的第二正样本影像训练得到初始检测网络,并通过该初始检测网络对第一正样本影像中的目标区域进行标注,得到第一正样本影像对应的目标区域标注数据,然后,将第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像一起对初始检测网络进行训练,得到目标检测网络,由于该方法中,可以将大量未对目标区域进行标注的医学影像转换为对目标区域进行了标注的影像,基于这些转换的影像,继续对检测网络进行训练,即可得到目标检测网络,这样丰富了检测网络训练数据的数量,大大提高了得到的目标检测网络的检出率和准确性,降低了假阳性。
附图说明
图1为一个实施例提供的一种网络训练方法的应用环境图;
图2为一个实施例提供的一种网络训练方法的流程示意图;
图3为一个实施例提供的一种网络训练方法的流程示意图;
图4为一个实施例提供的一种网络训练方法的流程示意图;
图5为一个实施例提供的一种检测方法的流程示意图;
图6为一个实施例提供的一种检测方法的流程示意图;
图7为一个实施例提供的一种网络训练装置的流程示意图;
图8为一个实施例提供的一种网络训练装置的结构框图;
图9为一个实施例提供的一种网络训练装置结构框图;
图10为一个实施例提供的一种检测装置的结构框图;
图11为一个实施例提供的一种检测装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的一种网络训练方法,可以应用于如图1所示的应用环境中,该计算机设备可以是服务器,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储一种网络训练方法和一种检测方法的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网络训练方法和一种检测方法。
本申请实施例提供一种网络训练方法、装置、检测方法、计算机设备和存储介质,旨在解决上述肺结节CADe系统的训练数据训练数据难以大批量获取,较少的标注训练数据,导致肺结节CADe系统的检出率比较低,或者假阳性比较高的技术问题。下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。需要说明的是,本申请提供的一种网络训练方法和一种检测方法,图2-图6的执行主体为计算机设备,其中,其执行主体还可以是网络训练装置,其中该装置可以通过软件、硬件或者软硬件结合的方式实现成为网络训练的部分或者全部,图2-图6的执行主体为计算机设备,其中,其执行主体还可以是检测装置,其中该装置可以通过软件、硬件或者软硬件结合的方式实现成为检测的部分或者全部。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
在一个实施例中,图2提供了一种网络训练方法,本实施例涉及的是计算机设备根据第一正样本影像、第二正样本影像和负样本影像训练目标检测网络的具体过程,如图2所示,所述方法包括:
S101,获取第一正样本影像、第二正样本影像和负样本影像;第一正样本影像包括未标注的目标区域;第二正样本影像包括已标注的目标区域;负样本影像未包括目标区域。
本实施例中,第一正样本影像包括未标注的目标区域,即第一正样本影像包括了目标区域,但是对该目标区域未进行标注。其中,第二正样本影像包括已标注的目标区域,即第二正样本影像包括了目标区域,但是对该目标区域已进行了标注。其中,负样本影像未包括目标区域。其中,第二正样本影像中对目标区域的标注是预先标注好的标准数据,而第一正样本影像和负样本影像只是对其是否包括目标区域进行了分类,无需预先进行标注。
另外,本申请实施例中所提及的第一正样本影像、第二正样本影像以及负样本影像在使用过程的数量均为多个,且各自的数量本申请实施例不做限定,可根据实际情况而定。可选地,第一正样本影像和负样本影像的总数量大于第二正样本影像数量。在实际应用中,获取第一正样本影像和负样本影像的总数量可以远远大于第二正样本影像数量,即在获取影像数据这个过程,为了节省时间,可以只对少量目标区域预先进行标注,形成第二正样本数据。则示例地,在实际应用中,计算机设备获取第一正样本影像、第二正样本影像和负样本影像的方式可以是接收其他设备的传输,也可以是从预先存储的影像集中直接提取,本申请实施例对此不做限定。
S102,将第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果;所述初始检测网络为根据负样本影像和第二正样本影像训练得到的网络。
基于上述S101步骤中获取的第一正样本影像,计算机设备将该第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果,其中,该初始检测网络为预先根据S101步骤中获取的负样本影像和第二正样本影像训练得到的网络,即在实际应用中,计算机设备先根据负样本影像和第二正样本影像训练得到初始检测网络,然后将第一正样本影像输入至该初始检测网络中,得到该第一正样本影像中目标区域的标注结果。
S103,根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
基于上述S102步骤中得到的第一正样本影像中目标区域的标注结果,计算机设备结合负样本影像和第二正样本影像继续对初始检测网络进行训练,得到目标检测网络。可以理解的是,在实际应用中,计算机设备根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练的过程,可以反复将第一正样本影像输入至当前检测网络中,以使第一正样本影像中目标区域的标注结果更加准确,即重复执行步骤S102和S103,这样训练出的检测网络更加准确。
本实施例提供的网络训练方法,对检测网络进行训练时,先通过负样本影像和预先标注好的第二正样本影像训练得到初始检测网络,并通过该初始检测网络对第一正样本影像中的目标区域进行标注,得到第一正样本影像对应的目标区域标注数据,然后,将第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像一起对初始检测网络进行训练,得到目标检测网络,由于该方法中,可以将大量未对目标区域进行标注的医学影像转换为对目标区域进行了标注的影像,基于这些转换的影像,继续对检测网络进行训练,即可得到目标检测网络,这样丰富了检测网络训练数据的数量,大大提高了得到的目标检测网络的检出率和准确性,降低了假阳性。
以上实施例的基础上,本申请实施例还提供了一种网络训练方法,其涉及的是计算机设备根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,并得到目标检测网络的具体过程,如图3所示,上述S103步骤包括:
S201,根据各第一正样本影像中目标区域的标注结果、各第一正样本影像确定第一正样本影像的训练数据。
本实施例中,第一正样本影像的训练数据表示训练初始检测网络时,该第一正样本影像对应的数据,即将各第一正样本影像中各目标区域的标注结果,和各目标区域对应的第一正样本影像确定为训练数据。
可选地,将大于等于第一预设概率阈值的目标区域的标注结果、和各目标区域对应的第一正样本影像确定为第一正样本影像的训练数据。
由于上述S102步骤第一正样本影像经过初始检测网络后,得到的各第一正样本影像中目标区域的标注结果中各标注质量参差不齐,因此需要选择一些标注质量较好的标注结果作为训练数据,则在实际应用中,计算机设备先根据第一预设概率阈值,将大于等于该第一预设概率阈值的标注结果确定出来,并获取这些标注结果大于等于该第一预设概率阈值的各目标区域对应的第一正样本影像,即得到该第一正样本影像的训练数据。
S202,根据第一正样本影像的训练数据、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
基于上述S201步骤中确定的第一正样本影像的训练数据,计算机设备根据第一正样本影像的训练数据、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络,示例地,计算机设备根据上述确定的第一正样本影像的训练数据、负样本影像、第二正样本影像对初始检测网络进行训练,训练迭代几次后,用当前训练迭代的检测网络对第一正样本影像继续进行检测,得到第一正样本影像的新一轮训练数据,基于该新得到的训练数据和负样本影像、第二正样本影像对当前检测网络进行训练,循环的采用当前检测网络对第一正样本影像的训练数据进行更新,这样,每隔N个迭代,这些第一正样本影像的标注结果都会随着检测网络参数的变化而变化,最终第一正样本影像的标注数据会随着检测网络的参数一起收敛。
对于上述实施例中第一正样本影像和负样本影像的获取方式,本申请实施例提供了一种网络训练方法,如图4所示,该方法包括:
S301,获取多个医学影像的临床阅片报告。
本实施例中,计算机设备获取多个医学影像的临床阅片报告,例如,计算机设备获取的方式可以是预先存储至计算机设备中的日常产生的大量带医生报告的CT影像数据,也可以从其他平台进行下载,本实施例对此不做限定,只要获取的医学影像均已包含临床阅片报告即可。
S302,根据各临床阅片报告确定各医学影像中是否存在目标区域。
基于上述S301步骤中获取的多个医学影像的临床阅片报告,计算机设备确定各个医学影像中是否存在目标区域。示例地,在实际应用中,以医学影像为肺结节检测的CT影像为例,则计算机设备可以检测临床阅片报告中是否存在“结节”/“肺结节”关键字样,若包括关键字则确定该临床阅片报告对应的医学影像中存在目标区域。
S303,将存在目标区域的医学影像确定为第一正样本影像、将不存在目标区域的医学影像确定为负样本影像。
基于上述S302步骤中确定的结果,计算机设备将将存在目标区域的医学影像确定为第一正样本影像、将不存在目标区域的医学影像确定为负样本影像。示例地,继续以医学影像为肺结节检测的CT影像为例,则计算机设备将临床阅片报告中无“结节”/“肺结节”关键字对应的CT影像确定为负样本影像,即不包括目标区域的医学影像。将临床阅片报告中有“结节”/“肺结节”关键字对应的CT影像确定为第一正样本影像,即包括目标区域的医学影像。可以理解的是,根据临床阅片报告确定出的第一正样本影像虽然可以确定该医学影像中包括目标区域,但是在医学影像中该目标区域并未被标注出来。
基于上述图2-图4实施例,以检测网络是肺结节检测网络,医学影像是肺部CT影像为例,本申请实施例提供一种本方案完整的训练过程:
S1:获取大量携带临床阅片报告的CT影像、少量带有肺结节标注的CT影像。
S2:将携带临床阅片过程中产生的报告的CT影像分为负样本CT影像(该病人的CT影像中没有肺结节),和正样本CT影像(该病人的CT影像中存在肺结节)。
S3:采用负样本CT影像和少量带有肺结节标注的CT影像训练检测网络模型,得到一个初始检测网络。
S4:将正样本CT影像输入到初始检测网络中,得到正样本CT影像中肺结节的标注框数据。
S5:从正样本CT影像中肺结节的标注框中选出一部分预测概率较高的标注框和对应的正样本CT影像作为正样本CT影像的训练数据。
S6:以正样本CT影像的训练数据、结合上述负样本CT影像和少量带有肺结节标注的CT影像继续训练上述初始检测网络,在训练过程中,重复步骤S3至S7,直至损失函数不再下降或者达到预设的迭代次数,即得到目标检测网络。
需要说明的是,对于少量带有肺结节标注的CT影像,我们可以采用常用的深度学习方法来进行网络训练,例如Faster RCNN网络、YOLO网络、SSD网络等。对于产生的报告的CT影像分为负样本CT影像和和正样本CT影像,可以通过报告来自适应地确定训练数据。
计算机设备在训练肺结节检测网络时,将少量带有肺结节标注的CT影像,和大量带有报告的CT影像混合来进行训练,这样,将日常产生的大量带医生报告的CT影像数据带入到模型迭代训练过程中,最终可以实现数据闭环,将医生的工作纳入到整个人工智能网络训练的过程中,医生通过每天审报告批报告可以不断为肺结节CADe系统提供训练数据,提升肺结节检出率,并降低假阳性率。
另外,对于上述目标检测网络的应用场景,本申请实施例还提供了一种检测方法,本实施例涉及的是计算机设备根据目标检测网络,得到待检测医学影像目标区域检测结果的具体过程,如图5所示,该方法包括:
S401,获取待检测医学影像。
本实施例中,计算机设备获取待检测医学影像,可以是待检测的CT影像,也可以是其他影像,本实施例不做限定。
S402,将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果;目标检测网络为根据上述图2-图4任一方法训练的网络。
基于上述S401步骤获取的待检测医学影像,计算机设备将该待检测医学影像输入至目标检测网络,其中该目标检测网络即上述图2至图4任一项实施例所示的训练方法训练得到的目标检测网络。
可选地,如图6所示,上述S402包括:
S501,将待检测医学影像输入至目标检测网络中,得到待检测医学影像的多个目标区域的标注框。
其中,计算机设备将待检测医学影像输入至目标检测网络中,得到各待检测医学影像的多个目标区域的标注框,其中该标注框中包含目标检测的概率,即当前标注的区域为目标区域的概率。
S502,将大于等于第二预设概率阈值的目标区域的标注框,确定为待检测医学影像的目标区域检测结果。
基于上述S501步骤中得到多个目标区域的标注框,计算机设备将大于等于第二预设概率阈值的目标区域的标注框确定为待检测医学影像的目标区域检测结果。
本实施例提供的检测方法,将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果。由于目标检测网络训练数据不仅仅包含了少量带有精确肺结节标注的胸部CT影像数据,还包括了大量由临床报告确定的正样本影像数据与负样本影像数据。这样训练所得的检测网络可以有更好的肺结节检出率以及更低的假阳性率。使用该目标检测网络对待检测医学影像进行检测,大大提高了得到检测结果的准确性。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种网络训练装置,包括:样本获取模块10、标注模块11和目标网络训练模块12,其中,
样本获取模块10,用于获取第一正样本影像、第二正样本影像和负样本影像;第一正样本影像包括未标注的目标区域;第二正样本影像包括已标注的目标区域;负样本影像未包括目标区域;
标注模块11,用于将第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果;根据负样本影像和第二正样本影像训练得到初始检测网络;
目标网络训练模块12,用于根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
上述实施例提供的一种网络训练装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,如图8所示,提供了一种网络训练装置,上述目标网络训练模块12包括:数据获取单元121和训练单元122,其中,
数据获取单元121,用于根据各第一正样本影像中目标区域的标注结果、各第一正样本影像确定第一正样本影像的训练数据;
训练单元122,用于根据第一正样本影像的训练数据、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
上述实施例提供的一种网络训练装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,上述数据获取单元121,具体用于将大于等于第一预设概率阈值的目标区域的标注结果、和各目标区域对应的第一正样本影像确定为第一正样本影像的训练数据。
上述实施例提供的一种网络训练装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,上述第一正样本影像和负样本影像的总数量大于第二正样本影像数量。
在一个实施例中,如图9所示,提供了一种网络训练装置,该装置包括:
报告获取模块13,用于获取多个医学影像的临床阅片报告;
目标确定模块14,用于根据各临床阅片报告确定各医学影像中是否存在目标区域;
样本确定模块15,用于将存在目标区域的医学影像确定为第一正样本影像、将不存在目标区域的医学影像确定为负样本影像。
上述实施例提供的一种网络训练装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,如图10所示,提供了一种检测装置,该装置包括:
影像获取模块16,用于获取待检测医学影像;
结果确定模块17,用于将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果;目标检测网络为根据上述图7-图9任一个网络训练装置训练的网络。
上述实施例提供的一种检测装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,如图11所示,提供了一种检测装置,上述结果确定模块17包括:
标注框确定单元171,用于将待检测医学影像输入至目标检测网络中,得到待检测医学影像的多个目标区域的标注框;
结果确定单元172,用于将大于等于第二预设概率阈值的目标区域的标注框,确定为待检测医学影像的目标区域检测结果。
上述实施例提供的一种检测装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
关于网络训练装置和检测装置的具体限定可以参见上文中对于网络训练方法和检测方法的限定,在此不再赘述。上述网络训练装置和检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如上述图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网络训练方法或者检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取第一正样本影像、第二正样本影像和负样本影像;第一正样本影像包括未标注的目标区域;第二正样本影像包括已标注的目标区域;负样本影像未包括目标区域;
将第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果;初始检测网络为根据负样本影像和第二正样本影像训练得到的网络;
根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
或者,该处理器执行计算机程序时实现以下步骤:
获取待检测医学影像;
将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果;目标检测网络为根据上述第一方面实施例任一项权利要求方法训练的网络。
上述实施例提供的一种计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取第一正样本影像、第二正样本影像和负样本影像;第一正样本影像包括未标注的目标区域;第二正样本影像包括已标注的目标区域;负样本影像未包括目标区域;
将第一正样本影像输入至初始检测网络中,得到第一正样本影像中目标区域的标注结果;初始检测网络为根据负样本影像和第二正样本影像训练得到的网络;
根据第一正样本影像中目标区域的标注结果、负样本影像、第二正样本影像对初始检测网络进行训练,得到目标检测网络。
或者,计算机程序被处理器执行时实现以下步骤:
获取待检测医学影像;
将待检测医学影像输入至目标检测网络中,得到待检测医学影像的目标区域检测结果;目标检测网络为根据上述第一方面实施例任一项权利要求方法训练的网络。
上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网络训练方法,其特征在于,所述方法包括:
获取第一正样本影像、第二正样本影像和负样本影像;所述第一正样本影像包括未标注的目标区域;所述第二正样本影像包括已标注的目标区域;所述负样本影像未包括所述目标区域;
将所述第一正样本影像输入至初始检测网络中,得到所述第一正样本影像中目标区域的标注结果;所述初始检测网络为根据所述负样本影像和所述第二正样本影像训练得到的网络;
根据所述第一正样本影像中目标区域的标注结果、所述负样本影像、所述第二正样本影像对所述初始检测网络进行训练,得到目标检测网络。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一正样本影像中目标区域的标注结果、所述负样本影像、所述第二正样本影像对所述初始检测网络进行训练,得到目标检测网络,包括:
根据各所述第一正样本影像中目标区域的标注结果、各所述第一正样本影像确定所述第一正样本影像的训练数据;
根据所述第一正样本影像的训练数据、所述负样本影像、所述第二正样本影像对所述初始检测网络进行训练,得到所述目标检测网络。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述第一正样本影像中目标区域的标注结果、各所述第一正样本影像确定所述第一正样本影像的训练数据,包括:将大于等于第一预设概率阈值的所述目标区域的标注结果、和各所述目标区域对应的第一正样本影像确定为所述第一正样本影像的训练数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一正样本影像和负样本影像的总数量大于所述第二正样本影像数量。
5.根据权利要求4所述的方法,其特征在于,获取第一正样本影像和负样本影像,包括:
获取多个医学影像的临床阅片报告;
根据各所述临床阅片报告确定各所述医学影像中是否存在所述目标区域;
将存在所述目标区域的医学影像确定为所述第一正样本影像、将不存在所述目标区域的医学影像确定为所述负样本影像。
6.一种检测方法,其特征在于,所述方法包括:
获取待检测医学影像;
将所述待检测医学影像输入至目标检测网络中,得到所述待检测医学影像的目标区域检测结果;所述目标检测网络为根据上述权利要求1-5任一项权利要求所述方法训练的网络。
7.根据权利要求6所述的方法,其特征在于,所述将所述待检测医学影像输入至目标检测网络中,得到所述待检测医学影像的目标区域检测结果,包括:
将所述待检测医学影像输入至所述目标检测网络中,得到所述待检测医学影像的多个所述目标区域的标注框;
将大于等于所述第二预设概率阈值的目标区域的标注框,确定为所述待检测医学影像的目标区域检测结果。
8.一种网络训练装置,其特征在于,所述装置包括:
样本获取模块,用于获取第一正样本影像、第二正样本影像和负样本影像;所述第一正样本影像包括未标注的目标区域;所述第二正样本影像包括已标注的目标区域;所述负样本影像未包括所述目标区域;
标注模块,用于将所述第一正样本影像输入至初始检测网络中,得到所述第一正样本影像中目标区域的标注结果;根据所述负样本影像和所述第二正样本影像训练得到所述初始检测网络;
目标网络训练模块,用于根据所述第一正样本影像中目标区域的标注结果、所述负样本影像、所述第二正样本影像对所述初始检测网络进行训练,得到目标检测网络。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910471489.3A 2019-05-31 2019-05-31 网络训练方法、装置、检测方法、计算机设备和存储介质 Pending CN110335250A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910471489.3A CN110335250A (zh) 2019-05-31 2019-05-31 网络训练方法、装置、检测方法、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910471489.3A CN110335250A (zh) 2019-05-31 2019-05-31 网络训练方法、装置、检测方法、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110335250A true CN110335250A (zh) 2019-10-15

Family

ID=68140619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910471489.3A Pending CN110335250A (zh) 2019-05-31 2019-05-31 网络训练方法、装置、检测方法、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110335250A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222842A (zh) * 2019-06-21 2019-09-10 数坤(北京)网络科技有限公司 一种网络模型训练方法、装置及存储介质
CN110837856A (zh) * 2019-10-31 2020-02-25 深圳市商汤科技有限公司 神经网络训练及目标检测方法、装置、设备和存储介质
CN111028224A (zh) * 2019-12-12 2020-04-17 广西医准智能科技有限公司 数据标注、模型训练和图像处理方法、装置及存储介质
CN111080625A (zh) * 2019-12-18 2020-04-28 北京推想科技有限公司 肺部影像条索检测模型的训练方法及其训练装置
CN111862001A (zh) * 2020-06-28 2020-10-30 微医云(杭州)控股有限公司 Ct影像的半自动标注方法及装置、电子设备、存储介质
CN112380900A (zh) * 2020-10-10 2021-02-19 深圳视见医疗科技有限公司 基于深度学习的子宫颈液基细胞数字图像分类方法及系统
CN113077876A (zh) * 2021-03-31 2021-07-06 广州金域医学检验中心有限公司 数字病理图像标注方法、装置、计算机设备及存储介质
CN113379687A (zh) * 2021-05-28 2021-09-10 上海联影智能医疗科技有限公司 网络训练方法、图像检测方法和介质
CN113505771A (zh) * 2021-09-13 2021-10-15 华东交通大学 一种双阶段物品检测方法及装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508859A (zh) * 2011-09-29 2012-06-20 北京亿赞普网络技术有限公司 一种基于网页特征的广告分类方法及装置
CN103793510A (zh) * 2014-01-29 2014-05-14 苏州融希信息科技有限公司 一种基于主动学习的分类器构建方法
CN104270392A (zh) * 2014-10-24 2015-01-07 中国科学院信息工程研究所 一种基于三分类器协同训练学习的网络协议识别方法及系统
CN105809091A (zh) * 2014-12-30 2016-07-27 同方威视技术股份有限公司 检查方法和系统
CN106126751A (zh) * 2016-08-18 2016-11-16 苏州大学 一种具有时间适应性的分类方法及装置
CN106295567A (zh) * 2016-08-10 2017-01-04 腾讯科技(深圳)有限公司 一种关键点的定位方法及终端
CN106326938A (zh) * 2016-09-12 2017-01-11 西安电子科技大学 基于弱监督学习的sar图像目标鉴别方法
CN106780460A (zh) * 2016-12-13 2017-05-31 杭州健培科技有限公司 一种用于胸部ct影像的肺结节自动检测系统
CN107644419A (zh) * 2017-09-30 2018-01-30 百度在线网络技术(北京)有限公司 用于分析医学影像的方法和装置
CN108009589A (zh) * 2017-12-12 2018-05-08 腾讯科技(深圳)有限公司 样本数据处理方法、装置和计算机可读存储介质
CN108664971A (zh) * 2018-05-22 2018-10-16 中国科学技术大学 基于2d卷积神经网络的肺结节检测方法
CN108805196A (zh) * 2018-06-05 2018-11-13 西安交通大学 用于图像识别的自动增量学习方法
CN109087306A (zh) * 2018-06-28 2018-12-25 众安信息技术服务有限公司 动脉血管图像模型训练方法、分割方法、装置及电子设备
CN109741346A (zh) * 2018-12-30 2019-05-10 上海联影智能医疗科技有限公司 感兴趣区域提取方法、装置、设备及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508859A (zh) * 2011-09-29 2012-06-20 北京亿赞普网络技术有限公司 一种基于网页特征的广告分类方法及装置
CN103793510A (zh) * 2014-01-29 2014-05-14 苏州融希信息科技有限公司 一种基于主动学习的分类器构建方法
CN104270392A (zh) * 2014-10-24 2015-01-07 中国科学院信息工程研究所 一种基于三分类器协同训练学习的网络协议识别方法及系统
CN105809091A (zh) * 2014-12-30 2016-07-27 同方威视技术股份有限公司 检查方法和系统
CN106295567A (zh) * 2016-08-10 2017-01-04 腾讯科技(深圳)有限公司 一种关键点的定位方法及终端
CN106126751A (zh) * 2016-08-18 2016-11-16 苏州大学 一种具有时间适应性的分类方法及装置
CN106326938A (zh) * 2016-09-12 2017-01-11 西安电子科技大学 基于弱监督学习的sar图像目标鉴别方法
CN106780460A (zh) * 2016-12-13 2017-05-31 杭州健培科技有限公司 一种用于胸部ct影像的肺结节自动检测系统
CN107644419A (zh) * 2017-09-30 2018-01-30 百度在线网络技术(北京)有限公司 用于分析医学影像的方法和装置
CN108009589A (zh) * 2017-12-12 2018-05-08 腾讯科技(深圳)有限公司 样本数据处理方法、装置和计算机可读存储介质
CN108664971A (zh) * 2018-05-22 2018-10-16 中国科学技术大学 基于2d卷积神经网络的肺结节检测方法
CN108805196A (zh) * 2018-06-05 2018-11-13 西安交通大学 用于图像识别的自动增量学习方法
CN109087306A (zh) * 2018-06-28 2018-12-25 众安信息技术服务有限公司 动脉血管图像模型训练方法、分割方法、装置及电子设备
CN109741346A (zh) * 2018-12-30 2019-05-10 上海联影智能医疗科技有限公司 感兴趣区域提取方法、装置、设备及存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222842A (zh) * 2019-06-21 2019-09-10 数坤(北京)网络科技有限公司 一种网络模型训练方法、装置及存储介质
CN110837856A (zh) * 2019-10-31 2020-02-25 深圳市商汤科技有限公司 神经网络训练及目标检测方法、装置、设备和存储介质
CN111028224A (zh) * 2019-12-12 2020-04-17 广西医准智能科技有限公司 数据标注、模型训练和图像处理方法、装置及存储介质
CN111028224B (zh) * 2019-12-12 2020-12-01 广西医准智能科技有限公司 数据标注、模型训练和图像处理方法、装置及存储介质
CN111080625A (zh) * 2019-12-18 2020-04-28 北京推想科技有限公司 肺部影像条索检测模型的训练方法及其训练装置
CN111080625B (zh) * 2019-12-18 2020-12-29 推想医疗科技股份有限公司 肺部影像条索检测模型的训练方法及其训练装置
CN111862001A (zh) * 2020-06-28 2020-10-30 微医云(杭州)控股有限公司 Ct影像的半自动标注方法及装置、电子设备、存储介质
CN111862001B (zh) * 2020-06-28 2023-11-28 微医云(杭州)控股有限公司 Ct影像的半自动标注方法及装置、电子设备、存储介质
CN112380900A (zh) * 2020-10-10 2021-02-19 深圳视见医疗科技有限公司 基于深度学习的子宫颈液基细胞数字图像分类方法及系统
CN113077876A (zh) * 2021-03-31 2021-07-06 广州金域医学检验中心有限公司 数字病理图像标注方法、装置、计算机设备及存储介质
CN113379687A (zh) * 2021-05-28 2021-09-10 上海联影智能医疗科技有限公司 网络训练方法、图像检测方法和介质
CN113505771A (zh) * 2021-09-13 2021-10-15 华东交通大学 一种双阶段物品检测方法及装置

Similar Documents

Publication Publication Date Title
CN110335250A (zh) 网络训练方法、装置、检测方法、计算机设备和存储介质
CN110135406A (zh) 图像识别方法、装置、计算机设备和存储介质
Chen et al. Interpretable machine learning: Moving from mythos to diagnostics
CN110366734A (zh) 优化神经网络架构
CN110334722A (zh) 图像分类方法、装置、计算机设备和存储介质
CN109598745B (zh) 图像配准方法、装置和计算机设备
CN109754447A (zh) 图像生成方法、装置、设备和存储介质
CN110797101B (zh) 医学数据处理方法、装置、可读存储介质和计算机设备
CN110941555B (zh) 测试用例推荐方法、装置、计算机设备和存储介质
Tu et al. Image cropping with composition and saliency aware aesthetic score map
KR20210036845A (ko) 실내 위치추정을 위한 준지도 변분 오토인코더
CN109657583A (zh) 脸部关键点检测方法、装置、计算机设备和存储介质
CN111209215B (zh) 应用程序的测试方法、装置、计算机设备及存储介质
CN112085056B (zh) 目标检测模型生成方法、装置、设备及存储介质
CN112639833A (zh) 可自适应神经网络
CN111488872B (zh) 图像检测方法、装置、计算机设备和存储介质
CN111598213B (zh) 网络训练方法、数据识别方法、装置、设备和介质
CN110298820A (zh) 影像分析方法、计算机设备和存储介质
KR102166835B1 (ko) 신경망 학습 방법 및 그 장치
CN111583184A (zh) 图像分析方法、网络、计算机设备和存储介质
US20220375211A1 (en) Multi-layer perceptron-based computer vision neural networks
CN111383259A (zh) 图像分析方法、计算机设备和存储介质
CN110335248A (zh) 医学图像病灶检测方法、装置、计算机设备和存储介质
CN109657675A (zh) 图像标注方法、装置、计算机设备和可读存储介质
CN109740487A (zh) 点云标注方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination