CN110399927A - 识别模型训练方法、目标识别方法及装置 - Google Patents
识别模型训练方法、目标识别方法及装置 Download PDFInfo
- Publication number
- CN110399927A CN110399927A CN201910687366.3A CN201910687366A CN110399927A CN 110399927 A CN110399927 A CN 110399927A CN 201910687366 A CN201910687366 A CN 201910687366A CN 110399927 A CN110399927 A CN 110399927A
- Authority
- CN
- China
- Prior art keywords
- target
- image
- identification model
- training
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本申请提供了一种识别模型训练方法、目标识别方法及装置,其中,该识别模型训练方法包括:将初始图像集进行筛选,以确定出目标图像集;目标图像集中包括含有目标特征的图像;根据预先标注的包括目标特征的标注图像集确定出锚框的目标参数;将目标图像集输入预识别模型中,基于目标参数的锚框对预识别模型进行训练,以得到目标识别模型。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种识别模型训练方法、目标识别方法及装置。
背景技术
目前,通过神经网络应用在各个领域中,一种常见的使用场景是通过神经网络对图像中的某一特征进行识别。但是现有的通过神经网络组建的模型,通过相关数据进行训练可以得到一个具有识别功能的模型,但是,现有的卷积神经网络模型还存在一些识别不准确的缺陷。
发明内容
有鉴于此,本申请实施例的目的在于提供一种识别模型训练方法、目标识别方法及装置。能够达到训练的模型能够更好地识别出图像中的目标特征。
第一方面,本申请实施例提供了一种识别模型训练方法,包括:
将初始图像集进行筛选,以确定出目标图像集;所述目标图像集中包括含有目标特征的图像;
根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数;
将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型。
本申请实施例提供的识别模型训练方法,采用标注图像集确定出锚框的目标参数,与现有技术中的随机生成锚框相比,其通过确定出锚框的目标参数,并以确定出锚框的目标参数为基础对模型进行训练,可以提高训练速度的情况下,还能够使训练得到的目标识别模型识别的准确率更高。
一种可能的实施方式中,所述识别模型训练方法还包括:
将所述目标图像集中的图像进行指定变换处理,以得到扩充图像;
根据所述目标图像集中的原始图像及所述原始图像对应的所述扩充图像扩充数据集,所述扩充数据集为更新的目标图像集。
本申请实施例提供的识别模型训练方法,还可以对用于训练的数据进行扩充,可以增加训练数据量,使识别模型的训练更为充分,进一步提高模型的识别准确率。
一种可能的实施方式中,所述标注的包括所述目标特征的标注图像集中包括框选所述目标特征的框;所述根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数的步骤,包括:
将所述预先标注的包括所述目标特征的标注图像集中的框进行聚类处理,得到多类尺寸的框,所述多类尺寸为目标参数。
本申请实施例提供的识别模型训练方法,还可以通过对标注图像集中对目标特征的标注框进行聚类,从而可确定出锚框的参数,使确定出的多类尺寸的框与需要识别的图像中的目标特征的大小更接近,从而可以提高训练出的目标识别模型的目标特征的识别的准确率。
一种可能的实施方式中,所述目标图像集包括:训练数据集、验证数据集;所述训练数据集中的图像携带图像标注;所述将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型的步骤,包括:
a、将所述训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到第一中间识别模型;
b、将所述验证数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第一识别准确率;
当所述第一识别准确率不大于第一设定值时,循环步骤a-c;直到所述第一识别准确率大于所述第一设定值,或训练次数达到第二设定值时,退出循环训练,将当前的第一中间识别模型确定为目标识别模型。
本申请实施例提供的识别模型训练方法,还可以通过训练数据集及验证数据集共同实现对预识别模型的训练,可以使训练得到的目标识别模型可以更符合识别要求。
一种可能的实施方式中,所述训练数据集中的图像数量大于所述验证数据集中的图像数量的两倍。
本申请实施例提供的识别模型训练方法,训练数据集中的图像数量大于验证数据集中的图像数量的两倍可以使能够实现测试和验证的前提下,还能够使训练阶段的训练相对更加充分。
一种可能的实施方式中,所述目标图像集中携带图像标注;所述将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型的步骤,包括:
d、使用所述目标参数的锚框对所述目标图像集中的图像进行框选,以得到框选图;
e、对所述框选图使用预识别模型进行计算,得到第一输出特征;
f、使用损失函数将所述第一输出特征与对应的所述图像标注进行计算,确定出第一误差;
g、当所述第一误差不小于第三设定值时,对所述预识别模型中每层权重参数进行调整,以得到第二中间识别模型;
循环步骤d-f直到所述第一误差小于所述第三设定值,将当前的第二中间识别模型确定为目标识别模型。
本申请实施例提供的识别模型训练方法,通过多轮训练,多轮权重参数的调整,从而可以使用训练出的目标识别模型可以更准确地识别目标特征。
第二方面,本申请实施例还提供一种目标识别方法,包括:
将待识别图像输入上述第一方面,或第一方面的任意一种可能的实施方式提供的方法训练得到的目标识别模型中进行识别,得到识别结果。
本申请实施例提供的目标识别方法,通过使用上述的目标识别模型对需要识别的图像进行识别,从而可以相对准确地识别出图像中的目标特征。
第三方面,本申请实施例还提供一种识别模型训练装置,包括:
筛选模块,用于将初始图像集进行筛选,以确定出目标图像集;所述目标图像集中包括含有目标特征的图像;
确定模块,用于根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数;
训练模块,用于将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型。
第四方面,本申请实施例还提供一种目标识别装置法,包括:
识别模块,用于将待识别图像输入上述第一方面,或第一方面的任意一种可能的实施方式提供的方法训练得到的目标识别模型中进行识别,得到识别结果。
第五方面,本申请实施例还提供一种电子设备,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行第一方面或第二方面所述的方法的步骤。
第五方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面或第二方面所述的方法的步骤。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备的方框示意图。
图2为本申请实施例提供的识别模型训练方法的流程图。
图3为本申请实施例提供的识别模型训练方法的步骤203的详细流程图。
图4为本申请实施例提供的识别模型训练方法的步骤203的另一详细流程图。
图5为本申请实施例提供的识别模型训练装置的功能模块示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
随着人工智能技术的发展,深度学习应用在医疗领域越来越普遍,例如,在宫颈病变细胞、肺结节、牙齿等领域都可以使用神经网络模型进行识别。
现有技术在图像中进行目标检测时,一般采用基于候选区域的CNN(Convolutional Neural Networks,中文称:卷积神经网络)及其延伸Fast RCNN(RegionConvolutional Neural Networks,中文称:区域卷积神经网络)和Faster RCNN。后来由Twostage发展到One stage,研究学者又发现基于anchor base的方法具有先天局限性,又发明了anchor free目标检测算法,基于anchor free目标检测算法能够有效的检测到非常规刚性目标。发明人发现基于anchor free目标检测算法的训练过程的效率相对较低,而且在识别过程的召回率相对较低。
针对现有技术检测病理图像中的病变组织召回率不高、定位精度差的问题,本申请提供的一种识别模型训练方法、目标识别方法及装置,可以提高训练出的识别模型的识别准确率。本申请实施例将卷积神经网络特征图中先验窗口与病变组织尺度和纵横比大小结合起来,有针对性地进行设计锚框的参数、模型的训练,以提高病变组织定位精度和召回率。
实施例一
为便于对本实施例进行理解,首先对执行本申请实施例所公开的识别模型训练方法或目标识别方法的电子设备进行详细介绍。
如图1所示,是电子设备的方框示意图。电子设备100可以包括存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115、显示单元116。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对电子设备100的结构造成限定。例如,电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
上述的存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115及显示单元116各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。上述的处理器113用于执行存储器中存储的可执行模块。
其中,存储器111可以是,但不限于,随机存取存储器(Random Access Memory,简称RAM),只读存储器(Read Only Memory,简称ROM),可编程只读存储器(ProgrammableRead-Only Memory,简称PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,简称EEPROM)等。其中,存储器111用于存储程序,所述处理器113在接收到执行指令后,执行所述程序,本申请实施例任一实施例揭示的过程定义的电子设备100所执行的方法可以应用于处理器113中,或者由处理器113实现。
上述的处理器113可能是一种集成电路芯片,具有信号的处理能力。上述的处理器113可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(digital signalprocessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述的外设接口114将各种输入/输出装置耦合至处理器113以及存储器111。在一些实施例中,外设接口114,处理器113以及存储控制器112可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
上述的输入输出单元115用于提供给用户输入数据。所述输入输出单元115可以是,但不限于,鼠标和键盘等。
上述的显示单元在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器进行计算和处理。
本实施例中的电子设备100可以用于执行本申请实施例提供的各个方法中的各个步骤。下面通过几个实施例详细描述识别模型训练方法或目标识别方法的实现过程。
实施例二
请参阅图2,是本申请实施例提供的识别模型训练方法的流程图。下面将对图2所示的具体流程进行详细阐述。
步骤201,将初始图像集进行筛选,以确定出目标图像集。
其中,目标图像集中包括含有目标特征的图像。可选地,目标图像集中的每一张图像均可以包含目标特征,也可以仅部分图像包含目标特征。
在一个可选的实施方式中,本实施例中的识别模型训练方法用于训练出能识别病变组织的模型。
上述的目标特征可以是目标对象在病变过程中形成的特征对应的图形。可选地,上述的目标特征可以包括目标对象在病变过程中的不同阶段形成的特征对应的图形。上述的目标特征可以体现在一图像中的全部,也就是说目标特征可以布满整个图像中;上述的目标特征也可以仅存在于一图像中的局部。存在上述目标特征的图像可以表征该图像对应的对象可能存在某种病理变化趋势。
可选地,上述的初始图像集可以是病变组织数字切片图像。
可选地,可以从上述的病变组织数字切片图像中筛选出具有目标特征的图像,以形成上述的目标图像集。
可选地,可以对上述的病变组织数字切片图像以设定大小滑动窗滑动取块截取图像,以为形成上述的目标图像集。示例性地,上述的设定大小的滑动窗可以是512*512像素大小的滑动窗。当然,上述的设定大小也可以是其它尺寸,例如,256*256像素等。
可选地,可以对上述的病变组织数字切片图像以传统图像处理方式对用于训练的候选图的区域的选取,以形成上述的目标图像集。上述的传统图像处理方式可以包括,但不限于,自适应阈值图像分割、Canny边缘检测法、分水岭法等。
在一可选的实施方式中,在步骤203之前还可以包括:将所述目标图像集中的图像进行指定变换处理,以得到扩充图像;根据所述目标图像集中的原始图像及原始图像对应的所述扩充图像扩充数据集,所述扩充数据集为更新的目标图像集。
可选地,还可以将上述的目标图像集中的图像进行标注。上述的标注方式可以是对目标图像集中的图像中的目标特征进行框选。
可选地,上述的指定变换可以包括:对图像进行旋转、对图像进行翻转、轻微形变,对比度调整等。
步骤202,根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数。
其中,预先标注的包括所述目标特征的标注图像集中包括框选所述目标特征的框。
步骤202可以包括:将所述预先标注的包括所述目标特征的标注图像集中的框进行聚类处理,得到多类尺寸的框,所述多类尺寸为目标参数。
上述的预先标注的包括所述目标特征的标注图像集可以是被标注后的目标图像集;也可以是其它被标注的图像集。
示例性地,上述的聚类处理的聚类数量可以按照具体需要进行聚类。例如,可以根据病变过程中可能出现的病变特征形成的图像种类确定聚类数量;也可以根据病变过程中可能出现的病变特征、病变特征的大小、病变特征的位置、病变特征的形状等形成的图像种类确定聚类数量。
上述的目标参数可以包括锚框的长、宽、长宽比等。
通过聚类出多个尺寸的锚框,从而可以实现在训练过程中,可以多个感受野的卷积层都直接参与目标的定位,多个感受野对应的特征图尺寸可以是由大到小,此时固定新设计的锚框的尺寸,直接对应到多个感受野的特征图上,从而可以更快地对模型进行训练。
步骤203,将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型。
在步骤203之前,可以先构建卷积神经网络模型,该神经网络模型可以作为预识别模型。
可选地,可以以卷积层、池化层、正则化层、softmax和smoothl1损失函数来构建上述的卷积神经网络模型。其中,卷积层、池化层用来提取训练图像或待识别图像的特征,损失函数用来监督训练图像或待识别图像中的目标特征的位置和类别。
示例性地,卷积神经网络模型可以包含七个卷积层。其中,最后一层是损失函数,用于统计模型误差。在一个实例中,七个卷积的卷积模板大小可以为3*3。每一卷积层对应的特征图个数依次可以为512、1024、512、256、256、256、256。
在一种实施方式中,目标图像集可以包括:训练数据集、验证数据集。可选地,训练数据集中的图像数量大于所述验证数据集中的图像数量的两倍。在一个实例中,训练数据集中的图像数量:验证数据集中的图像数量=8:2。基于目标图像集中包括两类数据集,步骤203可以包括以下步骤。
a、将所述训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到第一中间识别模型;
b、将所述验证数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第一识别准确率;
当所述第一识别准确率不大于第一设定值时,循环步骤a-b;直到所述第一识别准确率大于所述第一设定值,或训练次数达到第二设定值时,退出循环训练,将当前的第一中间识别模型确定为目标识别模型。
在一种实施方式中,目标图像集可以包括:训练数据集、测试数据集及验证数据集。可选地,训练数据集中的图像数量大于所述测试数据集及所述验证数据集中的图像数量总和。在一个实例中,训练数据集中的图像数量:测试数据集中的图像数量:验证数据集中的图像数量=6:2:2。基于目标图像集中包括三类数据集,如图3所示,步骤203可以包括以下步骤。
步骤2031,将训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到第一中间识别模型。
可选地,上述的训练数据集可以包括不同类型的病变组织。其中,训练数据集中的图像携带图像标注。
上述的步骤2031被实施为:将所述训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行有监督的训练,并使用随机梯度下降优化方法进行每层权重参数和偏移量的学习,以得到第一中间识别模型。
步骤2032,将所述测试数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第二识别准确率。
将测试数据集对应的各个检测结果的位置和类别标记出来,得到测试数据的目标特征检测结果,并对测试结果进行评估,确定出上述的第二识别准确率。如果第二识别准确率较低,则可以再次执行步骤2031的训练,调整第一中间识别模型中的各个层的权重参数,再重新训练卷积神经网络,直到第二识别准确率不小于第一设定值。
可选地,可以在第二识别准确率达到第一设定值时,再执行步骤2033。
步骤2033,将所述验证数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第三识别准确率。
将验证数据集对应的各个检测结果的位置和类别标记出来,得到验证数据的目标特征检测结果,并对验证结果进行评估,确定出上述的第三识别准确率。
可选地,如果第三识别准确率较低,则可以再次执行步骤2031的训练,调整第一中间识别模型中的各个层的权重参数,再重新训练卷积神经网络,直到第三识别准确率不小于第一设定值。
可选地,如果第三识别准确率较低,则可以再次执行步骤2031的训练和步骤2032的测试,调整第一中间识别模型中的各个层的权重参数,再重新训练卷积神经网络,直到第三识别准确率不小于第一设定值。
可选地,也可以顺序执行步骤2031-步骤2033后,执行步骤2034:判断第二识别准确率或所述第三识别准确率是否不大于第一设定值。
当所述第二识别准确率或所述第三识别准确率不大于第一设定值时,循环步骤步骤2031-步骤2033,直到所述第二识别准确率及所述第三识别准确率大于所述第一设定值,或训练次数达到第二设定值时,退出循环训练,将当前的第一中间识别模型确定为目标识别模型。
上述的第一设定值和第二设定值可以根据具体的训练需求设置。可选地,第一设定值可以是接近一的值,例如,90%、95%、98%等值。上述的第二设定值可以是一较大的值,例如,十万、五十万等值。本申请实施例并不以第一设定值和第二设定值的具体值为限。
上述的实施方式中,通过训练数据集、测试数据集及验证数据集三个数据集合配合完成目标识别模型的训练,从而可以使训练得到的目标识别模型可以相对更加准确地对待识别图像中的目标特征进行识别。
在另一种实施方式中,如图4所示,步骤203可以包括以下步骤。
步骤2035,使用目标参数的锚框对目标图像集中的图像进行框选,以得到框选图。
可选地,目标图像集中携带图像标注。
步骤2036,对所述框选图使用预识别模型进行计算,得到第一输出特征。
步骤2037,使用损失函数将所述第一输出特征与对应的所述图像标注进行计算,确定出第一误差。
步骤2038,判断第一误差是否小于第三设定值。
当所述第一误差不小于第三设定值时,执行步骤2039,当第一误差不小于第三设定值时退出循环。
步骤2039,对所述预识别模型中每层权重参数进行调整,以得到第二中间识别模型。
可选地,可以使用随机梯度下降法对预识别模型中每层权重参数进行调整。当然,也可以使用梯度下降法对预识别模型中每层权重参数进行调整。可选地,还可以其它方式对每层权重参数进行调整,例如,小批量梯度下降(Mini-Batch Gradient Descent,MBGD)、批量梯度下降(Batch Gradient Descent,BGD)、最小均方法(Least Mean squares)等。
循环步骤d-f直到所述第一误差小于所述第三设定值,将当前的第二中间识别模型确定为目标识别模型。
可选地,上述的第三设定值可以根据训练需求进行选取。其中,第三设定值可以是一个较小的值,例如,0.1、0.001等。
本实施例提供的识别模型训练方法,通过把卷积神经网络和病变组织结合起来,有针对地对测试集中病变组织的尺寸和纵横比进行设计、训练、改进,以达到较高的病变组织召回率和定位精度。进一步地,利用机器自学习病变组织特征并进行识别,减少了人为干预。进一步地,通过聚类等方式对训练所需的锚框的参数进行确定,从而可以使训练过程更快、定位目标特征更准确。
实施例三
基于同一申请构思,本申请实施例中还提供了与识别模型训练方法对应的识别模型训练装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述识别模型训练方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图5,是本申请实施例提供的识别模型训练装置的功能模块示意图。本实施例中的识别模型训练装置中的各个模块用于执行上述方法实施例中的各个步骤。识别模型训练装置包括:筛选模块301、确定模块302及训练模块303;其中,
筛选模块301,用于将初始图像集进行筛选,以确定出目标图像集;所述目标图像集中包括含有目标特征的图像;
确定模块302,用于根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数;
训练模块303,用于将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型。
一种可能的实施方式中,识别模型训练装置还包括:扩充模块304,用于:
将所述目标图像集中的图像进行指定变换处理,以得到扩充图像;
根据所述目标图像集中的原始图像及所述原始图像对应的所述扩充图像扩充数据集,所述扩充数据集为更新的目标图像集。
一种可能的实施方式中,所述预先标注的包括所述目标特征的标注图像集中包括框选所述目标特征的框;确定模块302,还用于:
将所述预先标注的包括所述目标特征的标注图像集中的框进行聚类处理,得到多类尺寸的框,所述多类尺寸为目标参数。
一种可能的实施方式中,所述目标图像集包括:训练数据集、测试数据集及验证数据集;所述训练数据集中的图像携带图像标注;训练模块303,还用于:
将所述训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到第一中间识别模型;
将所述测试数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第二识别准确率;
将所述验证数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第三识别准确率;
当所述第二识别准确率或所述第三识别准确率不大于第一设定值时,循环上述过程;直到所述第二识别准确率及所述第三识别准确率大于所述第一设定值,或训练次数达到第二设定值时,退出循环训练,将当前的第一中间识别模型确定为目标识别模型。
一种可能的实施方式中,所述目标图像集包括:训练数据集、验证数据集;所述训练数据集中的图像携带图像标注;训练模块303,还用于:
将所述训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到第一中间识别模型;
将所述验证数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第一识别准确率;
当所述第一识别准确率不大于第一设定值时,循环上述过程;直到所述第一识别准确率大于所述第一设定值,或训练次数达到第二设定值时,退出循环训练,将当前的第一中间识别模型确定为目标识别模型。
一种可能的实施方式中,所述训练数据集中的图像数量大于所述验证数据集中的图像数量的两倍。
一种可能的实施方式中,所述目标图像集中携带图像标注;训练模块303,还用于:
使用所述目标参数的锚框对所述目标图像集中的图像进行框选,以得到框选图;
对所述框选图使用预识别模型进行计算,得到第一输出特征;
使用损失函数将所述第一输出特征与对应的所述图像标注进行计算,确定出第一误差;
当所述第一误差不小于第三设定值时,对所述预识别模型中每层权重参数进行调整,以得到第二中间识别模型;
循环上述过程直到所述第一误差小于所述第三设定值,将当前的第二中间识别模型确定为目标识别模型。
实施例四
本申请实施例提供的目标识别方法的流程图。本实施例中的目标识别方法可以包括:将待识别图像输入目标识别模型中进行识别,得到识别结果。
其中,目标识别模型可以是实施例二所提供的识别模型训练方法所训练的目标识别模型。
实施例五
基于同一申请构思,本申请实施例中还提供了与目标识别方法对应的目标识别装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述目标识别方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
本申请实施例提供一种目标识别装置。本实施例中的目标识别装置中的各个模块用于执行上述方法实施例中的各个步骤。目标识别装置包括:识别模块,用于将待识别图像输入上述第一方面,或第一方面的任意一种可能的实施方式提供的方法训练得到的目标识别模型中进行识别,得到识别结果。
其中,目标识别模型可以是实施例二所提供的识别模型训练方法所训练的目标识别模型。
此外,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的识别模型训练方法或目标识别方法的步骤。
本申请实施例所提供的识别模型训练方法或目标识别方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的识别模型训练方法或目标识别方法的步骤,具体可参见上述方法实施例,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种识别模型训练方法,其特征在于,包括:
将初始图像集进行筛选,以确定出目标图像集;所述目标图像集中包括含有目标特征的图像;
根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数;
将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述目标图像集中的图像进行指定变换处理,以得到扩充图像;
根据所述目标图像集中的原始图像及所述原始图像对应的所述扩充图像扩充数据集,所述扩充数据集为更新的目标图像集。
3.根据权利要求1或2所述的方法,其特征在于,所述预先标注的包括所述目标特征的标注图像集中包括框选所述目标特征的框;所述根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数的步骤,包括:
将所述预先标注的包括所述目标特征的标注图像集中的框进行聚类处理,得到多类尺寸的框,所述多类尺寸为目标参数。
4.根据权利要求1或2所述的方法,其特征在于,所述目标图像集包括:训练数据集、验证数据集;所述训练数据集中的图像携带图像标注;所述将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型的步骤,包括:
a、将所述训练数据集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到第一中间识别模型;
b、将所述验证数据集对所述第一中间识别模型进行测试,确定出所述第一中间识别模型的第一识别准确率;
当所述第一识别准确率不大于第一设定值时,循环步骤a-b;直到所述第一识别准确率大于所述第一设定值,或训练次数达到第二设定值时,退出循环训练,将当前的第一中间识别模型确定为目标识别模型。
5.根据权利要求4所述的方法,其特征在于,所述训练数据集中的图像数量大于所述验证数据集中的图像数量的两倍。
6.根据权利要求1或2所述的方法,其特征在于,所述目标图像集中携带图像标注;所述将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型的步骤,包括:
d、使用所述目标参数的锚框对所述目标图像集中的图像进行框选,以得到框选图;
e、对所述框选图使用预识别模型进行计算,得到第一输出特征;
f、使用损失函数将所述第一输出特征与对应的所述图像标注进行计算,确定出第一误差;
g、当所述第一误差不小于第三设定值时,对所述预识别模型中每层权重参数进行调整,以得到第二中间识别模型;
循环步骤d-f直到所述第一误差小于所述第三设定值,将当前的第二中间识别模型确定为目标识别模型。
7.一种目标识别方法,其特征在于,包括:
将待识别图像输入权利要求1-6任意一项所述的方法训练得到的目标识别模型中进行识别,得到识别结果。
8.一种识别模型训练装置,其特征在于,包括:
筛选模块,用于将初始图像集进行筛选,以确定出目标图像集;所述目标图像集中包括含有目标特征的图像;
确定模块,用于根据预先标注的包括所述目标特征的标注图像集确定出锚框的目标参数;
训练模块,用于将所述目标图像集输入预识别模型中,基于所述目标参数的锚框对所述预识别模型进行训练,以得到目标识别模型。
9.一种电子设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910687366.3A CN110399927B (zh) | 2019-07-26 | 2019-07-26 | 识别模型训练方法、目标识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910687366.3A CN110399927B (zh) | 2019-07-26 | 2019-07-26 | 识别模型训练方法、目标识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110399927A true CN110399927A (zh) | 2019-11-01 |
CN110399927B CN110399927B (zh) | 2022-02-01 |
Family
ID=68324373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910687366.3A Active CN110399927B (zh) | 2019-07-26 | 2019-07-26 | 识别模型训练方法、目标识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399927B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488939A (zh) * | 2020-04-15 | 2020-08-04 | 天津美腾科技股份有限公司 | 模型训练方法、分类方法、装置及设备 |
CN111524106A (zh) * | 2020-04-13 | 2020-08-11 | 北京推想科技有限公司 | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 |
CN112100428A (zh) * | 2020-09-24 | 2020-12-18 | 大方众智创意广告(珠海)有限公司 | 图形模板匹配方法、装置及电子设备 |
CN112149501A (zh) * | 2020-08-19 | 2020-12-29 | 北京豆牛网络科技有限公司 | 具有包装的果蔬的识别方法、识别装置、电子设备以及计算机可读介质 |
CN113076983A (zh) * | 2021-03-26 | 2021-07-06 | 北京明略软件系统有限公司 | 一种图像的识别方法和装置 |
CN113327195A (zh) * | 2021-04-09 | 2021-08-31 | 中科创达软件股份有限公司 | 图像处理、图像处理模型训练、图像模式识别方法和装置 |
CN113407680A (zh) * | 2021-06-30 | 2021-09-17 | 竹间智能科技(上海)有限公司 | 异质集成模型筛选方法和电子设备 |
CN114821046A (zh) * | 2022-03-28 | 2022-07-29 | 深思考人工智能科技(上海)有限公司 | 基于细胞图像进行细胞检测和细胞核分割的方法及系统 |
CN115984261A (zh) * | 2023-03-13 | 2023-04-18 | 首都医科大学附属北京口腔医院 | 基于牙齿图像的识别跟踪方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461152A (zh) * | 2018-01-12 | 2018-08-28 | 平安科技(深圳)有限公司 | 医疗模型训练方法、医疗识别方法、装置、设备及介质 |
CN108510194A (zh) * | 2018-03-30 | 2018-09-07 | 平安科技(深圳)有限公司 | 风控模型训练方法、风险识别方法、装置、设备及介质 |
CN108549954A (zh) * | 2018-03-26 | 2018-09-18 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN109214343A (zh) * | 2018-09-14 | 2019-01-15 | 北京字节跳动网络技术有限公司 | 用于生成人脸关键点检测模型的方法和装置 |
CN109460792A (zh) * | 2018-11-14 | 2019-03-12 | 深圳市威富视界有限公司 | 一种基于图像识别的人工智能模型训练方法及装置 |
CN109740752A (zh) * | 2018-12-29 | 2019-05-10 | 北京市商汤科技开发有限公司 | 深度模型训练方法及装置、电子设备及存储介质 |
-
2019
- 2019-07-26 CN CN201910687366.3A patent/CN110399927B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461152A (zh) * | 2018-01-12 | 2018-08-28 | 平安科技(深圳)有限公司 | 医疗模型训练方法、医疗识别方法、装置、设备及介质 |
CN108549954A (zh) * | 2018-03-26 | 2018-09-18 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN108510194A (zh) * | 2018-03-30 | 2018-09-07 | 平安科技(深圳)有限公司 | 风控模型训练方法、风险识别方法、装置、设备及介质 |
CN109214343A (zh) * | 2018-09-14 | 2019-01-15 | 北京字节跳动网络技术有限公司 | 用于生成人脸关键点检测模型的方法和装置 |
CN109460792A (zh) * | 2018-11-14 | 2019-03-12 | 深圳市威富视界有限公司 | 一种基于图像识别的人工智能模型训练方法及装置 |
CN109740752A (zh) * | 2018-12-29 | 2019-05-10 | 北京市商汤科技开发有限公司 | 深度模型训练方法及装置、电子设备及存储介质 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111524106A (zh) * | 2020-04-13 | 2020-08-11 | 北京推想科技有限公司 | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 |
CN111524106B (zh) * | 2020-04-13 | 2021-05-28 | 推想医疗科技股份有限公司 | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 |
CN111488939A (zh) * | 2020-04-15 | 2020-08-04 | 天津美腾科技股份有限公司 | 模型训练方法、分类方法、装置及设备 |
CN112149501A (zh) * | 2020-08-19 | 2020-12-29 | 北京豆牛网络科技有限公司 | 具有包装的果蔬的识别方法、识别装置、电子设备以及计算机可读介质 |
CN112100428A (zh) * | 2020-09-24 | 2020-12-18 | 大方众智创意广告(珠海)有限公司 | 图形模板匹配方法、装置及电子设备 |
CN113076983A (zh) * | 2021-03-26 | 2021-07-06 | 北京明略软件系统有限公司 | 一种图像的识别方法和装置 |
CN113327195A (zh) * | 2021-04-09 | 2021-08-31 | 中科创达软件股份有限公司 | 图像处理、图像处理模型训练、图像模式识别方法和装置 |
CN113407680A (zh) * | 2021-06-30 | 2021-09-17 | 竹间智能科技(上海)有限公司 | 异质集成模型筛选方法和电子设备 |
CN113407680B (zh) * | 2021-06-30 | 2023-06-02 | 竹间智能科技(上海)有限公司 | 异质集成模型筛选方法和电子设备 |
CN114821046A (zh) * | 2022-03-28 | 2022-07-29 | 深思考人工智能科技(上海)有限公司 | 基于细胞图像进行细胞检测和细胞核分割的方法及系统 |
CN114821046B (zh) * | 2022-03-28 | 2024-05-03 | 深思考人工智能科技(上海)有限公司 | 基于细胞图像进行细胞检测和细胞核分割的方法及系统 |
CN115984261A (zh) * | 2023-03-13 | 2023-04-18 | 首都医科大学附属北京口腔医院 | 基于牙齿图像的识别跟踪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110399927B (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399927A (zh) | 识别模型训练方法、目标识别方法及装置 | |
CN109034365A (zh) | 深度学习模型的训练方法及装置 | |
CN106682633B (zh) | 基于机器视觉的粪便镜检图像有形成分的分类识别方法 | |
CN105303179A (zh) | 指纹识别方法、装置 | |
CN107358157A (zh) | 一种人脸活体检测方法、装置以及电子设备 | |
WO2019005186A1 (en) | NEURONAL NETWORKS OF TOPOLOGY-SENSITIVE GRAPHICS | |
CN108549870A (zh) | 一种对物品陈列进行鉴别的方法及装置 | |
US20180336454A1 (en) | Neural network systems | |
Zhou et al. | A vegetable disease recognition model for complex background based on region proposal and progressive learning | |
CN107958230A (zh) | 人脸表情识别方法及装置 | |
CN103745233B (zh) | 基于空间信息迁移的高光谱图像分类方法 | |
CN109993021A (zh) | 人脸正脸检测方法、装置及电子设备 | |
CN110443159A (zh) | 数字识别方法、装置、电子设备及存储介质 | |
CN109684302A (zh) | 数据预测方法、装置、设备及计算机可读存储介质 | |
Yilmaz et al. | Adaptive multidimensional outlier analysis for analog and mixed signal circuits | |
CN110046633A (zh) | 一种数据质量检测方法及装置 | |
CN107578438A (zh) | 圆识别方法、装置及电子设备 | |
CN110059635A (zh) | 一种皮肤瑕疵检测方法及装置 | |
Ma et al. | LabelForest: Non-parametric semi-supervised learning for activity recognition | |
CN109241962A (zh) | 一种字符识别方法及装置 | |
CN112420125A (zh) | 分子属性预测方法、装置、智能设备和终端 | |
CN109598285A (zh) | 一种模型的处理方法、装置及设备 | |
CN104616022A (zh) | 一种近红外光谱的分类方法 | |
CN104978569A (zh) | 一种基于稀疏表示的增量人脸识别方法 | |
CN113569726B (zh) | 一种联合自动数据增广和损失函数搜索的行人检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: Room 601-605, 6th Floor, Building J, Building 5, Yunmi City, No. 19, Ningshuang Road, Yuhuatai District, Nanjing, Jiangsu Province, 210000 Patentee after: Jiuyisanluling medical technology Nanjing Co.,Ltd. Address before: Room 305, building A3, Nanhai Science Park, 180 software Avenue, Yuhuatai District, Nanjing City, Jiangsu Province, 210000 Patentee before: Jiuyisanluling medical technology Nanjing Co.,Ltd. |