CN109447937B - 一种图像处理模型的确定方法及其相关装置 - Google Patents

一种图像处理模型的确定方法及其相关装置 Download PDF

Info

Publication number
CN109447937B
CN109447937B CN201710754656.6A CN201710754656A CN109447937B CN 109447937 B CN109447937 B CN 109447937B CN 201710754656 A CN201710754656 A CN 201710754656A CN 109447937 B CN109447937 B CN 109447937B
Authority
CN
China
Prior art keywords
sample data
image processing
training
rare
processing model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710754656.6A
Other languages
English (en)
Other versions
CN109447937A (zh
Inventor
张志鹏
寿文卉
许利群
徐青青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Heshi Eye Hospital Co ltd
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
Shenyang Heshi Eye Hospital Co ltd
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Heshi Eye Hospital Co ltd, China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical Shenyang Heshi Eye Hospital Co ltd
Priority to CN201710754656.6A priority Critical patent/CN109447937B/zh
Publication of CN109447937A publication Critical patent/CN109447937A/zh
Application granted granted Critical
Publication of CN109447937B publication Critical patent/CN109447937B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种图像处理模型的确定方法及其相关装置,首先,采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;之后,根据初始的图像处理模型确定训练样本数据中的稀有样本数据,并在训练样本数据中提升稀有样本数据的出现频率;最后,采用提升稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第一优化的图像处理模型。通过筛选出稀有样本数据并对其样本量进行扩充,使训练样本数据涵盖更多的数据变化条件,可以提高最后形成的图像处理模型对于稀有样本数据的分析精度。

Description

一种图像处理模型的确定方法及其相关装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种图像处理模型的确定方法及其相关装置。
背景技术
近些年计算机视觉、机器学习和人工智能在图像处理领域,尤其是医学图像处理领域已取得令人瞩目的成果。其中,深度学习领域是机器学习领域中最新且有影响力的前沿领域。传统的医学图像处理方法需要人工选取特征,这不仅需要相关医学经验,还需要消耗人力资源,而拍照环境、光照、拍摄角度等因素都会对检测精度造成影响。与传统的方法相比,使用深度学习进行医学图像处理可以自动选取特征,深度学习网络在迭代过程中可以不断学习提取特征。
深度学习在医学图像处理上的研究虽然不久,但近几年发展迅速,取得惊人的效果。随着深度学习研究的不断深入和发展,深度学习将会广泛地应用到医学图像分割领域,为医生提供决策支持。
一般的基于深度学习的图像特征分析的基本方法和处理流程,如图1所示,包括以下主要步骤:
1、数据预处理步骤:调整输入图像的维度,使之为诸如150*150的标准维度,接着对图像进行归一化(/255),使图像中所有的像素值都在[0,1]。
2、数据提升步骤:在深度学习的过程中,为了避免出现过拟合问题,通常需要输入充足的数据量,用已有的输入图像随机生成相似图像,具体简单地随机选择和平移已有的输入图像就能取得很大的数据提升。
3、训练深度学习卷积网络(CNN)步骤:CNN的网络结构如下:
卷积层(3*3)、激活层(激活函数为relu)、汇聚(Pooling)层;
卷积层(2*2)、激活层(激活函数为relu)、Pooling层;
卷积层(2*2)、激活层(激活函数为relu)、Pooling层;
全连接层,激活层(激活函数为relu);
全连接层,激活层(激活函数为sigmoid)。
采用上述训练CNN网络的过程经过大量实验和分析发现:训练集的常见样本(出现次数较多的样本)类似的照片基本不会被分类错误即分析精度较高,而训练数据集里的那些不长出现的样本即稀有样本容易被分类错误即分析精度较低。以眼前节图像为例,晶体混浊从晶状体中心部位即胚胎核位置开始出现密度增加,逐渐加重并缓慢向周围扩展,早期呈淡黄色,随着混浊加重,色泽渐加深如深黄色,深棕黄色。晶体混浊程度高的图像容易区分,但是晶体混浊程度轻的图像难以获得好的分类效果,即晶体混浊程度轻的图像为稀有样本。
因此,如何提高图像处理模型对于稀有样本的分析精度,是急需解决的技术问题。
发明内容
有鉴于此,本发明实施例提供了一种图像处理模型的确定方法及其相关装置,用以解决现有的图像处理模型对于稀有样本的分析精度不高的问题。
因此,本发明实施例提供了一种图像处理模型的确定方法,包括:
采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;
根据所述初始的图像处理模型确定所述训练样本数据中的稀有样本数据;
在所述训练样本数据中提升所述稀有样本数据的出现频率;
采用提升所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第一优化的图像处理模型。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定方法中,还包括:
根据所述第一优化的图像处理模型更新所述训练样本数据中的稀有样本数据;在所述训练样本数据中提升更新的所述稀有样本数据的出现频率;采用提升更新的所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第二优化的图像处理模型;
直到更新的所述稀有样本数据与上次更新的所述稀有样本数据之差在预设范围内为止,确定得到最终优化图像处理模型。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定方法中,根据图像处理模型确定所述训练样本数据中的稀有样本数据,具体包括:
利用所述图像处理模型确定所述训练样本数据中各样本图像的概率值;
根据确定出的各所述样本图像的概率值和各所述样本图像所包含的标签值,确定各所述样本图像经过所述图像处理模型后的误差值;
根据各所述样本图像经过所述图像处理模型后的误差值,确定所述训练样本数据中的稀有样本数据。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定方法中,所述根据各所述样本图像经过所述图像处理模型后的误差值,确定所述训练样本数据中的稀有样本数据,具体包括:
对各所述样本图像经过所述图像处理模型后的误差值进行排序;
将误差值大于预设值的各所述样本图像确定为所述训练样本数据中的稀有样本数据。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定方法中,在所述训练样本数据中提升所述稀有样本数据的出现频率,具体包括:
对所述稀有样本数据进行数据提升;
将数据提升后的所述稀有样本数据加入至所述训练样本数据中。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定方法中,采用训练样本数据对深度学习卷积网络训练,或,采用提升更新的所述稀有样本数据的出现频率后的训练样本数据,具体包括:
对所述训练样本数据进行归一化预处理;
对归一化处理后的训练样本数据进行数据提升;
采用数据提升后的训练样本数据对深度学习卷积网络训练。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定方法中,所述训练样本数据为眼前节图像的训练样本数据。
另一方面,本发明实施例还提供了一种图像处理模型的确定装置,包括:
训练样本数据模块,用于存储训练样本数据;
训练模块,用于采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;
确定模块,用于根据所述初始的图像处理模型确定所述训练样本数据中的稀有样本数据;
更新模块,用于在所述训练样本数据中提升所述稀有样本数据的出现频率;
所述训练模块,还用于采用提升所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第一优化的图像处理模型。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定装置中:
所述确定模块,还用于根据所述第一优化的图像处理模型更新所述训练样本数据中的稀有样本数据;
所述更新模块,还用于在所述训练样本数据中提升更新的所述稀有样本数据的出现频率;
所述训练模块,还用于采用提升更新的所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第二优化的图像处理模型;直到更新的所述稀有样本数据与上次更新的所述稀有样本数据之差在预设范围内为止,确定得到最终优化图像处理模型。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定装置中,所述确定模块,具体包括:
概率计算单元,用于利用所述图像处理模型确定所述训练样本数据中各样本图像的概率值;
误差计算单元,用于根据确定出的各所述样本图像的概率值和各所述样本图像所包含的标签值,确定各所述样本图像经过所述图像处理模型后的误差值;
稀有样本确定单元,用于根据各所述样本图像经过所述图像处理模型后的误差值,确定所述训练样本数据中的稀有样本数据。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定装置中,所述误差计算单元,具体用于对各所述样本图像经过所述图像处理模型后的误差值进行排序;将误差值大于预设值的各所述样本图像确定为所述训练样本数据中的稀有样本数据。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定装置中,所述更新模块,具体用于对所述稀有样本数据进行数据提升;将数据提升后的所述稀有样本数据加入至所述训练样本数据中。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定装置中,所述训练模块,具体包括:
预处理单元,用于对所述训练样本数据进行归一化预处理;
数据提升单元,用于对归一化处理后的训练样本数据进行数据提升;
训练单元,用于采用数据提升后的训练样本数据对深度学习卷积网络训练。
在一种可能实现的方式中,在本发明实施例提供的上述图像处理模型的确定装置中,所述训练样本数据模块,具体用于存储眼前节图像的训练样本数据。
另一方面,本发明实施例还提供了一种计算设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行本发明实施例提供的上述方法的步骤。
另一方面,本发明实施例还提供了一种计算机可读介质,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行本发明实施例提供的上述方法的步骤。
本发明实施例的有益效果包括:
本发明实施例提供的一种图像处理模型的确定方法及其相关装置,首先,采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;之后,根据初始的图像处理模型确定训练样本数据中的稀有样本数据,并在训练样本数据中提升稀有样本数据的出现频率;最后,采用提升稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第一优化的图像处理模型。通过筛选出稀有样本数据并对其样本量进行扩充,使训练样本数据涵盖更多的数据变化条件,可以提高最后形成的图像处理模型对于稀有样本数据的分析精度。
附图说明
图1为现有技术中基于深度学习的图像特征分析的基本方法和处理流程示意图;
图2为本发明实施例提供的图像处理模型的确定方法的流程示意图;
图3为本发明实施例提供的图像处理模型的确定方法的另一流程示意图;
图4为本发明实施例提供的图像处理模型的确定方法中根据图像处理模型确定训练样本数据中的稀有样本数据的流程示意图;
图5为本发明实施例提供的图像处理模型的确定装置的结构示意图。
具体实施方式
下面结合附图,对本发明实施例提供的图像处理模型的确定方法及其相关装置的具体实施方式进行详细地说明。
本发明实施例提供了一种图像处理模型的确定方法,如图2所示,可以包括以下步骤:
S201、采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;
S202、根据初始的图像处理模型确定训练样本数据中的稀有样本数据;
S203、在训练样本数据中提升稀有样本数据的出现频率;
S204、采用提升稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第一优化的图像处理模型。
具体地,由于在本发明实施例提供的上述图像处理模型的确定方法中,在采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型之后,可以根据初始的图像处理模型确定出训练样本数据中的稀有样本数据即筛选出稀有样本数据,之后在训练样本数据中提升稀有样本数据的出现频率即对稀有样本数据的样本量进行扩充,使训练样本数据涵盖更多的数据变化条件,最后,采用提升稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,可以提高最后形成的图像处理模型对于稀有样本数据的分析精度。
在具体实施时,为了进一步提高最后形成的图像处理模型对于稀有样本数据的分析精度,可以多次迭代计算稀有样本数据,基于此在本发明实施例提供的上述图像处理模型的确定方法中,如图3所示,还可以包括以下步骤:
S205、根据第一优化的图像处理模型更新训练样本数据中的稀有样本数据;
S206、在训练样本数据中提升更新的稀有样本数据的出现频率;
S207、采用提升更新的稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第二优化的图像处理模型;
S208、直到更新的稀有样本数据与上次更新的稀有样本数据之差在预设范围内为止,确定得到最终优化的图像处理模型。
具体地,在得到第一优化的图像处理模型之后,可以再次计算稀有样本数据,此次计算得到的稀有样本数据和上次计算得到的稀有样本数据存在一定的差异,该差异在预设范围时,在根据采用提升此次计算得到的稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到图像处理模型后即为最终优化的图像处理模型;当该差异超出预设范围时,在根据采用提升此次计算得到的稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到图像处理模型后再次计算稀有样本数据,直至本次稀有样本数据与上次计算的稀有样本数据之差在预设范围内为止。这样,通过多次迭代计算,可以逐步筛选和提升稀有样本数据的出现频率,以优化最终得到的图像处理模型,使得到最终优化的图像处理模型对于稀有样本数据的分析精度得益最大的提高。
或者,在本发明实施例提供的上述图像处理模型的确定方法中,可以设定固定的迭代次数,即执行多次建立图像处理模型,并执行多次确定稀有样本数据以及在训练样本数据中多次扩充稀有样本数据的出现频率,以最后建立的图像处理模型作为最终优化的图像处理模型。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定方法中,在多次迭代的过程中,根据图像处理模型确定训练样本数据中的稀有样本数据的步骤即步骤S202和步骤S205,如图4所示,均可以采用如下方式实现:
S401、利用图像处理模型确定训练样本数据中各样本图像Xi的概率值Si;
S402、根据确定出的各样本图像Xi的概率值Si和各样本图像Xi所包含的标签值Li,确定各样本图像Xi经过图像处理模型后的误差值Wi=|Si-Li|;
S403、根据各样本图像经过图像处理模型后的误差值Wi,确定训练样本数据中的稀有样本数据。
一般地,每个样本图像Xi多会有对应的标签值Li,例如Li=1则表示正常,Li=0则表示非正常即异常,误差值Wi越大则表示预测结果与最初的标签值Li差别越大,越难分辨,因此,可以根据误差值Wi可以挑选出稀有样本数据。并且,值得注意的是,存在较大误差值Wi的训练样本数据可能是异常数据,也能是正常数据,在此不做限定。
基于此,在具体实施时,在本发明实施例提供的上述图像处理模型的确定方法中,步骤S403根据各样本图像经过图像处理模型后的误差值Wi,确定训练样本数据中的稀有样本数据,可以具体通过如下方式实现:
首先,对各样本图像经过图像处理模型后的误差值Wi进行排序;
之后,将误差值Wi大于预设值的各样本图像确定为训练样本数据中的稀有样本数据。
当然,在具体实施时,在本发明实施例提供的上述图像处理模型的确定方法中,步骤S403根据各样本图像经过图像处理模型后的误差值Wi,确定训练样本数据中的稀有样本数据,也可以省去误差值Wi排序的过程,直接将每个误差值Wi与预设值进行比较,以确定误差值Wi大于预设值的各样本图像。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定方法中,在多次迭代的过程中,步在训练样本数据中提升稀有样本数据的出现频率的步骤即骤S203和S206,均可以具体通过如下方式实现:
首先,对稀有样本数据进行数据提升;例如,可以对稀有样本数据进行简单地随机选择和平移以随机生成相似数据;并且,还可以对于误差值Wi越大的稀有样本数据生成更多的相似数据,或者,也可以对全部稀有样本数据生成相同数量的相似数据;
之后,将数据提升后的稀有样本数据加入至训练样本数据中,即相当于更新后的训练样本数据中,同时存在稀有样本数据,以及数据提升后的稀有样本数据,这样,稀有样本数据的占比得以提高。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定方法中,在多次迭代的过程中,为了避免出现过拟合问题,训练深度学习卷积网络的步骤,即步骤S201采用训练样本数据对深度学习卷积网络训练和步骤S205采用提升更新的稀有样本数据的出现频率后的训练样本数据,可以具体通过如下方式实现:
首先,对训练样本数据进行归一化预处理;具体地,可以使训练样本数据为诸如150*150的标准维度,接着对训练样本数据进行归一化(/255),使训练样本数据中所有的像素值都在[0,1];
之后,对归一化处理后的训练样本数据进行数据提升;具体地,可以对训练样本数据进行简单地随机选择和平移以随机生成相似数据;
最后,采用数据提升后的训练样本数据对深度学习卷积网络训练。
当然,在本发明实施例提供的上述图像处理模型的确定方法中,当训练样本数据的数据量足够充足的情况下,也可以省去数据提升和归一化处理的步骤,在此不做限定。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定方法中,训练样本数据为眼前节图像的训练样本数据。即最后建立的图像处理模型可以时针对眼前节图像进行处理的模型。
基于同一发明构思,本发明实施例还提供了一种图像处理模型的确定装置,由于该确定装置解决问题的原理与前述一种图像处理模型的确定方法相似,因此该确定装置的实施可以参见确定方法的实施,重复之处不再赘述。
具体地,本发明实施例还提供了一种图像处理模型的确定装置,如图5所示,包括:
训练样本数据模块510,用于存储训练样本数据;
训练模块520,用于采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;
确定模块530,用于根据初始的图像处理模型确定训练样本数据中的稀有样本数据;
更新模块540,用于在训练样本数据中提升稀有样本数据的出现频率;
训练模块510,还用于采用提升稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第一优化的图像处理模型。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定装置中:
确定模块530,还用于根据第一优化的图像处理模型更新训练样本数据中的稀有样本数据;
更新模块540,还用于在训练样本数据中提升更新的稀有样本数据的出现频率;
训练模块510,还用于采用提升更新的稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第二优化的图像处理模型;直到更新的稀有样本数据与上次更新的稀有样本数据之差在预设范围内为止,确定得到最终优化图像处理模型。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定装置中,确定模块530,如图5所示,可以具体包括:
概率计算单元531,用于利用图像处理模型确定训练样本数据中各样本图像的概率值;
误差计算单元532,用于根据确定出的各样本图像的概率值和各样本图像所包含的标签值,确定各样本图像经过图像处理模型后的误差值;
稀有样本确定单元533,用于根据各样本图像经过图像处理模型后的误差值,确定训练样本数据中的稀有样本数据。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定装置中,误差计算单元532,具体用于对各样本图像经过图像处理模型后的误差值进行排序;将误差值大于预设值的各样本图像确定为训练样本数据中的稀有样本数据。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定装置中,更新模块540,具体用于对稀有样本数据进行数据提升;将数据提升后的稀有样本数据加入至训练样本数据中。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定装置中,训练模块520,具体包括:
预处理单元521,用于对训练样本数据进行归一化预处理;
数据提升单元522,用于对归一化处理后的训练样本数据进行数据提升;
训练单元523,用于采用数据提升后的训练样本数据对深度学习卷积网络训练。
在具体实施时,在本发明实施例提供的上述图像处理模型的确定装置中,训练样本数据模块510,具体用于存储眼前节图像的训练样本数据。
基于同一发明构思,本发明实施例还提供了一种计算设备,包括至少一个处理单元、以及至少一个存储单元,其中,存储单元存储有计算机程序,当程序被处理单元执行时,使得处理单元执行本发明实施例提供的上述方法的步骤。
基于同一发明构思,本发明实施例还提供了一种计算机可读介质,其存储有可由计算设备执行的计算机程序,当程序在计算设备上运行时,使得处理单元执行本发明实施例提供的上述方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明实施例可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本发明实施例提供的上述图像处理模型的确定方法及其相关装置,首先,采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;之后,根据初始的图像处理模型确定训练样本数据中的稀有样本数据,并在训练样本数据中提升稀有样本数据的出现频率;最后,采用提升稀有样本数据的出现频率后的训练样本数据,对深度学习卷积网络重新训练,得到第一优化的图像处理模型。通过筛选出稀有样本数据并对其样本量进行扩充,使训练样本数据涵盖更多的数据变化条件,可以提高最后形成的图像处理模型对于稀有样本数据的分析精度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种图像处理模型的确定方法,其特征在于,包括:
采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;
根据所述初始的图像处理模型确定所述训练样本数据中的稀有样本数据;
在所述训练样本数据中提升所述稀有样本数据的出现频率;
采用提升所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第一优化的图像处理模型;
根据图像处理模型确定所述训练样本数据中的稀有样本数据,具体包括:
利用所述图像处理模型确定所述训练样本数据中各样本图像的概率值;
根据确定出的各所述样本图像的概率值和各所述样本图像所包含的标签值,确定各所述样本图像经过所述图像处理模型后的误差值;
根据各所述样本图像经过所述图像处理模型后的误差值,确定所述训练样本数据中的稀有样本数据。
2.如权利要求1所述的确定方法,其特征在于,还包括:
根据所述第一优化的图像处理模型更新所述训练样本数据中的稀有样本数据;在所述训练样本数据中提升更新的所述稀有样本数据的出现频率;采用提升更新的所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第二优化的图像处理模型;
直到更新的所述稀有样本数据与上次更新的所述稀有样本数据之差在预设范围内为止,确定得到最终优化图像处理模型。
3.如权利要求1所述的确定方法,其特征在于,所述根据各所述样本图像经过所述图像处理模型后的误差值,确定所述训练样本数据中的稀有样本数据,具体包括:
对各所述样本图像经过所述图像处理模型后的误差值进行排序;
将误差值大于预设值的各所述样本图像确定为所述训练样本数据中的稀有样本数据。
4.如权利要求1或2所述的确定方法,其特征在于,在所述训练样本数据中提升所述稀有样本数据的出现频率,具体包括:
对所述稀有样本数据进行数据提升;
将数据提升后的所述稀有样本数据加入至所述训练样本数据中。
5.如权利要求1或2所述的确定方法,其特征在于,采用训练样本数据对深度学习卷积网络训练,或,采用提升更新的所述稀有样本数据的出现频率后的训练样本数据,具体包括:
对所述训练样本数据进行归一化预处理;
对归一化处理后的训练样本数据进行数据提升;
采用数据提升后的训练样本数据对深度学习卷积网络训练。
6.如权利要求1所述的确定方法,其特征在于,所述训练样本数据为眼前节图像的训练样本数据。
7.一种图像处理模型的确定装置,其特征在于,包括:
训练样本数据模块,用于存储训练样本数据;
训练模块,用于采用训练样本数据对深度学习卷积网络训练,得到初始的图像处理模型;
确定模块,用于根据所述初始的图像处理模型确定所述训练样本数据中的稀有样本数据;
更新模块,用于在所述训练样本数据中提升所述稀有样本数据的出现频率;
所述训练模块,还用于采用提升所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第一优化的图像处理模型;
所述确定模块,具体包括:
概率计算单元,用于利用所述图像处理模型确定所述训练样本数据中各样本图像的概率值;
误差计算单元,用于根据确定出的各所述样本图像的概率值和各所述样本图像所包含的标签值,确定各所述样本图像经过所述图像处理模型后的误差值;
稀有样本确定单元,用于根据各所述样本图像经过所述图像处理模型后的误差值,确定所述训练样本数据中的稀有样本数据。
8.如权利要求7所述的确定装置,其特征在于:
所述确定模块,还用于根据所述第一优化的图像处理模型更新所述训练样本数据中的稀有样本数据;
所述更新模块,还用于在所述训练样本数据中提升更新的所述稀有样本数据的出现频率;
所述训练模块,还用于采用提升更新的所述稀有样本数据的出现频率后的训练样本数据,对所述深度学习卷积网络重新训练,得到第二优化的图像处理模型;直到更新的所述稀有样本数据与上次更新的所述稀有样本数据之差在预设范围内为止,确定得到最终优化图像处理模型。
9.如权利要求7所述的确定装置,其特征在于,所述误差计算单元,具体用于对各所述样本图像经过所述图像处理模型后的误差值进行排序;将误差值大于预设值的各所述样本图像确定为所述训练样本数据中的稀有样本数据。
10.如权利要求7或8所述的确定装置,其特征在于,所述更新模块,具体用于对所述稀有样本数据进行数据提升;将数据提升后的所述稀有样本数据加入至所述训练样本数据中。
11.如权利要求7或8所述的确定装置,其特征在于,所述训练模块,具体包括:
预处理单元,用于对所述训练样本数据进行归一化预处理;
数据提升单元,用于对归一化处理后的训练样本数据进行数据提升;
训练单元,用于采用数据提升后的训练样本数据对深度学习卷积网络训练。
12.如权利要求7所述的确定装置,其特征在于,所述训练样本数据模块,具体用于存储眼前节图像的训练样本数据。
13.一种计算设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~6任一项权利要求所述方法的步骤。
14.一种计算机可读介质,其特征在于,其存储有可由计算设备执行的计算机程序,当所述程序在所述计算设备上运行时,使得所述计算设备执行权利要求1~6任一项所述方法的步骤。
CN201710754656.6A 2017-08-29 2017-08-29 一种图像处理模型的确定方法及其相关装置 Active CN109447937B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710754656.6A CN109447937B (zh) 2017-08-29 2017-08-29 一种图像处理模型的确定方法及其相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710754656.6A CN109447937B (zh) 2017-08-29 2017-08-29 一种图像处理模型的确定方法及其相关装置

Publications (2)

Publication Number Publication Date
CN109447937A CN109447937A (zh) 2019-03-08
CN109447937B true CN109447937B (zh) 2021-07-06

Family

ID=65530036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710754656.6A Active CN109447937B (zh) 2017-08-29 2017-08-29 一种图像处理模型的确定方法及其相关装置

Country Status (1)

Country Link
CN (1) CN109447937B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555847B (zh) * 2019-07-31 2021-04-02 瀚博半导体(上海)有限公司 一种基于卷积神经网络的图像处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105372723A (zh) * 2015-10-30 2016-03-02 中国科学院国家天文台 基于卷积神经网络模型的太阳耀斑预报方法
CN106294466A (zh) * 2015-06-02 2017-01-04 富士通株式会社 分类模型构建方法、分类模型构建设备和分类方法
CN106803247A (zh) * 2016-12-13 2017-06-06 上海交通大学 一种基于多级筛选卷积神经网络的微血管瘤自动检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4831550A (en) * 1986-03-27 1989-05-16 International Business Machines Corporation Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events
CN101295305B (zh) * 2007-04-25 2012-10-31 富士通株式会社 图像检索装置
CN101587493B (zh) * 2009-06-29 2012-07-04 中国科学技术大学 文本分类方法
CN102542014B (zh) * 2011-12-16 2013-09-18 华中科技大学 基于内容的图像检索反馈方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294466A (zh) * 2015-06-02 2017-01-04 富士通株式会社 分类模型构建方法、分类模型构建设备和分类方法
CN105372723A (zh) * 2015-10-30 2016-03-02 中国科学院国家天文台 基于卷积神经网络模型的太阳耀斑预报方法
CN106803247A (zh) * 2016-12-13 2017-06-06 上海交通大学 一种基于多级筛选卷积神经网络的微血管瘤自动检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
稀有类分类问题研究;刘艳霞;《微型机与应用》;20050630(第6期);第54页右栏,"3.1不平衡数据集的处理" *

Also Published As

Publication number Publication date
CN109447937A (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
WO2017020723A1 (zh) 一种字符分割方法、装置及电子设备
US10846566B2 (en) Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks
CN111079639B (zh) 垃圾图像分类模型构建的方法、装置、设备及存储介质
EP3227836B1 (en) Active machine learning
US11151417B2 (en) Method of and system for generating training images for instance segmentation machine learning algorithm
US11804069B2 (en) Image clustering method and apparatus, and storage medium
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
NL2025689B1 (en) Crop pest detection method based on f-ssd-iv3
EP3620982B1 (en) Sample processing method and device
CN111027605A (zh) 基于深度学习的细粒度图像识别方法和装置
US11875512B2 (en) Attributionally robust training for weakly supervised localization and segmentation
CN110956126A (zh) 一种联合超分辨率重建的小目标检测方法
CN110826457B (zh) 一种复杂场景下的车辆检测方法及装置
US11600088B2 (en) Utilizing machine learning and image filtering techniques to detect and analyze handwritten text
WO2018004980A1 (en) Technologies for classification using sparse coding in real time
JPWO2019146057A1 (ja) 学習装置、実写画像分類装置の生成システム、実写画像分類装置の生成装置、学習方法及びプログラム
CN114118287A (zh) 样本生成方法、装置、电子设备以及存储介质
JP2018195231A (ja) 学習モデル作成装置、該方法および該プログラム
CN110163206B (zh) 车牌识别方法、系统、存储介质和装置
CN116166812A (zh) 知识图谱补全方法、装置、电子设备和存储介质
CN111178153A (zh) 一种交通标志检测方法及系统
CN112991281B (zh) 视觉检测方法、系统、电子设备及介质
CN109447937B (zh) 一种图像处理模型的确定方法及其相关装置
US20220335274A1 (en) Multi-stage computationally efficient neural network inference
CN114692778B (zh) 用于智能巡检的多模态样本集生成方法、训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant