CN112364892B - 一种基于动态模型的图像识别方法及装置 - Google Patents

一种基于动态模型的图像识别方法及装置 Download PDF

Info

Publication number
CN112364892B
CN112364892B CN202011129516.8A CN202011129516A CN112364892B CN 112364892 B CN112364892 B CN 112364892B CN 202011129516 A CN202011129516 A CN 202011129516A CN 112364892 B CN112364892 B CN 112364892B
Authority
CN
China
Prior art keywords
algorithm
unit
image
image recognition
algorithm combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011129516.8A
Other languages
English (en)
Other versions
CN112364892A (zh
Inventor
温研
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Linzhuo Information Technology Co Ltd
Original Assignee
Beijing Linzhuo Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Linzhuo Information Technology Co Ltd filed Critical Beijing Linzhuo Information Technology Co Ltd
Priority to CN202011129516.8A priority Critical patent/CN112364892B/zh
Publication of CN112364892A publication Critical patent/CN112364892A/zh
Application granted granted Critical
Publication of CN112364892B publication Critical patent/CN112364892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于动态模型的图像识别方法及装置,通过预先确定图像识别过程中各算法间的最佳组合,使开发人员仅需要根据识别目标选择适合的算法组合动态生成模型即可实现图像识别的功能,而不需要再进行开发和训练,有效地提高了开发人员的开发效率。

Description

一种基于动态模型的图像识别方法及装置
技术领域
本发明属于图像识别技术领域,具体涉及一种基于动态模型的图像识别方法及装置。
背景技术
图像识别技术是人工智能研究的重点领域之一。在视频监控、人机交互、交通监控、行为识别、自动导航等方面都有大量成功应用的例子。目前己经形成了许多有价值的目标识别方法。一般来说,基于模型的图像识别过程,主要包括图像预处理、基于模型的特征提取、特征优化及图像分类等多个步骤。
现有技术中上述每个处理过程都有多种可选的方法,例如,图像预处理的步骤可采用图像增强或图像分割的方法,基于模型的特征提取步骤可采用VGG16(Very DeepConvolutional Networks for Large-Scale Image Recognition)、Darknet53等神经网络框架,特征优化步骤可采用总方误差、二值交叉熵、阶梯度的随机目标函数等优化方法,图像分类步骤可采用平均值算法、最大值索引算法、logistic回归预测算法等方法。上述方法的原理及适用范围均不同,对不同的目标的识别效果也不相同。在实际使用过程中,往往需要根据应用场景的要求或检测目标的像素值等客观因素来选择具体的识别方法,例如,在选择基于模型的特征提取步骤所用方法时,对于小像素目标的识别,则选择处理效果较好的SSD(Single Shot MultiBox Detection)算法,而对于复杂场景下的目标识别则选择YOLOv3(You Only Look Once Version 3)算法。
由此可见,由于每个处理过程都存在多种可选的算法,因此,图像识别过程也就存在着多种不同的算法组合。现有技术中,当图像识别过程中涉及的某个算法更新或优化后,往往是根据经验或理论分析选定某一种特定的组合方式进行训练及应用,但这种方式往往会因为考虑不够充分等原因,导致由于未能采用最佳算法组合而出现图像识别结果精度不够高或处理效率较低的问题。
发明内容
有鉴于此,本发明提供了一种基于动态模型的图像识别方法及装置,基于动态组装的智能模型能够实现图像的精确高效识别。
本发明提供的一种基于动态模型的图像识别方法,包括以下步骤:
步骤1、将图像识别过程划分为多个单元,由实现所述单元的算法构成所述单元的单元算法集合;针对不同图像,从任意相邻单元的单元算法集合中选取匹配算法形成算法组合集合;
步骤2、从步骤1形成的所述算法组合集合中选取适合处理待识别图像的算法组合,形成算法组合初始子集;当存在更新单元时,执行步骤3;否则,将所述算法组合初始子集作为图像识别模型集合,并执行步骤5;
步骤3、在步骤2形成的所述算法组合初始子集中选择与所述更新单元匹配的单元算法,形成算法组合最终子集;若所述更新单元属于网络结构单元,则执行步骤4;否则,将所述算法组合最终子集作为图像识别模型集合,并执行步骤5;
步骤4、完成步骤3中得到的所述算法组合最终子集中算法组合的训练,将训练后的所述算法组合最终子集作为图像识别模型集合;
步骤5、测试所述图像识别模型集合,评估所述图像识别模型集合中的图像识别模型得到图像识别模型列表;
步骤6、应用时,从步骤5得到的所述图像识别模型列表中选择图像识别模型完成对待识别图像的处理得到图像类型。
进一步地,所述步骤1中的所述单元包括图像预处理单元、图像特征提取单元、图像特征优化单元及图像分类单元。
进一步地,所述步骤3中的所述在步骤2形成的所述算法组合初始子集中选择与所述更新单元匹配的单元算法,形成算法组合最终子集,具体过程为:
根据所述更新单元的单元算法的输入及输出的数据格式,在所述算法组合初始子集内,选择与所述更新单元的单元算法的输入及输出的数据格式相匹配的匹配单元算法,由所述匹配单元算法形成所述算法组合最终子集。
进一步地,所述步骤5中所述评估所述图像识别模型集合中的图像识别模型,具体过程为:计算所述图像识别模型的准确度和识别时间,所述识别时间为所述图像识别模型识别出图像结果所用的时间;当所述更新单元为网络结构单元时,计算所述图像识别模型的训练过程的收敛速率。
进一步地,所述准确度采用公式(1)计算,
Figure GDA0003272114850000031
其中,R为第i次迭代测试样本中识别正确的测试样本数量,N为迭代的总次数,mi第i次迭代测试样本的测试样本总数,M为测试样本的总数。
进一步地,所述收敛速率a为所述图像识别模型网络层训练过程中相邻的两次迭代输出的loss值的差值的绝对值与后一次迭代时间的比值。
本发明提供了一种基于动态模型的图像识别装置,包括算法组合生成模块、算法组合筛选模块、算法组合二次筛选模块、图像识别模型训练模块、图像识别模型评估模块及图像识别模块;
其中,所述算法组合生成模块,用于从图像识别过程中任意相邻的两个单元的单元算法集合中选取匹配算法构成算法组合,确定所有相邻单元的算法组合形成算法组合集合;
所述算法组合筛选模块,用于在所述算法组合生成模块生成的所述算法组合集合中选取适用于待识别图像的算法组合,形成所述待识别图像的算法组合初始子集;当没有需要更新的单元时,则将所述算法组合初始子集作为图像识别模型集合输出;
所述算法组合二次筛选模块,用于在更新单元后,在与已更新单元的相邻单元中选取与所述已更新单元的单元算法相匹配的单元算法形成算法组合最终子集;若所述已更新单元属于非网络结构单元,则将所述算法组合最终子集作为图像识别模型集合输出;
所述图像识别模型训练模块,用于在所述已更新单元为网络结构单元时,完成所述算法组合二次筛选模块输出的所述算法组合最终子集中算法组合的训练,将完成训练的算法组合最终子集作为图像识别模型集合输出;
所述图像识别模型评估模块,用于测试并评估所述图像识别模型集合中的图像识别模型,得到所述待识别图像的图像识别模型列表;
所述图像识别模块,用于从所述图像识别模型评估模块输出的所述图像识别模型列表中选取图像识别模型完成待识别图像的识别。
进一步地,所述单元包括图像预处理单元、图像特征提取单元、图像特征优化单元及图像分类单元。
有益效果:
1、本发明通过预先确定图像识别过程中各算法间的最佳组合,使开发人员仅需要根据识别目标选择适合的算法组合动态生成模型即可实现图像识别的功能,而不需要再进行开发和训练,因此有效地提高了开发人员的开发效率;此外,当图像识别过程中某个算法需要更新或优化时,本发明能够根据预设的最佳组合进行匹配生成多种算法组合模型,并采用提出的组合评估方法对生成的多种算法组合模型进行评估,根据评估结果确定最佳的算法组合模型,从而有效提高了基于算法组合模型的图像识别精度。
2、本发明通过将图像识别过程中各个算法分别部署在不同的计算节点上,采用分布式的计算方式完成算法组合模型的训练和验证过程,能够有效提升模型训练的效率。
附图说明
图1为本发明提供的一种基于动态模型的图像识别方法的流程图。
图2为本发明提供的一种基于动态模型的图像识别方法的算法组合示例图。
图3为本发明提供的一种基于动态模型的图像识别方法的分布式部署示意图。
图4为本发明提供的一种基于动态模型的图像识别装置的结构示意图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供的一种基于动态模型的图像识别方法,方法的流程如图1所示,具体包括以下步骤:
步骤1、根据实现的功能将图像识别过程划分为顺序连接的多个单元,例如,将基于模型的图像识别过程划分为图像预处理、基于模型的特征提取、特征优化及图像分类等单元。由实现每个单元的功能的算法构成该单元的单元算法集合,针对不同的识别目标,从任意相邻的两个单元的单元算法集合中分别选取最佳的匹配算法,由这两个匹配算法构成该相邻单元间的算法组合。遍历选择出所有相邻单元的算法组合,形成算法组合集合。
其中,从任意相邻的两个单元的单元算法集合中分别选取匹配算法的过程,可以是基于对历史数据的分析进行选取,也可以是根据经验或专家知识进行确定。
举例来说,对于图像预处理单元,实现其功能的算法包括图像增强类的算法,如:裁剪、缩放、高斯滤波及变换等,及图像分割类的算法,如:分布式拆分大像素的图片等。对于基于模型的特征提取单元,实现其功能的算法包括:VGG16(Very Deep ConvolutionalNetworks for Large-Scale Image Recognition)、Darknet53等神经网络框架。对于特征优化单元,实现其功能的算法包括:均方误差、二值交叉熵及阶梯度的随机目标函数优化等算法。对于图像分类单元,实现其功能的算法包括:平均值算法、最大值索引算法、Logistic回归预测算法等。上述算法分别构成了图像预处理单元、基于模型的特征提取单元、特征优化单元及图像分类单元的单元算法集合。
其中,根据对历史数据的分析,可以确定基于模型的特征提取单元与特征优化单元两个相连单元间的算法组合,如表1所示,一种算法组合是采用裁剪算法将待识别图像处理为416*416三维数组,采用Darknet53网络层对416*416三维数组进行特征提取,再采用均方误差、二值交叉熵算法对提取到的特征进行优化,最后采用Logistic回归预测算法根据优化后的特征进行图像分类,得到最终的识别结果。
Figure GDA0003272114850000061
表1算法组合示例
步骤2、根据待识别图像的属性,在步骤1形成的算法组合集合中选择出适合处理该待识别图像的算法组合,形成算法组合初始子集。当存在需要更新的单元时,执行步骤3;否则,将算法组合初始子集作为图像识别模型集合执行步骤5。
例如,对于待识别图像的背景较为复杂,则采用表1中算法组合:裁剪、Darknet53网络层、均方误差及二值交叉熵损失函数、Logistic回归预测算法。具体过程为:在预处理单元中,通过标注工具LabelImg对图像进行标注,从解析生成的XML文件中获得图像的路径、目标框的坐标及类别,然后按照图像目标框坐标生成对应的9个Anchor Box,再将图像等比例缩小后裁剪为416*416三维数组;在特征提取单元中,经过卷积和下采样提取特征值,特征值包括3个Anchor Box(大、中、小)、类别数量、框的4个坐标值和1个置信度;在特征优化单元中,将特征值送入均方误差、二值交叉熵损失函数中计算,通过3部分的坐标损失、置信度损失和类别损失来更新权重值得到最优权重值;在图像分类单元中,删除置信度低的坐标框和重叠的坐标框,输出最终结果。
步骤3、在算法组合初始子集内进行二次筛选,即根据更新后的单元算法在步骤2形成的算法组合初始子集中选择该更新单元的上下游单元中能够与更新后的算法相匹配的单元算法,形成算法组合最终子集。如果需要更新的单元为网络结构单元,则执行步骤4;否则,将算法组合最终子集作为图像识别模型集合,执行步骤5,具体来说,算法组合最终子集内图像识别各单元的相匹配的算法组成图像识别模型,由所有图像识别模型组成图像识别模型集合。
对更新单元的更新算法进行匹配时,可以根据该更新算法的输入、输出数据格式在该单元的上下游单元的单元算法集合中进行匹配得到上游单元算法集合和下游单元算法集合。然后,选择上游单元算法集合和下游单元算法集合中的算法根据步骤1中确定的算法组合,确定与上游算法及下游算法相连接的其他相邻单元的单元算法,以此类推形成算法组合最终子集。例如,当需要更新的单元为B算法为B1时,则根据B1的输入、输出的数据格式可以匹配到单元B的上游单元A中的A1、A2及A3算法,下游单元C的C1、C2及C3算法,然后根据步骤1中确定算法组合,则能够确定与单元C相邻的单元D中的算法,即C1的最佳匹配算法为D1、C2的最佳匹配算法为D2、C3的最佳匹配算法为D3,如图2所示。
步骤4、采用图像训练样本集完成步骤3中得到的算法组合最终子集中算法组合的训练,将完成训练的算法组合最终子集作为图像识别模型集合,即算法组合最终子集内图像识别各单元的相匹配的算法组成图像识别模型,由所有图像识别模型组成图像识别模型集合。具体来说,本发明可采用标准数据集完成算法组合的训练,标准数据集如CoCo数据集、dota数据集。
此外,为了提高本方法的效率,本发明可采用分布式的处理方式,即将图像识别过程中的各个单元中的可选单元算法均部署在不同的计算节点上,由各计算节点协同完成算法组合的训练及测试。在分布式的处理方式中,各单元算法间采用报文通信的方式进行交互。
例如,对于图2所示的算法组合可采用如图3所示的方式进行分布式训练。
步骤5、采用图像测试样本集对图像识别模型集合进行测试,根据测试结果对集合中的各图像识别模型进行评估,根据评估结果给出适用于待识别图像的图像识别模型列表。
进一步地,为了得到更加精确有效的评估结果,本发明可采用准确度和识别时间两个指标进行评估。具体来说,识别时间为图像识别模型完成单张图像的预测所需要的时间。准确度为图像识别模型的对图像预测的预测结果正确率,准确度P可采用如下公式进行计算:
Figure GDA0003272114850000081
其中,R为第i次迭代测试样本中识别正确的测试样本数量,N为迭代的总次数,mi第i次迭代测试样本的测试样本总数,M为测试样本的总数。
此外,对于需要对算法组合进行训练的情况,本发明还引入了对算法组合的训练过程的评估,主要采用收敛速率这个指标进行评估。其中,收敛速率为算法组合训练过程中损失值收敛快速稳定降低的标准。对于具有相同准确度的模型,模型的收敛速率越大,则模型的训练时间越短,模型也相对更优。收敛速率a的计算方法为图像识别模型网络层训练过程中相邻的两次迭代输出的loss值的差值的绝对值与后一次迭代时间的比值,具体公式如下:
Figure GDA0003272114850000091
其中,Li为图像识别模型训练过程中第i次迭代输出的loss值,ti+1为第i+1次迭代所用的时间。
模型的收敛速率可采用TensorBoard等外部工具来获取,具体过程为:记录训练过程中每次迭代输出的loss值,当相连的两次迭代输出的loss值之间的差值连续k次大于设定的差值阈值,且k大于设定的次数阈值时,则认为该模型出现了梯度爆炸,此时图像识别模型的收敛速率接近为零;当连续k次迭代输出的loss值均为NAN,且k大于设定的次数阈值时,则认为该模型出现了梯度消失,此时图像识别模型的收敛速率接近为零。
例如,对于图2所示的算法组合测试评估的结果如表2所示。由此,A1-B1-C1-D1为最佳图像识别模型。
算法组合 准确度 计算效率(s)
A1-B1-C1-D1 98.2% 2.2
A1-B1-C2-D2 97.6% 2.2
A1-B1-C3-D3 94.7% 2.2
A2-B1-C1-D1 92.3% 1.8
A2-B1-C2-D2 78.4% 1.8
A2-B1-C3-D3 73.2% 1.8
A3-B1-C1-D1 71.4% 1
A3-B1-C2-D2 43.2% 1
A3-B1-C3-D3 11.1% 1
表2算法组合的评估结果
步骤6、应用时,从步骤5得到的图像识别模型列表中选择最佳图像识别模型,完成对待识别图像的处理,得到待识别图像的类型。
应用时,用户根据自身的识别要求从图像识别模型列表中选择出最佳的图像识别模型完成图像识别。例如,对精度要求更高的用户可以选择表2中的A1-B1-C1-D1组合。
基于本发明提供的一种基于动态模型的图像识别方法,本发明提供了一种基于动态模型的图像识别装置,装置结构如图4所示,具体包括算法组合生成模块、算法组合筛选模块、算法组合二次筛选模块、图像识别模型训练模块、图像识别模型评估模块及图像识别模块。
其中,算法组合生成模块,用于针对不同的识别目标从图像识别过程中任意相邻的两个单元的单元算法集合中分别选取最佳的匹配算法,由这两个匹配算法构成该相邻单元间的算法组合,遍历选择出所有相邻单元的算法组合形成算法组合集合。
算法组合筛选模块,用于根据输入的待识别图像的属性,在算法组合生成模块生成的算法组合集合中选择出适合该待识别图像的算法组合,形成该待识别图像的算法组合初始子集;如果没有需要更新的单元,则将算法组合初始子集作为图像识别模型集合进行输出。
算法组合二次筛选模块,用于在图像识别过程中某单元发生更新时,根据更新后的单元算法在已更新单元的上下游单元中选择能够与更新后的算法相匹配的单元算法,形成算法组合最终子集;如果需要更新的单元不是特征提取单元,则将算法组合最终子集作为图像识别模型集合进行输出。
图像识别模型训练模块,用于在图像识别过程中更新单元为特征提取单元时,采用图像训练样本集完成对算法组合二次筛选模块输出的算法组合最终子集中各算法组合的训练,将完成训练的算法组合最终子集作为图像识别模型集合。本发明中可采用标准数据集完成算法组合的训练,标准数据集如CoCo数据集、dota数据集。
图像识别模型评估模块,用于对算法组合筛选模块、算法组合二次筛选模块及图像识别模型训练模块输出的图像识别模型集合进行测试,根据测试结果对集合中的各算法组合进行评估,根据评估结果给出适用于待识别图像的图像识别模型列表。
图像识别模块,用于从算法组合评估模块输出的图像识别模型列表中选择最佳图像识别模型对待识别图像进行识别得到该待识别图像的类型。
综上,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于动态模型的图像识别方法,其特征在于,包括以下步骤:
步骤1、将图像识别过程划分为多个单元,由实现所述单元的算法构成所述单元的单元算法集合;针对不同图像,从任意相邻单元的单元算法集合中选取匹配算法形成算法组合集合;
步骤2、从步骤1形成的所述算法组合集合中选取适合处理待识别图像的算法组合,形成算法组合初始子集;当存在更新单元时,执行步骤3;否则,将所述算法组合初始子集作为图像识别模型集合,并执行步骤5;
步骤3、在步骤2形成的所述算法组合初始子集中选择与所述更新单元匹配的单元算法,形成算法组合最终子集;若所述更新单元属于网络结构单元,则执行步骤4;否则,将所述算法组合最终子集作为图像识别模型集合,并执行步骤5;
步骤4、完成步骤3中得到的所述算法组合最终子集中算法组合的训练,将训练后的所述算法组合最终子集作为图像识别模型集合;
步骤5、测试所述图像识别模型集合,评估所述图像识别模型集合中的图像识别模型得到图像识别模型列表;
步骤6、应用时,从步骤5得到的所述图像识别模型列表中选择图像识别模型完成对待识别图像的处理得到图像类型。
2.根据权利要求1所述的方法,其特征在于,所述步骤1中的所述单元包括图像预处理单元、图像特征提取单元、图像特征优化单元及图像分类单元。
3.根据权利要求1所述的方法,其特征在于,所述步骤3中的所述在步骤2形成的所述算法组合初始子集中选择与所述更新单元匹配的单元算法,形成算法组合最终子集,具体过程为:
根据所述更新单元的单元算法的输入及输出的数据格式,在所述算法组合初始子集内,选择与所述更新单元的单元算法的输入及输出的数据格式相匹配的匹配单元算法,由所述匹配单元算法形成所述算法组合最终子集。
4.根据权利要求1所述的方法,其特征在于,所述步骤5中所述评估所述图像识别模型集合中的图像识别模型,具体过程为:计算所述图像识别模型的准确度和识别时间,所述识别时间为所述图像识别模型识别出图像结果所用的时间;当所述更新单元为网络结构单元时,计算所述图像识别模型的训练过程的收敛速率。
5.根据权利要求4所述的方法,其特征在于,所述准确度采用公式(1)计算,
Figure FDA0002730910950000021
其中,R为第i次迭代测试样本中识别正确的测试样本数量,N为迭代的总次数,mi第i次迭代测试样本的测试样本总数,M为测试样本的总数。
6.根据权利要求4所述的方法,其特征在于,所述收敛速率a为所述图像识别模型网络层训练过程中相邻的两次迭代输出的loss值的差值的绝对值与后一次迭代时间的比值。
7.一种基于动态模型的图像识别装置,其特征在于,包括算法组合生成模块、算法组合筛选模块、算法组合二次筛选模块、图像识别模型训练模块、图像识别模型评估模块及图像识别模块;
其中,所述算法组合生成模块,用于从图像识别过程中任意相邻的两个单元的单元算法集合中选取匹配算法构成算法组合,确定所有相邻单元的算法组合形成算法组合集合;
所述算法组合筛选模块,用于在所述算法组合生成模块生成的所述算法组合集合中选取适用于待识别图像的算法组合,形成所述待识别图像的算法组合初始子集;当没有需要更新的单元时,则将所述算法组合初始子集作为图像识别模型集合输出;
所述算法组合二次筛选模块,用于在更新单元后,在与已更新单元的相邻单元中选取与所述已更新单元的单元算法相匹配的单元算法形成算法组合最终子集;若所述已更新单元属于非网络结构单元,则将所述算法组合最终子集作为图像识别模型集合输出;
所述图像识别模型训练模块,用于在所述已更新单元为网络结构单元时,完成所述算法组合二次筛选模块输出的所述算法组合最终子集中算法组合的训练,将完成训练的算法组合最终子集作为图像识别模型集合输出;
所述图像识别模型评估模块,用于测试并评估所述图像识别模型集合中的图像识别模型,得到所述待识别图像的图像识别模型列表;
所述图像识别模块,用于从所述图像识别模型评估模块输出的所述图像识别模型列表中选取图像识别模型完成待识别图像的识别。
8.根据权利要求7所述的装置,其特征在于,所述单元包括图像预处理单元、图像特征提取单元、图像特征优化单元及图像分类单元。
CN202011129516.8A 2020-10-21 2020-10-21 一种基于动态模型的图像识别方法及装置 Active CN112364892B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011129516.8A CN112364892B (zh) 2020-10-21 2020-10-21 一种基于动态模型的图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011129516.8A CN112364892B (zh) 2020-10-21 2020-10-21 一种基于动态模型的图像识别方法及装置

Publications (2)

Publication Number Publication Date
CN112364892A CN112364892A (zh) 2021-02-12
CN112364892B true CN112364892B (zh) 2021-11-23

Family

ID=74511334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011129516.8A Active CN112364892B (zh) 2020-10-21 2020-10-21 一种基于动态模型的图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN112364892B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920759B2 (en) * 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
CN104123533A (zh) * 2013-04-26 2014-10-29 株式会社电装 对象检测设备
CN109344177A (zh) * 2018-09-18 2019-02-15 图普科技(广州)有限公司 一种模型组合方法及装置
CN110097128A (zh) * 2019-05-07 2019-08-06 广东工业大学 医学图像分类装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7838814B2 (en) * 2007-05-23 2010-11-23 Xerox Corporation Plenoptic system for recording images from sheets

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920759B2 (en) * 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
CN104123533A (zh) * 2013-04-26 2014-10-29 株式会社电装 对象检测设备
CN109344177A (zh) * 2018-09-18 2019-02-15 图普科技(广州)有限公司 一种模型组合方法及装置
CN110097128A (zh) * 2019-05-07 2019-08-06 广东工业大学 医学图像分类装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"最优算法组合在目标检测图像信号处理中的应用";岳元 等;《计算机测量与控制》;20111231;全文 *

Also Published As

Publication number Publication date
CN112364892A (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN110532859B (zh) 基于深度进化剪枝卷积网的遥感图像目标检测方法
CN110298266B (zh) 基于多尺度感受野特征融合的深度神经网络目标检测方法
CN110569901B (zh) 一种基于通道选择的对抗消除弱监督目标检测方法
CN111898432B (zh) 一种基于改进YOLOv3算法的行人检测系统及方法
CN113033520B (zh) 一种基于深度学习的树木线虫病害木识别方法及系统
CN109740679B (zh) 一种基于卷积神经网络和朴素贝叶斯的目标识别方法
CN110969166A (zh) 一种巡检场景下小目标识别方法和系统
CN107784288A (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN112990282B (zh) 一种细粒度小样本图像的分类方法及装置
CN112766283B (zh) 一种基于多尺度卷积网络的两相流流型识别方法
CN111815526B (zh) 基于图像滤波和cnn的有雨图像雨条纹去除方法及系统
CN112233129A (zh) 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN111401149A (zh) 基于长短期时域建模算法的轻量级视频行为识别方法
CN113077444A (zh) 一种基于cnn的超声无损检测图像缺陷分类方法
CN116310850B (zh) 基于改进型RetinaNet的遥感图像目标检测方法
CN112288700A (zh) 一种铁轨缺陷检测方法
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN109740672B (zh) 多流特征距离融合系统与融合方法
CN115410059A (zh) 基于对比损失的遥感图像部分监督变化检测方法及设备
CN115861246A (zh) 应用于工业互联网的产品质量异常检测方法及其系统
CN114782997A (zh) 基于多损失注意力自适应网络的行人重识别方法及系统
CN104598898A (zh) 一种基于多任务拓扑学习的航拍图像快速识别系统及其快速识别方法
CN112528058B (zh) 基于图像属性主动学习的细粒度图像分类方法
CN116796248A (zh) 森林康养环境评估系统及其方法
CN112364892B (zh) 一种基于动态模型的图像识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant