CN110363224B - 一种基于图像的物体分类方法、系统及电子设备 - Google Patents

一种基于图像的物体分类方法、系统及电子设备 Download PDF

Info

Publication number
CN110363224B
CN110363224B CN201910535775.1A CN201910535775A CN110363224B CN 110363224 B CN110363224 B CN 110363224B CN 201910535775 A CN201910535775 A CN 201910535775A CN 110363224 B CN110363224 B CN 110363224B
Authority
CN
China
Prior art keywords
image
classification
classified
images
fine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910535775.1A
Other languages
English (en)
Other versions
CN110363224A (zh
Inventor
张发恩
张祥伟
宋亮
赵江华
秦永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alnnovation Beijing Technology Co ltd
Original Assignee
Alnnovation Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alnnovation Beijing Technology Co ltd filed Critical Alnnovation Beijing Technology Co ltd
Priority to CN201910535775.1A priority Critical patent/CN110363224B/zh
Publication of CN110363224A publication Critical patent/CN110363224A/zh
Application granted granted Critical
Publication of CN110363224B publication Critical patent/CN110363224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于图像的物体分类方法,该方法通过获取具有粗分类模型的神经网络,将多种细分类模型调整至对应的粗分类模型下,分别保存待分类物体的粗分类、细分类特征向量作为检索底库,输入具有待分类物体的第一图像,获得n张与所述第一图像相似度大于第一阈值的第二图像,在n张第二图像内进行筛选,进一步获得m张与所述第一图像相似度大于第二阈值的第三图像,在m张第三图像的特征向量中进行测距筛选,获得待分类物体的分类结果,提高了模型的分类效率,使得当神经网络需要识别新的种类时,只需要通过将新种类的特征向量进行存储即可进行识别分类,避免了对神经网络的重新训练,降低了对大量学习样本的依赖。

Description

一种基于图像的物体分类方法、系统及电子设备
【技术领域】
本发明涉及图像识别领域,特别涉及一种基于图像的物 体分类方法、系统及电子设备。
【背景技术】
在图像识别领域,通常使用神经网络对图像内的物体进 行识别分类,其通过对固定种类集合的物体图像进行标注, 并将带有标注的图像输入至模型进行训练,以获得具有识别 分类功能的神经网络模型。
但在现有的具有图像识别分类功能的神经网络中,当需 要识别分类新的种类物体时,需要准备大量带有标注的训练 样本以对神经网络进行重新训练,对大量学习样本的依赖较 大,分类效率较低。
【发明内容】
为了克服目前现有基于图像的物体分类方法中分类效 率较低的问题,本发明提供一种基于图像的物体分类方法。
本发明为解决上述技术问题,提供一技术方案如下:一 种基于图像的物体分类方法,包括如下步骤:步骤S1:获取具 有粗分类模型的神经网络;步骤S2:获取多种细分类模型, 并将多种细分类模型调整至对应的粗分类模型下;步骤S3: 分别保存预设的待分类物体的粗分类特征向量、细分类特征 向量作为检索底库;步骤S4:输入具有待分类物体的第一图 像,获得n张与所述第一图像相似度大于第一阈值的第二图 像;步骤S5:在n张第二图像内进行筛选,进一步获得n张与 所述第一图像相似度大于第二阈值的第三图像;及步骤S6: 对比m张第三图像对应的细分类特征向量与第一图像中待分 类物体的细分类特征向量之间的距离,以获得待分类物体的 分类结果。
优选地,上述步骤S2中细分类模型是通过预先训练获得 的神经网络模型。
优选地,上述步骤S4具体包括如下步骤:步骤S41:输 入具有待分类物体的第一图像,粗分类特征提取器提取待分 类物体的特征向量;及步骤S42:对检索底库中的特征向量与待分类物体的特征向量进行筛选,获得n张与所述第一图 像相似度大于第一阈值的第二图像。
优选地,上述步骤S4还包括步骤S43,步骤S43:根据提 取的所述第一图像内的待分类物体,获得待分类物体在第一 图像内的位置。
优选地,步骤S5具体包括如下步骤:步骤S51:根据待 分类物体在所述第一图像的位置,使用粗分类模型下对应的 细分类特征提取器提取待分类物体的特征;及步骤S52:将细分类特征提取器提取的特征在n张第二图像中进行进一步 筛选,获得n张与所述第一图像相似度大于第二阈值的第三 图像。
优选地,步骤S2中所述所述粗分类特征向量、细分类特 征向量通过降维处理后存入检索底库中。
优选地,上述步骤S6具体包括如下步骤:步骤S61:测 量n张第三图像的细分类特征向量与第一图像的细分类特征 向量之间的距离;步骤S62:选取与第一图像的特征向量距 离最短的一第三图像;及步骤S63:根据选取的第三图像所 属的类别作为第一图像内待分类物体的分类结果。
本发明还提供一种基于图像的物体分类系统,包括:模 型获取单元,用于获取具有粗分类模型的神经网络;模型调 整单元,用于获取多种细分类模型,并将多种细分类模型调 整至对应的粗分类模型下;特征保存单元,用于分别保存预 设的待分类物体的粗分类特征向量、细分类特征向量作为检 索底库;粗分类单元,用于输入具有待分类物体的第一图像, 获得n张与所述第一图像相似度大于第一阈值的第二图像; 细分类单元,用于在n张第二图像内进行筛选,进一步获得n 张与所述第一图像相似度大于第二阈值的第三图像;及分类 确认单元,用于对比m张第三图像对应的细分类特征向量与 第一图像中待分类物体的细分类特征向量之间的距离,以获 得待分类物体的分类结果。
优选地,所述分类确认单元还包括:测距单元,用于测 量n张第三图像的特征向量与第一图像的特征向量距离;选 择单元,用于选取与第一图像的特征向量距离最短的一第三 图像;及信息提取单元:用于根据选取的第三图像所属的类 别作为第一图像内待分类物体的分类结果。
本发明还提供一种电子设备,包括存储器和处理器,所 述存储器中存储有计算机程序,所述计算机程序被设置为运 行时执行上述任一项中所述的基于图像的物体分类方法;所 述处理器被设置为通过所述计算机程序执行上述任一项中 所述的基于图像的物体分类方法。
与现有技术相比,本发明提供的一种基于图像的物体分 类方法,具有以下优点:
1、通过预先将待分类物体的特征向量存储入检索底库, 分别对待分类物体的特征向量与检索底库中的特征向量进 行筛选以获得粗分类和细分类,最后通过在筛选出多个第三 图像中进行筛选,获得待分类物体的分类结果,提高了模型 的分类效率,使得当神经网络需要识别新的种类时,只需要 通过将新种类的特征向量进行存储即可进行识别分类,避免 了对神经网络的重新训练,降低了对大量学习样本的依赖。 同时,通过粗分类模型筛选出n张与所述第一图像相似度大 于第一阈值的第二图像,并在n张第二图像内进行筛选,进 一步获得m张与所述第一图像相似度大于第二阈值的第三图 像,最后对比m张第三图像对应的细分类特征向量与第一图 像中待分类物体的细分类特征向量之间的距离,获得待分类 物体的分类结果,使得本发明提供的一种基于图像的物体分 类方法可快速识别图像中的待分类物体,提高了识别分类的 效率和准确度。
2、通过获得所述第一图像中待分类物体的位置,使得 后续步骤可根据该位置对待分类物体特征直接进行识别分 类,避免了神经网络对第一图像中背景物体的重复识别,提 高分类效率。
3、通过对预存的粗分类特征向量、细分类特征向量进 行降维处理后存入检索底库中,使得神经网络在多个特征向 量中进行筛选时,减少了神经网络的计算量,提高了分类效 率。
【附图说明】
图1为本发明第一实施例提供的一种基于图像的物体 分类方法的整体流程图。
图2a为本发明第一实施例提供的一种基于图像的物体 分类方法的步骤S4的细节流程图。
图2b为本发明第一实施例提供的一种基于图像的物体 分类方法的步骤S4中步骤S41的实施过程的示意图。
图2c为本发明第一实施例提供的一种基于图像的物体 分类方法的步骤S4中步骤S42的实施过程的示意图。
图3a为本发明第一实施例提供的一种基于图像的物体 分类方法的步骤S5的细节流程图。
图3b为本发明第一实施例提供的一种基于图像的物体 分类方法的步骤S5的实施过程的示意图。
图4为本发明第一实施例提供的一种基于图像的物体 分类方法的步骤S6的细节流程图。
图5为本发明第二实施例提供的一种基于图像的物体 分类系统的模块图。
图6为本发明第二实施例提供的一种基于图像的物体 分类系统中分类确认单元的模块图。
图7为本发明第三实施例提供的一种电子设备的模块 图。
附图标记说明:
1、模型获取单元;2、模型调整单元;3、特征保存单 元;4、粗分类单元;5、细分类单元;6、分类确认单元; 61、测距单元;62、选择单元;63、信息提取单元;
10、存储器;20、处理器;
100、第一图像;101、第一瓶体;
200、第二图像;201、第二瓶体;202、第三瓶体;203、 第四瓶体;
300、第三图像。
【具体实施方式】
为了使本发明的目的,技术方案及优点更加清楚明白, 以下结合附图及实施实例,对本发明进行进一步详细说明。 应当理解,此处所描述的具体实施例仅仅用以解释本发明, 并不用于限定本发明。
请参阅图1,本发明第一实施例提供一种基于图像的物 体分类方法,包括以下步骤:
步骤S1:获取具有粗分类模型的神经网络。
可以理解,所述粗分类模型为预先训练好的神经网络模 型,该神经网络模型可对输入的图像进行粗分类。
步骤S2:获取多种细分类模型,并将多种细分类模型调 整至对应的粗分类模型下。
可以理解,多种粗分类模型中,每一种粗分类下对应包 含有多种细分类模型,例如,饮料与面包为不同种类的商品, 在同一种饮料下还包括有不同种类的饮料,例如汽水、果汁 和矿泉水等细分类。
可以理解,所述粗分类模型内包括粗分类特征提取器, 用于提取图像中物体的粗分类特征;细分类模型内包括细分 类特征提取器,用于提取图像中物体的细分类特征。
步骤S3:分别保存预设的待分类物体的粗分类特征向 量、细分类特征向量作为检索底库。
可以理解,所述预设的粗分类特征向量、细分类特征向 量为预先获得的特征向量,其包含有待分类物体的类别信 息、特征信息等多种信息,可通过神经网络直接保存于检索 底库中。
可以理解,特征向量为可视的图像特征转化而成的计算 机可识别的语言,一特征向量对应一个特征。将已知特征的 特征向量保存于检索底库中,避免了对神经网络的重新训 练。
步骤S4:输入具有待分类物体的第一图像,获得n张与 所述第一图像相似度大于第一阈值的第二图像;
步骤S5:在n张第二图像内进行筛选,进一步获得m张与 所述第一图像相似度大于第二阈值的第三图像;及
步骤S6:对比m张第三图像对应的细分类特征向量与第 一图像中待分类物体的细分类特征向量之间的距离,以获得 待分类物体的分类结果。
可以理解,上述步骤S3与步骤S4中的第一阈值与第二阈 值为预先设置的数值,其根据对图像相似度筛选的结果,选 取相似度大于或等于预设数值的多个图像。例如,第一阈值 设置为相似度大于或等于70%,则将与所述第一图像相似度 大于或等于70%的n张图像选取为第二图像。
可选地,上述步骤S3中的特征向量通常具有多维度的特 征向量,神经网络通过对特征向量在多维度上的多个数值进 行匹配计算,以达到筛选的目的。但特征向量的维数过多, 就会增加神经网络计算的复杂度,给后续的分类带来负担, 影响分类效率。在本实施例中,通过PCA(Principal Component Analysis)降维算法对保存的特征向量进行降维 处理,PCA将数据投射到一个低维子空间实现降维。例如, 二维数据集降维就是把点投射成一条线,数据集的每个样本 都将原有的两个值用一个值表示。三维数据集可以降成二 维,也即把变量映射成一个平面。
请参阅图2a,步骤S4:输入具有待分类物体的第一图像, 获得n张与所述第一图像相似度大于第一阈值的第二图像。 步骤S4具体包括步骤S41~S42:
步骤S41:输入具有待分类物体的第一图像,粗分类特 征提取器提取待分类物体的特征,获得待分类物体的特征向 量;及
步骤S42:对检索底库中的特征向量与待分类物体的特 征向量进行筛选,获得n张与所述第一图像相似度大于第一 阈值的第二图像。
可以理解,粗分类特征提取器提取的特征为待分类物体 粗分类下对应的基本特征,例如,在粗分类下,物体分为饮 料、面包两种,通过辨识饮料的瓶体特征来对分面包与饮料 进行分类。
例如,如图2b和图2c中所示,粗分类特征提取器提取第 一图像100内的第一瓶体101。在第一图像100与检索底库中 的特征进行筛选过后,获得3张具有不同种类瓶体特征的第 二图像200,依次包括第二瓶体201、第三瓶体202及第四瓶 体203。
可选地,上述步骤S4还包括:
步骤S43:根据提取的所述第一图像内的待分类物体, 获得待分类物体在第一图像内的位置。
可以理解,第一图像内包括有待分类物体以及背景物 体,获得待分类物体在第一图像内的位置,使得后续步骤对 待分类物体进行识别时,减少了对背景物体的重新识别,提 高识别分类的效率,而且可以提高识别的精准度。
可以理解,步骤S41~S43仅为该实施例的一种实施方式, 其实施方式并不限定于步骤S41~S43。
请参阅图3a,步骤S5:在n张第二图像内进行筛选,获 得m张与所述第一图像相似度大于第二阈值的第三图像。步 骤S5具体包括步骤S51~S52:
步骤S51:根据待分类物体在所述第一图像的位置,使 用粗分类模型下对应的细分类特征提取器提取待分类物体 的特征;及
步骤S52:将细分类特征提取器提取的特征在n张第二图 像中进行进一步筛选,获得m张与所述第一图像相似度大于 第二阈值的第三图像。
可以理解,通过细分类特征提取器进一步对待分类物体 进行特征提取,以便于进一步识别出待分类物体的特征,进 而在n张第二图像中将筛选结果进一步缩小至m张第三图像 的范围内,提高识别的准确度。
例如,如图3b中所示,通过上述步骤S4获得的三个第二 图像200,通过对比第一瓶体101与第二瓶体201、第三瓶体 202、第四瓶体203之间的相似度,例如可通过对比瓶体的高 度、宽度,获得第二瓶体201与第四瓶体203与第一瓶体101 的相似度大于第二阈值的两张第三图像300。
可以理解,步骤S51~S52仅为该实施例的一种实施方式, 其实施方式并不限定于步骤S51~S52。
请参阅图4,步骤S6:对比m张第三图像对应的细分类特 征向量与第一图像中待分类物体的细分类特征向量之间的 距离,以获得待分类物体的分类结果。步骤S6具体包括步骤 S61~S63:
步骤S61:测量m张第三图像的特征向量与第一图像的特 征向量之间的距离;
步骤S62:选取与第一图像的特征向量距离最短的一第 三图像;及
步骤S63:根据选取的第三图像所属的类别作为第一图 像内待分类物体的分类结果。
可以理解,所述第一图像的待分类物体在经过粗分类、 细分类特征提取器提取特征后,形成了一个具有多维度的特 征向量,以便于计算机识别。而在上述步骤S3中保存的待分 类物体的粗分类、细分类特征向量对应为第三图像内物体的 特征向量。m张第三图像内物体的特征向量与第一图像内待 分类物体的特征向量位于同一个具有多维度的坐标系内,通 过选取与待分类物体距离最近的第三图像,以获得特征最接 近待分类物体的第三图像。
可以理解,步骤S63中,选取的第三图像为预先储存的 细分类特征向量,其上包括了待分类物体的细分类结果,根 据选取的第三图像以确定第一图像中待分类物体的分类结 果。
请参阅图5,本发明第二实施例还提供一种基于图像的 物体分类系统。该基于图像的物体分类系统可以包括:
模型获取单元1,用于获取具有粗分类模型的神经网络;
模型调整单元2,用于获取多种细分类模型,并将多种 细分类模型调整至对应的粗分类模型下;
特征保存单元3,用于分别保存预设的待分类物体的粗 分类特征向量、细分类特征向量作为检索底库;
粗分类单元4,用于输入具有待分类物体的第一图像, 获得n张与所述第一图像相似度大于第一阈值的第二图像;
细分类单元5,用于在n张第二图像内进行筛选,进一步 获得n张与所述第一图像相似度大于第二阈值的第三图像; 及
分类确认单元6,用于对比m张第三图像对应的细分类特 征向量与第一图像中待分类物体的细分类特征向量之间的 距离,以获得待分类物体的分类结果。
请参阅图6,所述分类确认单元6还包括:
测距单元61,用于测量m张第三图像的特征向量与第一 图像的特征向量距离;
选择单元62,用于选取与第一图像的特征向量距离最短 的一第三图像;及
信息提取单元63,用于根据选取的第三图像所属的类别 作为第一图像内待分类物体的分类结果。
请参阅图7,本发明第三实施例提供一种用于实 施上述基于图像的物体分类方法的电子设备,所述 电子设备包括存储器10和处理器20,所述存储器10 中存储有运算机程序,所述运算机程序被设置为运 行时执行上述任一项基于图像的物体分类方法实施 例中的步骤。所述处理器20被设置为通过所述运算 机程序执行上述任一项基于图像的物体分类方法实 施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于运算机 网络的多个网络设备中的至少一个网络设备。
具体地,所述电子设备为商店中商品的识别分类设备, 特别是针对商品中同种类型下不同种类的商品识别分类设 备,例如具有瓶装的饮料中,不同口味或品牌的商品,提高 对同种类型下不同种类的商品识别分类效率。
与现有技术相比,本发明提供的一种基于图像的物体分 类方法,具有以下优点:
1、通过预先将待分类物体的特征向量存储入检索底库, 分别对待分类物体的特征向量与检索底库中的特征向量进 行筛选以获得粗分类和细分类,最后通过在筛选出多个第三 图像中进行筛选,获得待分类物体的分类结果,提高了模型 的分类效率,使得当神经网络需要识别新的种类时,只需要 通过将新种类的特征向量进行存储即可进行识别分类,避免 了对神经网络的重新训练,降低了对大量学习样本的依赖。 同时,通过粗分类模型筛选出n张与所述第一图像相似度大 于第一阈值的第二图像,并在n张第二图像内进行筛选,进 一步获得m张与所述第一图像相似度大于第二阈值的第三图 像,最后对比m张第三图像对应的细分类特征向量与第一图 像中待分类物体的细分类特征向量之间的距离,获得待分类 物体的分类结果,提高了识别分类的效率和准确度。
2、通过获得所述第一图像中待分类物体的位置,使得 后续步骤可根据该位置对待分类物体特征直接进行识别分 类,避免了神经网络对第一图像中背景物体的重复识别,提 高分类效率。
3、通过对预存的粗分类特征向量、细分类特征向量进 行降维处理后存入检索底库中,使得神经网络在多个特征向 量中进行筛选时,减少了神经网络的计算量,提高了分类效 率。
特别地,根据本公开的实施例,上文参考流程图描述的 过程可以被实现为计算机软件程序。例如,本公开的实施例 包括一种计算机程序产品,其包括承载在计算机可读介质上 的计算机程序,该计算机程序包含用于执行流程图所示的方 法的程序代码。
在该计算机程序被处理器执行时,执行本申请的方法中 限定的上述功能。需要说明的是,本申请所述的计算机存储 器可以是计算机可读信号介质或者计算机可读存储介质或 者是上述两者的任意组合。计算机存储器例如可以是——但 不限于——电、磁、光、电磁、红外线、或半导体的系统、 装置或器件,或者任意以上的组合。
计算机存储器的更具体的例子可以包括但不限于:具有 一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机 访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读 存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器 (CD-ROM)、光存储器件、磁存储器件、或者上述的任意合 适的组合。在本申请中,计算机可读信号介质可以是任何包 含或存储程序的有形介质,该程序可以被指令执行系统、装 置或者器件使用或者与其结合使用。而在本申请中,计算机 可读的信号介质可以包括在基带中或者作为载波一部分传 播的数据信号,其中承载了计算机可读的程序代码。这种传 播的数据信号可以采用多种形式,包括但不限于电磁信号、 光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该 计算机可读介质可以发送、传播或者传输用于由指令执行系 统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括 但不限于:无线、电线、光缆、RF等,或者上述的任意合适 的组合。
可以以一种或多种程序设计语言或其组合来编写用于 执行本申请的操作的计算机程序代码,所述程序设计语言包 括面向对象的程序设计语言—诸如Java、Smalltalk、C++, 还包括常规的过程式程序设计语言—诸如“C”语言或类似 的程序设计语言。程序代码可以完全地在用户计算机上执 行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完 全在远程计算机或服务器上执行。在涉及远程计算机的情形 中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连 接到外部计算机(例如利用因特网服务提供商来通过因特网 连接)。
附图中的流程图和框图,图示了按照本申请各种实施例 的系统、方法和计算机程序产品的可能实现的体系架构、功 能和操作。在这点上,流程图或框图中的每个方框可以代表 一个模块、程序段、或代码的一部分,该模块、程序段、或 代码的一部分包含一个或多个用于实现规定的逻辑功能的 可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。 例如,两个接连地表示的方框实际上可以基本并行地执行, 它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框 图和/或流程图中的方框的组合,可以用执行规定的功能或操 作的专用的基于硬件的系统来实现,或者可以用专用硬件与 计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件 的方式实现,也可以通过硬件的方式来实现。所描述的单元 也可以设置在处理器中,例如,可以描述为:一种处理器包 括模型获取单元、模型调整单元、特征保存单元、粗分类单 元、细分类单元以及分类确认单元。其中,这些单元的名称 在某种情况下并不构成对该单元本身的限定,例如,细分类单元还可以被描述为“基于当前获得的待分类物体的粗分类 结果,对待分类物体进行进一步分类的单元”。
作为另一方面,本申请还提供了一种计算机存储器,该 计算机存储器可以是上述实施例中描述的装置中所包含的; 也可以是单独存在,而未装配入该装置中。上述计算机存储 器承载有一个或者多个程序,当上述一个或者多个程序被该 装置执行时,使得该装置:获取具有粗分类模型的神经网络, 将多种细分类模型调整至对应的粗分类模型下,分别保存待 分类物体的粗分类、细分类特征向量作为检索底库,输入具 有待分类物体的第一图像,获得n张与所述第一图像最相似 的第二图像,在n张第二图像内进行筛选,进一步获得m张与 所述第一图像最相似的第三图像,对m张第三图像施加权重, 获得待分类物体的分类结果。
以上仅为本发明较佳实施例而已,并不用以限制本发 明,凡在本发明原则之内所作的任何修改,等同替换和改进 等均应包含本发明的保护范围之内。

Claims (9)

1.一种基于图像的物体分类方法,其特征在于,包括如下步骤:
步骤S1:获取具有粗分类模型的神经网络;
步骤S2:获取多种细分类模型,并将多种细分类模型调整至对应的粗分类模型下;
步骤S3:分别保存预设的待分类物体的粗分类特征向量、细分类特征向量作为检索底库;
步骤S4:输入具有待分类物体的第一图像,获得n张与所述第一图像相似度大于第一阈值的第二图像,
步骤S4具体包括如下步骤:
步骤S41:输入具有待分类物体的第一图像,粗分类特征提取器提取待分类物体的特征向量;及
步骤S42:对检索底库中的特征向量与待分类物体的特征向量进行筛选,获得n张与所述第一图像相似度大于第一阈值的第二图像;
步骤S5:在n张第二图像内进行筛选,进一步获得m张与所述第一图像相似度大于第二阈值的第三图像;步骤S5的过程具体如下:
使用粗分类模型下对应的细分类特征提取器提取待分类物体的特征,细分类特征提取器提取待分类物体的特征;及将细分类特征提取器提取的特征在n张第二图像中进行进一步筛选,获得m张与所述第一图像相似度大于第二阈值的第三图像;及
步骤S6:对比m张第三图像对应的细分类特征向量与第一图像中待分类物体的细分类特征向量之间的距离,以获得待分类物体的分类结果。
2.如权利要求1中所述基于图像的物体分类方法,其特征在于:上述步骤S2中细分类模型是通过预先训练获得的神经网络模型。
3.如权利要求1中所述基于图像的物体分类方法,其特征在于:上述步骤S4还包括步骤S43,
步骤S43:根据提取的所述第一图像内的待分类物体,获得待分类物体在第一图像内的位置。
4.如权利要求3中所述基于图像的物体分类方法,其特征在于:步骤S5还包括如下步骤:
根据待分类物体在所述第一图像的位置,使用粗分类模型下对应的细分类特征提取器提取待分类物体的特征。
5.如权利要求1中所述基于图像的物体分类方法,其特征在于:步骤S3 中所述粗分类特征向量、细分类特征向量通过降维处理后存入检索底库中。
6.如权利要求1中所述基于图像的物体分类方法,其特征在于:上述步骤S6具体包括如下步骤:
步骤S61:测量m张第三图像的细分类特征向量与第一图像的细分类特征向量之间的距离;
步骤S62:选取与第一图像的特征向量距离最短的一张 第三图像;及
步骤S63:根据选取的第三图像所属的类别作为第一图像内待分类物体的分类结果。
7.一种基于图像的物体分类系统,其特征在于,包括:
模型获取单元,用于获取具有粗分类模型的神经网络;
模型调整单元,用于获取多种细分类模型,并将多种细分类模型调整至对应的粗分类模型下;
特征保存单元,用于分别保存预设的待分类物体的粗分类特征向量、细分类特征向量作为检索底库;
粗分类单元,用于输入具有待分类物体的第一图像,获得n张与所述第一图像相似度大于第一阈值的第二图像,输入具有待分类物体的第一图像,粗分类特征提取器提取待分类物体的特征向量;及对检索底库中的特征向量与待分类物体的特征向量进行筛选,获得n张与所述第一图像相似度大于第一阈值的第二图像;
细分类单元,用于在n张第二图像内进行筛选,进一步获得m张与所述第一图像相似度大于第二阈值的第三图像,使用粗分类模型下对应的细分类特征提取器提取待分类物体的特征,细分类特征提取器提取待分类物体的特征;及将细分类特征提取器提取的特征在n张第二图像中进行进一步筛选,获得m张与所述第一图像相似度大于第二阈值的第三图像;及
分类确认单元,用于对比m张第三图像对应的细分类特征向量与第一图像中待分类物体的细分类特征向量之间的距离,以获得待分类物体的分类结果。
8.如权利要求7 中所述基于图像的物体分类系统,其特征在于,所述分类确认单元还包括:
测距单元,用于测量m张第三图像的细分类特征向量与第一图像中待分类物体的细分类特征向量距离;
选择单元,用于选取与第一图像的特征向量距离最短的一第三图像;及
信息提取单元:用于根据选取的第三图像所属的类别作为第一图像内待分类物体的分类结果。
9.一种电子设备,包括存储器和处理器,其特征在于:所述存储器中存储有计算机程序,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的基于图像的物体分类方法;
所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的基于图像的物体分类方法。
CN201910535775.1A 2019-06-19 2019-06-19 一种基于图像的物体分类方法、系统及电子设备 Active CN110363224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910535775.1A CN110363224B (zh) 2019-06-19 2019-06-19 一种基于图像的物体分类方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910535775.1A CN110363224B (zh) 2019-06-19 2019-06-19 一种基于图像的物体分类方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN110363224A CN110363224A (zh) 2019-10-22
CN110363224B true CN110363224B (zh) 2021-07-06

Family

ID=68217405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910535775.1A Active CN110363224B (zh) 2019-06-19 2019-06-19 一种基于图像的物体分类方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN110363224B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852288B (zh) * 2019-11-15 2022-07-05 苏州大学 一种基于两阶段卷积神经网络的细胞图像分类方法
CN111738316B (zh) * 2020-06-10 2024-02-02 北京字节跳动网络技术有限公司 零样本学习的图像分类方法、装置及电子设备
CN112183639B (zh) * 2020-09-30 2022-04-19 四川大学 一种矿物图像识别与分类方法
CN114818909B (zh) * 2022-04-22 2023-09-15 北大荒信息有限公司 一种基于作物长势特征的杂草检测方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052203A (zh) * 1990-12-29 1991-06-12 清华大学 脱机手写汉字识别系统及其识别方法
CN1075811A (zh) * 1993-02-25 1993-09-01 清华大学 自由书写联机手写汉字识别方法及其系统
CN107316042A (zh) * 2017-07-18 2017-11-03 盛世贞观(北京)科技有限公司 一种绘画图像检索方法及装置
CN107393000A (zh) * 2017-08-24 2017-11-24 广东欧珀移动通信有限公司 图像处理方法、装置、服务器及计算机可读存储介质
CN109002562A (zh) * 2018-08-30 2018-12-14 北京信立方科技发展股份有限公司 一种仪器识别模型训练方法和装置及仪器识别方法和装置
CN109784366A (zh) * 2018-12-07 2019-05-21 北京飞搜科技有限公司 目标物体的细粒度分类方法、装置与电子设备
CN109800698A (zh) * 2019-01-11 2019-05-24 北京邮电大学 基于深度网络的图标检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19955919C1 (de) * 1999-11-20 2001-05-31 Daimler Chrysler Ag Verfahren zur Erkennung von Objekten in Bildern auf der Bildpixelebene
CN104102921A (zh) * 2014-07-15 2014-10-15 广州市番禺奥莱照明电器有限公司 一种基于人脸识别的视频检测方法及其检测装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052203A (zh) * 1990-12-29 1991-06-12 清华大学 脱机手写汉字识别系统及其识别方法
CN1075811A (zh) * 1993-02-25 1993-09-01 清华大学 自由书写联机手写汉字识别方法及其系统
CN107316042A (zh) * 2017-07-18 2017-11-03 盛世贞观(北京)科技有限公司 一种绘画图像检索方法及装置
CN107393000A (zh) * 2017-08-24 2017-11-24 广东欧珀移动通信有限公司 图像处理方法、装置、服务器及计算机可读存储介质
CN109002562A (zh) * 2018-08-30 2018-12-14 北京信立方科技发展股份有限公司 一种仪器识别模型训练方法和装置及仪器识别方法和装置
CN109784366A (zh) * 2018-12-07 2019-05-21 北京飞搜科技有限公司 目标物体的细粒度分类方法、装置与电子设备
CN109800698A (zh) * 2019-01-11 2019-05-24 北京邮电大学 基于深度网络的图标检测方法

Also Published As

Publication number Publication date
CN110363224A (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
CN110363224B (zh) 一种基于图像的物体分类方法、系统及电子设备
CN107633007B (zh) 一种基于层次化ap聚类的商品评论数据标签化系统和方法
EP2808827B1 (en) System and method for OCR output verification
CN110929774B (zh) 图像中目标物的分类方法、模型训练方法和装置
CN111126396B (zh) 图像识别方法、装置、计算机设备以及存储介质
CN110717554B (zh) 图像识别方法、电子设备及存储介质
CN110472675A (zh) 图像分类方法、图像分类装置、存储介质与电子设备
Yang et al. A framework for improved video text detection and recognition
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
JP7393472B2 (ja) 陳列シーン認識方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN111428631A (zh) 无人机飞控信号可视化识别分选方法
CN111860309A (zh) 一种人脸识别方法及系统
CN112287957A (zh) 目标匹配方法与装置
CN110659374A (zh) 一种基于神经网络提取车辆特征值及属性的以图搜图方法
CN113239227A (zh) 图像数据结构化方法、装置、电子设备及计算机可读介质
US11132577B2 (en) System and a method for efficient image recognition
CN108615006A (zh) 用于输出信息的方法和装置
CN110555406B (zh) 一种基于Haar-like特征及CNN匹配的视频运动目标识别方法
CN116152576B (zh) 图像处理方法、装置、设备及存储介质
KR20180126352A (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
CN114863189B (zh) 一种基于大数据的图像智能识别方法
CN110825896A (zh) 一种商标检索系统及检索方法
CN116188445A (zh) 一种产品表面缺陷的检测定位方法、装置及终端设备
AU2021101517A4 (en) A system for object recognition for visual surveillance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant