CN105608472A - 一种将环境微生物进行全自动分类的方法和系统 - Google Patents

一种将环境微生物进行全自动分类的方法和系统 Download PDF

Info

Publication number
CN105608472A
CN105608472A CN201511016390.2A CN201511016390A CN105608472A CN 105608472 A CN105608472 A CN 105608472A CN 201511016390 A CN201511016390 A CN 201511016390A CN 105608472 A CN105608472 A CN 105608472A
Authority
CN
China
Prior art keywords
classification
sift
microorganism
environmental microorganism
grader
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511016390.2A
Other languages
English (en)
Inventor
李晨
蒋涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Moniuliuma Intelligent Technology Co Ltd
Original Assignee
Sichuan Moniuliuma Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Moniuliuma Intelligent Technology Co Ltd filed Critical Sichuan Moniuliuma Intelligent Technology Co Ltd
Priority to CN201511016390.2A priority Critical patent/CN105608472A/zh
Publication of CN105608472A publication Critical patent/CN105608472A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及环境微生物分类技术领域,本发明公开了一种将环境微生物进行全自动分类的方法,其具体包括以下的步骤:步骤一、构建环境微生物分类模型,采用原始环境微生物显微图片对分类模型进行训练;步骤二、获取新的需要分类的环境微生物的显微图片,获取该显微图片的SIFT特征,将初始的SIFT特征向量映射到一个更高维度的视觉词袋(BoVW)特征向量上,并构成更加精密的SIFT-BoVW特征向量;步骤三、应用分类器进行分类。本发明不需要进行图像分割即可实现分类,便于实现,减少了对分割技术的依赖。

Description

一种将环境微生物进行全自动分类的方法和系统
技术领域
本发明涉及环境微生物分类技术领域,尤其涉及一种将环境微生物进行全自动分类的方法和系统。
背景技术
微生物在自然界中是无处不在,无处不有的,数目巨大。微生物对于地球上的生命是至关重要的,它们可以将重要的元素转换为能量,保持大气中的化学平衡,为植物和动物提供养分。微生物还可以用于实现许多商业目的,如制造抗生素、提高农业效率以及生产生物燃料。此外还有一小部分微生物对人有害,导致各种疾病的发生。从历史观点来看,微生物研究主要集中于研究个体物种。
现有技术中的分类结果很大程度上依靠图像分割技术的精确程度。一旦图像分割技术水平较低,系统就无法获得高质量的预处理二值图片,从而影响特征提取的精度。
发明内容
本发明的目的是针对现有技术中的分类方法依赖图像分割精确程度的技术问题,本发明公开了一种将环境微生物进行全自动分类的方法和系统。
本发明的技术方案如下:
本发明公开了一种将环境微生物进行全自动分类的方法,其具体包括以下的步骤:步骤一、构建环境微生物分类模型,采用原始环境微生物显微图片对分类模型进行训练;步骤二、获取新的需要分类的环境微生物的显微图片,获取该显微图片的SIFT特征,将初始的SIFT特征向量映射到一个更高维度的视觉词袋(BoVW)特征向量上,并构成更加精密的SIFT-BoVW特征向量;步骤三、应用分类器进行分类。
更进一步地,当采用SVM作为分类器时,采用基于区域的支持向量机(RBSVM)分类器完成环境微生物的分类。通过构建分类模型,不需图片预处理的结果(图像分割后得到的二值图片),而只需要根据原始显微图片就可以实现环境微生物的特征提取与分类,简化了分类的过程。
更进一步地,上述RBSVM分类器完成环境微生物的分类的过程具体包括:首先,利用SIFT-BoVW特征向量对每张环境微生物图片进行描述,其次,应用优化检索法对每张图片中的区域进行快速检索,再次,利用SVM给以上每个由优化检索法检索到的区域打分,并认定得到最高分的区域内的物体为该图的主要物体,接着,算出图片中主要物体对应的特征向量,根据特征向量进行分类。本发明不需要人工的参与,完全自动实现环境微生物的分类,不需要手动参与图像分割,也避免了环境微生物分类依靠图片分割技术的问题。
更进一步地,上述优化检索法为分枝限定法BaB、剪枝算法、或者贪婪算法中的一种。
更进一步地,上述SIFT特征为RGB-SIFT特征、成对的SIFT特征、或者快速SIFT其中的一种。
更进一步地,上述SIFT特征的提取包括以下的步骤:首先在尺度空间中寻找极值点,接着提取出这些极值点的位置、尺度、旋转不变参数,最后形成一个128维度的特征向量。
更进一步地,上述初始的SIFT特征向量映射到一个1000维度的高维度BoVW特征向量上。
更进一步地,上述方法还包括应用弱指导学习WSL框架对微生物分类模型进行训练。
上述方法还包括:当测试图片中得分最高的区域的分数高于训练过程中阳性图片的阈值,则判断其为阳性图片,否则判断其为阴性图片。
更进一步地,上述分类器为SVM分类器或者人工神经网络ANN分类器、K-最邻近KNN分类器或者贝叶斯Bayesian分类器其中的一种或者几种的组合。
本发明还公开了一种将环境微生物进行全自动分类的系统,其具体包括分类模型构建单元、模型训练单元、环境微生物显微图片获取单元、SIFT特征获取单元、向量映射单元、以及分类器;所述分类模型构建单元用于构建环境微生物分类模型;所述模型训练单元用于采用原始环境微生物显微图片对分类模型进行训练;所述环境微生物显微图片获取单元用于获取新的需要分类的环境微生物的显微图片;所述SIFT特征获取单元用于获取该显微图片的SIFT特征,所述向量映射单元用于将初始的SIFT特征向量映射到一个更高维度的视觉词袋(BoVW)特征向量上,并构成更加精密的SIFT-BoVW特征向量;所述分类器用于进行分类。
通过采用以上的技术方案,本发明的有益效果是:本发明的方法和系统加强了环境微生物分类系统的智能程度,形成了一套全自动的检查与分类方法,SIFT-BoVW特征提取方法的使用,解决了现有技术强烈依靠图片分割技术的问题。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1为本发明的具体实现流程图。
图2为本专利实验结果柱状图,纵轴:平均精确度,在[0,1]之间,值越
高说明分类结果越好;横轴:ω1,ω2,……ω15为EMDS数据库中的15类环境微生物样本,μ为15类样本分类结果的平均值。
具体实施方式
下面结合说明书附图,详细说明本发明的具体实施例。
本发明公开了一种将环境微生物进行全自动分类的方法,其具体包括以下的步骤:步骤一、构建环境微生物分类模型,采用原始环境微生物显微图片对分类模型进行训练;步骤二、获取新的需要分类的环境微生物的显微图片,获取该显微图片的SIFT特征,将初始的SIFT特征向量映射到一个更高维度的视觉词袋(BoVW)特征向量上,并构成更加精密的SIFT-BoVW特征向量;步骤三、应用分类器进行分类。当采用SVM作为分类器时,采用基于区域的支持向量机(RBSVM)分类器完成环境微生物的分类。通过构建分类模型,根据图片就可以实现环境微生物的分类,不需要进行图像分割,简化了分类的过程。对于EMDS环境微生物数据库的15类微生物(每类10个样本)进行检测与分类测试,本发明的方法获得了25.06%的总体平均精确度,并在第二与第六组取得了超过50.00%的平均精度,这说明本发明的方法还是有较高的实用性的。
更进一步地,上述RBSVM分类器完成环境微生物的分类的过程具体包括:首先,利用SIFT-BoVW特征向量对每张环境微生物图片进行描述,其次,应用优化检索法对每张图片中的区域进行快速检索,再次,利用SVM给以上每个由优化检索法检索到的区域打分,并认定得到最高分的区域内的物体为该图的主要物体,接着,算出图片中主要物体对应的特征向量,根据特征向量进行分类。本发明不需要人工的参与,完全自动实现环境微生物的分类,不需要手动参与图像分割,也避免了环境微生物分类依靠图片分割技术的问题。
本发明中采用北京科技大学土木与环境工程学院提供的EMDS环境微生物显微图片数据库进行系统训练。EMDS数据库包含15类(太阳虫、表壳虫、钟虫等),300张常见环境微生物图片,涵盖了环境工程实践工作中经常可见的环境微生物形态。
更进一步地,上述优化检索法为分枝限定法BaB、剪枝算法、或者贪婪算法中的一种。BaB是一种高效的优化算法,与传统的遍历检索法相比,可以节约大量计算量。
更进一步地,上述SIFT特征为RGB-SIFT特征、成对的SIFT特征、或者快速SIFT其中的一种。
SIFT特征是一种用来检测与描述图像中的局部形状特征的计算机视觉算法,它首先在尺度空间中寻找极值点(尺度空间指:物体能够发生尺度变化的空间。尺度变化包括:位移变化,尺度变化和旋转变换等。本专利所在的尺度空间是一个二维的平面尺度空间。尺度空间中的极值点:在一个尺度空间中,物体形态发生突变的位置就是尺度空间的极值点。本专利的极值点多发生在微生物与背景间的边缘上。寻找极值点:可以使用边缘检测、角点检测等方法来找到物体形态发生突变的位置。),接着提取出这些极值点的位置、尺度、旋转不变参数等特征值,最后形成一个128维度(128维度:SIFT算法定义的特征向量维度。128维度包含的信息:图片的方向信息和极值点分布信息)的特征向量:SIFT=[s1,s2,…,s128]T。本发明应用BoVW技术,将初始的SIFT特征向量映射到一个1000维度的高维度BoVW特征向量上,并构成更加精密的SIFT-BoVW特征向量:S-BoVW=[b1,b2,…,b1000]T
映射过程:首先,利用K-means聚类方法从一百万个SIFT特征向量中总结出一个包含1000个视觉词的视觉词袋(BoVW)。其中,因为每个视觉词都是由这些SIFT特征向量总结得到的,所以它们也都具有128维度的特征向量。其次,计算一个SIFT特征向量与每个视觉词之间的相似度(它们之间的欧几里得距离),并选择最接近的一个视觉词来近似表示这个SIFT特征向量。接着,用以上的方法,把所有SIFT特征向量都用最接近的视觉词来表示。最后,整理所有的近似视觉词,查点每个视觉词在视觉词袋(BoVW)中的出现次数,并得到一个1000维度的S-BoVW特征向量。
更进一步地,上述方法还包括应用弱指导学习(WSL)框架(WSL:是弱指导学习的英文缩写,英文全称为WeaklySupervisedLearning。具体实现:WSL是一个宏观的设计框架,包含特征提取、分类器设计、训练、测试等)对微生物分类模型进行训练。WSL框架,既能对测试图片进行分类,又能在分类的同时检测出图片中微生物具体的位置,有助于使用者对图片进行进一步的分析。在WSL框架的指导下,一个基于区域的支持向量机分(RBSVM)分类器得以构建。这个RBSVM分类器能够全自动地同时完成测试图片的检测与分类工作。一旦测试图片被输入模型,模型将依照训练的结果检测出测试图片中得分最高的区域,并对该区域进行锁定和分类。如果这个区域的分数高于训练过程中阳性图片的阈值,则判断其为阳性图片,否则判断其为阴性图片。
上述方法还包括:当测试图片中得分最高的区域的分数高于训练过程中阳性图片的阈值,则判断其为阳性图片,否则判断其为阴性图片。
更进一步地,上述分类器为支持向量机(SVM)分类器或者人工神经网络(ANN)分类器、K-最邻近(KNN)分类器或者贝叶斯Bayesian分类器其中的一种或者几种的组合。用人工神经网络(ANN)分类器、K-最邻近(KNN)分类器、贝叶斯(Bayesian)分类器其中的一种或者几种可以代替支持向量机(SVM)分类器,进行环境微生物分类。
本发明还公开了一种将环境微生物进行全自动分类的系统,其具体包括分类模型构建单元、模型训练单元、环境微生物显微图片获取单元、SIFT特征获取单元、向量映射单元、以及分类器;所述分类模型构建单元用于构建环境微生物分类模型;所述模型训练单元用于采用原始环境微生物显微图片对分类模型进行训练;所述环境微生物显微图片获取单元用于获取新的需要分类的环境微生物的显微图片;所述SIFT特征获取单元用于获取该显微图片的SIFT特征,所述向量映射单元用于将初始的SIFT特征向量映射到一个更高维度的视觉词带BoVW特征向量上,并构成更加精密的SIFT-BoVW特征向量;所述分类器用于进行分类。
当采用SVM作为分类器时,采用基于区域的支持向量机RBSVM分类器完成环境微生物的分类。通过构建分类模型,根据图片就可以实现环境微生物的分类,本发明不需要进行图像分割,简化了分类的过程。对于EMDS环境微生物数据库的15类微生物(每类10个样本)进行检测与分类测试,本发明的方法获得了25.06%的总体平均精确度,并在第二与第六组取得了超过50.00%的平均精度,这说明本发明的方法还是有较高的实用性的。
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims (10)

1.一种将环境微生物进行全自动分类的方法,其具体包括以下的步骤:步骤一、构建环境微生物分类模型,采用原始环境微生物显微图片对分类模型进行训练;步骤二、获取新的需要分类的环境微生物的显微图片,获取该显微图片的SIFT特征,将初始的SIFT特征向量映射到一个更高维度的视觉词袋BoVW特征向量上,并构成更加精密的SIFT-BoVW特征向量;步骤三、应用分类器进行分类。
2.如权利要求1所述的将环境微生物进行全自动分类的方法,其特征在于当采用SVM作为分类器时,采用基于区域的支持向量机RBSVM分类器完成环境微生物的分类。
3.如权利要求2所述的将环境微生物进行全自动分类的方法,其特征在于所述RBSVM分类器完成环境微生物的分类的过程具体包括:首先,利用SIFT-BoVW特征向量对每张环境微生物图片进行描述,其次,应用优化检索法对每张图片中的区域进行快速检索,再次,利用SVM给以上每个由优化检索法检索到的区域打分,并认定得到最高分的区域内的物体为该图的主要物体,接着,算出图片中主要物体对应的特征向量,根据特征向量进行分类。
4.如权利要求1所述的将环境微生物进行全自动分类的方法,其特征在于所述优化检索法为分枝限定法BaB、剪枝算法、或者贪婪算法中的一种。
5.如权利要求1所述的将环境微生物进行全自动分类的方法,其特征在于所述SIFT特征为RGB-SIFT特征、成对的SIFT特征、或者快速SIFT其中的一种。
6.如权利要求1所述的将环境微生物进行全自动分类的方法,其特征在于所述SIFT特征的提取包括以下的步骤:首先在尺度空间中寻找极值点,接着提取出这些极值点的位置、尺度和旋转不变参数,最后形成一个128维度的特征向量。
7.如权利要求2所述的将环境微生物进行全自动分类的方法,其特征在于所述初始的SIFT特征向量映射到一个1000维度的高维度BoVW特征向量上。
8.如权利要求1所述的将环境微生物进行全自动分类的方法,其特征在于所述方法还包括应用弱指导学习框架对微生物分类模型进行训练。
9.如权利要求1所述的将环境微生物进行全自动分类的方法,其特征在于所述分类器为支持向量机SVM分类器或者人工神经网络ANN分类器、K-最邻近KNN分类器或者贝叶斯Bayesian分类器其中的一种或者几种的组合。
10.一种将环境微生物进行全自动分类的系统,其特征在于具体包括分类模型构建单元、模型训练单元、环境微生物显微图片获取单元、SIFT特征获取单元、向量映射单元、以及分类器;所述分类模型构建单元用于构建环境微生物分类模型;所述模型训练单元用于采用原始环境微生物显微图片对分类模型进行训练;所述环境微生物显微图片获取单元用于获取新的需要分类的环境微生物的显微图片;所述SIFT特征获取单元用于获取该显微图片的SIFT特征,所述向量映射单元用于将初始的SIFT特征向量映射到一个更高维度的视觉词袋BoVW特征向量上,并构成更加精密的SIFT-BoVW特征向量;所述分类器用于进行分类。
CN201511016390.2A 2015-12-31 2015-12-31 一种将环境微生物进行全自动分类的方法和系统 Pending CN105608472A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511016390.2A CN105608472A (zh) 2015-12-31 2015-12-31 一种将环境微生物进行全自动分类的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511016390.2A CN105608472A (zh) 2015-12-31 2015-12-31 一种将环境微生物进行全自动分类的方法和系统

Publications (1)

Publication Number Publication Date
CN105608472A true CN105608472A (zh) 2016-05-25

Family

ID=55988396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511016390.2A Pending CN105608472A (zh) 2015-12-31 2015-12-31 一种将环境微生物进行全自动分类的方法和系统

Country Status (1)

Country Link
CN (1) CN105608472A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600608A (zh) * 2016-11-28 2017-04-26 四川木牛流马智能科技有限公司 一种人机互动的环境微生物显微图像分割方法
CN106897991A (zh) * 2017-01-05 2017-06-27 浙江大学 基于Live‑Wire分割的微生物群落识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104040561A (zh) * 2011-12-02 2014-09-10 生物梅里埃有限公司 通过质谱术和分数规整识别微生物的方法
CN104185850A (zh) * 2012-04-04 2014-12-03 生物梅里埃有限公司 利用谱测量法的微生物的鉴定和结构化分类

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104040561A (zh) * 2011-12-02 2014-09-10 生物梅里埃有限公司 通过质谱术和分数规整识别微生物的方法
CN104185850A (zh) * 2012-04-04 2014-12-03 生物梅里埃有限公司 利用谱测量法的微生物的鉴定和结构化分类

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN LI等: "Environmental microbiology aided by content-based image analysis", 《HTTPS://LINK.SPRINGER.COM/ARTICLE/10.1007%2FS10044-015-0498-7》 *
CHEN LI等: "Environmental Microorganism Classification Using Sparse Coding and Weakly Supervised Learning", 《EMR’15》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600608A (zh) * 2016-11-28 2017-04-26 四川木牛流马智能科技有限公司 一种人机互动的环境微生物显微图像分割方法
CN106897991A (zh) * 2017-01-05 2017-06-27 浙江大学 基于Live‑Wire分割的微生物群落识别方法

Similar Documents

Publication Publication Date Title
Yao et al. Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model
CN101916376B (zh) 基于局部样条嵌入的正交半监督子空间图像分类方法
Sivic et al. Unsupervised discovery of visual object class hierarchies
CN104517112B (zh) 一种表格识别方法与系统
CN109002834B (zh) 基于多模态表征的细粒度图像分类方法
Shalunts et al. Architectural style classification of building facade windows
CN106408030B (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
Xu et al. A supervoxel approach to the segmentation of individual trees from LiDAR point clouds
CN102289522B (zh) 一种对于文本智能分类的方法
CN106339416B (zh) 基于网格快速搜寻密度峰值的教育数据聚类方法
Zafar et al. Intelligent image classification-based on spatial weighted histograms of concentric circles
CN104599275A (zh) 基于概率图模型的非参数化的rgb-d场景理解方法
CN103886330A (zh) 基于半监督svm集成学习的分类方法
CN105447527A (zh) 采用图像识别技术将环境微生物进行分类的方法和系统
CN101620615A (zh) 一种基于决策树学习的自动图像标注与翻译的方法
Reiss et al. Improvements on coronal hole detection in SDO/AIA images using supervised classification
CN104156945A (zh) 基于多目标粒子群算法的灰度图像分割方法
CN102324038A (zh) 一种基于数字图像的植物种类识别方法
CN111507296A (zh) 基于无人机遥感与深度学习的违章建筑智能化提取方法
CN106599915A (zh) 一种车载激光点云分类方法
CN104361342A (zh) 一种基于几何不变形状特征的在线植物物种识别方法
CN104616319A (zh) 基于支持向量机的多特征选择目标跟踪方法
CN103279746A (zh) 一种基于支持向量机的人脸识别方法及系统
Weinmann et al. A hybrid semantic point cloud classification-segmentation framework based on geometric features and semantic rules
Tong et al. Point set multi-level aggregation feature extraction based on multi-scale max pooling and LDA for point cloud classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160525

RJ01 Rejection of invention patent application after publication