CN113011467B - 基于图像结构纹理信息的当归药材产地识别方法 - Google Patents

基于图像结构纹理信息的当归药材产地识别方法 Download PDF

Info

Publication number
CN113011467B
CN113011467B CN202110212396.6A CN202110212396A CN113011467B CN 113011467 B CN113011467 B CN 113011467B CN 202110212396 A CN202110212396 A CN 202110212396A CN 113011467 B CN113011467 B CN 113011467B
Authority
CN
China
Prior art keywords
image
angelica
gray
origin
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110212396.6A
Other languages
English (en)
Other versions
CN113011467A (zh
Inventor
王天舒
严辉
陈承武
段金廒
包贝华
杨曦晨
胡孔法
胡晨骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Chinese Medicine
Original Assignee
Nanjing University of Chinese Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Chinese Medicine filed Critical Nanjing University of Chinese Medicine
Priority to CN202110212396.6A priority Critical patent/CN113011467B/zh
Publication of CN113011467A publication Critical patent/CN113011467A/zh
Application granted granted Critical
Publication of CN113011467B publication Critical patent/CN113011467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像结构纹理信息的当归药材产地识别方法,它包括以下步骤:(1)样品制备和图像数据采集;(2)提取图像特征;(3)采用机器学习方法支持向量机(SVM)建立当归产地预测模型。本发明首次采用基于图像结构纹理信息与SVM的当归药材产地识别方法,能够准确预测对当归的产地进行预测,具有快速无损、识别准确率高以及稳定性强的优势。

Description

基于图像结构纹理信息的当归药材产地识别方法
技术领域
本发明属于药材检测技术领域;具体涉及一种基于图像结构纹理信息的当归药材产地识别方法。
背景技术
道地中药材是指经过中医临床长期应用优选出来的,产在特定地域,与其他地区所产同种中药材相比,品质和疗效更好,且质量稳定,具有较高知名度的中药材。道地药材的产地与品质具有高度关联性。道地药材的道地性表现为“优型”与“优质”的特征。“优型”指道地药材具有公认的形状、大小、色泽、表面纹理、质地等性状特征。“优质”指道地药材具有独特的化学成分组成。药材的“优形”和“优质”特征是统一的。不同产地的药材具有不同的形态特征,不同品质的药材也往往具有形态差异。通过人工智能与计算机视觉方法,可以对不同产地药材的形态进行图像分析、特征提取与智能识别,从而为道地药材的优型优质机理研究提供支撑。
当归为伞形科植物当归Angelicasinensis(Oliv.)Diels的干燥根,性甘、辛、温,归肝、心、脾经,具有补血活血,调经止痛的功效。研究表明当归品质与其生长环境具有密切联系。因此,不同产地的当归药效参差不齐。当归的主要产地包括甘肃、云南与青海。而甘肃岷县的当归药材品质好、疗效高、质量佳,各项评价指标都优于其它产地当归。因此,当归产地的准确判别对当归的质量评价具有参考价值。
传统的产地判别方法主要以专业人员对中药形状、颜色和气味特征的性状鉴别为主。此类方法依赖专业人员的经验与主观感觉,不利于中药的高效和大批量检测。高效液相色谱法可以准确测量当归有效成分的含量,进而对当归道地性进行评价,然而此类方耗时且损耗药材。近红外光谱与电子鼻技术具有快速无损的优势。此类技术分析中药内在官能团,通过神经网络等机器学习方法提取中药光谱特征或气味指纹图谱特征实现道地性评价。目前有研究联合电子鼻技术与主成分分析、软独立建模等方法实现对当归的产地鉴别;有采集淫羊藿近红外光谱,通过现有机器学习方法判别分析、BP神经网络、K近邻与支持向量机对其产地进行预测。然而此类方法过分依赖昂贵的红外光谱仪与电子鼻设备。
发明内容
为解决以上技术问题,本发明提供了一种基于卷积图像纹理与机器学习方法SVM的当归产地识别方法,该方法的准确率较高。与传统鉴别方法相比,这种方法能对当归的产地进行准确预测,具有快速无损、识别准确率高以及稳定性强的优势。
为实现以上目的,本发明提供的技术方案如下:
一种基于图像结构纹理信息的当归药材产地识别方法。包括以下步骤:
(1)样品采集:选用不同批次不同产地的当归药材样品;
(2)图像数据采集:通过图像采集设备采集不同产地的当归高清图像,并对每张图像的产地信息进行标记;
(3)图像数据特征提取:对于样品原始的彩色图像,首先通过各像素点的RGB值得到灰度图像;设图像第i行第j列个像素点(i,j)的RGB值为Rij,Gij,Bij,通过式(1)可以计算该像素点的灰度值Grayij
Gar.yij=0.3*Rij+0.59*Gij+0.11*Bij (1)
通过图像中各像素点的灰度值计算像素点之间的关系,采用基于一致性的旋转不变LBP算子计算各像素点灰度关系值。计算方法如式(2)所示。
式(2)中P为像素点(i,j)的相邻像素点数目,grayp为(i,j)第p个像素点的灰度值;公式中f的计算方法如式(3)所示;uij为像素点(i,j)的相邻像素点的灰度一致性参数,其计算方法如式(4)所示,由该式可知,当uij=0时,(i,j)邻居像素点的灰度值均小于或均大于(i,j)灰度值;当uij=2时,有连续若干个邻居像素点的灰度值大于(i,j)灰度值;当uij>2时,存在不连续的邻居像素点灰度值大于(i,j)灰度值;
对图像的所有像素点均计算其灰度关系值,即可得到图像的灰度关系图;
然后通过灰度关系图得到当归图像对应的直方图,图像中像素点的灰度关系值Gary_rij为区间[1,10]内的整数,统计这些整数出现的概率,即可得到图像纹理分布特征;
(4)采用机器学习方法SVM建立当归产地预测模型:以图像纹理分布特征为特征向量,使用支持向量机学习样本类型,采用LibSVM软件包进行模型训练,构建当归药材预测模型;对于新测试样本,其特征值被提取后,预测模型即可判定预测结果类型。
优选地,步骤(1)的不同产地的当归药材样品中,甘肃当归样品均来自岷县,包括岷县西寨镇、清水乡、梅川镇、麻子川乡、中寨乡、蒲麻镇、闾井乡等7主产区,每个乡镇各3批样品。青海当归来自西宁市与互助县,各5批样品。云南当归样品来自鹤庆县,共5批。
优选地,步骤(2)中,为确保当归形态细节信息的完整性,图像的数据采集采用佳能全画幅数码相机(EOS 5DS R),适马广角镜头(24-35mm)同一条件下拍摄。
以上所述的基于图像结构纹理信息的当归药材产地识别方法,步骤(4)中的预测模型对不同产地的当归进行图片采集,建立当归图像数据库,计算当归图像像素点之间的灰度关系,提取当归图像的纹理特征,并通过机器学习算法支持向量机对当归产地进行预测。
与现有技术比,本发明的有益效果在于:
1、相较于传统经验鉴别,指标成分含量测定以及红外分析方法,本发明具有快速、无损、方便以及成本低廉的优势。
2、本发明为当归产地提供了新的识别方法,对市场上的当归药材的道地性评估提供科学依据,具有广阔的应用前景。
附图说明
图1:本发明实施例1的数据处理流程图;
图2:本发明实施例1的不同产地的当归药材图像;
图3:本发明实施例1的灰度图像;
图4:本发明实施例1的灰度关系值;
图5:本发明实施例1的原始图,灰度图和灰度关系图;
图6:本发明实施例1的图像特征直方图;
图7:本发明实施例1的不同r值预测准确率图;
图8:本发明实施例1的训练集规模对准确度的影响图。
具体实施方式
下面通过具体实施例对本发明进行说明,以使本发明技术方案更易于理解、掌握,但本发明并不局限于此。下述实施例中所述实验方法,如无特殊说明,均为常规方法;所述试剂和材料,如无特殊说明,均可从商业途径获得。
本发明所使用仪器:佳能全画幅数码相机(EOS 5DS R),适马广角镜头24-35mm。
实施例1
1、药材样品收集:不同产地当归药材样品共36批次,每批次2~3kg,,从甘肃省、青海省和云南省等当归主产地收集。其中,甘肃当归样品均来自岷县,包括岷县西寨镇、清水乡、梅川镇、麻子川乡、中寨乡、蒲麻镇、闾井乡7主产区,每个乡镇各3批样品。青海当归来自西宁市与互助县,各5批样品。云南当归样品来自鹤庆县,共5批。采集时间为2019年10月~2020年3月间。研究用当归药材经南京中医药大学段金廒教授鉴定为伞形科植物当归Angelicasinensis(Oliv.)Diels的干燥根。
2、采集样品的图像数据:通过图像采集设备采集不同产地的当归高清图像,并对每张图像的产地信息进行标记。为确保当归形态细节信息的完整性,图像的数据采集采用佳能全画幅数码相机(EOS 5DS R),适马广角镜头(24-35mm)同一条件下拍摄。图2(a)、(b)与(c)分别展示产自青海、云南与甘肃岷县的当归图像数据。
3、图像特征提取:对于一幅原始的彩色图像,首先通过各像素点的RGB值得到灰度图像,如图3所示,设图像第i行第j列个像素点(i,j)的RGB值为(Rij,Gij,Bij),通过式(1)可以计算该像素点的灰度值Grayij
Garyij=0·3*Rij+0,59*Gij+0.11*Bij (1)
通过图像中各像素点的灰度值计算像素点之间的关系,采用基于一致性的旋。本发明采用基于一致性的旋转不变LBP算子(Ahonen T,Matas J,He C,M.(2009)Rotation Invariant Image Description with Local Binary PatternHistogramFourier Features.In:SalbergAB.,Hardeberg J.Y.,JenssenR.(eds)ImageAnalysis.SCIA2009.Lecture Notes in Computer Science,vol 5575.Springer,Berlin,Heidelberg)计算各像素点灰度关系值。设某像素点(i,j)的灰度值为grayij,则在其半径r内的P个相邻像素点的灰度值为Gary0,Gary1,...,Garyp-1,如图4(a)所示。图4示例中r=1,P=8。首先,统计灰度关系的一致性。图4(b)与(c)分别给出灰度一致与不一致的示例。若相邻像素点灰度值大于中心点灰度值,用红色标记;否则,用白色标记。因此,图4(b)中,中心像素点(i,j)的相邻像素点中有三个连续像素点的灰度值均大于中心点灰度值56,像素点(i,j)的灰度关系值Gary_rij为3;图4(c)中,中心像素点(i,j)的相邻像素点中存在不连续像素点的灰度值均大于中心点灰度值的情况,像素点(i,j)的灰度关系值gray_rij为p+1,即9。灰度关系值gray_rij的计算方法如式(2)所示。
式(2)中P为像素点(i,j)的相邻像素点数目,grayp为(i,j)第p个像素点的灰度值;公式中f的计算方法如式(3)所示;uij为像素点(i,j)的相邻像素点的灰度一致性参数,其计算方法如式(4)所示,由该式可知,当uij=0时,(i,j)邻居像素点的灰度值均小于或均大于(i,j)灰度值;当uij=2时,有连续若干个邻居像素点的灰度值大于(i,j)灰度值;当uij>2时,存在不连续的邻居像素点灰度值大于(i,j)灰度值;
对图像的所有像素点均计算其灰度关系值,即可得到图像的灰度关系图。图5(a)、(b)与(c)分别展示甘肃岷县某当归的原始图,灰度图以及灰度关系图。
然后通过灰度关系图得到当归图像对应的直方图。图像中像素点的灰度关系值Gary_rij为区间[1,10]内的整数。统计这些整数出现的概率,即可得到图像纹理分布特征。图6展示图5中当归的直方图。
4、建立定性鉴别模型:在不同产地的当归图像数据库中,云南、青海以及甘肃的当归图像数分别为536、48以及1066。在进行当归图像的特征提取时,需要对像素点周围半径为r的p个点(p=8)进行采样。首先对r值进行对比分析,得到最优r值。图7为r的不同取值下当归产地的预测准确率。在模型训练过程中训练集的比例为80%。为避免因随机抽样导致的实验误差,预测的train-test过程重复200次。以代表特征值为特征向量,使用支持向量机学习样本类型,采用LibSVM软件包进行模型训练,构建预测模型实现对当归产地的预测。由表1给出当归产地预测的出错情况。其中,训练集占比80%,采样半径r=2。
表1当归产地预测出错情况
5、训练集规模对预测准确性的影响:训练集的规模会影响最终预测的准确性,分别以训练集样本量的10%,20%,30%,40%,50%,60%,70%,80%,90%,用train-test程序重复训练100次。如图8所示,结果表明,当训练集占比80%,预测准确率高达98.19%。同时,该方法具有高度稳定性。当训练集占比仅为10%时,预测准确率仍能达到93%以上。表明本发明中所建方法是可靠的,均可以准确判别样本产地。
上述详细说明是针对本发明其中之一可行实施例的具体说明,该实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本发明技术方案的范围内。

Claims (4)

1.一种基于图像结构纹理信息的当归药材产地识别方法,其特征在于,它包括以下步骤:
(1)样品采集:选用不同批次不同产地的当归药材样品;
(2)图像数据采集:通过图像采集设备采集不同产地的当归高清图像,并对每张图像的产地信息进行标记;
(3)图像数据特征提取:对于样品原始的彩色图像,首先通过各像素点的RGB值得到灰度图像;设图像第i行第j列个像素点(i,j)的RGB值为Rij,Gij,Bij,通过式(1)可以计算该像素点的灰度值Grayij
Garyij=0.3*Rij+0.59*Gij+0.11*Bij (1)
通过图像中各像素点的灰度值计算像素点之间的关系;采用基于一致性的旋转不变LBP算子计算各像素点灰度关系值;计算方法如式(2)所示:
式(2)中P为像素点(i,j)的相邻像素点数目,grayp为(i,j)第p个像素点的灰度值;公式中f的计算方法如式(3)所示;uij为像素点(i,j)的相邻像素点的灰度一致性参数,其计算方法如式(4)所示,由该式可知,当uij=0时,(i,j)邻居像素点的灰度值均小于或均大于(i,j)灰度值;当uij=2时,有连续若干个邻居像素点的灰度值大于(i,j)灰度值;当uij>2时,存在不连续的邻居像素点灰度值大于(i,j)灰度值;
对图像的所有像素点均计算其灰度关系值,即可得到图像的灰度关系图;
然后通过灰度关系图得到当归图像对应的直方图,图像中像素点的灰度关系值Gary_rij为区间[1,10]内的整数,统计这些整数出现的概率,即可得到图像纹理分布特征;
(4)采用机器学习方法SVM建立当归产地预测模型:以图像纹理分布特征为特征向量,使用支持向量机学习样本类型,采用LibSVM软件包进行模型训练,构建当归药材预测模型;对于新测试样本,其特征值被提取后,预测模型即可判定预测结果类型。
2.根据权利要求1所述的基于图像结构纹理信息的当归药材产地识别方法,其特征在于,步骤(1)的不同产地的当归药材样品中,甘肃当归样品均来自岷县,包括岷县西寨镇、清水乡、梅川镇、麻子川乡、中寨乡、蒲麻镇和闾井乡,每个乡镇各3批样品;青海当归来自西宁市与互助县,各5批样品,云南当归样品来自鹤庆县,共5批。
3.根据权利要求1所述的基于图像结构纹理信息的当归药材产地识别方法,其特征在于,步骤(2)中,为确保当归形态细节信息的完整性,图像的数据采集采用佳能全画幅数码相机EOS 5DS R,适马广角镜头24-35mm同一条件下拍摄。
4.根据权利要求1所述的基于图像结构纹理信息的当归药材产地识别方法,其特征在于,步骤(4)中的预测模型对不同产地的当归进行图片采集,建立当归图像数据库,计算当归图像像素点之间的灰度关系,提取当归图像的纹理特征,并通过机器学习算法支持向量机对当归产地进行预测。
CN202110212396.6A 2021-02-25 2021-02-25 基于图像结构纹理信息的当归药材产地识别方法 Active CN113011467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110212396.6A CN113011467B (zh) 2021-02-25 2021-02-25 基于图像结构纹理信息的当归药材产地识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110212396.6A CN113011467B (zh) 2021-02-25 2021-02-25 基于图像结构纹理信息的当归药材产地识别方法

Publications (2)

Publication Number Publication Date
CN113011467A CN113011467A (zh) 2021-06-22
CN113011467B true CN113011467B (zh) 2024-06-14

Family

ID=76387100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110212396.6A Active CN113011467B (zh) 2021-02-25 2021-02-25 基于图像结构纹理信息的当归药材产地识别方法

Country Status (1)

Country Link
CN (1) CN113011467B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114445659B (zh) * 2022-01-20 2024-07-12 南京中医药大学 一种基于图像颜色及纹理特征的真伪酸枣仁鉴别方法
CN114580511B (zh) * 2022-02-25 2024-05-24 南京中医药大学 一种基于图像亮度信息和投票机制的硫熏干姜鉴别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308697A (zh) * 2018-09-18 2019-02-05 安徽工业大学 一种基于机器学习算法的树叶病害识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10532268B2 (en) * 2016-05-02 2020-01-14 Bao Tran Smart device
CN112329607B (zh) * 2020-11-03 2022-10-21 齐鲁工业大学 基于面部特征和纹理特征的年龄预测方法、系统和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308697A (zh) * 2018-09-18 2019-02-05 安徽工业大学 一种基于机器学习算法的树叶病害识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于图像处理技术的中药饮片识别研究;谭超群;温川飙;吴纯洁;;时珍国医国药;20180720(第07期);全文 *

Also Published As

Publication number Publication date
CN113011467A (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
Kumar et al. Image based leaf segmentation and counting in rosette plants
CN111985536B (zh) 一种基于弱监督学习的胃镜病理图像分类方法
CN106295124B (zh) 多种图像检测技术综合分析基因子图相似概率量的方法
CN109325431B (zh) 草原放牧绵羊采食路径中植被覆盖度的检测方法及其装置
CN109063754B (zh) 一种基于OpenStreetMap的遥感影像多特征联合分类方法
CN111310756B (zh) 一种基于深度学习的损伤玉米颗粒检测和分类方法
CN113011467B (zh) 基于图像结构纹理信息的当归药材产地识别方法
CN105718866B (zh) 一种视觉目标检测与识别方法
CN114399686A (zh) 一种基于弱监督学习的遥感图像地物识别与分类方法和装置
CN108898269A (zh) 基于度量的电力图像环境影响评估方法
CN109614869A (zh) 一种基于多尺度压缩奖惩网络的病理图像分类方法
CN111539910B (zh) 锈蚀区域检测方法及终端设备
Batule et al. Leaf disease detection using image processing and support vector machine (SVM)
CN110929787A (zh) 一种基于图像的苹果客观定级系统
CN111881965B (zh) 药材产地等级的高光谱图形分类识别方法、装置及设备
CN106886754A (zh) 一种基于三角面片的三维场景下的物体识别方法及系统
CN109741351A (zh) 一种基于深度学习的类别敏感型边缘检测方法
CN115908950B (zh) 基于相似度正切映射的快速医学高光谱影像分类方法
CN111259913A (zh) 一种基于词袋模型和纹理特征的细胞光谱图像分类方法
CN116563603A (zh) 基于全局-局部能量协同表征的小样本开集识别方法
CN113052194A (zh) 一种基于深度学习的服装色彩认知系统及其认知方法
CN112951427B (zh) 异常细胞的分级系统
CN112364844B (zh) 一种基于计算机视觉技术的数据采集方法及系统
Tan et al. Herb Classification with Convolutional Neural Network
CN117197139B (zh) 一种基于ai的舌诊图像多标签分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant