CN113255749A - 基于机器学习的大米品种快速识别方法 - Google Patents

基于机器学习的大米品种快速识别方法 Download PDF

Info

Publication number
CN113255749A
CN113255749A CN202110533885.1A CN202110533885A CN113255749A CN 113255749 A CN113255749 A CN 113255749A CN 202110533885 A CN202110533885 A CN 202110533885A CN 113255749 A CN113255749 A CN 113255749A
Authority
CN
China
Prior art keywords
rice
machine learning
variety
sample
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110533885.1A
Other languages
English (en)
Inventor
罗芳
付琪
潘嘉勋
卢荟霖
林振宇
郭隆华
邱彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110533885.1A priority Critical patent/CN113255749A/zh
Publication of CN113255749A publication Critical patent/CN113255749A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于机器学习的大米品种快速识别方法:其采用不同品种的大米,作为实验样本;将不同品种的大米置于暗箱中拍照,作为原始数据集;对大米的原始图像进行分割,实现背景与目标分离;提取预处理后大米样本图像的特征;基于所获得的特征信息,以此建立用于预测大米品种的机器学习分类模型;基于所建立的分类模型,对待测大米样本进行品种识别。该方法有利于简单、快捷地检测出大米的品种。

Description

基于机器学习的大米品种快速识别方法
技术领域
本发明属于食品检测技术领域,尤其涉及一种基于机器学习的大米品种快速识别方法。
背景技术
在亚洲地区,人们主要以大米为主食。我国是稻谷生产大国,稻米产量居世界首位。国内将大米分为3类:籼米、粳米和糯米。籼米的米粒细而长,较长的达到7毫米以上,由籼型非糯性稻谷制成,蒸煮后粘性较小,出饭率高;粳米与之相反,米粒一般圆而短,由粳型非糯性稻谷碾制而成,蒸煮后粘性较大,出饭率低;糯米为人们所熟知,每逢节日制作粽子、汤圆或是各式各样的糕点常需要用到它。当前,大米市场行业的发展虽然总体上趋好,但也面临以下问题:大米品种鉴别方法不够完善,从而导致一些不法商家将品种混卖去谋取高额利益。这不仅扰乱了大米市场秩序,还使得消费者的利益遭受到了损失。因此,有效鉴别大米品种对维护消费者权益、保障合理市场秩序以及降低食品安全隐患具有重要意义。
综上所述,为了拓展大米品种检测在食品领域中的应用,急需开发一种快速、简单的便于现场实时检测大米品种的方法。
发明内容
针对现有技术的空白,本发明提出了一种基于机器学习的大米品种快速识别方法,采用不同品种的大米,作为实验样本;将不同品种的大米置于暗箱中拍照,作为原始数据集;对大米的原始图像进行分割,实现背景与目标分离;提取预处理后大米样本图像的特征;基于所获得的特征信息,以此建立用于预测大米品种的机器学习分类模型;基于所建立的分类模型,对待测大米样本进行品种识别。该方法有利于简单、快捷地检测出大米的品种。
本发明具体采用以下技术方案:
一种基于机器学习的大米品种快速识别方法,其特征在于:采用不同品种的大米样本图像作为数据集训练大米品种的机器学习分类模型;并通过训练获得的分类模型进行大米品种快速识别。
进一步地,包括以下步骤:
步骤S1:选择不同品种的大米作为样本;
步骤S2:将不同品种的大米置于暗箱中拍照,将获取的图像作为原始数据集;
步骤S3:对大米的原始图像进行分割,实现背景与目标分离;
步骤S4:提取预处理后大米样本图像的特征;
步骤S5:基于步骤S4获得的特征信息,以此建立用于预测大米品种的机器学习分类模型;
步骤S6:基于步骤S5建立的分类模型,对待测大米样本进行品种识别。
进一步地,在步骤S2中,以培养皿作为载物台,将大米摊平后进行拍摄。
进一步地,在步骤S3中,基于直方图对大米图像进行分割,以实现背景与目标分离。
进一步地,在步骤S4中,基于卷积神经网络中的卷积核进行卷积运算实现不同品种大米图像的特征提取。
进一步地,在步骤S5中,建立的机器学习分类模型为:高斯朴素贝叶斯模型或K近邻学习模型或线性判别分析模型或随机森林模型。
进一步地,在步骤S5中,建立的机器学习分类模型为支持向量机模型。
进一步地,在步骤S6中,对待测大米样品进行品种识别的过程为:
取待测大米样本,用培养皿盛装并摊平,置于暗箱中拍摄照片,将照片进行分割与特征提取,最后将大米的特征信息输入训练好的SVM模型,SVM模型预测出该待测大米样本属于哪个品种,并将其作为输出。
相较于现有技术,本发明及其优选方案具有以下有益效果:通过在暗箱中拍摄不同品种的大米样本图像,作为原始数据集,以此构建了五种机器学习分类模型(GNB、KNN、LDA、RF、及SVM),模型能有效识别出大米品种。该方法简单、快捷,可以显著提升检测效率,为简化大米品种识别提供了新的方法,具有很强的实用性和广阔的应用前景。其解决了机器学习方法在大米品种识别的应用的问题。
附图说明
下面结合附图和具体实施方式对本发明进一步详细的说明:
图1是本发明实施例的方法实现流程图。
图2是本发明实施例中大米样本的原始图像。
图3是本发明实施例中大米样本的分割图像。
图4是本发明实施例中建立的主成分分析(PCA)模型测试结果示意图。
图5是本发明实施例中建立的GNB模型测试结果示意图。
图6是本发明实施例中建立的KNN模型测试结果示意图。
图7是本发明实施例中建立的LDA模型测试结果示意图。
图8是本发明实施例中建立的RF模型测试结果示意图。
图9是本发明实施例中建立的SVM模型测试结果示意图。
具体实施方式
为让本专利的特征和优点能更明显易懂,下文特举实施例,作详细说明如下:
本实施例提供了一种基于机器学习的大米品种快速识别方法,如图1所示,包括以下步骤:
(1)于超市购得不同品种的大米,作为实验样本。
在本实施例中,所购大米包括粳米、糯米及籼米,其中粳米:东北米和田趣长粒香,糯米:长糯米和圆糯米,籼米:福粥米、金针银粘米、月牙米、软丁优米、国泰香米及泰国茉莉香米,共计10个品种。
(2)将不同品种的大米置于暗箱中拍照,作为原始数据集。
在本实施例中,用培养皿作为载物台,每次将大米摊平后即可进行拍摄。
(3)对大米的原始图像进行分割,实现背景与目标分离。
在本实施例中,基于直方图对大米图像进行分割,最终实现背景与目标分离。
(4)提取预处理后大米样本图像的特征。
在本实施例中,基于CNN中的卷积核进行卷积运算来实现不同品种大米图像的特征提取。它涵盖了大米样本图像的所有特征信息,包括颜色、大小、纹理、形状等特征。
(5)基于步骤(4)获得特征信息,以此建立用于预测大米品种的机器学习分类模型。
在本实施例中,建立的机器学习分类模型为:GNB、KNN、LDA、RF、及SVM;所述分类模型中,GNB在测试集上识别的准确率为81.00%,KNN在测试集上识别的准确率为85.33%,LDA在测试集上识别的准确率为92.67%,RF在测试集上识别的准确率为93.33%,SVM在测试集上识别的准确率为96.67%,结果表明,SVM模型表现最好。
(6)基于建立的机器学习分类模型,对待测大米样本进行品种预测。具体方法为:
取待测大米样本少许,用培养皿盛装并摊平,置于暗箱中拍摄照片,将照片导入预先编写好的程序中,程序会自动对图像进行分割与特征提取,最后将大米的特征信息输入训练好的SVM模型,SVM模型会预测出该待测大米样本属于哪个品种,并将其作为输出。
下面以具体实施例对本发明作进一步说明。
1、如图2所示为不同品种大米的原始图像,每个品种拍摄150张,总样本量150×10=1500张,拍摄完成后及时将照片导入计算机,运用matlab2019b编写程序进行后续的建模分析。
2、基于直方图对大米样本图像进行分割,分割效果如图3所示。
3、基于CNN中的卷积核进行卷积运算来实现不同品种大米图像的特征提取。它涵盖了大米样本图像的所有特征信息,包括颜色、大小、纹理、形状等特征。
4、将数据集(1500张照片)按8:2随机划分为训练集和测试集,1200张用于训练模型,剩余300张用于评估模型。
5、如图4所示为10个品种(共1500个样本)大米样本图像的PCA投影图,从图中可以看出,同一品种的大米样本出现良好的聚集现象,表明不同品种的大米间存在着差异,但图中所示差异并不十分明显,需进一步构建机器学习分类模型进行分析。
6、如图5所示为GNB模型的混淆矩阵图。横坐标为预测标签,纵坐标为真实标签。从图中可以看出,东北米:8个样本误判成田趣长粒香;福粥米:10个样本误判成金针银粘米;国泰香米:1个样本误判成金针银粘米,3个样本误判成软丁优米,1个样本误判成月牙米;金针银粘米:6个样本误判成福粥米,1个样本误判成软丁优米;软丁优米:1个样本误判成福粥米,8个样本误判成国泰香米,1个样本误判成金针银粘米,2个样本误判成泰国茉莉香米;长糯米:没有误判;泰国茉莉香米:2个样本误判成金针银粘米,3个样本误判成软丁优米;田趣长粒香:1个样本误判成东北米;圆糯米:没有误判;月牙米:5个样本误判成国泰香米,4个样本误判成软丁优米。
7、如图6所示为KNN模型的混淆矩阵图。横坐标为预测标签,纵坐标为真实标签。从图中可以看出,东北米:1个样本误判成田趣长粒香;福粥米:1个样本误判成国泰香米,1个样本误判成金针银粘米,1个样本误判成泰国茉莉香米,1个样本误判成月牙米;国泰香米:5个样本误判成软丁优米,2个样本误判成田趣长粒香;金针银粘米:2个样本误判成福粥米;软丁优米:10个样本误判成国泰香米,1个样本误判成金针银粘米;长糯米:没有误判;泰国茉莉香米:4个样本误判成软丁优米;田趣长粒香:3个样本误判成东北米;圆糯米:没有误判;月牙米:1个样本误判成福粥米,2个样本误判成国泰香米,7个样本误判成软丁优米。
8、如图7所示为LDA模型的混淆矩阵图。横坐标为预测标签,纵坐标为真实标签。从图中可以看出,东北米:没有误判;福粥米:1个样本误判成软丁优米,1个样本误判成泰国茉莉香米;国泰香米:3个样本误判成软丁优米;金针银粘米:3个样本误判成福粥米;软丁优米:1个样本误判成福粥米,3个样本误判成国泰香米,1个样本误判成金针银粘米;长糯米:没有误判;泰国茉莉香米:2个样本误判成软丁优米;田趣长粒香:1个样本误判成东北米,1个样本误判成月牙米;圆糯米:没有误判;月牙米:2个样本误判成软丁优米。
9、如图8所示为RF模型的混淆矩阵图。横坐标为预测标签,纵坐标为真实标签。从图中可以看出,东北米:1个样本误判成田趣长粒香;福粥米:1个样本误判成国泰香米,3个样本误判成金针银粘米;国泰香米:没有误判;金针银粘米:2个样本误判成国泰香米,1个样本误判成软丁优米;软丁优米:1个样本误判成福粥米,3个样本误判成国泰香米,1个样本误判成金针银粘米;长糯米:没有误判;泰国茉莉香米:2个样本误判成福粥米,1个样本误判成软丁优米;田趣长粒香:1个样本误判成东北米,1个样本误判成国泰香米;圆糯米:没有误判;月牙米:2个样本误判成软丁优米。
10、如图9所示为SVM模型的混淆矩阵图。横坐标为预测标签,纵坐标为真实标签。从图中可以看出,东北米:1个样本误判成田趣长粒香;福粥米:1个样本误判成金针银粘米;国泰香米:没有误判;金针银粘米:没有误判;软丁优米:2个样本误判成福粥米,2个样本误判成国泰香米;长糯米:没有误判;泰国茉莉香米:没有误判;田趣长粒香:1个样本误判成东北米;圆糯米:没有误判;月牙米:1个样本误判成福粥米,2个样本误判成软丁优米。
最后,就可以用得到的机器学习分类模型对未知大米样本图像进行品种预测了。
专利不局限于上述最佳实施方式,任何人在本专利的启示下都可以得出其它各种形式的基于机器学习的大米品种快速识别方法,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本专利的涵盖范围。

Claims (8)

1.一种基于机器学习的大米品种快速识别方法,其特征在于:采用不同品种的大米样本图像作为数据集训练大米品种的机器学习分类模型;并通过训练获得的分类模型进行大米品种快速识别。
2.根据权利要求1所述的基于机器学习的大米品种快速识别方法,其特征在于,包括以下步骤:
步骤S1:选择不同品种的大米作为样本;
步骤S2:将不同品种的大米置于暗箱中拍照,将获取的图像作为原始数据集;
步骤S3:对大米的原始图像进行分割,实现背景与目标分离;
步骤S4:提取预处理后大米样本图像的特征;
步骤S5:基于步骤S4获得的特征信息,以此建立用于预测大米品种的机器学习分类模型;
步骤S6:基于步骤S5建立的分类模型,对待测大米样本进行品种识别。
3.根据权利要求2所述的基于机器学习的大米品种快速识别方法,其特征在于:在步骤S2中,以培养皿作为载物台,将大米摊平后进行拍摄。
4.根据权利要求2所述的基于机器学习的大米品种快速识别方法,其特征在于:在步骤S3中,基于直方图对大米图像进行分割,以实现背景与目标分离。
5.根据权利要求2所述的基于机器学习的大米品种快速识别方法,其特征在于:在步骤S4中,基于卷积神经网络中的卷积核进行卷积运算实现不同品种大米图像的特征提取。
6.根据权利要求2所述的基于机器学习的大米品种快速识别方法,其特征在于:在步骤S5中,建立的机器学习分类模型为:高斯朴素贝叶斯模型或K近邻学习模型或线性判别分析模型或随机森林模型。
7.根据权利要求2所述的基于机器学习的大米品种快速识别方法,其特征在于:在步骤S5中,建立的机器学习分类模型为支持向量机模型。
8.根据权利要求7所述的基于机器学习的大米品种快速识别方法,其特征在于:在步骤S6中,对待测大米样品进行品种识别的过程为:
取待测大米样本,用培养皿盛装并摊平,置于暗箱中拍摄照片,将照片进行分割与特征提取,最后将大米的特征信息输入训练好的SVM模型,SVM模型预测出该待测大米样本属于哪个品种,并将其作为输出。
CN202110533885.1A 2021-05-17 2021-05-17 基于机器学习的大米品种快速识别方法 Pending CN113255749A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110533885.1A CN113255749A (zh) 2021-05-17 2021-05-17 基于机器学习的大米品种快速识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110533885.1A CN113255749A (zh) 2021-05-17 2021-05-17 基于机器学习的大米品种快速识别方法

Publications (1)

Publication Number Publication Date
CN113255749A true CN113255749A (zh) 2021-08-13

Family

ID=77182272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110533885.1A Pending CN113255749A (zh) 2021-05-17 2021-05-17 基于机器学习的大米品种快速识别方法

Country Status (1)

Country Link
CN (1) CN113255749A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104458747A (zh) * 2014-12-22 2015-03-25 扬州大学 一种水稻垩白测算方法
CN110186924A (zh) * 2019-07-24 2019-08-30 长沙荣业智能制造有限公司 一种大米品种智能检测方法、系统及装置
CN110414295A (zh) * 2018-04-26 2019-11-05 佛山市顺德区美的电热电器制造有限公司 识别大米的方法、装置、烹饪设备及计算机存储介质
WO2020188042A1 (en) * 2019-03-19 2020-09-24 Bühler AG Industrialized system for rice grain recognition and method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104458747A (zh) * 2014-12-22 2015-03-25 扬州大学 一种水稻垩白测算方法
CN110414295A (zh) * 2018-04-26 2019-11-05 佛山市顺德区美的电热电器制造有限公司 识别大米的方法、装置、烹饪设备及计算机存储介质
WO2020188042A1 (en) * 2019-03-19 2020-09-24 Bühler AG Industrialized system for rice grain recognition and method thereof
CN110186924A (zh) * 2019-07-24 2019-08-30 长沙荣业智能制造有限公司 一种大米品种智能检测方法、系统及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐克虎等, 北京航空航天大学出版社, pages: 226 - 131 *

Similar Documents

Publication Publication Date Title
US20210374940A1 (en) Product defect detection method, device and system
Fu et al. A deep-learning-based approach for fast and robust steel surface defects classification
CN108074231B (zh) 一种基于卷积神经网络的磁片表面缺陷检测方法
CN107688808B (zh) 一种快速的自然场景文本检测方法
CN110399927B (zh) 识别模型训练方法、目标识别方法及装置
CN108564589A (zh) 一种基于改进全卷积神经网络的植物叶片分割方法
CN111553303A (zh) 基于卷积神经网络的遥感正射影像密集建筑物提取方法
CN112215790A (zh) 基于深度学习的ki67指数分析方法
CN112926652B (zh) 一种基于深度学习的鱼类细粒度图像识别方法
CN109117703A (zh) 一种基于细粒度识别的混杂细胞种类鉴定方法
Zhao et al. Separate degree based Otsu and signed similarity driven level set for segmenting and counting anthrax spores
CN109975292A (zh) 一种基于机器视觉的大西洋鲑鱼和虹鳟鱼快速鉴别方法
CN110929787B (zh) 一种基于图像的苹果客观定级系统
CN110189799B (zh) 基于变量重要性评分和奈曼皮尔逊检验的宏基因组特征选择方法
CN111932639A (zh) 一种基于卷积神经网络的不均衡缺陷样本的检测方法
CN111768402A (zh) 一种基于mu-svm的冰鲜鲳鱼新鲜度评估方法
Wiling Locust Genetic Image Processing Classification Model-Based Brain Tumor Classification in MRI Images for Early Diagnosis
CN114818931A (zh) 一种基于小样本元学习的水果图像分类方法
CN113537278A (zh) 一种基于1d-cnn电子舌的酒检测方法及系统
CN113255749A (zh) 基于机器学习的大米品种快速识别方法
CN109598245B (zh) 基于1d-cnn的食用油横向弛豫衰减曲线信号特征提取方法
Zhang et al. Lightweight Multi-scale Convolutional Neural Network for Rice Leaf Disease Recognition.
Kuo et al. Automated assessment in HER-2/neu immunohistochemical expression of breast cancer
CN110443259B (zh) 一种从中等分辨率遥感影像中提取甘蔗的方法
CN114155399A (zh) 基于多特征融合递进式判别的乳腺病理全切片分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210813