CN116958960A

CN116958960A - 一种基于机器学习随机森林算法的鸡蛋暗斑检测方法

Info

Publication number: CN116958960A
Application number: CN202310628118.8A
Authority: CN
Inventors: 郑江霞; 宣琳; 徐桂云; 杨宁
Original assignee: China Agricultural University
Current assignee: China Agricultural University
Priority date: 2023-05-30
Filing date: 2023-05-30
Publication date: 2023-10-27

Abstract

本发明涉及一种基于机器学习随机森林算法的鸡蛋暗斑检测方法，该方法包括鸡蛋暗斑图像样本的采集步骤，预处理步骤，鸡蛋暗斑图像样本的特征值提取步骤，随机森林算法的模型构建，以及利用随机森林算法对暗斑进行自动识别和检测步骤。本发明提供的检测方法利用随机森林算法并运用鸡蛋本身的暗斑特征图像，建立自动化的鸡蛋暗斑评价体系，能够自动识别暗斑区域，并自动计算暗斑的面积大小，反映鸡蛋暗斑的严重程度。与其他机器学习算法相比，可以高效地对大量鸡蛋样本进行回归、分类及预测，且其构建模型所需样本数量少，准确率高，易用性强，能显著提高鸡蛋暗斑评价的效率及准确性和一致性，具有广阔的应用前景。

Description

一种基于机器学习随机森林算法的鸡蛋暗斑检测方法

技术领域

本发明涉及鸡蛋暗斑检测领域，具体涉及一种基于机器学习随机森林算法的鸡蛋暗斑检测方法。

背景技术

鸡蛋暗斑是在自然光条件下，鸡蛋表面可被肉眼观察到的灰色斑点，鸡蛋暗斑会降低鸡蛋的外观品质，影响消费者的购买欲望，给鸡蛋生产者造成潜在的经济损失。

目前，鸡蛋暗斑的检测方法主要是人工评级法，该方法采用人工的方式对鸡蛋进行照检，首先人工预选并制定出暗斑质量评价分级标准图，然后，检测员根据待测蛋暗斑与标准图的匹配度，对待测鸡蛋进行主观的评价分级。人工评价法所需的检测时间长，检测人员的劳动强度高，且受检测员个人主观因素的影响较大，往往无法准确、客观、一致地得到鸡蛋暗斑质量的评价结果。

为了克服人工评级过程中存在的效率低、准确性及一致性差的缺陷，基于图像特征获取及机器学习的蛋品质检测方法得到研究。

蒋敏兰等采集鸡蛋透光图像样本，应用GoogLeNet卷积神经网络模型，对鸡蛋暗斑进行等级评分(Minlan Jiang,Peilun Wu,Fei Li.Detecting dark spot eggs based onCNN GoogLeNet model[J].Wireless Networks,2021(prepublish).)；杨航等采用视觉传感器获取鸽蛋的图片，用YOLOv5s网络模型，对鸽蛋的受精蛋进行区分(CN20211083875.6，一种鸽蛋品质识别方法)，上述研究在蛋品质自动化评价方面进行了尝试，但仍存在诸多缺点。例如，所采用的GoogLeNet卷积神经网络模型，因为模型本身存在的过度矫正及梯度弥散问题，导致在初期的训练集构建时需要采集大量图像样本来进行训练，从而导致大量样本的损失；且上述方法的图像采集系统对硬件要求较高，一般的鸡蛋生产基地很难满足标准，因而易用性较差；此外，市场为了迎合消费者对蛋壳颜色的多元化消费需求，所推出的蛋壳颜色有时存在较大的差异性，现有的检测方法无法适用于对绿壳蛋的自动检测。

如何克服现有技术中存在的上述缺陷，开发一种检测效率高、准确性及一致性好，普适性强，且成本低的对蛋壳暗斑自动识别及检测方法是本领域技术人员关注的重点问题。

发明内容

本发明的目的在于提供一种基于机器学习随机森林算法的鸡蛋暗斑检测方法，以解决背景技术中所提出的问题。

本发明所提供的基于机器学习随机森林算法的鸡蛋暗斑检测方法，包括如下步骤：

一种基于机器学习随机森林算法的鸡蛋暗斑检测方法，所述检测方法包括如下步骤：

步骤1，搭建照蛋图像采集系统，对待测鸡蛋进行鸡蛋暗斑图像样本的采集；

步骤2，对所述鸡蛋暗斑图像样本进行预处理；

步骤3，从所述鸡蛋暗斑图像样本中提取特征值；

步骤4，将所述特征值输入到随机森林算法中，进行随机森林的模型构建；

步骤5，输入待测图像样本，利用随机森林算法完成对暗斑的自动识别，并计算其面积占比。

可选的，所述对待测鸡蛋进行鸡蛋暗斑图像样本的采集，包括：

对暗斑蛋使用单一参数采集方式，其中，固定鸡蛋采集的感光度参数从而保证图像样本的透光率相同，每个暗斑蛋采集一张图像样本。

可选的，所述对所述鸡蛋暗斑图像样本进行预处理，包括：

采用线性缩放算法将所述鸡蛋暗斑图像样本转换为8bit的图像。

可选的，所述对所述鸡蛋暗斑图像样本进行预处理，还包括：

在8bit图像的基础上采用高斯模糊算法选取暗斑边界；

采用线性增强算法将所获取的暗斑边界图像进行增强，随后采用线性光融合模式将所述暗斑边界图像与原所述8bit图像进行加法运算，以满足随机森林算法模型快速建立及测试的先决条件。

可选的，所述对所述鸡蛋暗斑图像样本进行预处理，包括：

步骤2.1，对获得的暗斑图像样本自动颜色阈值筛选，将完整鸡蛋选入ROI中，并进行反选，对反选后的区域进行像素值设定，设定值固定为0，将背景噪音去除；

步骤2.2，将以去除背景噪音的所述暗斑图像样本，采用双线性插值算法进行缩放，将原图像缩放到原始大小的1/4，并进行三样本复制，复制后样本1命名为8bit，样本2命名为dealing，样本3命名为origin，并对其进行RGB色彩空间向8bit转换为后续处理做准备；

步骤2.3，对图像样本2-dealing进行高斯模糊算法处理，σ值固定为2；使用减法运算将样本1-8bit减高斯模糊后的样本2-dealing图像，将减法运算结果进行乘法运算，增强值固定为15，得到所述暗斑图像样本的暗斑轮廓特征图像；

步骤2.4，将所得到的所述暗斑轮廓特称图像与样本3-origin进行加法运算，得到一张暗斑轮廓被增强后的所述暗斑图像样本，将样本进行8bit运算以便暗斑区域自动识别。

可选的，所述从所述鸡蛋暗斑图像样本中提取特征值，包括：

将预处理后得到的一张图像样本进行图像特征提取，通过高斯模糊、高斯函数差分、膜投影、Hessian矩阵、Sobel滤波器，共五种不同图像特征筛选器提取图像样本中的图像特征，以满足所述随机森林算法的单个决策树基础结构单元。

可选的，对所述从所述鸡蛋暗斑图像样本中提取特征值，包括：

3.1，将预处理后得到的8bit图像样本输入到weka算法中，以使用高斯模糊、Hessian矩阵、sobel滤波器、高斯差以及膜投影进行特征数据的采集；

3.2，将图像进行高斯模糊，用n个σ照常变化对每个像素进行n次独立卷积，半径越大，图像越模糊，直到像素均匀化停止；

3.3，计算每个像素的图像强度梯度的近似值，在滤波之前，先进行σ值照常变化的高斯模糊，随后应用所述Sobel滤波器在水平和垂直方向上做像素值的差分，能够得到图像梯度的近似值，在像素周围进行运算时，能够减少噪声带来的影响，得到轮廓特征；

3.4，提取特征值，在每个像素处进行计算一个2×2的Hessian矩阵，在滤波之前，先进行σ值照常变化的高斯模糊，通过矩阵运算在每个像素出得到以下特征：模块、轨迹、行列式、第一特征值、第二特征值、二阶导数最大方向值、伽马归一化平方特征值差、伽马归一化特征值差值的平方；

3.5，从原始图像中计算出两个高斯模糊图像，并从另一个中减去一个；σ值像往常一样变化，因此n(n-1)/2个特征图像被添加到特征中；

3.6，膜投影通过定向过滤增强图像的膜状结构；此操作的初始内核被硬编码为19×19零矩阵，中间列条目设置为1；通过将原始内核旋转6度，最多旋转180度，产生30个内核，从而创建多个内核；每个核与图像卷积，然后通过以下6种方法将30幅图像Z投影到单个图像中，包括每个图像中像素的总和、平均值、标准偏差、中值、最大像素以及最小像素。

可选的，所述进行随机森林的模型构建，包括：

挑选一张暗斑特征明显的8bit暗斑图像样本，导入到Trainable WekaSegmentation平台实现所述随机森林算法及对暗斑图像建模过程。

可选的，所述将所述特征值输入到随机森林算法中，进行随机森林的模型构建，包括：

4.1，决策树的生成；将所有所述特征值输入堆栈中，每个特征种类独立生成一颗决策树；决策树的类型为CART树，对每个特征A的每个值a，根据样本点对A＝a的测试为是或否，将D分为D1、D2，计算A＝a的基尼指数；

4.2，在所有的特征A及所有的可能的切分点a中，选择基尼指数最小的特征和切分点，将数据集分配到两个子节点中；重复上述操作直到所有子节点产生，生成CART树；

4.3，对整个特征样本应用bagging，训练集大小为N，对于每棵树而言，随机且有放回地从训练集中的抽取N个训练样本，这种采样方式称为bootstrap sample方法，作为该树的训练集；

4.4，如果每个样本的特征维度为M，指定一个常数m<<M，随机地从M个特征中选取m个特征子集，每次树进行分裂时，从这m个特征中选择最优的；

4.5，每棵树都尽最大程度的生长，并且没有剪枝过程。

可选的，所述输入待测图像样本，利用随机森林算法完成对暗斑的自动识别，并计算其面积占比，包括：

将所述待测图像样本代入到所述随机森林算法中，通过特征bagging过程进行决策树选择以及二值化计算，输出结果；

5.1，对每个所述待测图像样本，输入随机森林的模型中进行预测，并计算它作为oob样本的树对它的分类情况，约1/3的树，然后以简单多数投票作为该样本的分类结果；

5.2，将所得选取图像进行8bit转换，并进行图像二值化以及填补空隙，获得暗斑区域标准图像，进行统计分析得到暗斑面积占比。

本发明所能获得的优势技术效果：

(1)解决了目前鸡蛋暗斑人工评级法检测人员的劳动强度高，且容易受到检测员个人主观因素的影响，导致无法客观、准确、一致地体现鸡蛋暗斑质量评价的问题。

(2)本发明为取得暗斑特征图像，搭建了照蛋图像采集系统，采集暗斑图像的样本；解决了以往鸡蛋暗斑检测的研究存在的系统搭建成本高、样本数量过少、模型过拟合等问题。

(3)本发明将机器学习随机森林算法应用于鸡蛋暗斑自动测量，可以高效地对大量样本进行回归、分类及预测分析，实验用于多种蛋壳颜色鸡蛋暗斑测量的秩相关P值均小于0.001，证明基于机器学习随机森林算法的鸡蛋暗斑检测方法，可以替代人工评级法，准确率高，易用性强。

(4)该方法构建模型所需样本数量远少于其它算法，并且只需要CPU硬件要求，全自动，可行性高并有极强的相关性。本发明为鸡蛋暗斑检测提供了新方法，将在我国的鸡蛋品质检测中发挥巨大作用。

附图说明

图1是本发明所采用的基于机器学习随机森林算法的鸡蛋暗斑检测方法的流程示意图；

图2是本发明所采用的随机森林算法的原理示意图；

图3是本发明实施例两组样品的暗斑自动测量结果；

图4是本发明实施例样品的暗斑自动测量结果与人工暗斑等级评分线性回归分析；

图5是常规的人工暗斑等级评分标准图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。

如图1所示的基于机器学习随机森林算法的鸡蛋暗斑检测方法的流程示意图，该方法可以包括如下步骤：

S100、搭建照蛋图像采集系统，对待测鸡蛋进行鸡蛋暗斑图像样本的采集。

具体地，照蛋图像采集系统可以由摄像单元、照明单元和设备支架构成。摄像单元可以采用常见的市售的摄像设备，例如可以使用智能手机的摄像可调节参数模式。摄像单元使用智能手机的摄像可调节参数模式，可调节参数固定值分别感光度200，快门速度1/20，白平衡2800K。照明单元可以采用常见的市售的光源，例如采用白色LED点光源。照明单元采用直径135mm，光通量1000lm的白色LED点光源。

具体的，对暗斑蛋使用单一参数采集方式，其中，固定鸡蛋采集的感光度参数从而保证图像样本的透光率相同，每个暗斑蛋采集一张图像样本，正常鸡蛋每个采集一张图像样本。

S110、对鸡蛋暗斑图像样本进行预处理。

考虑到所采集的暗斑蛋图像蛋壳颜色各不相同，进而各蛋暗斑特征颜色也有所不同，可选的，采用线性缩放算法将鸡蛋暗斑图像样本转换为8bit的图像。由于采集到的暗斑图像样本中鸡蛋为红色图像，鸡蛋暗斑颜色为黄近红色，二者颜色差异不显著，为了提高颜色的差异度，我们对暗斑图像样本进行预处理操作。在8bit图像的基础上采用高斯模糊算法选取暗斑边界，采用线性增强算法将所获取的暗斑边界图像进行增强，随后采用线性光融合模式将暗斑边界图像与原8bit图像进行加法运算，以满足随机森林算法模型快速建立及测试的先决条件。

具体的：

步骤一：对获得的暗斑图像样本自动颜色阈值筛选，将完整鸡蛋选入ROI中，并进行反选。对反选后的区域进行像素值设定，设定值固定为0，将背景噪音去除。

步骤二：将以去除背景噪音的暗斑图像样本，采用双线性插值算法进行缩放，将原图像缩放到原始大小的1/4，并进行三样本复制。复制后样本1命名为8bit，样本2命名为dealing，样本3命名为origin，并对其进行RGB色彩空间向8bit转换为后续处理做准备。

步骤三：对图像样本2-dealing进行高斯模糊算法处理，σ值固定为2。使用减法运算将样本1-8bit减高斯模糊后的样本2-dealing图像，将减法运算结果进行乘法运算，增强值固定为15，得到暗斑图像样本的暗斑轮廓特征图像。

步骤四：将所得到的暗斑轮廓特称图像与样本3-origin进行加法运算，得到一张暗斑轮廓被增强后的暗斑图像样本，将样本进行8bit运算以便暗斑区域自动识别。

S120、从鸡蛋暗斑图像样本中提取特征值。

将预处理后得到的一张图像样本进行图像特征提取，通过高斯模糊、高斯函数差分、膜投影、Hessian矩阵、Sobel滤波器，共五种不同图像特征筛选器提取图像样本中的图像特征，以满足随机森林算法的单个决策树基础结构单元。

具体地：

步骤五：将预处理后得到的8bit图像样本输入到weka算法中，以使用高斯模糊、Hessian矩阵、sobel滤波器、高斯差以及膜投影进行特征数据的采集；

步骤六：将图像进行高斯模糊，用n个σ照常变化对每个像素进行n次独立卷积，半径越大，图像越模糊，直到像素均匀化停止；

步骤七：计算每个像素的图像强度梯度的近似值。在滤波之前，先进行σ值照常变化的高斯模糊，随后应用Sobel滤波器在水平和垂直方向上做像素值的差分，能够得到图像梯度的近似值，在像素周围进行运算时，能够减少噪声带来的影响，得到轮廓特征；

步骤八：提取特征值。在每个像素处进行计算一个2×2的Hessian矩阵，在滤波之前，先进行σ值照常变化的高斯模糊，通过矩阵运算在每个像素出得到以下特征：模块、轨迹、行列式、第一特征值、第二特征值、二阶导数最大方向值、伽马归一化平方特征值差、伽马归一化特征值差值的平方；

步骤九：从原始图像中计算出两个高斯模糊图像，并从另一个中减去一个。σ值像往常一样变化，因此n(n-1)/2个特征图像被添加到特征中；

步骤十：膜投影通过定向过滤增强图像的膜状结构。此操作的初始内核被硬编码为19×19零矩阵，中间列条目设置为1。通过将原始内核旋转6度，最多旋转180度，产生30个内核，从而创建多个内核。每个核与图像卷积，然后通过以下6种方法将30幅图像Z投影到单个图像中，包括每个图像中像素的总和、平均值、标准偏差、中值、最大像素以及最小像素。

S130、将特征值输入到随机森林算法中，进行随机森林的模型构建。

挑选一张暗斑特征明显的8bit暗斑图像样本，导入到Trainable WekaSegmentation平台实现随机森林算法及对暗斑图像建模过程。

具体的：

步骤十一：决策树的生成。将步骤S120计算所得所有特征值输入堆栈中，每个特征种类独立生成一颗决策树。决策树的类型为CART树，对每个特征A的每个值a，根据样本点对A＝a的测试为是或否，将D分为D1、D2，计算A＝a的基尼指数；

步骤十二：在所有的特征A及所有的可能的切分点a中，选择基尼指数最小的特征和切分点，将数据集分配到两个子节点中。重复上述操作直到所有子节点产生，生成CART树；

步骤十三：对整个特征样本应用bagging，训练集大小为N，对于每棵树而言，随机且有放回地从训练集中的抽取N个训练样本，这种采样方式称为bootstrap sample方法，作为该树的训练集；

步骤十四：如果每个样本的特征维度为M，指定一个常数m＜＜M，随机地从M个特征中选取m个特征子集，每次树进行分裂时，从这m个特征中选择最优的；

步骤十五：每棵树都尽最大程度的生长，并且没有剪枝过程。

S140、输入待测图像样本，利用随机森林算法完成对暗斑的自动识别，并计算其面积占比。

将待测图像样本代入到随机森林算法中，通过特征bagging过程进行决策树选择以及二值化计算，输出结果。

具体地，将得到的训练模型、待测样本以及标签带入到随机森林算法输入、输出进行计算，采用装袋算法进行矫正避免过拟合的发生。得出选取结果后，将所得选取图像进行8bit转换，并进行图像二值化以及填补空隙，获得暗斑区域标准图像，进行统计分析得到暗斑面积占比。

本发明所采用的随机森林算法的原理示意图如图2所示，将机器学习随机森林算法应用于鸡蛋暗斑自动测量，可高效地对大量样本进行回归、分类及预测分析，实验用于多种蛋壳颜色鸡蛋暗斑测量的秩相关P值均小于0.001(详见实施例)，证明基于机器学习随机森林算法的鸡蛋暗斑检测方法，可以替代人工评级法，准确率高，易用性强。且该方法构建模型所需样本数量远少于其它算法，并且只需要CPU硬件要求，全自动，可行性高并有极强的相关性。本发明为鸡蛋暗斑检测提供了新方法，将在我国的鸡蛋品质检测中发挥巨大作用。具体实施例：不同蛋壳颜色鸡蛋的暗斑检测

根据基于机器学习随机森林算法的鸡蛋暗斑检测方法，对某鸡场的京粉6号鸡蛋样品、绿壳蛋鸡鸡蛋样品进行暗斑面积占比计算。

鸡蛋暗斑图像样本的采集：对60枚鸡蛋进行暗斑图像样本的采集，将可调节参数固定值分别设定为感光度200，快门速度1/20，白平衡2800K。照明单元采用直径135mm，光通量1000lm的白色LED点光源。对暗斑鸡蛋使用单样本采集方式，正常鸡蛋每个采集一张图像样本；

暗斑图像样本的特征预处理：采集到的暗斑图像样本中鸡蛋为红色图像，鸡蛋暗斑颜色为黄近红色，二者颜色差异并不显著，因此对暗斑图像样本进行如下预处理：a、对获得的暗斑图像样本自动颜色阈值筛选，将完整鸡蛋选入ROI中，并进行反选。对反选后的区域进行像素值设定，设定值固定为0，将背景噪音去除；b、将以去除背景噪音的暗斑图像样本，采用双线性插值算法进行缩放，将原图像缩放到原始大小的1/4，并进行三样本复制。复制后样本1命名为8bit，样本2命名为dealing，样本3命名为origin，并对其进行RGB色彩空间向8bit转换为后续处理做准备；c、对图像样本2-dealing进行高斯模糊算法处理，σ值固定为2。使用减法运算将样本1-8bit减高斯模糊后的样本2-dealing图像，将减法运算结果进行乘法运算，增强值固定为15，得到暗斑图像样本的暗斑轮廓特征图像；d、将所得到的暗斑轮廓特称图像与样本3-origin进行加法运算，得到一张暗斑轮廓被增强后的暗斑图像样本，将样本进行8bit运算以便暗斑区域自动识别；

暗斑区域的特征提取及建模：挑选一张暗斑特征明显的8bit暗斑图像样本，导入到Trainable Weka Segmentation平台实现随机森林算法及对暗斑图像建模过程。a、将预处理后的暗斑图像样本输入，选取部分暗斑特征图像并归类于class1，选取正常蛋壳区域特征图像以及背景像素值为0区域并归类于class2；b、将步骤a所得的训练样本以及其特征带入到随机森林算法中，采用高斯模糊、高斯函数差分、膜投影、Hessian矩阵、Sobel滤波器五种特征筛选器，提取图像样本中的图像特征值，输出模型结果并保存。

暗斑区域占比测量：将得到的训练模型、待测样本以及标签带入到随机森林算法输入、输出进行计算，采用装袋算法进行矫正避免过拟合的发生。得出选取结果后，将所得选取图像进行8bit转换，并进行图像二值化以及填补空隙，获得暗斑区域标准图像，进行统计分析得到暗斑面积占比。

待测样品分组情况：

A：60枚京粉6号未受精鸡蛋，来自于北京某商品代鸡场；

B：30枚绿壳蛋鸡未受精鸡蛋，来自于中国农业大学实验鸡场。

图3是两组样品的暗斑自动测量结果，其中a为京粉6号粉壳蛋，b为绿壳蛋鸡绿壳蛋。

图4a和图4b分别是两组样品的暗斑自动测量结果与人工暗斑等级评分线性回归分析，其中图4a为京粉6号粉壳蛋的暗斑自动测量结果与人工暗斑等级评分线性回归分析，图4b为绿壳蛋鸡绿壳蛋的暗斑自动测量结果与人工暗斑等级评分线性回归分析。

秩相关分析，又称等级相关分析，是将两样本值按数据的大小顺序排列位次，以每个个体的位次代替实际数据而求得的一种统计量，它是反映等级相关程度的统计分析指标。基于机器学习随机森林算法的鸡蛋暗斑检测方法与人工评级法做Spearman秩相关分析结果显示，京粉6号粉壳蛋、绿壳蛋鸡绿壳蛋R值分别为0.941、0.919，且p值均小于0.0001(见表1)，具有统计学意义，表明不同蛋壳颜色鸡蛋的暗斑检测中，基于机器学习随机森林算法的鸡蛋暗斑检测方法与人工评级法之间存在强相关关系。

表1、两组样品的秩相关分析

鸡蛋样品	N	M	SD	R	P
						京粉6号	30	12.72	8.45	0.941^**	＜0.0001
绿壳蛋鸡	30	34.23	22.67	0.919^**	＜0.0001

对比例：鸡蛋暗斑不同检测方法的对比

(1)人工暗斑等级评分法

在黑暗条件下，用LED灯照射鸡蛋，固定拍照设备，在相同距离下拍摄照片。根据在光照下的透光斑点严重程度，将鸡蛋的蛋壳分为6个级别，暗斑评分标准图见图5，其中，1级为优，只有极少数细微亮点，室外条件下蛋壳表面无黑斑；2级为优良，分布少量细微亮点，室外条件下蛋壳表面无黑斑；3级为良，分布较多细微亮点，室外条件下蛋壳表面无黑斑；4级为中度，分布大量细微亮点，室外条件下蛋壳表面有少量黑斑；5级为重度，表面密布细微亮点和大亮点，室外条件下蛋壳表面有较多黑斑；6级为极重度，表面密布各种亮点，室外条件下蛋壳表面有大量黑斑。

(2)卷积神经网络暗斑评价方法

对暗斑鸡蛋使用多角度采集方式,在鸡蛋图像采集后,将其翻转90度,重复采集,若某角度蛋壳无暗斑,则不采集,正常鸡蛋单个采集一张图像样本；实验每隔1天重复上述采集,采样周期为20天左右；

采集的鸡蛋透射光图像颜色为黄接近红色,鸡蛋暗斑颜色为深红色,二者颜色对比度不高,对鸡蛋样本RGB空间中G分量进行4倍增强；之后利用插值算法将G增强的图像尺寸缩小为原样本的1/8,以满足GoogLeNet模型快速训练、测试；

采样共获得1200张暗斑鸡蛋图像和8850张正常鸡蛋图像。选择训练集和测试集的数量，按照1：3的比例进行。本文从每个类别中随机抽取900个样本作为模型训练样本，300个作为测试样本。暗斑蛋和正常蛋的标签用one-hot编码为0001和0010。然后，将训练样本和标签代入CNN GoogLeNet模型的输入和输出进行训练，采用随机梯度下降算法(SGD)来进行权重更新。当误差或迭代次数达到阈值时，训练停止。最后将测试样本代入训练好的网络中，得到测试结果。

(3)基于机器视觉的蛋壳暗斑评价方法

将鸡蛋放置在图像采集装置上，模拟鸡蛋分级过程的工作流程。整个分级过程由上料、图像采集、分选三个关键环节组成。在图像采集时，鸡蛋的图像是在跟随鸡蛋滚轮的运输过程中拍摄的。因此，图像的背景会包含输送装置的一部分。为了便于后续的统计分析，必须先去除图像的背景，从而得到只包含鸡蛋的图像。

在去除背景后的鸡蛋图像中，暗斑与正常蛋壳的对比度尚未达到完全区分暗斑的要求。因此本文采用非锐化掩模法进一步增强暗斑的对比度，随后将图像转换为二值图可以更清晰地可视化蛋壳上暗斑的分布。由于暗斑多为不规则的多边形，从几何角度统计暗斑的量比较困难。在二维图像中，八连通区域内的像素属于同一对象。通过计算二值图像中八连通区域的个数来实现暗斑评价。

(4)基于灰度识别的蛋壳暗斑评价方法

首先确认蛋壳长径默认为平行于y轴，蛋壳平行于y轴的2条切线之间的最短距离即为蛋壳短径，已知短径的实际长度，可统计图片中短径的像素，从而确定蛋壳实际长度与图形长度的比值；利用Photoshop CS6软件将蛋壳上的暗斑涂成黑色；用Image-Pro Plus6.0软件提取蛋壳上的斑点，去除蛋壳不透明区域；通过Image-Pro Plus软件提取蛋壳上水分斑点和不透明区域的轮廓。

(5)基于颜色阈值的蛋壳暗斑评价方法

选择LAB颜色模型进行颜色阈值的选取。采集鸡蛋图像进行灰度识别后，使用便携式分光光度计测量每个鸡蛋自身3个部位(钝头、中间和尖头)的L、A、B值。L代表光度，范围从0到100，对应颜色从黑到白的变化；A的变化范围为-120到120，对应颜色从绿色到红色的变化；和B的变化范围为-120到120，对应颜色从蓝色到黄色的变化。

以上各种鸡蛋暗斑检测方法的效果对比见表2，由表2可知，本发明提出的机器学习随机森林算法相较于其他方法，在识别质量、识别效率、操作性等方面均具有显著优势。

表2、各种鸡蛋暗斑检测方法的效果对比表

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明精神和原则之内做的任何修改、等同替换和改进等，均应该包含在本发明的保护范围之内。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

在一个典型的配置中，设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述检测方法包括如下步骤：

步骤2，对所述鸡蛋暗斑图像样本进行预处理；

步骤3，从所述鸡蛋暗斑图像样本中提取特征值；

2.根据权利要求1所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述对待测鸡蛋进行鸡蛋暗斑图像样本的采集，包括：

3.根据权利要求1所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述对所述鸡蛋暗斑图像样本进行预处理，包括：

4.根据权利要求3所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述对所述鸡蛋暗斑图像样本进行预处理，还包括：

在8bit图像的基础上采用高斯模糊算法选取暗斑边界；

5.根据权利要求1所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述对所述鸡蛋暗斑图像样本进行预处理，包括：

6.根据权利要求1所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述从所述鸡蛋暗斑图像样本中提取特征值，包括：

7.根据权利要求3所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，对步骤3所述从所述鸡蛋暗斑图像样本中提取特征值，包括：

8.根据权利要求3所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，所述进行随机森林的模型构建，包括：

挑选一张暗斑特征明显的8bit暗斑图像样本，导入到Trainable Weka Segmentation平台实现所述随机森林算法及对暗斑图像建模过程。

9.如权利要求1所述的检测方法，其特征在于，步骤4所述将所述特征值输入到随机森林算法中，进行随机森林的模型构建，包括：

4.5，每棵树都尽最大程度的生长，并且没有剪枝过程。

10.根据权利要求1所述的基于机器学习随机森林算法的鸡蛋暗斑检测方法，其特征在于，步骤5所述输入待测图像样本，利用随机森林算法完成对暗斑的自动识别，并计算其面积占比，包括：