CN118155759B - 用于评价荚果脱壳难易程度的评价模型构建方法及系统 - Google Patents
用于评价荚果脱壳难易程度的评价模型构建方法及系统 Download PDFInfo
- Publication number
- CN118155759B CN118155759B CN202410259948.2A CN202410259948A CN118155759B CN 118155759 B CN118155759 B CN 118155759B CN 202410259948 A CN202410259948 A CN 202410259948A CN 118155759 B CN118155759 B CN 118155759B
- Authority
- CN
- China
- Prior art keywords
- pod
- samples
- shelling
- difficulty
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013210 evaluation model Methods 0.000 title claims abstract description 46
- 238000010276 construction Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000000556 factor analysis Methods 0.000 claims abstract description 13
- 238000005259 measurement Methods 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 abstract description 13
- 238000009395 breeding Methods 0.000 abstract description 7
- 230000001488 breeding effect Effects 0.000 abstract description 7
- 241001553178 Arachis glabrata Species 0.000 description 18
- 235000020232 peanut Nutrition 0.000 description 18
- 235000014571 nuts Nutrition 0.000 description 14
- 235000017060 Arachis glabrata Nutrition 0.000 description 9
- 235000010777 Arachis hypogaea Nutrition 0.000 description 9
- 235000018262 Arachis monticola Nutrition 0.000 description 9
- 238000011161 development Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 230000000704 physical effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000012850 discrimination method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Animal Husbandry (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- General Business, Economics & Management (AREA)
- Agronomy & Crop Science (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用于评价荚果脱壳难易程度的评价模型构建方法及系统,其中方法包括:基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型。本发明的评价模型,可以基于荚果的荚果因子、果仁因子得到被评价的荚果的难度级别,使得荚果脱壳难度可以量化计算,为育种方向等理论研究提供理论支撑。
Description
技术领域
本发明涉及荚果加工特征的评价模型构建技术领域,特别是涉及用于评价荚果脱壳难易程度的评价模型构建方法及系统。
背景技术
农机农艺融合是提升农业机具作业质量的关键,二者相互融合,互相适应与促进是现代农业发展的内在要求和必然趋势,其融合水平不仅关系到关键环节机械化的突破,关系到先进、适用农业技术的推广普及应用,也影响农机化发展速度和质量。花生等荚果的品种和脱壳技术装备的融合是从根源突破现有脱壳技术难题的重要抓手,是低损脱壳技术研究的重要内容,也是全面提升花生脱壳作业质量的关键。长期以来,适于机械化低损脱壳的花生品种特征研究较少,致使低损脱壳品种特征不明,育种专家在适于机械化低损脱壳品种选育时缺乏方向,不仅影响了脱壳设备作业质量提升,而且将制约花生机械化生产的全面协调发展,威胁花生产业健康发展。
从全球花生机械化生产的发展来看,美国已在耕、种、管、收方面实现了农机农艺高水平融合,并且在花生育种初期就以是否适于机械化生产作为考量指标,是否适于机械化脱壳是其品种推广的重要标准之一。因此,其品种与现存技术装备作业参数、工艺流程高度融合,脱壳技术装备能满足其不同用途的花生脱壳需求。然而,从我国农业科研的发展来看,我国农业科研长期以主要农作物高产为主要方向,以保障国家粮食安全为主要目标,在农机农艺融合方面起步较晚,并且进展较为缓慢。农机农艺融合水平低是造成农业装备与品种不相适应、作业质量不稳定、作业质量差的主要原因。近年,农业主管部门在农机农艺融合方面政策频出,在政府、科研单位、农业推广等部门共同努力下,农机农艺融合水平有效提升,但仍存在很多薄弱环节和亟待探索、解决的问题,在花生脱壳技术装备方面表现尤为突出。我国在适于机械化低损脱壳品种特征的研究尚处于起步阶段,农机农艺联合研发机制尚未建立,现有技术中,不乏在脱壳过程中实时对破损率、脱净率等指标进行监测的装置,如专利CN202111257275.X等,但是适于低损脱壳的品种特征及机械化脱壳难度评价方面尚处于空白,部分品种完全不适于机械化脱壳。*
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种
技术方案:为实现上述目的,本发明的用于评价荚果脱壳难易程度的评价模型构建方法,所述方法包括:
基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;
获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;
基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型。
进一步地,所述基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,包括:
随机选取k组所述荚果样本,并将其脱壳指标的数值作为质心;
对剩余的每组待分类的荚果样本,基于其脱壳指标与各所述质心的距离,将待分类的荚果样本归入与其最近的所述质心对应的类别,形成k个分组;
基于分组中所有所述荚果样本的脱壳指标重新计算质心,并基于新的质心重新采用对比聚类的方式重新分类,形成新的k个分组;
每完成一次重新分类,重新计算各分组的质心,并将其与旧的质心对比,对比两者的偏移是否超出第一预设阈值,是则继续重新分类,否则结束进程并输出分类结果。
进一步地,所述基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,包括:
针对每个难度级别的所述荚果样本,采用90%的所述荚果样本所对应的所述判别因子构建分级函数;
所述方法还包括:
利用剩余的10%的所述荚果样本对所述评价模型进行验证。
进一步地,所述利用剩余的10%的所述荚果样本对所述评价模型进行验证,包括:
将每组所述荚果样本所对应的所述判别因子代入所述评价模型中的各所述分级函数,得到对应于各分级函数的计算值;
对比各所述计算值的大小,将最大的计算值对应的所述分级函数所对应的级别作为该组所述荚果样本的判定级别;
判断所述判定级别与所述荚果样本的实际级别是否一致,是则将其记入被正确判别的组别;
计算被正确判别的荚果样本占参与验证的荚果样本总数的百分比;
判断所述百分比是否超出第二预设阈值,是则判定所述评价模型是有效的。
进一步地,所述分级函数基于距离判别法、费舍尔判别法或贝叶斯判别法进行构建。
用于评价荚果脱壳难易程度的评价模型构建系统,其包括:
分级模块,其用于基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;
分析模块,其用于获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;
建模模块,其用于基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型。
有益效果:本发明的用于评价荚果脱壳难易程度的评价模型构建方法及系统具有如下有益效果:
(1)本发明在荚果生理、机械力学特征研究基础上,以脱壳低破损率、高脱净率为目标,开展品种特性对作业质量影响机理研究,探明并提出适于低损脱壳的品种评价模型,为育种专家提供适于机械化低损脱壳的育种方向,为提升花生生产农机农艺融合水平提供支撑。
(2)本发明基于采集的多品种荚果样本的实测脱壳指标与物理特性数据,基于脱壳指标对荚果样本进行分类,利用因子分析对物理特性进行简化,并利用简化得到的因子对同一难度级别的荚果建立分级函数,实现了对荚果脱壳难易程度的评价模型的构建,后续对于未知难度级别的荚果,可以基于其物理特性求解其荚果因子与果仁因子,并基于荚果因子、果仁因子以及分级函数可以得到被评价的荚果的难度级别,使得荚果脱壳难度可以量化计算,方便对荚果进行品种研究,为育种方向等后续理论研究提供理论支撑。
附图说明
图1为用于评价荚果脱壳难易程度的评价模型构建方法的流程示意图;
图2为用于评价荚果脱壳难易程度的评价模型构建系统的构成示意图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1所示的用于评价荚果脱壳难易程度的评价模型构建方法,所述方法包括如下步骤S101-S103:
步骤S101,基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;
本实施例中,荚果样本有多个品种,本实施例中以花生脱壳为例,采用了29个品种的花生进行了脱壳试验实测,得到了对应于各品种花生的破损率与脱净率;k=3,三个难度级别分别代表容易、中等、困难。根据实际需要,还可以分为更多的难度级别。
步骤S102,获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;
本步骤中,因子分析的目的在于研究众多原始变量之间的内部依赖关系,探求观测变量之间的基本结构并用少数几个独立的不可观测变量来表示原始变量的数据结构,这些不可观测的变量是假想的变量,称为因子。
因子分析的数学模型以X(p×1)=A(p×q)×F(q×1)+e(p×1)表示,其中,p、q为维度数据,X为可实测的p维向量,其每一维的分量代表一个物理特性;A为因子载荷矩阵,其中每一个元素称为因子载荷,F为不可观测的p维向量,其每个分量称为公共因子,也即本申请中的判别因子。e为特殊因子,其包括随机误差。实际计算时,忽略e,以F替代X,以较少的因子体现较多物理特性之间的关系,达到简化变量降低维度的目的。
本实施例中,以花生为例,花生的物理特性为可观测的变量,物理特性包括外壳特性与果仁特性,外壳特性包括外壳饱满度、外壳球度、外壳整齐度、外壳饱满度、外壳力学特性(单位:N)、外壳几何平均直径、外壳形状、外壳网纹、缩缢深度、果嘴;果仁特性包括果仁整齐度、果仁力学特征(单位:N)、果仁平均直径、果仁球度以及果仁形状,一共14个特征。这些物理特性的具体值是针对每一品种的荚果样本进行实测得到的。
进行因子分析后,可以得到4个荚果因子与1个果仁因子,4个荚果因子分别为荚果因子1、荚果因子2、荚果因子3以及荚果因子5,分别以x1、x2、x3、x4表示,1个果仁因子以x5表示。其中,x1代表了外壳球度、外壳整齐度、外壳力学特征、缩缢深度这四个物理特性;x2代表了外壳饱满度、外壳几何平均直径这两个物理特性;x3代表了外壳形状与外壳网这两个物理特性;x4代表了果嘴这一项物理特性;x4代表了果仁球度、果仁整齐度、果仁力学特征以及果仁形状这四项物理特性。
在因子分析得到4个荚果因子与1个果仁因子,对每个因子(荚果因子以及果仁因子)与其对应的物理特性进行线性回归,可以得到每个因子与对应的物理特性之间的线性表达式。
步骤S103,基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型。
本步骤中,评价模型的具体公式为:
其中,所述判别模型包含的k个公式分别对应于k个难度级别;y1、y2…yk为判别值,x1、x2…xn为果壳因子或果仁因子,n为判别因子的总数;a1、a2…an为第1难度级别的对应的系数;b1、b2…bn为第2难度级别的对应的系数;c1、c2…cn为第k难度级别的对应的系数。
基于上述S103得到的评价模型,对待评估的荚果进行脱壳难度预测时,先针对待评估的荚果进行上述物理特性进行测定,得到测定值,然后,根据测定值以及上述因子与对应物理特性之间的线性表达式,可以得到各果壳因子与果仁因子,再根据评价模型,即可得到荚果对应的难度等级。
上述步骤S101-S103中,基于采集的多品种荚果样本的实测脱壳指标与物理特性数据,基于脱壳指标对荚果样本进行分类,利用因子分析对物理特性进行简化,并利用简化得到的因子对同一难度级别的荚果建立分级函数,实现了对荚果脱壳难易程度的评价模型的构建,后续对于未知难度级别的荚果,可以基于其物理特性求解其荚果因子与果仁因子,并基于荚果因子、果仁因子以及分级函数可以得到被评价的荚果的难度级别,使得荚果脱壳难度可以量化计算,方便对荚果进行品种研究,为育种方向等后续理论研究提供理论支撑。
优选地,上述步骤S101中所述基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,包括如下步骤S201-S204:
步骤S201,随机选取k组所述荚果样本,并将其脱壳指标的数值作为质心;脱壳指标具有破损率与脱净率两个数据,相当于两个坐标维度,也即质心为一个多维数据;
步骤S202,对剩余的每组待分类的荚果样本,基于其脱壳指标与各所述质心的距离,将待分类的荚果样本归入与其最近的所述质心对应的类别,形成k个分组;
本步骤中的距离计算方式为:若质心为(p0,q0),第i组荚果样本的破损率与脱净率分别为pi、qi,则距离为
步骤S203,基于分组中所有所述荚果样本的脱壳指标重新计算质心,并基于新的质心重新采用对比聚类的方式重新分类,形成新的k个分组;
步骤S204,每完成一次重新分类,重新计算各分组的质心,并将其与旧的质心对比,对比两者的偏移是否超出第一预设阈值,是则继续重新分类,否则结束进程并输出分类结果。此处的第一预设阈值可以按需选择较小的数值。
采用上述分类方式,可以充分基于破损率与脱净率两个维度的数据对所有荚果样本进行有效分类,使得不同分组的荚果样本属于不同的难度级别。
优选地,上述步骤S103中所述基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,包括:
针对每个难度级别的所述荚果样本,采用90%的所述荚果样本所对应的所述判别因子构建分级函数;
所述方法还包括如下步骤:
利用剩余的10%的所述荚果样本对所述评价模型进行验证,对所述评价模型的有效性进行确认。
优选地,所述利用剩余的10%的所述荚果样本对所述评价模型进行验证,包括如下步骤S301-S305:
步骤S301,将每组所述荚果样本所对应的所述判别因子代入所述评价模型中的各所述分级函数,得到对应于各分级函数的计算值;
步骤S302,对比各所述计算值的大小,将最大的计算值对应的所述分级函数所对应的级别作为该组所述荚果样本的判定级别;
步骤S303,判断所述判定级别与所述荚果样本的实际级别是否一致,是则将其记入被正确判别的组别;
步骤S304,计算被正确判别的荚果样本占参与验证的荚果样本总数的百分比;
步骤S305,判断所述百分比是否超出第二预设阈值,是则判定所述评价模型是有效的。第二预设阈值可按需设置,如可以设置为95%。
采用上述步骤S301-S305,可以有效利用采集的荚果样品的数据,对评价模型进行有效验证,确保评价模型的准确性。
优选地,上述步骤S103中所述分级函数基于距离判别法、费舍尔判别法或贝叶斯判别法进行构建。
本发明还提供了一种用于评价荚果脱壳难易程度的评价模型构建系统400(以下简称:评价模型构建系统400),评价模型构建系统400可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述用于评价荚果脱壳难易程度的评价模型构建方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述用于评价荚果脱壳难易程度的评价模型构建方法在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能,如图2所示,其包括:
分级模块401,其用于基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;
分析模块402,其用于获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;
建模模块403,其用于基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型。
其他基于评价模型构建系统400实现上述用于评价荚果脱壳难易程度的评价模型构建方法的内容在之前实施例中已经详细介绍,可参考之前实施例中的对应内容,此处不再赘述。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (2)
1.用于评价荚果脱壳难易程度的评价模型构建方法,其特征在于,所述方法包括:
基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;
获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;
基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型;
所述基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,包括:
随机选取k组所述荚果样本,并将其脱壳指标的数值作为质心;
对剩余的每组待分类的荚果样本,基于其脱壳指标与各所述质心的距离,将待分类的荚果样本归入与其最近的所述质心对应的类别,形成k个分组;
基于分组中所有所述荚果样本的脱壳指标重新计算质心,并基于新的质心重新采用对比聚类的方式重新分类,形成新的k个分组;
每完成一次重新分类,重新计算各分组的质心,并将其与旧的质心对比,对比两者的偏移是否超出第一预设阈值,是则继续重新分类,否则结束进程并输出分类结果;
所述基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,包括:
针对每个难度级别的所述荚果样本,采用90%的所述荚果样本所对应的所述判别因子构建分级函数;
所述方法还包括:
利用剩余的10%的所述荚果样本对所述评价模型进行验证;
所述利用剩余的10%的所述荚果样本对所述评价模型进行验证,包括:
将每组所述荚果样本所对应的所述判别因子代入所述评价模型中的各所述分级函数,得到对应于各分级函数的计算值;
对比各所述计算值的大小,将最大的计算值对应的所述分级函数所对应的级别作为该组所述荚果样本的判定级别;
判断所述判定级别与所述荚果样本的实际级别是否一致,是则将其记入被正确判别的组别;
计算被正确判别的荚果样本占参与验证的荚果样本总数的百分比;
判断所述百分比是否超出第二预设阈值,是则判定所述评价模型是有效的;
所述分级函数基于距离判别法、费舍尔判别法或贝叶斯判别法进行构建。
2.用于评价荚果脱壳难易程度的评价模型构建系统,其特征在于,其包括:
分级模块,其用于基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,k为大于1的整数;所述脱壳指标包括破损率与脱净率;
分析模块,其用于获取所述荚果样本的物理特性的数据,并利用因子分析方法对所有所述物理特性进行简化,得到多个判别因子;
建模模块,其用于基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,所有所述分级函数构成评价模型;
所述基于多组荚果样本的脱壳指标的实测数据对所有品种的所述荚果样本进行分类,形成多个反应脱壳难易程度的k个难度级别,包括:
随机选取k组所述荚果样本,并将其脱壳指标的数值作为质心;
对剩余的每组待分类的荚果样本,基于其脱壳指标与各所述质心的距离,将待分类的荚果样本归入与其最近的所述质心对应的类别,形成k个分组;
基于分组中所有所述荚果样本的脱壳指标重新计算质心,并基于新的质心重新采用对比聚类的方式重新分类,形成新的k个分组;
每完成一次重新分类,重新计算各分组的质心,并将其与旧的质心对比,对比两者的偏移是否超出第一预设阈值,是则继续重新分类,否则结束进程并输出分类结果;
所述基于所述判别因子及其所对应荚果样本的难度级别构建对应于该所述难度级别的分级函数,包括:
针对每个难度级别的所述荚果样本,采用90%的所述荚果样本所对应的所述判别因子构建分级函数;
所述方法还包括:
利用剩余的10%的所述荚果样本对所述评价模型进行验证;
所述利用剩余的10%的所述荚果样本对所述评价模型进行验证,包括:
将每组所述荚果样本所对应的所述判别因子代入所述评价模型中的各所述分级函数,得到对应于各分级函数的计算值;
对比各所述计算值的大小,将最大的计算值对应的所述分级函数所对应的级别作为该组所述荚果样本的判定级别;
判断所述判定级别与所述荚果样本的实际级别是否一致,是则将其记入被正确判别的组别;
计算被正确判别的荚果样本占参与验证的荚果样本总数的百分比;
判断所述百分比是否超出第二预设阈值,是则判定所述评价模型是有效的;
所述分级函数基于距离判别法、费舍尔判别法或贝叶斯判别法进行构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410259948.2A CN118155759B (zh) | 2024-03-06 | 2024-03-06 | 用于评价荚果脱壳难易程度的评价模型构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410259948.2A CN118155759B (zh) | 2024-03-06 | 2024-03-06 | 用于评价荚果脱壳难易程度的评价模型构建方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118155759A CN118155759A (zh) | 2024-06-07 |
CN118155759B true CN118155759B (zh) | 2024-08-13 |
Family
ID=91298198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410259948.2A Active CN118155759B (zh) | 2024-03-06 | 2024-03-06 | 用于评价荚果脱壳难易程度的评价模型构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118155759B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09955A (ja) * | 1995-06-19 | 1997-01-07 | Satake Eng Co Ltd | 籾摺機における脱ぷ難易度判別装置 |
CN108576844A (zh) * | 2018-03-16 | 2018-09-28 | 青岛理工大学 | 高效核桃破壳取仁壳仁分离自动化生产系统 |
-
2024
- 2024-03-06 CN CN202410259948.2A patent/CN118155759B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09955A (ja) * | 1995-06-19 | 1997-01-07 | Satake Eng Co Ltd | 籾摺機における脱ぷ難易度判別装置 |
CN108576844A (zh) * | 2018-03-16 | 2018-09-28 | 青岛理工大学 | 高效核桃破壳取仁壳仁分离自动化生产系统 |
Also Published As
Publication number | Publication date |
---|---|
CN118155759A (zh) | 2024-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111157698B (zh) | 一种利用发射率数据获取黑土土壤全钾含量的反演方法 | |
CN109273096A (zh) | 一种基于机器学习的药品风险分级评估方法 | |
CN116564409A (zh) | 基于机器学习的转移性乳腺癌转录组测序数据识别方法 | |
CN110119756B (zh) | 一种基于投票法的趋势性数据特征自动选择方法 | |
CN108491991A (zh) | 基于工业大数据产品工期的约束条件分析系统与方法 | |
CN117236278B (zh) | 一种基于数字孪生技术的芯片生产仿真方法及系统 | |
CN114416707A (zh) | 工业时序数据的自动化特征工程方法和装置 | |
CN116071592A (zh) | 基于高光谱可增量更新的玉米种子品种鉴定方法及系统 | |
CN118155759B (zh) | 用于评价荚果脱壳难易程度的评价模型构建方法及系统 | |
CN115033591A (zh) | 一种电费数据异常智能检测方法、系统、存储介质及计算机设备 | |
WO2024131358A1 (zh) | 一种电池电芯一致性评估方法、装置、系统及介质 | |
CN113705110A (zh) | 一种基于双重随机森林回归方法的爆破振动速度预测方法 | |
CN116502155B (zh) | 一种用于数控电动螺旋压力机的安全监管系统 | |
CN115995262B (zh) | 基于随机森林及lasso回归解析玉米遗传机理的方法 | |
CN116756662A (zh) | 基于哈里斯鹰算法优化随机森林的良率预测方法及系统 | |
CN110942808A (zh) | 一种基于基因大数据的预后预测方法及预测系统 | |
CN116313111A (zh) | 基于组合模型的乳腺癌风险预测方法、系统、介质、设备 | |
CN115270861A (zh) | 一种产品成分数据监测方法、装置、电子设备及存储介质 | |
CN113780334A (zh) | 基于两阶段混合特征选择的高维数据分类方法 | |
CN113076309A (zh) | 烟草生丝水分加水量预测系统及方法 | |
CN114663102A (zh) | 基于半监督模型预测发债主体违约的方法、设备及存储介质 | |
TW202105106A (zh) | 資料處理裝置、方法、及半導體製造裝置 | |
CN110766087A (zh) | 一种基于离差最大化法改进k-means的提高数据聚类质量的方法 | |
CN116776134B (zh) | 一种基于PCA-SFFS-BiGRU的光伏出力预测方法 | |
CN118155758A (zh) | 基于荚果物理特征的易脱壳性评价方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |