CN111325404B - 求解米粉原料指标范围的数据驱动模型分析方法及装置 - Google Patents

求解米粉原料指标范围的数据驱动模型分析方法及装置 Download PDF

Info

Publication number
CN111325404B
CN111325404B CN202010122027.3A CN202010122027A CN111325404B CN 111325404 B CN111325404 B CN 111325404B CN 202010122027 A CN202010122027 A CN 202010122027A CN 111325404 B CN111325404 B CN 111325404B
Authority
CN
China
Prior art keywords
rice flour
raw material
data
target
flour raw
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010122027.3A
Other languages
English (en)
Other versions
CN111325404A (zh
Inventor
舒行
杨华
周康
刘朔
刘江蓉
高婧
周坚
吕新宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Polytechnic University
Original Assignee
Wuhan Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Polytechnic University filed Critical Wuhan Polytechnic University
Priority to CN202010122027.3A priority Critical patent/CN111325404B/zh
Publication of CN111325404A publication Critical patent/CN111325404A/zh
Application granted granted Critical
Publication of CN111325404B publication Critical patent/CN111325404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Manufacturing & Machinery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Adjustment And Processing Of Grains (AREA)
  • Cereal-Derived Products (AREA)

Abstract

本发明涉及米粉加工技术领域,公开了一种求解米粉原料指标范围的数据驱动模型分析方法及装置,所述方法包括:获取根据米粉原料指标及米粉制品指标构建的样本数据库;对样本数据库中的数据进行预处理,获得处理后的目标数据;基于目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据;根据计算数据和预设优化目标构建米粉原料品质标准优化模型;根据米粉原料品质标准优化模型确定米粉原料品质指标标准。从而通过构建米粉原料品质标准优化模型,根据该模型来确定米粉原料品质指标范围,解决了如何确定米粉原料品质指标的最佳范围,使得在给定的生产工艺条件下米粉原料能够生产出合格的米粉制品的技术问题。

Description

求解米粉原料指标范围的数据驱动模型分析方法及装置
技术领域
本发明涉及米粉加工技术领域,尤其涉及一种求解米粉原料指标范围的数据驱动模型分析方法及装置。
背景技术
在米粉加工领域,多样化的米粉制品对米粉原料品质的需求也不尽相同,需要制作出符合国标、省标、行标、企标的米粉制品,就要根据米粉制品品质预测米粉原料的最佳品质范围,这样可为企业采办原料提供依据,采办合适的原料,在给定的生产工艺条件下生产出合格的目标制品,提高合格率,减少浪费,为企业减少损失,提高企业利润。
目前企业在确定米粉制品的生产原料时有很多方法,如根据生产经验或进行简单的对比试验就可以大致判断出何种米粉原料投入制作将会得到怎样的米粉制品,但是这种根据生产经验对米粉制品生产流程做决策的方法在效率上存在着一定的提升空间。对于企业的生产规划来说,如何科学地找到生产目标米粉制品最合适的米粉原料品质范围是一个比较大的难题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提出一种求解米粉原料指标范围的数据驱动模型分析方法及装置,旨在解决如何确定米粉原料品质指标的最佳范围,使得在给定的生产工艺条件下米粉原料能够生产出合格的米粉制品的技术问题。
为实现上述目的,本发明提供一种求解米粉原料指标范围的数据驱动模型分析方法,所述求解米粉原料指标范围的数据驱动模型分析方法包括以下步骤:
获取根据米粉原料指标及米粉制品指标构建的样本数据库;
对所述样本数据库中的数据进行预处理,获得处理后的目标数据;
基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据;
根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型;
根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。
优选地,所述对所述样本数据库中的数据进行预处理,获得处理后的目标数据,具体包括:
从所述样本数据库中提取米粉原料样本集和米粉制品样本集;
分别对所述米粉原料样本集和所述米粉制品样本集进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集;
获取所述标准化米粉原料样本集中的标准化米粉原料样本数据;
对所述标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵;
从所述目标米粉原料样本数据中提取目标米粉原料指标;
根据所述主成分因子载荷矩阵将所述目标米粉原料指标映射为米粉原料品质指标;
将所述目标米粉原料样本数据、所述标准化米粉制品样本集、所述米粉原料品质指标作为目标数据。
优选地,所述基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据,具体包括:
根据所述目标米粉原料样本数据和所述标准化米粉制品样本集生成多元线性回归模型的训练集;
根据所述训练集对所述多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型;
从所述标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定所述目标米粉制品指标对应的回归函数;
根据所述回归函数确定拟合优度;
将所述预测模型和所述拟合优度作为计算数据。
优选地,所述根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型,具体包括:
查找所述米粉原料品质指标对应的米粉原料品质的理化性质数据,并基于所述理化性质数据确定米粉原料限制约束;
基于所述预测模型和预设目标食品品质要求,确定米粉制品限制约束;
根据所述拟合优度对所述米粉制品限制约束进行修正,获得目标米粉制品限制约束;
根据多个目标米粉原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;
根据所述扩散因子和预设目标区域要求确定扩散因子约束;
将所述米粉原料限制约束、所述目标米粉制品限制约束和所述扩散因子约束作为约束条件;
根据所述约束条件和预设优化目标构建米粉原料品质标准优化模型。
优选地,所述根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围,具体包括:
采用线性加权法将所述米粉原料品质标准化模型转化为单目标品质标准优化模型;
根据所述单目标品质标准优化模型对所述标准化米粉原料样本数据进行四分位数计算,获得计算结果数据;
根据所述计算结果数据和所述米粉原料品质标准化模型确定调控模型;
根据所述调控模型确定米粉原料品质指标范围。
优选地,所述根据所述计算结果数据和所述米粉原料品质标准化模型确定调控模型,具体包括:
从所述计算结果数据中选取下四分位数据和上四分位数据;
根据所述下四分位数据和所述上四分位数据计算差值;
根据所述差值和预设标准化方法确定约束权重;
根据所述约束权重和所述扩散因子对所述扩散因子约束进行优化,获得目标扩散因子约束;
根据所述目标扩散因子约束对所述米粉原料品质标准优化模型进行调控,获得调控模型。
优选地,所述根据所述调控模型确定米粉原料品质指标范围,具体包括:
根据所述调控模型计算米粉原料品质指标下界值和米粉原料品质指标上界值;
对所述米粉原料品质指标下界值和所述米粉原料品质指标上界值进行反标准化处理;
根据处理结果确定米粉原料品质指标范围。
此外,为实现上述目的,本发明还提出一种求解米粉原料指标范围的数据驱动模型分析装置,所述求解米粉原料指标范围的数据驱动模型分析装置包括:
数据获取模块,用于获取根据米粉原料指标及米粉制品指标构建的样本数据库;
数据处理模块,用于对所述样本数据库中的数据进行预处理,获得处理后的目标数据;
指标预测模块,用于基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据;
模型构建模块,用于根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型;
范围确定模块,用于根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。
优选地,所述数据处理模块,还用于从所述样本数据库中提取米粉原料样本集和米粉制品样本集;
所述数据处理模块,还用于分别对所述米粉原料样本集和所述米粉制品样本集进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集;
所述数据处理模块,还用于获取所述标准化米粉原料样本集中的标准化米粉原料样本数据;
所述数据处理模块,还用于对所述标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵;
所述数据处理模块,还用于从所述目标米粉原料样本数据中提取目标米粉原料指标;
所述数据处理模块,还用于根据所述主成分因子载荷矩阵将所述目标米粉原料指标映射为米粉原料品质指标;
所述数据处理模块,还用于将所述目标米粉原料样本数据、所述标准化米粉制品样本集、所述米粉原料品质指标作为目标数据。
优选地,所述指标预测模块,还用于根据所述目标米粉原料样本数据和所述标准化米粉制品样本集生成多元线性回归模型的训练集;
所述指标预测模块,还用于根据所述训练集对所述多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型;
所述指标预测模块,还用于从所述标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定所述目标米粉制品指标对应的回归函数;
所述指标预测模块,还用于根据所述回归函数确定拟合优度;
所述指标预测模块,还用于将所述预测模型和所述拟合优度作为计算数据。
本发明提出的求解米粉原料指标范围的数据驱动模型分析方法,通过获取根据米粉原料指标及米粉制品指标构建的样本数据库;对所述样本数据库中的数据进行预处理,获得处理后的目标数据;基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型;根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。从而通过对样本数据库中的数据进行预处理得到目标数据,获取基于目标数据对米粉制品品质指标进行预测过程中的计算数据,进而构建米粉原料品质标准优化模型,根据该模型来确定米粉原料品质指标范围,解决了如何确定米粉原料品质指标的最佳范围,使得在给定的生产工艺条件下米粉原料能够生产出合格的米粉制品的技术问题。
附图说明
图1为本发明求解米粉原料指标范围的数据驱动模型分析方法第一实施例的流程示意图;
图2为本发明求解米粉原料指标范围的数据驱动模型分析方法第一实施例中的米粉制品限制约束在二维空间的表示图;
图3为本发明求解米粉原料指标范围的数据驱动模型分析方法第二实施例的流程示意图;
图4为本发明求解米粉原料指标范围的数据驱动模型分析方法第三实施例的流程示意图;
图5为本发明求解米粉原料指标范围的数据驱动模型分析装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明求解米粉原料指标范围的数据驱动模型分析方法第一实施例的流程示意图。
在第一实施例中,所述求解米粉原料指标范围的数据驱动模型分析方法包括以下步骤:
步骤S10,获取根据米粉原料指标及米粉制品指标构建的样本数据库。
需要说明的是,本实施例的执行主体可为具有数据处理、程序运行以及网络通信功能的计算服务设备,例如智能手机、平板电脑、个人电脑等,还可为其他可实现相同或相似功能的求解米粉原料指标范围的数据驱动模型分析设备,本实施例对此不作限制,在本实施例中,以求解米粉原料指标范围的数据驱动模型分析设备为例进行说明。
需要说明的是,已知根据米粉原料指标和米粉制品指标构建的样本数据库,该样本数据库为高质量数据库,包括{x1,x2,…xm,y1,y2,…yn},其中{x1,x2,…xm}是可以评价米粉原料的米粉原料指标,{y1,y2,…yn}是可以评价米粉制品的米粉制品指标。
样本数据库D为:
Figure BDA0002391897800000061
DA为米粉原料的基础信息数据,DM为米粉原料的指标数据集,即米粉原料样本集,DN为米粉制品的指标数据集,即米粉制品样本集,其中,t为t种米粉原料,k为第k个米粉原料的基础信息数据,m为第m个米粉原料的指标数据,n为第n个米粉制品的指标数据。
应当理解的是,获取样本数据库的方式可为从本地存储器获取,也可为从网络端获取,还可为其他方式获取,本实施例对此不作限制。
步骤S20,对所述样本数据库中的数据进行预处理,获得处理后的目标数据。
需要说明的是,获取所述样本数据库中的米粉原料样本集和米粉制品样本集,将米粉制品样本集中的指标设置为响应变量,将米粉原料样本集中的指标设置为预测变量,就可以将对米粉制品标准的约束转化为对米粉原料标准的约束。
应当理解的是,对样本数据库中的数据进行预处理的步骤具体为:
首先,从样本数据库中提取米粉原料样本集和米粉制品样本集,再分别对米粉原料样本集和米粉制品样本集进行标准化处理,可获得标准化米粉原料样本集和标准化米粉制品样本集,而之所以要先对样本集进行标准化处理,是因为进行标准化处理之后的样本集中的数据更方便于后续的使用。
然后,获取标准化米粉原料样本集中的标准化米粉原料样本数据,对标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵,进行主成分降维的目的是为了排除不合适的数据,从而降低数据的维度,使降维后的数据满足后续关系模型的训练要求和降低训练难度。
最后,从目标米粉原料样本数据中提取目标米粉原料指标,根据主成分因子载荷矩阵将目标米粉原料指标映射为米粉原料品质指标,将目标米粉原料样本数据、标准化米粉制品样本集、米粉原料品质指标作为目标数据,用于后续的计算和使用,即所述目标数据包括目标米粉原料样本数据、标准化米粉制品样本集、米粉原料品质指标。
步骤S30,基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据。
需要说明的是,基于目标数据对米粉制品品质指标进行预测的步骤具体为:
首先,根据目标米粉原料样本数据和标准化米粉制品样本集生成多元线性回归模型的训练集,再根据训练集对多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型,预测模型用于根据米粉原料品质指标预测米粉制品品质指标,在后续步骤中,通过预测模型来确定米粉制品限制约束。
然后,从标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定目标米粉制品指标对应的回归函数,并根据回归函数确定拟合优度。
最后,将预测步骤过程中得到的预测模型和拟合优度作为计算数据,用于后续的计算和使用,即所述计算数据包括预测模型和拟合优度。
应当理解的是,为了解决精度问题,为米粉原料标准的约束引入基于回归预测精度的修正因子来改造约束条件,使得优化后的米粉原料最大限度地保证获得符合米粉品质标准的制品,提高了优化决策的可信度。
步骤S40,根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型。
需要说明的是,所述预设优化目标为以原料品质指标标准的最优化制定为目标。
需要说明的是,米粉原料品质标准优化模型的约束条件主要分为两类:
第一类约束:米粉原料限制约束。此约束按照米粉原料的指标数值的合理范围限制求解范围。
第二类约束:米粉制品限制约束。此约束是通过米粉原料和米粉制品的关系模型的传递,将对米粉制品的限制转移到对米粉原料的限制上来,其中还需考虑关系模型的精度矫正问题。以两项米粉原料指标和两项米粉制品指标为例研究构建米粉制品限制约束的原理,该原理可以推广到更高维空间的情形。
建立米粉制品限制约束:
Figure BDA0002391897800000081
其中,x1、x2为两个原料大米预测变量(米粉原料指标),y1、y2为两个米粉响应变量(米粉制品指标)训练得到预测模型为y1=f1(x1,x2),y2=f2(x1,x2),y1 low表示该米粉制品指标标准下界、y1 up表示上界。
如图2中的四条实的斜直线构成米粉制品限制约束的边界,四条斜直线所围成的区域为米粉制品限制约束域,即平行四边形区域,该区域内的坐标点(x1,x2)表示的米粉原料品质指标在不考虑第一种米粉原料约束的情况下,通过关系模型f映射成制品指标,理论上映射后得到的制品指标都是满足制品约束的。
如图2所示的米粉制品限制约束域若再考虑第一类约束就得到符合米粉原料品质标准制定的米粉原料品质,即我们需要的米粉品质范围的目标区域就在这个区域内部选取,所求的目标区域就是在米粉原料的品质范围区域中的一个矩形。该目标区域应该是在符合米粉原料品质标准制定的米粉原料品质区域中包含尽可能多的米粉原料品种的矩形区域。
该矩形区域可以通过两个点来确定:矩形区域距离原点最远的点和最近的点,并依此可以确定矩形区域其他顶点。优化模型的目标是,目标区域的所有顶点在符合米粉原料品质标准制定的区域中的前提下,使得距离原点最远的点达到最远和最近的点达到最近。
例如图2中的A,B两点,此两点的坐标值正是优化建模结果——米粉原料品质指标上下界。由A,B两点绘制出的矩形区域即图3中的虚线区域,且该区域包含的坐标点所表示的米粉原料指标值在理论上都是可取的。优化模型的目标就是要找到A,B两点的坐标,将这两点的坐标设置为优化目标。结合图1中矩形描述优化目标的设置要求:
(1)各边长度表示此边代表的米粉品质指标取值范围,因此各边要尽量长。
(2)矩形边长之和也应在可行域内寻求最大。
(3)故对多目标进行加权求解时,各指标的优化权重要根据品质指标的离散特性来设置,且各权重比例直观表现为虚线矩形的边长之比。
将求解空间维数还原至米粉原料指标集的指标数,米粉原料限制约束和米粉制品限制约束会形成由一个个超平面界定出来的可行域,建模优化求解目标就是在此可行域中搜寻一个超立方体。
步骤S50,根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。
需要说明的是,可对米粉原料品质标准优化模型进行优化,获得调控模型,再根据调控模型确定米粉原料品质指标范围,应当理解的是指标范围即指标标准,在本实施例中代表相同的意思。
需要说明的是,优化的主要手段是对优化函数中权值的调整,使调控后求解结论的样本尽可能多的覆盖,可采用离散性度量指标中的四分位数等方法来调整权重。计算四分位数的长度并经归一化处理得到权重,代入到建模步骤的模型中进行二次建模求解。二次建模求得的矩形各边长比例为各指标离散度之比,再进行灵敏度分析探索各指标范围之和(各边长之和),以观察是否还有提升的可能,从而取得最合适解。
二次建模在一次建模基础上做如下调控:
(1)将一次建模求解结论中的最大边长代入约束,并设置各边长的优化权重为样本数据各指标的离散度。
(2)对(1)中最大边长设置缩减步长,进行多次优化求解。
(1)步是在一次建模结果的基础上进行参数优化,重新定义各边长的比例约束。(2)步是设置对比实验进行灵敏度分析,分析解范围的变化情况并得到最优解。经以上两步调控后的优化解可以满足建模步骤中优化目标的设置要求,得到各指标优化后的最佳范围。
本实施例中通过获取根据米粉原料指标及米粉制品指标构建的样本数据库;对所述样本数据库中的数据进行预处理,获得处理后的目标数据;基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型;根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。从而通过对样本数据库中的数据进行预处理得到目标数据,获取基于目标数据对米粉制品品质指标进行预测过程中的计算数据,进而构建米粉原料品质标准优化模型,根据该模型来确定米粉原料品质指标范围,解决了如何确定米粉原料品质指标的最佳范围,使得在给定的生产工艺条件下米粉原料能够生产出合格的米粉制品的技术问题。
在一实施例中,如图3所示,基于第一实施例提出本发明求解米粉原料指标范围的数据驱动模型分析方法第二实施例,所述步骤S20,包括:
步骤S201,从所述样本数据库中提取米粉原料样本集和米粉制品样本集。
步骤S202,分别对所述米粉原料样本集和所述米粉制品样本集进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集。
需要说明的是,分别对米粉原料样本集DM和米粉制品样本集DN进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集,计算公式为:
Figure BDA0002391897800000111
其中,xi=(x1i;x2i;…;xti)(i=1,2,…,m)是米粉原料样本集;
yj=(y1j;y2j;…;ytj)(j=1,2,…,n)是米粉制品样本集;t种米粉原料;
均值
Figure BDA0002391897800000112
标准差
Figure BDA0002391897800000113
标准化后的样本集仍记为DM、DN
步骤S203,获取所述标准化米粉原料样本集中的标准化米粉原料样本数据。
步骤S204,对所述标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵。
需要说明的是,主成分降维的具体步骤为:
(1)进行Pearson相关性分析。若数据指标之间存在较强相关,可考虑进行主成分降维,和使用多元线性模型预测给定生产场景下的米粉制品品质。
米粉制品的评价指标有(以下为包含但不是全部指标):
淀粉含量 胶稠度 蛋白质含量 氨基酸态氮 脂肪含量 水溶性 糊化温度
米粉原料的评价指标有(以下为包含但不是全部指标):
水分 蛋白质 脂肪 粗淀粉 直链淀粉 支链淀粉 峰值粘度 最低粘度 最终粘度 衰减值 回生值
(2)进行主成分降维。PCA流程中,m为米粉原料样本集维度,d为降维后的数据维度,本文通过观察降维后数据可以解释原始数据的总方差量来指定d,也为第二阶段回归模型投入训练的解释变量数。PCA流程结束后,对应特征值较小的特征向量被舍弃,舍弃规则为前几个特征值的累加方差若超过95%,则后续特征向量皆可抛弃,主成分降维减少的维数为m-d。降维目的是减少训练计算成本消耗的同时使得投入训练数据符合多元线性模型的基本假设之一——解释变量间不存在相关。
最终使得标准化米粉原料样本数据降维为目标米粉原料样本数据Dd
Figure BDA0002391897800000121
以及得到主成分因子载荷矩阵:
Figure BDA0002391897800000122
步骤S205,从所述目标米粉原料样本数据中提取目标米粉原料指标。
步骤S206,根据所述主成分因子载荷矩阵将所述目标米粉原料指标映射为米粉原料品质指标。
需要说明的是,主成分因子载荷矩阵用于计算s各主成分表达式,而主成分表达式用于目标米粉原料指标映射为米粉原料品质指标。主成分表达式为:
Figure BDA0002391897800000123
其中i=1,2,…,m
Figure BDA0002391897800000124
表示第i个原料品质指标,j=1,2,…,d,主成分关于各原料品质指标的系数
Figure BDA0002391897800000125
λ=(λ1,λ2,…,λj)为选取的d个特征值。
步骤S207,将所述目标米粉原料样本数据、所述标准化米粉制品样本集、所述米粉原料品质指标作为目标数据。
进一步地,所述步骤S30,包括:
步骤S301,根据所述目标米粉原料样本数据和所述标准化米粉制品样本集生成多元线性回归模型的训练集。
应当理解的是,以降维后的目标米粉原料样本数据Dd为基础,用米粉原料品质指标预测米粉制品品质指标。
需要说明的是,训练米粉制品各品质指标的多元线性回归模型时,将Dd与标准化米粉制品样本集DN构成多元线性回归模型的训练集(Dd|DN)。
步骤S302,根据所述训练集对所述多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型。
步骤S303,从所述标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定所述目标米粉制品指标对应的回归函数。
步骤S304,根据所述回归函数确定拟合优度。
需要说明的是,因每个多元线性回归模型用来预测单变量,故每次运用最小二乘法求解时投入的样本集为:
Figure BDA0002391897800000131
其中,Dd是降维后的目标米粉原料样本数据,yj=(y1j;y2j;…;ytj)(j=1,2,…,n)是米粉制品指标集。
算法流程结束,可以得到各米粉制品品质指标的预测模型。依据系数矩阵(θ|ω*)n*(m+1)给出第i个米粉制品指标的回归函数:
Figure BDA0002391897800000132
其中i=1,2,…,n,j=1,2,…,m。θ是主成分因子载荷矩阵,多元线性回归函数fi(x)的拟合优度Ri 2,取值为[0,1]。
步骤S305,将所述预测模型和所述拟合优度作为计算数据。
本实施例中通过对数据进行数据处理以保证预测模型的精度,然后通过米粉原料的品质指标对米粉制品的品质指标的预测,完成米粉制品的品质指标向原料的品质指标的转移,保证模型建立的直接有效合理。
在一实施例中,如图4所示,基于第一实施例或第二实施例提出本发明求解米粉原料指标范围的数据驱动模型分析方法第三实施例,在本实施例中,基于第二实施例进行说明,所述步骤S40,包括:
步骤S401,查找所述米粉原料品质指标对应的米粉原料品质的理化性质数据,并基于所述理化性质数据确定米粉原料限制约束。
应当理解的是,确定米粉原料的各项品质指标的标准的下界值和上界值xlow、xup为决策变量组成的向量。
其中,
Figure BDA0002391897800000141
需要说明的是,基于米粉原料品质的理化性质,确定第一类约束:米粉原料限制约束。
米粉原料限制约束是实际生产中投入的符合要求的米粉原料指标范围,表示的向量空间为:
Xlimit={x|lα≤xα≤uα,α=1,2,…,m}
其中,lα和uα分别是米粉原料指标xα的下界与上界,有m个这样的指标。
步骤S402,基于所述预测模型和预设目标食品品质要求,确定米粉制品限制约束。
步骤S403,根据所述拟合优度对所述米粉制品限制约束进行修正,获得目标米粉制品限制约束。
需要说明的是,基于所述预测模型和预设目标食品品质要求,确定米粉制品限制约束,根据所述拟合优度对所述米粉制品限制约束进行修正,获得目标米粉制品限制约束的步骤具体为:
(1)米粉制品品质标准的确定
假设米粉制品品质指标中的理化性质、感官评分或TPA指标的可行范围为L=(L1,L2,…,Ln),U=(U1,U2,…,Un),分别代表目标米粉制品品质指标的下界和上界。
(2)修正因子的确定
为提高米粉制品限制约束的准确度,要根据拟合度修正米粉制品品质标准的约束。对预测阶段获得的拟合优度
Figure BDA0002391897800000142
具体修正方法为:
a计算Δk=Lk-Uk,Δk为范围初始值。
b计算各回归函数的拟合优度Ri 2的“修正因子”:
Figure BDA0002391897800000143
c计算米粉制品品质指标上下界根据上下界修正量进行同等大小的减小和增大:
[L′j,U′j]=[Lj+0.5*Δj*∈j,Uj-0.5*Δj*∈j]
其中j=1,2,…,n,表示在制定第k个制品指标的品质标准,0.5表示上下界修正量在上下界的均摊。
(3)米粉制品限制约束
由(1)、(2)两步设置“米粉制品限制约束”:
Figure BDA0002391897800000151
其中,k=1,2,…,n,Xprocess为“米粉制品限制约束”所限制的可行域,
Figure BDA0002391897800000152
是第k个米粉制品指标的回归函数,L=(L1,L2,…,Ln),U=(U1,U2,…,Un),分别代表目标米粉制品品质指标的下界和上界。
步骤S404,根据多个目标米粉原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子。
步骤S405,根据所述扩散因子和预设目标区域要求确定扩散因子约束。
需要说明的是,所述预设目标区域要求为以目标区域最大化为目标的要求。
需要说明的是,基于目标区域最大化为目标的要求,确定第三类约束:扩散因子约束,在多个目标米粉原料指标组成的高维目标空间中设置扩散因子”,并代入线性加权法目标中满足以下要求:
(1)范围合理,以确保求得米粉原料范围是在综合考虑各项制品预测误差的情况下给出的高可信度范围解。
(2)范围最广泛,追求最终解在米粉原料限制约束与米粉制品限制约束中尽可能大的覆盖度。
设xlow、xup为各原料最终求解的下界和上界,δ为扩散因子,有m个这样的指标,则有
Figure BDA0002391897800000153
步骤S406,将所述米粉原料限制约束、所述目标米粉制品限制约束和所述扩散因子约束作为约束条件。
步骤S407,根据所述约束条件和预设优化目标构建米粉原料品质标准优化模型。
通过多目标优化模型求解的米粉原料品质指标范围在满足约束条件的前提下要覆盖较广的范围,首先要满足δ的最大化,此为首要目标:
max f1=δ
且最终解上下界分别要满足最大和最小,有以下次要目标:
Figure BDA0002391897800000161
Figure BDA0002391897800000162
综上所述,米粉原料品质标准优化模型是一个多目标优化的数学模型,具体表达为:
Figure BDA0002391897800000163
Figure BDA0002391897800000164
其中,xlow、xup为米粉原料的各项品质指标的标准的下界值和上界值,δ为扩散因子,f为目标函数,L=(L1,L2,…,Ln),U(U1,U2,…,Un),分别代表目标米粉制品品质指标的下界和上界,Xlimit为符合要求的米粉原料指标范围表示的向量空间,yk是米粉制品指标集。
进一步地,所述步骤S50,包括:
步骤S501,采用线性加权法将所述米粉原料品质标准化模型转化为单目标品质标准优化模型。
需要说明的是,运用线性加权法,依据目标的优先级和同级目标的重要性设置具有量级差别的权重值,将原料品质标准优化模型转化为单目标原料品质标准优化模型:
Figure BDA0002391897800000165
其中,βα为各指标的权重,各权重相等且
Figure BDA0002391897800000166
β'为扩散因子权重,求得合适解时一般比βα大一两个数量级。
在由全体原料指标变量构造的高维空间中,Xlimit限制了空间各维度的变量基本取值范围,形成了一个超立方体空间,而Xprocess通过各维度变量与L、U的线性函数构造出了一个具有不规则形状的超维空间。这两个空间在高维空间中有包含或部分重叠两种情况。设置目标函数的目的是在这两个高维空间的重叠区域中找到一个超立方体,超立方体具有2m个顶点,其中有两个点的坐标分别为
Figure BDA0002391897800000167
Figure BDA0002391897800000168
此两个坐标已经包含了超立方体所有的顶点坐标信息,故只需确定这两个坐标,即可确定所有米粉原料品质标准范围。
步骤S502,根据所述单目标品质标准优化模型对所述标准化米粉原料样本数据进行四分位数计算,获得计算结果数据。
应当理解是,利用单目标品质标准化模型计算的最优解,对第三类约束进行优化,先计算原料标准化数据的四分位数,即四分位数把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。
步骤S503,根据所述计算结果数据和所述米粉原料品质标准化模型确定调控模型。
进一步地,所述步骤S503,包括:
从所述计算结果数据中选取下四分位数据和上四分位数据;根据所述下四分位数据和所述上四分位数据计算差值;根据所述差值和预设标准化方法确定约束权重;根据所述约束权重和所述扩散因子对所述扩散因子约束进行优化,获得目标扩散因子约束;根据所述目标扩散因子约束对所述米粉原料品质标准优化模型进行调控,获得调控模型。
需要说明的是,从所述计算结果数据中选取在25%位置上的数值(下分位数据)和处在75%位置上的数值(下分为数据),根据所述下四分位数据和所述上四分位数据计算差值R=(r1,r2,…,rα)。
用min-max标准化方法计算新的各决策变量求解权重和约束权重:
βα=rα/∑αrα
此时各权重仍满足
Figure BDA0002391897800000171
但不满足相等。
根据扩散因子δ0调整第三类约束
Figure BDA0002391897800000172
将其修改为
Figure BDA0002391897800000173
其中ρ为松弛因子,用来将扩散因子缩小,使得最终解空间(超立方体)的坐标有δ0*ρ的松弛空间,各顶点可以在该空间中调整变动。γ为浮动变量,用来控制各指标最终解根据实际米粉原料各品质指标的离散特性进行浮动,以获得不同解范围。
调控后的具有优先级的多目标优化模型为:
Figure BDA0002391897800000174
Figure BDA0002391897800000175
其中,xlow、xup为米粉原料的各项品质指标的标准的下界值和上界值,δ为扩散因子,f为目标函数,L=(L1,L2,…,Ln),U=(U1,U2,…,Un),分别代表目标米粉制品品质指标的下界和上界,Xlimit为符合要求的米粉原料指标范围表示的向量空间,yk是米粉制品指标集,γ为浮动变量。
其中P1远远大于P2,松弛因子ρ的取值范围为[0,0.05],即最多让最大扩散因子一半的值作为超立方体坐标的浮动范围,设置0.05为ρ的步长,进行10次求解并对比结果得到最合理的解范围。
步骤S504,根据所述调控模型确定米粉原料品质指标范围。
进一步地,所述步骤S504,包括:
根据所述调控模型计算米粉原料品质指标下界值和米粉原料品质指标上界值;对所述米粉原料品质指标下界值和所述米粉原料品质指标上界值进行反标准化处理;根据处理结果确定米粉原料品质指标范围。
需要说明的是,运用线性加权法求解时,将新的各决策变量求解权重代入,多目标化为单目标:
Figure BDA0002391897800000181
其中,γ为“浮动变量”,xlow、xup为米粉原料的各项品质指标的标准的下界值(米粉原料品质指标下界值)和上界值(米粉原料品质指标上界值),m个指标,βα为更新后的优化权重,β'的数量级比βα要高。
应当理解的是,依据数据标准化过程标准差σi及均值
Figure BDA0002391897800000182
i表示第几个原料品质指标,对求解结果xlow、xup进行反标准化处理,得到各原料指标的优化范围
Figure BDA0002391897800000183
反标准化公式为:
Figure BDA0002391897800000184
Figure BDA0002391897800000185
本实施例中通过构建米粉原料品质标准化优化模型来确定米粉原料品质指标标准,并且为了在制定的米粉原料品质指标的变化范围内包含尽可能多的原料品种,优化调整原料品质指标模型结构和参数,对米粉原料品质标准化优化模型进行改进得到调控模型,优化超立方体的形状,从而获得目标制品最合适的米粉原料品质指标范围。
此外,参照图5,本发明实施例还提出一种求解米粉原料指标范围的数据驱动模型分析装置,所述求解米粉原料指标范围的数据驱动模型分析装置包括:
数据获取模块10,用于获取根据米粉原料指标及米粉制品指标构建的样本数据库。
需要说明的是,已知根据米粉原料指标和米粉制品指标构建的样本数据库,该样本数据库为高质量数据库,包括{x1,x2,…xm,y1,y2,…yn},其中{x1,x2,…xm}是可以评价米粉原料的米粉原料指标,{y1,y2,…yn}是可以评价米粉制品的米粉制品指标。
样本数据库D为:
Figure BDA0002391897800000191
DA为米粉原料的基础信息数据,DM为米粉原料的指标数据集,即米粉原料样本集,DN为米粉制品的指标数据集,即米粉制品样本集,其中,t为t种米粉原料,k为第k个米粉原料的基础信息数据,m为第m个米粉原料的指标数据,n为第n个米粉制品的指标数据。
应当理解的是,获取样本数据库的方式可为从本地存储器获取,也可为从网络端获取,还可为其他方式获取,本实施例对此不作限制。
数据处理模块20,用于对所述样本数据库中的数据进行预处理,获得处理后的目标数据。
需要说明的是,获取所述样本数据库中的米粉原料样本集和米粉制品样本集,将米粉制品样本集中的指标设置为响应变量,将米粉原料样本集中的指标设置为预测变量,就可以将对米粉制品标准的约束转化为对米粉原料标准的约束。
应当理解的是,对样本数据库中的数据进行预处理的步骤具体为:
首先,从样本数据库中提取米粉原料样本集和米粉制品样本集,再分别对米粉原料样本集和米粉制品样本集进行标准化处理,可获得标准化米粉原料样本集和标准化米粉制品样本集,而之所以要先对样本集进行标准化处理,是因为进行标准化处理之后的样本集中的数据更方便于后续的使用。
然后,获取标准化米粉原料样本集中的标准化米粉原料样本数据,对标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵,进行主成分降维的目的是为了排除不合适的数据,从而降低数据的维度,使降维后的数据满足后续关系模型的训练要求和降低训练难度。
最后,从目标米粉原料样本数据中提取目标米粉原料指标,根据主成分因子载荷矩阵将目标米粉原料指标映射为米粉原料品质指标,将目标米粉原料样本数据、标准化米粉制品样本集、米粉原料品质指标作为目标数据,用于后续的计算和使用,即所述目标数据包括目标米粉原料样本数据、标准化米粉制品样本集、米粉原料品质指标。
指标预测模块30,用于基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据。
需要说明的是,基于目标数据对米粉制品品质指标进行预测的步骤具体为:
首先,根据目标米粉原料样本数据和标准化米粉制品样本集生成多元线性回归模型的训练集,再根据训练集对多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型,预测模型用于根据米粉原料品质指标预测米粉制品品质指标,在后续步骤中,通过预测模型来确定米粉制品限制约束。
然后,从标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定目标米粉制品指标对应的回归函数,并根据回归函数确定拟合优度。
最后,将预测步骤过程中得到的预测模型和拟合优度作为计算数据,用于后续的计算和使用,即所述计算数据包括预测模型和拟合优度。
应当理解的是,为了解决精度问题,为米粉原料标准的约束引入基于回归预测精度的修正因子来改造约束条件,使得优化后的米粉原料最大限度地保证获得符合米粉品质标准的制品,提高了优化决策的可信度。
模型构建模块40,用于根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型。
需要说明的是,所述预设优化目标为以原料品质指标标准的最优化制定为目标。
需要说明的是,米粉原料品质标准优化模型的约束条件主要分为两类:
第一类约束:米粉原料限制约束。此约束按照米粉原料的指标数值的合理范围限制求解范围。
第二类约束:米粉制品限制约束。此约束是通过米粉原料和米粉制品的关系模型的传递,将对米粉制品的限制转移到对米粉原料的限制上来,其中还需考虑关系模型的精度矫正问题。以两项米粉原料指标和两项米粉制品指标为例研究构建米粉制品限制约束的原理,该原理可以推广到更高维空间的情形。
建立米粉制品限制约束:
Figure BDA0002391897800000211
其中,x1、x2为两个原料大米预测变量(米粉原料指标),y1、y2为两个米粉响应变量(米粉制品指标)训练得到预测模型为y1=f1(x1,x2),y2=f2(x1,x2),y1 low表示该米粉制品指标标准下界、y1 up表示上界。
如图2中的四条实的斜直线构成米粉制品限制约束的边界,四条斜直线所围成的区域为米粉制品限制约束域,即平行四边形区域,该区域内的坐标点(x1,x2)表示的米粉原料品质指标在不考虑第一种米粉原料约束的情况下,通过关系模型f映射成制品指标,理论上映射后得到的制品指标都是满足制品约束的。
如图2所示的米粉制品限制约束域若再考虑第一类约束就得到符合米粉原料品质标准制定的米粉原料品质,即我们需要的米粉品质范围的目标区域就在这个区域内部选取,所求的目标区域就是在米粉原料的品质范围区域中的一个矩形。该目标区域应该是在符合米粉原料品质标准制定的米粉原料品质区域中包含尽可能多的米粉原料品种的矩形区域。
该矩形区域可以通过两个点来确定:矩形区域距离原点最远的点和最近的点,并依此可以确定矩形区域其他顶点。优化模型的目标是,目标区域的所有顶点在符合米粉原料品质标准制定的区域中的前提下,使得距离原点最远的点达到最远和最近的点达到最近。
例如图2中的A,B两点,此两点的坐标值正是优化建模结果——米粉原料品质指标上下界。由A,B两点绘制出的矩形区域即图3中的虚线区域,且该区域包含的坐标点所表示的米粉原料指标值在理论上都是可取的。优化模型的目标就是要找到A,B两点的坐标,将这两点的坐标设置为优化目标。结合图1中矩形描述优化目标的设置要求:
(1)各边长度表示此边代表的米粉品质指标取值范围,因此各边要尽量长。
(2)矩形边长之和也应在可行域内寻求最大。
(3)故对多目标进行加权求解时,各指标的优化权重要根据品质指标的离散特性来设置,且各权重比例直观表现为虚线矩形的边长之比。
将求解空间维数还原至米粉原料指标集的指标数,米粉原料限制约束和米粉制品限制约束会形成由一个个超平面界定出来的可行域,建模优化求解目标就是在此可行域中搜寻一个超立方体。
范围确定模块50,用于根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。
需要说明的是,可对米粉原料品质标准优化模型进行优化,获得调控模型,再根据调控模型确定米粉原料品质指标范围,应当理解的是指标范围即指标标准,在本实施例中代表相同的意思。
需要说明的是,优化的主要手段是对优化函数中权值的调整,使调控后求解结论的样本尽可能多的覆盖,可采用离散性度量指标中的四分位数等方法来调整权重。计算四分位数的长度并经归一化处理得到权重,代入到建模步骤的模型中进行二次建模求解。二次建模求得的矩形各边长比例为各指标离散度之比,再进行灵敏度分析探索各指标范围之和(各边长之和),以观察是否还有提升的可能,从而取得最合适解。
二次建模在一次建模基础上做如下调控:
(1)将一次建模求解结论中的最大边长代入约束,并设置各边长的优化权重为样本数据各指标的离散度。
(2)对(1)中最大边长设置缩减步长,进行多次优化求解。
(1)步是在一次建模结果的基础上进行参数优化,重新定义各边长的比例约束。(2)步是设置对比实验进行灵敏度分析,分析解范围的变化情况并得到最优解。经以上两步调控后的优化解可以满足建模步骤中优化目标的设置要求,得到各指标优化后的最佳范围。
本实施例中通过获取根据米粉原料指标及米粉制品指标构建的样本数据库;对所述样本数据库中的数据进行预处理,获得处理后的目标数据;基于所述目标数据对米粉制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建米粉原料品质标准优化模型;根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。从而通过对样本数据库中的数据进行预处理得到目标数据,获取基于目标数据对米粉制品品质指标进行预测过程中的计算数据,进而构建米粉原料品质标准优化模型,根据该模型来确定米粉原料品质指标范围,解决了如何确定米粉原料品质指标的最佳范围,使得在给定的生产工艺条件下米粉原料能够生产出合格的米粉制品的技术问题。
在一实施例中,所述数据处理模块20,还用于从所述样本数据库中提取米粉原料样本集和米粉制品样本集;分别对所述米粉原料样本集和所述米粉制品样本集进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集;获取所述标准化米粉原料样本集中的标准化米粉原料样本数据;对所述标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵;从所述目标米粉原料样本数据中提取目标米粉原料指标;根据所述主成分因子载荷矩阵将所述目标米粉原料指标映射为米粉原料品质指标;将所述目标米粉原料样本数据、所述标准化米粉制品样本集、所述米粉原料品质指标作为目标数据。
在一实施例中,所述指标预测模块30,还用于根据所述目标米粉原料样本数据和所述标准化米粉制品样本集生成多元线性回归模型的训练集;根据所述训练集对所述多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型;从所述标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定所述目标米粉制品指标对应的回归函数;根据所述回归函数确定拟合优度;将所述预测模型和所述拟合优度作为计算数据。
在一实施例中,所述模型构建模块40,还用于查找所述米粉原料品质指标对应的米粉原料品质的理化性质数据,并基于所述理化性质数据确定米粉原料限制约束;基于所述预测模型和预设目标食品品质要求,确定米粉制品限制约束;根据所述拟合优度对所述米粉制品限制约束进行修正,获得目标米粉制品限制约束;根据多个目标米粉原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;根据所述扩散因子和预设目标区域要求确定扩散因子约束;将所述米粉原料限制约束、所述目标米粉制品限制约束和所述扩散因子约束作为约束条件;根据所述约束条件和预设优化目标构建米粉原料品质标准优化模型。
在一实施例中,所述范围确定模块50,还用于采用线性加权法将所述米粉原料品质标准化模型转化为单目标品质标准优化模型;根据所述单目标品质标准优化模型对所述标准化米粉原料样本数据进行四分位数计算,获得计算结果数据;根据所述计算结果数据和所述米粉原料品质标准化模型确定调控模型;根据所述调控模型确定米粉原料品质指标范围。
在一实施例中,所述范围确定模块50,还用于从所述计算结果数据中选取下四分位数据和上四分位数据;根据所述下四分位数据和所述上四分位数据计算差值;根据所述差值和预设标准化方法确定约束权重;根据所述约束权重和所述扩散因子对所述扩散因子约束进行优化,获得目标扩散因子约束;根据所述目标扩散因子约束对所述米粉原料品质标准优化模型进行调控,获得调控模型。
在一实施例中,所述范围确定模块50,还用于根据所述调控模型计算米粉原料品质指标下界值和米粉原料品质指标上界值;对所述米粉原料品质指标下界值和所述米粉原料品质指标上界值进行反标准化处理;根据处理结果确定米粉原料品质指标范围。
在本发明所述求解米粉原料指标范围的数据驱动模型分析装置的其他实施例或具体实现方法可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该估算机软件产品存储在如上所述的一个估算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能设备(可以是手机,估算机,求解米粉原料指标范围的数据驱动模型分析设备,空调器,或者网络求解米粉原料指标范围的数据驱动模型分析设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (5)

1.一种求解米粉原料指标范围的数据驱动模型分析方法,其特征在于,所述求解米粉原料指标范围的数据驱动模型分析方法包括以下步骤:
获取根据米粉原料指标及米粉制品指标构建的样本数据库;
从所述样本数据库中提取米粉原料样本集和米粉制品样本集;
分别对所述米粉原料样本集和所述米粉制品样本集进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集;
获取所述标准化米粉原料样本集中的标准化米粉原料样本数据;
对所述标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵;
从所述目标米粉原料样本数据中提取目标米粉原料指标;
根据所述主成分因子载荷矩阵将所述目标米粉原料指标映射为米粉原料品质指标;
将所述目标米粉原料样本数据、所述标准化米粉制品样本集、所述米粉原料品质指标作为目标数据;
根据所述目标米粉原料样本数据和所述标准化米粉制品样本集生成多元线性回归模型的训练集;
根据所述训练集对所述多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型;
从所述标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定所述目标米粉制品指标对应的回归函数;
根据所述回归函数确定拟合优度;
将所述预测模型和所述拟合优度作为计算数据;
查找所述米粉原料品质指标对应的米粉原料品质的理化性质数据,并基于所述理化性质数据确定米粉原料限制约束;
基于所述预测模型和预设目标食品品质要求,确定米粉制品限制约束;
根据所述拟合优度对所述米粉制品限制约束进行修正,获得目标米粉制品限制约束;
根据多个目标米粉原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;
根据所述扩散因子和预设目标区域要求确定扩散因子约束;
将所述米粉原料限制约束、所述目标米粉制品限制约束和所述扩散因子约束作为约束条件;
根据所述约束条件和预设优化目标构建米粉原料品质标准优化模型;
根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。
2.如权利要求1所述的求解米粉原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围,具体包括:
采用线性加权法将所述米粉原料品质标准优化模型转化为单目标品质标准优化模型;
根据所述单目标品质标准优化模型对所述标准化米粉原料样本数据进行四分位数计算,获得计算结果数据;
根据所述计算结果数据和所述米粉原料品质标准优化模型确定调控模型;
根据所述调控模型确定米粉原料品质指标范围。
3.如权利要求2所述的求解米粉原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述计算结果数据和所述米粉原料品质标准优化模型确定调控模型,具体包括:
从所述计算结果数据中选取下四分位数据和上四分位数据;
根据所述下四分位数据和所述上四分位数据计算差值;
根据所述差值和预设标准化方法确定约束权重;
根据所述约束权重和所述扩散因子对所述扩散因子约束进行优化,获得目标扩散因子约束;
根据所述目标扩散因子约束对所述米粉原料品质标准优化模型进行调控,获得调控模型。
4.如权利要求2所述的求解米粉原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述调控模型确定米粉原料品质指标范围,具体包括:
根据所述调控模型计算米粉原料品质指标下界值和米粉原料品质指标上界值;
对所述米粉原料品质指标下界值和所述米粉原料品质指标上界值进行反标准化处理;
根据处理结果确定米粉原料品质指标范围。
5.一种求解米粉原料指标范围的数据驱动模型分析装置,其特征在于,所述求解米粉原料指标范围的数据驱动模型分析装置包括:
数据获取模块,用于获取根据米粉原料指标及米粉制品指标构建的样本数据库;
数据处理模块,用于从所述样本数据库中提取米粉原料样本集和米粉制品样本集;分别对所述米粉原料样本集和所述米粉制品样本集进行标准化处理,获得标准化米粉原料样本集和标准化米粉制品样本集;获取所述标准化米粉原料样本集中的标准化米粉原料样本数据;对所述标准化米粉原料样本数据进行主成分降维,获得目标米粉原料样本数据和主成分因子载荷矩阵;从所述目标米粉原料样本数据中提取目标米粉原料指标;根据所述主成分因子载荷矩阵将所述目标米粉原料指标映射为米粉原料品质指标;将所述目标米粉原料样本数据、所述标准化米粉制品样本集、所述米粉原料品质指标作为目标数据;
指标预测模块,用于根据所述目标米粉原料样本数据和所述标准化米粉制品样本集生成多元线性回归模型的训练集;根据所述训练集对所述多元线性回归模型进行训练,获得米粉制品品质指标对应的预测模型;从所述标准化米粉制品样本集中提取目标米粉制品指标,并基于预设系数矩阵确定所述目标米粉制品指标对应的回归函数;根据所述回归函数确定拟合优度;将所述预测模型和所述拟合优度作为计算数据;
模型构建模块,用于查找所述米粉原料品质指标对应的米粉原料品质的理化性质数据,并基于所述理化性质数据确定米粉原料限制约束;基于所述预测模型和预设目标食品品质要求,确定米粉制品限制约束;根据所述拟合优度对所述米粉制品限制约束进行修正,获得目标米粉制品限制约束;根据多个目标米粉原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;根据所述扩散因子和预设目标区域要求确定扩散因子约束;将所述米粉原料限制约束、所述目标米粉制品限制约束和所述扩散因子约束作为约束条件;根据所述约束条件和预设优化目标构建米粉原料品质标准优化模型;
范围确定模块,用于根据所述米粉原料品质标准优化模型确定米粉原料品质指标范围。
CN202010122027.3A 2020-02-25 2020-02-25 求解米粉原料指标范围的数据驱动模型分析方法及装置 Active CN111325404B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010122027.3A CN111325404B (zh) 2020-02-25 2020-02-25 求解米粉原料指标范围的数据驱动模型分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010122027.3A CN111325404B (zh) 2020-02-25 2020-02-25 求解米粉原料指标范围的数据驱动模型分析方法及装置

Publications (2)

Publication Number Publication Date
CN111325404A CN111325404A (zh) 2020-06-23
CN111325404B true CN111325404B (zh) 2022-04-22

Family

ID=71173123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010122027.3A Active CN111325404B (zh) 2020-02-25 2020-02-25 求解米粉原料指标范围的数据驱动模型分析方法及装置

Country Status (1)

Country Link
CN (1) CN111325404B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112666998B (zh) * 2020-12-28 2022-02-11 柳州市汇方科技有限公司 一种调控米粉含水率的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003010624A2 (en) * 2001-07-23 2003-02-06 Cognis Corporation On-site analysis system with central processor and method of analysing
CN107228924A (zh) * 2017-06-20 2017-10-03 中国农业科学院农产品加工研究所 一种适宜蛋白加工用花生原料品质测定及其评价方法
CN107464020A (zh) * 2017-08-03 2017-12-12 中南林业科技大学 一种米制品加工原料快速筛选方法
CN109409579A (zh) * 2018-09-29 2019-03-01 中国农业科学院农产品加工研究所 Bp人工神经网络预测原料加工适宜性的方法
CN110132938A (zh) * 2019-05-29 2019-08-16 南京财经大学 一种拉曼光谱法鉴别大米种类的特征数据提取方法
CN110458362A (zh) * 2019-08-15 2019-11-15 中储粮成都储藏研究院有限公司 基于svm支持向量机模型的粮食品质指标预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003010624A2 (en) * 2001-07-23 2003-02-06 Cognis Corporation On-site analysis system with central processor and method of analysing
CN107228924A (zh) * 2017-06-20 2017-10-03 中国农业科学院农产品加工研究所 一种适宜蛋白加工用花生原料品质测定及其评价方法
CN107464020A (zh) * 2017-08-03 2017-12-12 中南林业科技大学 一种米制品加工原料快速筛选方法
CN109409579A (zh) * 2018-09-29 2019-03-01 中国农业科学院农产品加工研究所 Bp人工神经网络预测原料加工适宜性的方法
CN110132938A (zh) * 2019-05-29 2019-08-16 南京财经大学 一种拉曼光谱法鉴别大米种类的特征数据提取方法
CN110458362A (zh) * 2019-08-15 2019-11-15 中储粮成都储藏研究院有限公司 基于svm支持向量机模型的粮食品质指标预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
板栗粉面皮工艺及品质研究;彭毅秦 等;《食品与发酵科技》;20190131;第55卷(第一期);53-58 *

Also Published As

Publication number Publication date
CN111325404A (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN110334875B (zh) 计及评估指标冲突的风电功率组合概率预测方法
CN113393028B (zh) 一种基于数据挖掘技术的负荷预测方法
CN111325404B (zh) 求解米粉原料指标范围的数据驱动模型分析方法及装置
CN115983622B (zh) 一种内控协同管理系统的风险预警方法
Li et al. Spectrally-corrected estimation for high-dimensional Markowitz mean-variance optimization
He et al. Weighted incremental minimax probability machine-based method for quality prediction in gasoline blending process
CN111310127B (zh) 基于食品制品品质范围获取原料品质范围的方法及装置
CN114581141A (zh) 基于特征选择与lssvr的短期负荷预测方法
CN111291496B (zh) 求解汤圆原料指标范围的数据驱动模型分析方法及装置
CN111340369B (zh) 求解食品原料指标范围的数据驱动模型分析方法及装置
CN111353643B (zh) 基于米粉制品品质范围获取原料品质范围的方法及装置
CN111429979A (zh) 一种基于支持向量机分位数回归的钢材力学性能预测方法
CN111383722A (zh) 求解葡萄酒原料指标范围的数据驱动模型分析方法及装置
Lv et al. Integrated parameter and tolerance design for multiple response optimization
CN111353638B (zh) 基于汤圆制品品质范围获取原料品质范围的方法及装置
CN111340361B (zh) 求解黄酒原料指标范围的数据驱动模型分析方法及装置
CN110796006A (zh) 一种股票k线图像识别方法、装置、智能终端及存储介质
Kon et al. Empirical normalization for quadratic discriminant analysis and classifying cancer subtypes
CN114398493B (zh) 一种基于模糊聚类与费效价值的无人机型谱构建方法
CN117670381A (zh) 数据资产的价值评估方法、装置、设备及存储介质
Zeybek Process capability: A new criterion for loss function–based quality improvement
CN118153815A (zh) 矿石的质量评价方法、系统、设备、介质及计算机程序
CN118228019A (zh) 一种卷烟叶组配方的相似度度量方法
CN111311191A (zh) 基于葡萄酒制品品质范围获取原料品质范围的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant