CN111340361B - 求解黄酒原料指标范围的数据驱动模型分析方法及装置 - Google Patents
求解黄酒原料指标范围的数据驱动模型分析方法及装置 Download PDFInfo
- Publication number
- CN111340361B CN111340361B CN202010118189.XA CN202010118189A CN111340361B CN 111340361 B CN111340361 B CN 111340361B CN 202010118189 A CN202010118189 A CN 202010118189A CN 111340361 B CN111340361 B CN 111340361B
- Authority
- CN
- China
- Prior art keywords
- yellow wine
- raw material
- wine raw
- index
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000014101 wine Nutrition 0.000 title claims abstract description 672
- 239000002994 raw material Substances 0.000 title claims abstract description 424
- 238000004458 analytical method Methods 0.000 title claims abstract description 43
- 238000005457 optimization Methods 0.000 claims abstract description 102
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000004364 calculation method Methods 0.000 claims abstract description 31
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000009792 diffusion process Methods 0.000 claims description 41
- 230000006870 function Effects 0.000 claims description 27
- 238000012417 linear regression Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 15
- 238000012790 confirmation Methods 0.000 claims description 10
- 230000001105 regulatory effect Effects 0.000 claims description 10
- 230000001276 controlling effect Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 235000019991 rice wine Nutrition 0.000 claims 4
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract description 12
- 238000012937 correction Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000000452 restraining effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000010206 sensitivity analysis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229920000856 Amylose Polymers 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012803 optimization experiment Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Mathematical Analysis (AREA)
- General Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Biology (AREA)
- Computational Mathematics (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及黄酒加工技术领域,公开了一种求解黄酒原料指标范围的数据驱动模型分析方法及装置,所述方法包括:获取根据黄酒原料指标及黄酒制品指标构建的样本数据库,提取黄酒原料样本集和黄酒制品样本集并进行标准化处理,对黄酒原料品质指标进行逐步回归处理,根据获得的回归方程对黄酒制品品质指标进行预测,并根据预测过程中的计算数据构建黄酒原料品质标准优化模型;根据黄酒原料品质标准优化模型确定黄酒原料品质指标范围。从而通过构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
Description
技术领域
本发明涉及黄酒加工技术领域,尤其涉及一种求解黄酒原料指标范围的数据驱动模型分析方法及装置。
背景技术
在黄酒加工领域,多样化的黄酒制品对黄酒原料品质的需求也不尽相同,需要制作出符合国标、省标、行标、企标的黄酒制品,就要根据黄酒制品品质预测黄酒原料的最佳品质范围,这样可为企业采办原料提供依据,采办合适的原料,在给定的生产工艺条件下生产出合格的目标制品,提高合格率,减少浪费,为企业减少损失,提高企业利润。
目前企业在确定黄酒制品的生产原料时有很多方法,如根据生产经验或进行简单的对比试验就可以大致判断出何种黄酒原料投入制作将会得到怎样的黄酒制品,但是这种根据生产经验对黄酒制品生产流程做决策的方法在效率上存在着一定的提升空间。对于企业的生产规划来说,如何科学地找到生产目标黄酒制品最合适的黄酒原料品质范围是一个比较大的难题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提出一种求解黄酒原料指标范围的数据驱动模型分析方法及装置,旨在解决如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
为实现上述目的,本发明提供一种求解黄酒原料指标范围的数据驱动模型分析方法,所述求解黄酒原料指标范围的数据驱动模型分析方法包括以下步骤:
获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;
根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;
根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
优选地,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程之前,还包括:
从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
将所述方差膨胀系数与预设系数阈值进行比较;
若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
优选地,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程,具体包括:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;
从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;
根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
优选地,所述根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据,具体包括:
生成黄酒制品品质指标对应的多元线性回归模型;
根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;
从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
根据所述回归函数确定拟合优度;
将所述预测模型和所述拟合优度作为计算数据。
优选地,所述根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型,具体包括:
查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒原料限制约束;
基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约束;
根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制品限制约束;
根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;
根据所述扩散因子和预设目标区域要求确定扩散因子约束;
将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件;
根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
优选地,所述根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围,具体包括:
将所述黄酒原料品质标准化模型转化为单目标品质标准优化模型;
获取所述单目标品质标准优化模型的结果数据;
根据所述结果数据对所述扩散因子约束进行优化,获得目标扩散因子约束;
根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型进行调控,获得调控模型;
根据所述调控模型确定黄酒原料品质指标范围。
优选地,所述根据所述调控模型确定黄酒原料品质指标范围,具体包括:
根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上界值;
对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行反标准化处理;
根据处理结果确定黄酒原料品质指标范围。
此外,为实现上述目的,本发明还提出一种求解黄酒原料指标范围的数据驱动模型分析装置,所述求解黄酒原料指标范围的数据驱动模型分析装置包括:
数据获取模块,用于获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
样本提取模块,用于从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
数据处理模块,用于分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
逐步回归模块,用于基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;
指标预测模块,用于根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;
模型构建模块,用于根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
范围确定模块,用于根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
优选地,所述求解黄酒原料指标范围的数据驱动模型分析装置还包括回归确认模块;
所述回归确认模块,用于从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
所述回归确认模块,还用于对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
所述回归确认模块,还用于将所述方差膨胀系数与预设系数阈值进行比较;
所述回归确认模块,还用于若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
优选地,所述指标预测模块,还用于生成黄酒制品品质指标对应的多元线性回归模型;
所述指标预测模块,还用于根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;
所述指标预测模块,还用于从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
所述指标预测模块,还用于根据所述回归函数确定拟合优度;
所述指标预测模块,还用于将所述预测模型和所述拟合优度作为计算数据。
本发明提出的求解黄酒原料指标范围的数据驱动模型分析方法,通过获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。从而通过对样本数据库中的样本集进行处理,构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
附图说明
图1为本发明求解黄酒原料指标范围的数据驱动模型分析方法第一实施例的流程示意图;
图2为本发明求解黄酒原料指标范围的数据驱动模型分析方法第一实施例中的黄酒制品限制约束在二维空间的表示图;
图3为本发明求解黄酒原料指标范围的数据驱动模型分析方法第二实施例的流程示意图;
图4为本发明求解黄酒原料指标范围的数据驱动模型分析方法第三实施例的流程示意图;
图5为本发明求解黄酒原料指标范围的数据驱动模型分析装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明求解黄酒原料指标范围的数据驱动模型分析方法第一实施例的流程示意图。
在第一实施例中,所述求解黄酒原料指标范围的数据驱动模型分析方法包括以下步骤:
步骤S10,获取根据黄酒原料指标及黄酒制品指标构建的样本数据库。
需要说明的是,本实施例的执行主体可为具有数据处理、程序运行以及网络通信功能的计算服务设备,例如智能手机、平板电脑、个人电脑等,还可为其他可实现相同或相似功能的求解黄酒原料指标范围的数据驱动模型分析设备,本实施例对此不作限制,在本实施例中,以求解黄酒原料指标范围的数据驱动模型分析设备为例进行说明。
应当理解的是,获取样本数据库的方式可为从本地存储器获取,也可为从网络端获取,还可为其他方式获取,本实施例对此不作限制。
需要说明的是,已知根据黄酒原料指标及黄酒制品指标构建的样本数据库,该样本数据库为高质量数据库,包括{x1,x2,…,x8,y1,y2,…,y7}
表1各黄酒原料指标对应符号
表2各黄酒制品指标对应符号
其中{x1,x2,…x8}是可以评价黄酒原料的黄酒原料指标,{y1,y2,…y7}是可以评价黄酒制品的黄酒制品指标。
数据库D为:
其中,DA为黄酒原料的基础信息数据,DM为黄酒原料的指标数据集,即黄酒原料样本集,DN为黄酒制品的指标数据集,即黄酒制品样本集,其中t为t中黄酒原料,k为第k个黄酒原料的基础信息数据,黄酒原料的指标数据集中的8为第8个黄酒原料的指标集数据,黄酒制品的指标数据集中的7为第7个黄酒制品的指标集数据。
步骤S20,从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集。
可以理解的是,样本数据库中包含有黄酒原料样本集和黄酒制品样本集,因此可从样本数据库中提取黄酒原料样本集和黄酒制品样本集。
步骤S30,分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集。
需要说明的是,对黄酒原料样本集DM和黄酒制品样本集DN进行标准化处理的计算公式为:
其中,xi=(x1i;x2i;…;xti)(i=1,2,…,8)是黄酒原料样本集,yj=(y1j;x2j;…;ytj)(j=1,2,…,7)是黄酒制品样本集,t种黄酒原料,均值标准差标准化后的标准化黄酒原料样本集和标准化黄酒制品样本集仍记为DM、DN。
步骤S40,基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程。
需要说明的是,获取所述样本数据库中的黄酒原料样本集和黄酒制品样本集,将黄酒制品样本集中的指标设置为响应变量,将黄酒原料样本集中的指标设置为预测变量,就可以将对黄酒制品标准的约束转化为对黄酒原料标准的约束。
应当理解的是,基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理的步骤具体为:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
可以理解的是,通过逐步回归的方式,可以对数据进行筛选,使保留在模型中的解释变量既是重要的,又没有严重的多重共线性,可以使后续的步骤更加准确。
步骤S50,根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据。
需要说明的是,基于目标数据对黄酒制品品质指标进行预测的步骤具体为:
首先,根据目标黄酒原料样本数据和标准化黄酒制品样本集生成多元线性回归模型的训练集,再根据训练集对多元线性回归模型进行训练,获得黄酒制品品质指标对应的预测模型,预测模型用于根据黄酒原料品质指标预测黄酒制品品质指标,在后续步骤中,通过预测模型来确定黄酒制品限制约束。
然后,从标准化黄酒制品样本集中提取目标黄酒制品指标,并基于预设系数矩阵确定目标黄酒制品指标对应的回归函数,并根据回归函数确定拟合优度。
最后,将预测步骤过程中得到的预测模型和拟合优度作为计算数据,用于后续的计算和使用,即所述计算数据包括预测模型和拟合优度。
应当理解的是,为了解决精度问题,为黄酒原料标准的约束引入基于回归预测精度的修正因子来改造约束条件,使得优化后的黄酒原料最大限度地保证获得符合黄酒品质标准的制品,提高了优化决策的可信度。
步骤S60,根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型。
需要说明的是,所述预设优化目标为以原料品质指标标准的最优化制定为目标。
需要说明的是,黄酒原料品质标准优化模型的约束条件主要分为两类:
第一类约束:黄酒原料限制约束。此约束按照黄酒原料的指标数值的合理范围限制求解范围。
第二类约束:黄酒制品限制约束。此约束是通过黄酒原料和黄酒制品的关系模型的传递,将对黄酒制品的限制转移到对黄酒原料的限制上来,其中还需考虑关系模型的精度矫正问题。以两项黄酒原料指标和两项黄酒制品指标为例研究构建黄酒制品限制约束的原理,该原理可以推广到更高维空间的情形。
建立黄酒制品限制约束:
其中,x1、x2为两个黄酒预测变量(黄酒原料指标),y1、y2为两个黄酒响应变量(黄酒制品指标)训练得到预测模型为y1=f1(x1,x2),y2=f2(x1,x2),y1 low表示该黄酒制品指标标准下界、y1 up表示上界。
如图2中的四条实的斜直线构成黄酒制品限制约束的边界,四条斜直线所围成的区域为黄酒制品限制约束域,即平行四边形区域,该区域内的坐标点(x1,x2);表示的黄酒原料品质指标在不考虑第一种黄酒原料约束的情况下,通过关系模型f映射成制品指标,理论上映射后得到的制品指标都是满足制品约束的。
如图2所示的黄酒制品限制约束域若再考虑第一类约束就得到符合黄酒原料品质标准制定的黄酒原料品质,即我们需要的黄酒品质范围的目标区域就在这个区域内部选取,所求的目标区域就是在黄酒原料的品质范围区域中的一个矩形。该目标区域应该是在符合黄酒原料品质标准制定的黄酒原料品质区域中包含尽可能多的黄酒原料品种的矩形区域。
该矩形区域可以通过两个点来确定:矩形区域距离原点最远的点和最近的点,并依此可以确定矩形区域其他顶点。优化模型的目标是,目标区域的所有顶点在符合黄酒原料品质标准制定的区域中的前提下,使得距离原点最远的点达到最远和最近的点达到最近。
例如图2中的A,B两点,此两点的坐标值正是优化建模结果——黄酒原料品质指标上下界。由A,B两点绘制出的矩形区域即图3中的虚线区域,且该区域包含的坐标点所表示的黄酒原料指标值在理论上都是可取的。优化模型的目标就是要找到A,B两点的坐标,将这两点的坐标设置为优化目标。结合图1中矩形描述优化目标的设置要求:
(1)各边长度表示此边代表的黄酒品质指标取值范围,因此各边要尽量长。
(2)矩形边长之和也应在可行域内寻求最大。
(3)故对多目标进行加权求解时,各指标的优化权重要根据品质指标的离散特性来设置,且各权重比例直观表现为虚线矩形的边长之比。
将求解空间维数还原至黄酒原料指标集的指标数,黄酒原料限制约束和黄酒制品限制约束会形成由一个个超平面界定出来的可行域,建模优化求解目标就是在此可行域中搜寻一个超立方体。
步骤S70,根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
需要说明的是,可对黄酒原料品质标准优化模型进行优化,获得调控模型,再根据调控模型确定黄酒原料品质指标范围,应当理解的是指标范围即指标标准,在本实施例中代表相同的意思。
需要说明的是,优化的主要手段是对优化函数中权值的调整,使调控后求解结论的样本尽可能多的覆盖,可采用离散性度量指标中的四分位数等方法来调整权重。计算四分位数的长度并经归一化处理得到权重,代入到建模步骤的模型中进行二次建模求解。二次建模求得的矩形各边长比例为各指标离散度之比,再进行灵敏度分析探索各指标范围之和(各边长之和),以观察是否还有提升的可能,从而取得最合适解。
二次建模在一次建模基础上做如下调控:
(1)将一次建模求解结论中的最大边长代入约束,并设置各边长的优化权重为样本数据各指标的离散度。
(2)对(1)中最大边长设置缩减步长,进行多次优化求解。
(1)步是在一次建模结果的基础上进行参数优化,重新定义各边长的比例约束。(2)步是设置对比实验进行灵敏度分析,分析解范围的变化情况并得到最优解。经以上两步调控后的优化解可以满足建模步骤中优化目标的设置要求,得到各指标优化后的最佳范围。
本实施例中通过获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。从而通过对样本数据库中的样本集进行处理,构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
在一实施例中,如图3所示,基于第一实施例提出本发明求解黄酒原料指标范围的数据驱动模型分析方法第二实施例,所述步骤S40之前,还包括:
步骤S301,从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标。
步骤S302,对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数。
步骤S303,将所述方差膨胀系数与预设系数阈值进行比较。
步骤S304,若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
需要说明的是,在进行逐步回归处理之前,需要判断是否需要进行逐步回归处理,从标准化黄酒原料样本集中提取目标黄酒原料指标,对目标黄酒原料指标进行多重共线分析处理,获得目标黄酒原料指标对应的方差膨胀系数VIF,通过将方差膨胀系数与预设系数阈值进行比较,若方差膨胀系数大于预设系数阈值,则进行逐步回归处理。
在具体实现中,预设系数阈值可为10,基于SPSS多重共线分析,若目标黄酒原料指标之间VIF>10,则进行逐步回归处理,用于给定场景下的黄酒制品品质,针对各目标黄酒原料指标做多重共线分析得到的结果为:
其中直链淀粉、会升值VIF均大于10,存在多重共线性。
进一步地,所述步骤S40,包括:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
需要说明的是,逐步回归的基本思想为:将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除。以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止。以保证最后所得到的解释变量集是最优的。同时经过逐步回归,使得最后保留在模型中的解释变量既是重要的,又没有严重多重共线性。
在具体实现中,逐步回归的步骤具体为:
(1)对8个黄酒原料指标,分别与7个黄酒制品指标建立回归模型
ym=β0+βnxn+ε,m=1,2,…7;n=1,2,…8;
逐步回归方程结果为:
回归模型评价如下表:
本实施例中通过对数据进行逐步回归处理,可以对数据进行筛选,使保留在模型中的解释变量既是重要的,又没有严重的多重共线性,可以使后续的步骤更加准确,提升了计算的准确性。
在一实施例中,如图4所示,基于第一实施例或第二实施例提出本发明求解黄酒原料指标范围的数据驱动模型分析方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤S50,包括:
步骤S501,生成黄酒制品品质指标对应的多元线性回归模型。
步骤S502,根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型。
步骤S503,从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数。
步骤S504,根据所述回归函数确定拟合优度。
步骤S505,将所述预测模型和所述拟合优度作为计算数据。
需要说明的是,生成黄酒制品品质指标对应的多元线性回归模型,根据回归方程对多元线性回归模型进行训练,得到各黄酒制品品质指标对应的预测模型。第i各目标黄酒制品指标的回归函数:
其中,i=1,2,…,8;j=1,2,…,7,θ为系数,多元线性回归函数的fi(x)的拟合优度Ri 2,取值为[0,1]。
进一步地,所述步骤S60,包括:
步骤S601,查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒原料限制约束。
应当理解的是,查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定第一类约束:黄酒原料限制约束。
表3黄酒原料基本约束系数
步骤S602,基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约束。
需要说明的是,预设目标黄酒制品品质要求也为用户根据实际情况进行设置,本实施例对此不作限制。
基于所述预测模型和预设目标黄酒制品品质要求,确定第二类约束:黄酒制品限制约束。
假设黄酒品质指标的可行范围为L=(L1,L1,…,L7),U=(U1,U2,…,U7),分别代表黄酒品质指标的下界和上界。
表4黄酒制品限制约束上下界
步骤S603,根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制品限制约束。
需要说明的是,为了提高黄酒制品限制约束的准确度,要根据拟合优度修正黄酒制品限制约束,获得目标黄酒制品限制约束。
a计算Δk=Lk-Uk,Δk为范围初始值。
c计算黄酒制品品质指标上下界根据上下界修正量进行同等大小的减小和增大:
[L′j,U′j]=[Lj+0.5*Δj*∈j,Uj-0.5*Δj*∈j]
其中j=1,2,…,7,表示在制定第k个制品指标的品质标准,0.5表示上下界修正量在上下界的均摊。
步骤S604,根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子。
步骤S605,根据所述扩散因子和预设目标区域要求确定扩散因子约束。
需要说明的是,所述预设目标区域要求可为目标区域最大化,基于目标区域最大化的要求,确定第三类约束:扩散因子约束。
在多个黄酒原料指标组成的高维目标空间中设置“扩散因子”,并代入线性加权法目标中满足以下要求:
(1)范围合理,以确保求得黄酒原料范围是在综合考虑各项制品预测误差的情况下给出的高可信度范围解。
(2)范围最广泛,追求最终解在“黄酒原料限制约束”与“黄酒制品限制约束”中尽可能大的覆盖度。
设xlow、xup为各黄酒原料最终求解的下界和上界,δ为“扩散因子”,有9个这样的指标,则有
将黄酒优化模型放在Lingo中编程求解,得到最大的扩散因子和各初始解:
步骤S606,将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件。
步骤S607,根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
需要说明的是,将初始各指标权重βα设置为0.0625,即目标函数中每个指标上下界的权重一样,且和为1。依据第三阶段目标分析将β'设置为1000,以确保δ为首要目标。线性加权法求解的目标为:
依据上述数据和目标函数得到黄酒原料的线性加权求解单目标表达式及初始多目标优化模型为:
根据以上优化模型,得出黄酒的三种约束表达式:
其中α=1,2,…8。
进一步地,所述步骤S70,包括:
步骤S701,将所述黄酒原料品质标准化模型转化为单目标品质标准优化模型。
步骤S702,获取所述单目标品质标准优化模型的结果数据。
步骤S703,根据所述结果数据对所述扩散因子约束进行优化,获得目标扩散因子约束。
步骤S704,根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型进行调控,获得调控模型。
需要说明的是,调控阶段分为三个部分:调控范围大小的确定、调控模型的确定、专用黄酒原料的品质标准的获得。调控阶段具体实施步骤如下。
步骤1:确定调控范围的大小。
利用单目标黄酒原料品质标准优化模型计算的最优解,对第三类约束具体优化过程为:
求权重。根据四分位数建立各优化目标的权重为
β=(β1,β2,β3,β4,β5,β6,β7,β8)
=(0.0692,0.1369,0.4217,0.1554,0.0432,0.0136,0.1145,0.0456)
根据扩散因子δ0调整第三类约束根据上述的优化结论得到最大扩散因子δ0的值,再在确定扩散因子的基础上设置不同的松弛因子ρ建立对比试验并分析不同松弛因子对各黄酒原料指标解的影响,将浮动变量和松弛因子加入后:
其中α=1,...,8,r为浮动变量。
步骤2:确定调控模型。
作为迭代调控后优化模型的首要优化目标,其他约束不作修改,松弛因子ρ∈[0,0.5]。二次建模为:
其中α=1,2,...,8。xlow,xup为黄酒原料的各项品质指标的标准的下界值和上界值,ρ为“扩散因子”,γ为“浮动变量”。
步骤3:计算调控模型。
设置步长进行求解。对比实验中,将每一次实验按照设置松弛因子ρ步长为0.05,一共进行11次优化实验,对以上十一次结论的对比分析可以发现,松弛因子ρ越大,各指标解范围的和越大。
步骤S705,根据所述调控模型确定黄酒原料品质指标范围。
进一步地,所述步骤S705,包括:
根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上界值;对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行反标准化处理;根据处理结果确定黄酒原料品质指标范围。
需要说明的是,采用结论反标准化的方式来确定黄酒原料品质指标范围。依据数据标准化过程标准差σi及均值i表示第几个原料品质指标,对求解结果xlow、xup(黄酒原料品质指标下界值和黄酒原料品质指标上界值)进行反标准化处理,得到各原料指标的优化范围 反标准化公式为:
以范围值和最大为标准,选择ρ=0.5时的各指标计算结果进行反标准化得到最终目标解,最终目标解即代表着黄酒原料品质指标范围。
8种黄酒原料指标最终优化标准
本实施例中通过构建黄酒原料品质标准化优化模型来确定黄酒原料品质指标范围,并且为了在指定的黄酒原料品质指标的变化范围内包含尽可能多的原料品种,优化调整原料品质指标模型结构和参数,对黄酒原料品质标准化优化模型进行改进得到调控模型,优化超立方体的形状,从而获得目标制品最合适的黄酒原料品质指标范围。
此外,参照图5,本发明实施例还提出一种求解黄酒原料指标范围的数据驱动模型分析装置,所述求解黄酒原料指标范围的数据驱动模型分析装置包括:
数据获取模块10,用于获取根据黄酒原料指标及黄酒制品指标构建的样本数据库。
需要说明的是,本实施例的执行主体可为具有数据处理、程序运行以及网络通信功能的计算服务设备,例如智能手机、平板电脑、个人电脑等,还可为其他可实现相同或相似功能的求解黄酒原料指标范围的数据驱动模型分析设备,本实施例对此不作限制,在本实施例中,以求解黄酒原料指标范围的数据驱动模型分析设备为例进行说明。
应当理解的是,获取样本数据库的方式可为从本地存储器获取,也可为从网络端获取,还可为其他方式获取,本实施例对此不作限制。
需要说明的是,已知根据黄酒原料指标及黄酒制品指标构建的样本数据库,该样本数据库为高质量数据库,包括{x1,x2,…,x8,y1,y2,…,y7}
表1各黄酒原料指标对应符号
表2各黄酒制品指标对应符号
其中{x1,x2,…x8}是可以评价黄酒原料的黄酒原料指标,{y1,y2,…y7}是可以评价黄酒制品的黄酒制品指标。
数据库D为:
其中,DA为黄酒原料的基础信息数据,DM为黄酒原料的指标数据集,即黄酒原料样本集,DN为黄酒制品的指标数据集,即黄酒制品样本集,其中t为t中黄酒原料,k为第k个黄酒原料的基础信息数据,黄酒原料的指标数据集中的8为第8个黄酒原料的指标集数据,黄酒制品的指标数据集中的7为第7个黄酒制品的指标集数据。
样本提取模块20,用于从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集。
可以理解的是,样本数据库中包含有黄酒原料样本集和黄酒制品样本集,因此可从样本数据库中提取黄酒原料样本集和黄酒制品样本集。
数据处理模块30,用于分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集。
需要说明的是,对黄酒原料样本集DM和黄酒制品样本集DN进行标准化处理的计算公式为:
其中,xi=(x1i;x2i;…;xti)(i=1,2,…,8)是黄酒原料样本集,yj=(y1j;x2j;…;ytj)(j=1,2,…,7)是黄酒制品样本集,t种黄酒原料,均值标准差标准化后的标准化黄酒原料样本集和标准化黄酒制品样本集仍记为DM、DN。
逐步回归模块40,用于基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程。
需要说明的是,获取所述样本数据库中的黄酒原料样本集和黄酒制品样本集,将黄酒制品样本集中的指标设置为响应变量,将黄酒原料样本集中的指标设置为预测变量,就可以将对黄酒制品标准的约束转化为对黄酒原料标准的约束。
应当理解的是,基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理的步骤具体为:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
可以理解的是,通过逐步回归的方式,可以对数据进行筛选,使保留在模型中的解释变量既是重要的,又没有严重的多重共线性,可以使后续的步骤更加准确。
指标预测模块50,用于根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据。
需要说明的是,基于目标数据对黄酒制品品质指标进行预测的步骤具体为:
首先,根据目标黄酒原料样本数据和标准化黄酒制品样本集生成多元线性回归模型的训练集,再根据训练集对多元线性回归模型进行训练,获得黄酒制品品质指标对应的预测模型,预测模型用于根据黄酒原料品质指标预测黄酒制品品质指标,在后续步骤中,通过预测模型来确定黄酒制品限制约束。
然后,从标准化黄酒制品样本集中提取目标黄酒制品指标,并基于预设系数矩阵确定目标黄酒制品指标对应的回归函数,并根据回归函数确定拟合优度。
最后,将预测步骤过程中得到的预测模型和拟合优度作为计算数据,用于后续的计算和使用,即所述计算数据包括预测模型和拟合优度。
应当理解的是,为了解决精度问题,为黄酒原料标准的约束引入基于回归预测精度的修正因子来改造约束条件,使得优化后的黄酒原料最大限度地保证获得符合黄酒品质标准的制品,提高了优化决策的可信度。
模型构建模块60,用于根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型。
需要说明的是,所述预设优化目标为以原料品质指标标准的最优化制定为目标。
需要说明的是,黄酒原料品质标准优化模型的约束条件主要分为两类:
第一类约束:黄酒原料限制约束。此约束按照黄酒原料的指标数值的合理范围限制求解范围。
第二类约束:黄酒制品限制约束。此约束是通过黄酒原料和黄酒制品的关系模型的传递,将对黄酒制品的限制转移到对黄酒原料的限制上来,其中还需考虑关系模型的精度矫正问题。以两项黄酒原料指标和两项黄酒制品指标为例研究构建黄酒制品限制约束的原理,该原理可以推广到更高维空间的情形。
建立黄酒制品限制约束:
其中,x1、x2为两个黄酒预测变量(黄酒原料指标),y1、y2为两个黄酒响应变量(黄酒制品指标)训练得到预测模型为y1=f1(x1,x2),y2=f2(x1,x2),y1 low表示该黄酒制品指标标准下界、y1 up表示上界。
如图2中的四条实的斜直线构成黄酒制品限制约束的边界,四条斜直线所围成的区域为黄酒制品限制约束域,即平行四边形区域,该区域内的坐标点(x1,x2);表示的黄酒原料品质指标在不考虑第一种黄酒原料约束的情况下,通过关系模型f映射成制品指标,理论上映射后得到的制品指标都是满足制品约束的。
如图2所示的黄酒制品限制约束域若再考虑第一类约束就得到符合黄酒原料品质标准制定的黄酒原料品质,即我们需要的黄酒品质范围的目标区域就在这个区域内部选取,所求的目标区域就是在黄酒原料的品质范围区域中的一个矩形。该目标区域应该是在符合黄酒原料品质标准制定的黄酒原料品质区域中包含尽可能多的黄酒原料品种的矩形区域。
该矩形区域可以通过两个点来确定:矩形区域距离原点最远的点和最近的点,并依此可以确定矩形区域其他顶点。优化模型的目标是,目标区域的所有顶点在符合黄酒原料品质标准制定的区域中的前提下,使得距离原点最远的点达到最远和最近的点达到最近。
例如图2中的A,B两点,此两点的坐标值正是优化建模结果——黄酒原料品质指标上下界。由A,B两点绘制出的矩形区域即图3中的虚线区域,且该区域包含的坐标点所表示的黄酒原料指标值在理论上都是可取的。优化模型的目标就是要找到A,B两点的坐标,将这两点的坐标设置为优化目标。结合图1中矩形描述优化目标的设置要求:
(1)各边长度表示此边代表的黄酒品质指标取值范围,因此各边要尽量长。
(2)矩形边长之和也应在可行域内寻求最大。
(3)故对多目标进行加权求解时,各指标的优化权重要根据品质指标的离散特性来设置,且各权重比例直观表现为虚线矩形的边长之比。
将求解空间维数还原至黄酒原料指标集的指标数,黄酒原料限制约束和黄酒制品限制约束会形成由一个个超平面界定出来的可行域,建模优化求解目标就是在此可行域中搜寻一个超立方体。
范围确定模块70,用于根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
需要说明的是,可对黄酒原料品质标准优化模型进行优化,获得调控模型,再根据调控模型确定黄酒原料品质指标范围,应当理解的是指标范围即指标标准,在本实施例中代表相同的意思。
需要说明的是,优化的主要手段是对优化函数中权值的调整,使调控后求解结论的样本尽可能多的覆盖,可采用离散性度量指标中的四分位数等方法来调整权重。计算四分位数的长度并经归一化处理得到权重,代入到建模步骤的模型中进行二次建模求解。二次建模求得的矩形各边长比例为各指标离散度之比,再进行灵敏度分析探索各指标范围之和(各边长之和),以观察是否还有提升的可能,从而取得最合适解。
二次建模在一次建模基础上做如下调控:
(1)将一次建模求解结论中的最大边长代入约束,并设置各边长的优化权重为样本数据各指标的离散度。
(2)对(1)中最大边长设置缩减步长,进行多次优化求解。
(1)步是在一次建模结果的基础上进行参数优化,重新定义各边长的比例约束。(2)步是设置对比实验进行灵敏度分析,分析解范围的变化情况并得到最优解。经以上两步调控后的优化解可以满足建模步骤中优化目标的设置要求,得到各指标优化后的最佳范围。
本实施例中通过获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。从而通过对样本数据库中的样本集进行处理,构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
在一实施例中,所述求解黄酒原料指标范围的数据驱动模型分析装置还包括回归确认模块,用于从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;将所述方差膨胀系数与预设系数阈值进行比较;若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
在一实施例中,所述逐步回归模块40,还用于根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
在一实施例中,所述指标预测模块50,还用于生成黄酒制品品质指标对应的多元线性回归模型;根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;根据所述回归函数确定拟合优度;将所述预测模型和所述拟合优度作为计算数据。
在一实施例中,所述模型构建模块60,还用于查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒原料限制约束;基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约束;根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制品限制约束;根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;根据所述扩散因子和预设目标区域要求确定扩散因子约束;将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件;根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
在一实施例中,所述范围确定模块70,还用于将所述黄酒原料品质标准化模型转化为单目标品质标准优化模型;获取所述单目标品质标准优化模型的结果数据;根据所述结果数据对所述扩散因子约束进行优化,获得目标扩散因子约束;根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型进行调控,获得调控模型;根据所述调控模型确定黄酒原料品质指标范围。
在一实施例中,所述范围确定模块70,还用于根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上界值;对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行反标准化处理;根据处理结果确定黄酒原料品质指标范围。
在本发明所述求解黄酒原料指标范围的数据驱动模型分析装置的其他实施例或具体实现方法可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该估算机软件产品存储在如上所述的一个估算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能设备(可以是手机,估算机,求解黄酒原料指标范围的数据驱动模型分析设备,空调器,或者网络求解黄酒原料指标范围的数据驱动模型分析设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述求解黄酒原料指标范围的数据驱动模型分析方法包括以下步骤:
获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;
根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;
根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围;
其中,所述根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据,具体包括:
生成黄酒制品品质指标对应的多元线性回归模型;
根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;
从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
根据所述回归函数确定拟合优度;
将所述预测模型和所述拟合优度作为计算数据;
其中,所述根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型,具体包括:
查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒原料限制约束;
基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约束;
根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制品限制约束;
根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;
根据所述扩散因子和预设目标区域要求确定扩散因子约束;
将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件;
根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
2.如权利要求1所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程之前,还包括:
从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
将所述方差膨胀系数与预设系数阈值进行比较;
若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
3.如权利要求2所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程,具体包括:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;
从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;
根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
4.如权利要求1所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围,具体包括:
将所述黄酒原料品质标准化模型转化为单目标品质标准优化模型;
获取所述单目标品质标准优化模型的结果数据;
根据所述结果数据对所述扩散因子约束进行优化,获得目标扩散因子约束;
根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型进行调控,获得调控模型;
根据所述调控模型确定黄酒原料品质指标范围。
5.如权利要求4所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述调控模型确定黄酒原料品质指标范围,具体包括:
根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上界值;
对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行反标准化处理;
根据处理结果确定黄酒原料品质指标范围。
6.一种求解黄酒原料指标范围的数据驱动模型分析装置,其特征在于,所述求解黄酒原料指标范围的数据驱动模型分析装置包括:
数据获取模块,用于获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
样本提取模块,用于从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
数据处理模块,用于分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
逐步回归模块,用于基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;
指标预测模块,用于根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;
模型构建模块,用于根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
范围确定模块,用于根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围;
所述指标预测模块,还用于生成黄酒制品品质指标对应的多元线性回归模型;
所述指标预测模块,还用于根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;
所述指标预测模块,还用于从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
所述指标预测模块,还用于根据所述回归函数确定拟合优度;
所述指标预测模块,还用于将所述预测模型和所述拟合优度作为计算数据;
其中,所述模型构建模块,还用于查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒原料限制约束;基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约束;根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制品限制约束;根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;根据所述扩散因子和预设目标区域要求确定扩散因子约束;将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件;根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
7.如权利要求6所述的求解黄酒原料指标范围的数据驱动模型分析装置,其特征在于,所述求解黄酒原料指标范围的数据驱动模型分析装置还包括回归确认模块;
所述回归确认模块,用于从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
所述回归确认模块,还用于对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
所述回归确认模块,还用于将所述方差膨胀系数与预设系数阈值进行比较;
所述回归确认模块,还用于若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118189.XA CN111340361B (zh) | 2020-02-25 | 2020-02-25 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118189.XA CN111340361B (zh) | 2020-02-25 | 2020-02-25 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111340361A CN111340361A (zh) | 2020-06-26 |
CN111340361B true CN111340361B (zh) | 2023-04-28 |
Family
ID=71186946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010118189.XA Active CN111340361B (zh) | 2020-02-25 | 2020-02-25 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111340361B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118275630B (zh) * | 2024-05-31 | 2024-08-09 | 启思半导体(杭州)有限责任公司 | 酒类品质监测识别方法、系统及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005106656A2 (en) * | 2004-04-16 | 2005-11-10 | Fortelligent, Inc. | Predictive modeling |
JP2007122418A (ja) * | 2005-10-28 | 2007-05-17 | Bioinformatics Institute For Global Good Inc | 予測方法、予測装置および予測プログラム |
CN101479627A (zh) * | 2006-05-22 | 2009-07-08 | Ohm有限公司 | 电磁勘测 |
CN106021865A (zh) * | 2016-05-10 | 2016-10-12 | 北京航空航天大学 | 一种基于d-最优设计的逐批投入试验设计方法 |
CN108256181A (zh) * | 2017-12-31 | 2018-07-06 | 西北农林科技大学 | 融合效率约束的设施二氧化碳目标值的优化调控模型的构建与应用 |
CN109242341A (zh) * | 2018-09-29 | 2019-01-18 | 中国农业科学院农产品加工研究所 | 基于苹果原料指标预测果汁综合品质的方法 |
CN109325626A (zh) * | 2018-09-29 | 2019-02-12 | 中国农业科学院农产品加工研究所 | 基于苹果原料指标预测干制品综合品质的方法 |
CN109325273A (zh) * | 2018-09-06 | 2019-02-12 | 天津大学 | 基于非参数核密度估计的太阳能集热器出力概率建模方法 |
CN109409579A (zh) * | 2018-09-29 | 2019-03-01 | 中国农业科学院农产品加工研究所 | Bp人工神经网络预测原料加工适宜性的方法 |
CN109712716A (zh) * | 2018-12-25 | 2019-05-03 | 广州天鹏计算机科技有限公司 | 疾病影响因素确定方法、系统和计算机设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090177520A1 (en) * | 2007-12-31 | 2009-07-09 | Arash Bateni | Techniques for casual demand forecasting |
-
2020
- 2020-02-25 CN CN202010118189.XA patent/CN111340361B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005106656A2 (en) * | 2004-04-16 | 2005-11-10 | Fortelligent, Inc. | Predictive modeling |
JP2007122418A (ja) * | 2005-10-28 | 2007-05-17 | Bioinformatics Institute For Global Good Inc | 予測方法、予測装置および予測プログラム |
CN101479627A (zh) * | 2006-05-22 | 2009-07-08 | Ohm有限公司 | 电磁勘测 |
CN106021865A (zh) * | 2016-05-10 | 2016-10-12 | 北京航空航天大学 | 一种基于d-最优设计的逐批投入试验设计方法 |
CN108256181A (zh) * | 2017-12-31 | 2018-07-06 | 西北农林科技大学 | 融合效率约束的设施二氧化碳目标值的优化调控模型的构建与应用 |
CN109325273A (zh) * | 2018-09-06 | 2019-02-12 | 天津大学 | 基于非参数核密度估计的太阳能集热器出力概率建模方法 |
CN109242341A (zh) * | 2018-09-29 | 2019-01-18 | 中国农业科学院农产品加工研究所 | 基于苹果原料指标预测果汁综合品质的方法 |
CN109325626A (zh) * | 2018-09-29 | 2019-02-12 | 中国农业科学院农产品加工研究所 | 基于苹果原料指标预测干制品综合品质的方法 |
CN109409579A (zh) * | 2018-09-29 | 2019-03-01 | 中国农业科学院农产品加工研究所 | Bp人工神经网络预测原料加工适宜性的方法 |
CN109712716A (zh) * | 2018-12-25 | 2019-05-03 | 广州天鹏计算机科技有限公司 | 疾病影响因素确定方法、系统和计算机设备 |
Non-Patent Citations (1)
Title |
---|
张小燕 等.不同马铃薯品种用于加工油炸薯片的适宜性.农业工程学报.2013,第29卷(第8期),第276-283页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111340361A (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016A (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN103049651A (zh) | 一种用于电力负荷聚类的方法及装置 | |
CN114678080B (zh) | 转炉终点磷含量预测模型及构建方法、磷含量预测方法 | |
CN107016416B (zh) | 基于邻域粗糙集和pca融合的数据分类预测方法 | |
CN111340361B (zh) | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 | |
CN112784493A (zh) | 基于自适应深度q网络的地理空间预测方法及系统 | |
CN116502455A (zh) | 一种激光选区熔化技术的工艺参数确定方法及系统 | |
CN117252107A (zh) | 可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN115204533A (zh) | 基于多变量的加权组合模型的油气产量预测方法及系统 | |
CN111291496B (zh) | 求解汤圆原料指标范围的数据驱动模型分析方法及装置 | |
CN111325404B (zh) | 求解米粉原料指标范围的数据驱动模型分析方法及装置 | |
CN111310127B (zh) | 基于食品制品品质范围获取原料品质范围的方法及装置 | |
CN111680720A (zh) | 基于改进cs-svr模型的高炉铁水硅含量预测方法 | |
CN116613732A (zh) | 一种基于shap值选择策略的多元负荷预测方法及系统 | |
CN110648023A (zh) | 基于二次指数平滑改进gm(1,1)的数据预测模型的建立方法 | |
CN115525697A (zh) | 一种基于中药生产数据挖掘的工艺优化方法 | |
CN111340369B (zh) | 求解食品原料指标范围的数据驱动模型分析方法及装置 | |
CN113537553A (zh) | 一种区域配电网负荷需求混合预测方法 | |
Juszczyk | Cost estimates of buildings’ floor structural frames with the use of support vector regression | |
Wang et al. | Combined sensitivity ranking of input parameters and model forms of building energy simulation | |
Bourdache et al. | Active preference elicitation by bayesian updating on optimality polyhedra | |
CN111353643B (zh) | 基于米粉制品品质范围获取原料品质范围的方法及装置 | |
CN111353638B (zh) | 基于汤圆制品品质范围获取原料品质范围的方法及装置 | |
Safta et al. | Uncertainty quantification methods for model calibration, validation, and risk analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |