CN111340361A - 求解黄酒原料指标范围的数据驱动模型分析方法及装置 - Google Patents

求解黄酒原料指标范围的数据驱动模型分析方法及装置 Download PDF

Info

Publication number
CN111340361A
CN111340361A CN202010118189.XA CN202010118189A CN111340361A CN 111340361 A CN111340361 A CN 111340361A CN 202010118189 A CN202010118189 A CN 202010118189A CN 111340361 A CN111340361 A CN 111340361A
Authority
CN
China
Prior art keywords
yellow wine
raw material
yellow
wine raw
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010118189.XA
Other languages
English (en)
Other versions
CN111340361B (zh
Inventor
周胜玲
周康
周坚
杨华
刘朔
刘江蓉
高婧
尹明君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Polytechnic University
Original Assignee
Wuhan Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Polytechnic University filed Critical Wuhan Polytechnic University
Priority to CN202010118189.XA priority Critical patent/CN111340361B/zh
Publication of CN111340361A publication Critical patent/CN111340361A/zh
Application granted granted Critical
Publication of CN111340361B publication Critical patent/CN111340361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Computational Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及黄酒加工技术领域,公开了一种求解黄酒原料指标范围的数据驱动模型分析方法及装置,所述方法包括:获取根据黄酒原料指标及黄酒制品指标构建的样本数据库,提取黄酒原料样本集和黄酒制品样本集并进行标准化处理,对黄酒原料品质指标进行逐步回归处理,根据获得的回归方程对黄酒制品品质指标进行预测,并根据预测过程中的计算数据构建黄酒原料品质标准优化模型;根据黄酒原料品质标准优化模型确定黄酒原料品质指标范围。从而通过构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。

Description

求解黄酒原料指标范围的数据驱动模型分析方法及装置
技术领域
本发明涉及黄酒加工技术领域,尤其涉及一种求解黄酒原料指标范围的 数据驱动模型分析方法及装置。
背景技术
在黄酒加工领域,多样化的黄酒制品对黄酒原料品质的需求也不尽相同, 需要制作出符合国标、省标、行标、企标的黄酒制品,就要根据黄酒制品品 质预测黄酒原料的最佳品质范围,这样可为企业采办原料提供依据,采办合 适的原料,在给定的生产工艺条件下生产出合格的目标制品,提高合格率, 减少浪费,为企业减少损失,提高企业利润。
目前企业在确定黄酒制品的生产原料时有很多方法,如根据生产经验或 进行简单的对比试验就可以大致判断出何种黄酒原料投入制作将会得到怎样 的黄酒制品,但是这种根据生产经验对黄酒制品生产流程做决策的方法在效 率上存在着一定的提升空间。对于企业的生产规划来说,如何科学地找到生 产目标黄酒制品最合适的黄酒原料品质范围是一个比较大的难题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是 现有技术。
发明内容
本发明的主要目的在于提出一种求解黄酒原料指标范围的数据驱动模型 分析方法及装置,旨在解决如何确定黄酒原料品质指标的最佳范围,使得在 给定的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
为实现上述目的,本发明提供一种求解黄酒原料指标范围的数据驱动模 型分析方法,所述求解黄酒原料指标范围的数据驱动模型分析方法包括以下 步骤:
获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获 得标准化黄酒原料样本集和标准化黄酒制品样本集;
基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处 理,获得回归方程;
根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的 计算数据;
根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
优选地,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行 逐步回归处理,获得回归方程之前,还包括:
从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准 化黄酒制品样本集中提取目标黄酒制品指标;
对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原 料指标对应的方差膨胀系数;
将所述方差膨胀系数与预设系数阈值进行比较;
若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准 化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的 步骤。
优选地,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行 逐步回归处理,获得回归方程,具体包括:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;
从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标 准化黄酒制品样本集中提取黄酒制品样本集维度;
根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模 型确定回归方程。
优选地,所述根据所述回归方程对黄酒制品品质指标进行预测,并获取 预测过程中的计算数据,具体包括:
生成黄酒制品品质指标对应的多元线性回归模型;
根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制 品品质指标对应的预测模型;
从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目 标黄酒制品指标对应的回归函数;
根据所述回归函数确定拟合优度;
将所述预测模型和所述拟合优度作为计算数据。
优选地,所述根据所述计算数据和预设优化目标构建黄酒原料品质标准 优化模型,具体包括:
查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基 于所述理化性质数据确定黄酒原料限制约束;
基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约 束;
根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制 品限制约束;
根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间 中设置扩散因子;
根据所述扩散因子和预设目标区域要求确定扩散因子约束;
将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束 作为约束条件;
根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
优选地,所述根据所述黄酒原料品质标准优化模型确定黄酒原料品质指 标范围,具体包括:
将所述黄酒原料品质标准化模型转化为单目标品质标准优化模型;
获取所述单目标品质标准优化模型的结果数据;
根据所述结果数据对所述扩散因子约束进行优化,获得目标扩散因子约 束;
根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型进行调 控,获得调控模型;
根据所述调控模型确定黄酒原料品质指标范围。
优选地,所述根据所述调控模型确定黄酒原料品质指标范围,具体包括:
根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上 界值;
对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行反 标准化处理;
根据处理结果确定黄酒原料品质指标范围。
此外,为实现上述目的,本发明还提出一种求解黄酒原料指标范围的数 据驱动模型分析装置,所述求解黄酒原料指标范围的数据驱动模型分析装置 包括:
数据获取模块,用于获取根据黄酒原料指标及黄酒制品指标构建的样本 数据库;
样本提取模块,用于从所述样本数据库中提取黄酒原料样本集和黄酒制 品样本集;
数据处理模块,用于分别对所述黄酒原料样本集和所述黄酒制品样本集 进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
逐步回归模块,用于基于所述标准化黄酒原料样本集对黄酒原料品质指 标进行逐步回归处理,获得回归方程;
指标预测模块,用于根据所述回归方程对黄酒制品品质指标进行预测, 并获取预测过程中的计算数据;
模型构建模块,用于根据所述计算数据和预设优化目标构建黄酒原料品 质标准优化模型;
范围确定模块,用于根据所述黄酒原料品质标准优化模型确定黄酒原料 品质指标范围。
优选地,所述求解黄酒原料指标范围的数据驱动模型分析装置还包括回 归确认模块;
所述回归确认模块,用于从所述标准化黄酒原料样本集中提取目标黄酒 原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
所述回归确认模块,还用于对所述目标黄酒原料指标进行多重共线分析 处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
所述回归确认模块,还用于将所述方差膨胀系数与预设系数阈值进行比 较;
所述回归确认模块,还用于若所述方差膨胀系数大于所述预设系数阈值, 则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回 归处理,获得回归方程的步骤。
优选地,所述指标预测模块,还用于生成黄酒制品品质指标对应的多元 线性回归模型;
所述指标预测模块,还用于根据所述回归方程对所述多元线性回归模型 进行训练,获得所述黄酒制品品质指标对应的预测模型;
所述指标预测模块,还用于从所述标准化黄酒制品样本集中提取目标黄 酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
所述指标预测模块,还用于根据所述回归函数确定拟合优度;
所述指标预测模块,还用于将所述预测模型和所述拟合优度作为计算数 据。
本发明提出的求解黄酒原料指标范围的数据驱动模型分析方法,通过获 取根据黄酒原料指标及黄酒制品指标构建的样本数据库;从所述样本数据库 中提取黄酒原料样本集和黄酒制品样本集;分别对所述黄酒原料样本集和所 述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄 酒制品样本集;基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐 步回归处理,获得回归方程;根据所述回归方程对黄酒制品品质指标进行预 测,并获取预测过程中的计算数据;根据所述计算数据和预设优化目标构建 黄酒原料品质标准优化模型;根据所述黄酒原料品质标准优化模型确定黄酒 原料品质指标范围。从而通过对样本数据库中的样本集进行处理,构建黄酒 原料品质标准优化模型,根据该模型来确定黄酒原料品质指标范围,解决了 如何确定黄酒原料品质指标的最佳范围,使得在给定的生产工艺条件下黄酒 原料能够生产出合格的黄酒制品的技术问题。
附图说明
图1为本发明求解黄酒原料指标范围的数据驱动模型分析方法第一实施 例的流程示意图;
图2为本发明求解黄酒原料指标范围的数据驱动模型分析方法第一实施 例中的黄酒制品限制约束在二维空间的表示图;
图3为本发明求解黄酒原料指标范围的数据驱动模型分析方法第二实施 例的流程示意图;
图4为本发明求解黄酒原料指标范围的数据驱动模型分析方法第三实施 例的流程示意图;
图5为本发明求解黄酒原料指标范围的数据驱动模型分析装置第一实施 例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限 定本发明。
参照图1,图1为本发明求解黄酒原料指标范围的数据驱动模型分析方 法第一实施例的流程示意图。
在第一实施例中,所述求解黄酒原料指标范围的数据驱动模型分析方法 包括以下步骤:
步骤S10,获取根据黄酒原料指标及黄酒制品指标构建的样本数据库。
需要说明的是,本实施例的执行主体可为具有数据处理、程序运行以及 网络通信功能的计算服务设备,例如智能手机、平板电脑、个人电脑等,还 可为其他可实现相同或相似功能的求解黄酒原料指标范围的数据驱动模型分 析设备,本实施例对此不作限制,在本实施例中,以求解黄酒原料指标范围 的数据驱动模型分析设备为例进行说明。
应当理解的是,获取样本数据库的方式可为从本地存储器获取,也可为 从网络端获取,还可为其他方式获取,本实施例对此不作限制。
需要说明的是,已知根据黄酒原料指标及黄酒制品指标构建的样本数据 库,该样本数据库为高质量数据库,包括{x1,x2,…,x8,y1,y2,…,y7}
表1各黄酒原料指标对应符号
Figure BDA0002391897740000061
表2各黄酒制品指标对应符号
Figure BDA0002391897740000071
其中{x1,x2,…x8}是可以评价黄酒原料的黄酒原料指标,{y1,y2,…y7}是可以 评价黄酒制品的黄酒制品指标。
数据库D为:
Figure BDA0002391897740000072
其中,DA为黄酒原料的基础信息数据,DM为黄酒原料的指标数据集,即 黄酒原料样本集,DN为黄酒制品的指标数据集,即黄酒制品样本集,其中t 为t中黄酒原料,k为第k个黄酒原料的基础信息数据,黄酒原料的指标数据 集中的8为第8个黄酒原料的指标集数据,黄酒制品的指标数据集中的7为 第7个黄酒制品的指标集数据。
步骤S20,从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集。
可以理解的是,样本数据库中包含有黄酒原料样本集和黄酒制品样本集, 因此可从样本数据库中提取黄酒原料样本集和黄酒制品样本集。
步骤S30,分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准 化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集。
需要说明的是,对黄酒原料样本集DM和黄酒制品样本集DN进行标准化 处理的计算公式为:
Figure BDA0002391897740000073
其中,xi=(x1i;x2i;…;xti)(i=1,2,…,8)是黄酒原料样本集,yj=(y1j;x2j;…;ytj)(j=1,2,…,7) 是黄酒制品样本集,t种黄酒原料,均值
Figure BDA0002391897740000074
标准差
Figure BDA0002391897740000075
标准化后的标准化黄酒原料样本集和标准化黄酒制品样本集仍记为DM、DN
步骤S40,基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐 步回归处理,获得回归方程。
需要说明的是,获取所述样本数据库中的黄酒原料样本集和黄酒制品样 本集,将黄酒制品样本集中的指标设置为响应变量,将黄酒原料样本集中的 指标设置为预测变量,就可以将对黄酒制品标准的约束转化为对黄酒原料标 准的约束。
应当理解的是,基于所述标准化黄酒原料样本集对黄酒原料品质指标进 行逐步回归处理的步骤具体为:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从 所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄 酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、 所述黄酒制品样本集维度和所述回归模型确定回归方程。
可以理解的是,通过逐步回归的方式,可以对数据进行筛选,使保留在 模型中的解释变量既是重要的,又没有严重的多重共线性,可以使后续的步 骤更加准确。
步骤S50,根据所述回归方程对黄酒制品品质指标进行预测,并获取预 测过程中的计算数据。
需要说明的是,基于目标数据对黄酒制品品质指标进行预测的步骤具体 为:
首先,根据目标黄酒原料样本数据和标准化黄酒制品样本集生成多元线 性回归模型的训练集,再根据训练集对多元线性回归模型进行训练,获得黄 酒制品品质指标对应的预测模型,预测模型用于根据黄酒原料品质指标预测 黄酒制品品质指标,在后续步骤中,通过预测模型来确定黄酒制品限制约束。
然后,从标准化黄酒制品样本集中提取目标黄酒制品指标,并基于预设 系数矩阵确定目标黄酒制品指标对应的回归函数,并根据回归函数确定拟合 优度。
最后,将预测步骤过程中得到的预测模型和拟合优度作为计算数据,用 于后续的计算和使用,即所述计算数据包括预测模型和拟合优度。
应当理解的是,为了解决精度问题,为黄酒原料标准的约束引入基于回 归预测精度的修正因子来改造约束条件,使得优化后的黄酒原料最大限度地 保证获得符合黄酒品质标准的制品,提高了优化决策的可信度。
步骤S60,根据所述计算数据和预设优化目标构建黄酒原料品质标准优 化模型。
需要说明的是,所述预设优化目标为以原料品质指标标准的最优化制定 为目标。
需要说明的是,黄酒原料品质标准优化模型的约束条件主要分为两类:
第一类约束:黄酒原料限制约束。此约束按照黄酒原料的指标数值的合 理范围限制求解范围。
第二类约束:黄酒制品限制约束。此约束是通过黄酒原料和黄酒制品的 关系模型的传递,将对黄酒制品的限制转移到对黄酒原料的限制上来,其中 还需考虑关系模型的精度矫正问题。以两项黄酒原料指标和两项黄酒制品指 标为例研究构建黄酒制品限制约束的原理,该原理可以推广到更高维空间的 情形。
建立黄酒制品限制约束:
Figure BDA0002391897740000091
其中,x1、x2为两个黄酒预测变量(黄酒原料指标),y1、y2为两个黄酒 响应变量(黄酒制品指标)训练得到预测模型为y1=f1(x1,x2),y2=f2(x1,x2), y1 low表示该黄酒制品指标标准下界、y1 up表示上界。
如图2中的四条实的斜直线构成黄酒制品限制约束的边界,四条斜直线 所围成的区域为黄酒制品限制约束域,即平行四边形区域,该区域内的坐标 点(x1,x2);表示的黄酒原料品质指标在不考虑第一种黄酒原料约束的情况下, 通过关系模型f映射成制品指标,理论上映射后得到的制品指标都是满足制 品约束的。
如图2所示的黄酒制品限制约束域若再考虑第一类约束就得到符合黄酒 原料品质标准制定的黄酒原料品质,即我们需要的黄酒品质范围的目标区域 就在这个区域内部选取,所求的目标区域就是在黄酒原料的品质范围区域中 的一个矩形。该目标区域应该是在符合黄酒原料品质标准制定的黄酒原料品 质区域中包含尽可能多的黄酒原料品种的矩形区域。
该矩形区域可以通过两个点来确定:矩形区域距离原点最远的点和最近 的点,并依此可以确定矩形区域其他顶点。优化模型的目标是,目标区域的 所有顶点在符合黄酒原料品质标准制定的区域中的前提下,使得距离原点最 远的点达到最远和最近的点达到最近。
例如图2中的A,B两点,此两点的坐标值正是优化建模结果——黄酒原 料品质指标上下界。由A,B两点绘制出的矩形区域即图2中的虚线区域,且 该区域包含的坐标点所表示的黄酒原料指标值在理论上都是可取的。优化模 型的目标就是要找到A,B两点的坐标,将这两点的坐标设置为优化目标。结 合图1中矩形描述优化目标的设置要求:
(1)各边长度表示此边代表的黄酒品质指标取值范围,因此各边要尽量 长。
(2)矩形边长之和也应在可行域内寻求最大。
(3)故对多目标进行加权求解时,各指标的优化权重要根据品质指标的 离散特性来设置,且各权重比例直观表现为虚线矩形的边长之比。
将求解空间维数还原至黄酒原料指标集的指标数,黄酒原料限制约束和 黄酒制品限制约束会形成由一个个超平面界定出来的可行域,建模优化求解 目标就是在此可行域中搜寻一个超立方体。
步骤S70,根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标 范围。
需要说明的是,可对黄酒原料品质标准优化模型进行优化,获得调控模 型,再根据调控模型确定黄酒原料品质指标范围,应当理解的是指标范围即 指标标准,在本实施例中代表相同的意思。
需要说明的是,优化的主要手段是对优化函数中权值的调整,使调控后 求解结论的样本尽可能多的覆盖,可采用离散性度量指标中的四分位数等方 法来调整权重。计算四分位数的长度并经归一化处理得到权重,代入到建模 步骤的模型中进行二次建模求解。二次建模求得的矩形各边长比例为各指标 离散度之比,再进行灵敏度分析探索各指标范围之和(各边长之和),以观察 是否还有提升的可能,从而取得最合适解。
二次建模在一次建模基础上做如下调控:
(1)将一次建模求解结论中的最大边长代入约束,并设置各边长的优化 权重为样本数据各指标的离散度。
(2)对(1)中最大边长设置缩减步长,进行多次优化求解。
(1)步是在一次建模结果的基础上进行参数优化,重新定义各边长的比 例约束。(2)步是设置对比实验进行灵敏度分析,分析解范围的变化情况并 得到最优解。经以上两步调控后的优化解可以满足建模步骤中优化目标的设 置要求,得到各指标优化后的最佳范围。
本实施例中通过获取根据黄酒原料指标及黄酒制品指标构建的样本数据 库;从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;分别对所 述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒 原料样本集和标准化黄酒制品样本集;基于所述标准化黄酒原料样本集对黄 酒原料品质指标进行逐步回归处理,获得回归方程;根据所述回归方程对黄 酒制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数 据和预设优化目标构建黄酒原料品质标准优化模型;根据所述黄酒原料品质 标准优化模型确定黄酒原料品质指标范围。从而通过对样本数据库中的样本 集进行处理,构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料 品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定 的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
在一实施例中,如图3所示,基于第一实施例提出本发明求解黄酒原料 指标范围的数据驱动模型分析方法第二实施例,所述步骤S40之前,还包括:
步骤S301,从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并 从所述标准化黄酒制品样本集中提取目标黄酒制品指标。
步骤S302,对所述目标黄酒原料指标进行多重共线分析处理,获得所述 目标黄酒原料指标对应的方差膨胀系数。
步骤S303,将所述方差膨胀系数与预设系数阈值进行比较。
步骤S304,若所述方差膨胀系数大于所述预设系数阈值,则执行所述基 于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得 回归方程的步骤。
需要说明的是,在进行逐步回归处理之前,需要判断是否需要进行逐步 回归处理,从标准化黄酒原料样本集中提取目标黄酒原料指标,对目标黄酒 原料指标进行多重共线分析处理,获得目标黄酒原料指标对应的方差膨胀系 数VIF,通过将方差膨胀系数与预设系数阈值进行比较,若方差膨胀系数大 于预设系数阈值,则进行逐步回归处理。
在具体实现中,预设系数阈值可为10,基于SPSS多重共线分析,若目 标黄酒原料指标之间VIF>10,则进行逐步回归处理,用于给定场景下的黄 酒制品品质,针对各目标黄酒原料指标做多重共线分析得到的结果为:
Figure BDA0002391897740000121
其中直链淀粉、会升值VIF均大于10,存在多重共线性。
进一步地,所述步骤S40,包括:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从 所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄 酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、 所述黄酒制品样本集维度和所述回归模型确定回归方程。
需要说明的是,逐步回归的基本思想为:将变量逐个引入模型,每引入 一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验, 当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删 除。以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个 反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解 释变量从回归方程中剔除为止。以保证最后所得到的解释变量集是最优的。 同时经过逐步回归,使得最后保留在模型中的解释变量既是重要的,又没有 严重多重共线性。
在具体实现中,逐步回归的步骤具体为:
(1)对8个黄酒原料指标,分别与7个黄酒制品指标建立回归模型
ym=β0nxn+ε,m=1,2,…7;n=1,2,…8;
其中m是黄酒原料样本集维度,n是黄酒制品样本集维度。并进行F检 验统计量的值,记为
Figure BDA0002391897740000131
取其中的最大值
Figure BDA0002391897740000132
Figure BDA0002391897740000133
对给定的显著性水平α,记相应的临界值为F(1)
Figure BDA0002391897740000134
则将
Figure BDA0002391897740000135
引入回 归模型,记I1为选入变量指标集合。
(2)建立黄酒制品Y与原料子集
Figure BDA0002391897740000136
的二 元回归模型,共有7个。计算变量的回归系数F检验的统计量值,记为
Figure BDA0002391897740000137
选其中最大者,记为
Figure BDA0002391897740000138
Figure BDA0002391897740000139
对给定的显著性水平α,记相应的临界值为F(2)
Figure BDA00023918977400001310
则将
Figure BDA00023918977400001311
引入 回归模型。否则,终止变量引入过程。
(3)考虑黄酒制品对黄酒原料指标子集
Figure BDA00023918977400001312
的回归。
逐步回归方程结果为:
Figure BDA00023918977400001313
回归模型评价如下表:
Figure BDA00023918977400001314
本实施例中通过对数据进行逐步回归处理,可以对数据进行筛选,使保 留在模型中的解释变量既是重要的,又没有严重的多重共线性,可以使后续 的步骤更加准确,提升了计算的准确性。
在一实施例中,如图4所示,基于第一实施例或第二实施例提出本发明 求解黄酒原料指标范围的数据驱动模型分析方法第三实施例,在本实施例中, 基于第一实施例进行说明,所述步骤S50,包括:
步骤S501,生成黄酒制品品质指标对应的多元线性回归模型。
步骤S502,根据所述回归方程对所述多元线性回归模型进行训练,获得 所述黄酒制品品质指标对应的预测模型。
步骤S503,从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并 确定所述目标黄酒制品指标对应的回归函数。
步骤S504,根据所述回归函数确定拟合优度。
步骤S505,将所述预测模型和所述拟合优度作为计算数据。
需要说明的是,生成黄酒制品品质指标对应的多元线性回归模型,根据 回归方程对多元线性回归模型进行训练,得到各黄酒制品品质指标对应的预 测模型。第i各目标黄酒制品指标的回归函数:
Figure BDA0002391897740000141
其中,i=1,2,…,8;j=1,2,…,7,θ为系数,多元线性回归函数的fi(x)的拟合优度Ri 2,取值为[0,1]。
进一步地,所述步骤S60,包括:
步骤S601,查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质 数据,并基于所述理化性质数据确定黄酒原料限制约束。
需要说明的是,确定黄酒原料的各项品质指标的标准的下界值和上界值 xlow、xup为决策变量组成的向量,其中
Figure BDA0002391897740000142
应当理解的是,查找所述黄酒原料品质指标对应的黄酒原料品质的理化 性质数据,并基于所述理化性质数据确定第一类约束:黄酒原料限制约束。
表3黄酒原料基本约束系数
Figure BDA0002391897740000143
步骤S602,基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒 制品限制约束。
需要说明的是,预设目标黄酒制品品质要求也为用户根据实际情况进行 设置,本实施例对此不作限制。
基于所述预测模型和预设目标黄酒制品品质要求,确定第二类约束:黄 酒制品限制约束。
假设黄酒品质指标的可行范围为L=(L1,L1,…,L7),U=(U1,U2,…,U7),分 别代表黄酒品质指标的下界和上界。
表4黄酒制品限制约束上下界
Figure BDA0002391897740000151
步骤S603,根据所述拟合优度对所述黄酒制品限制约束进行修正,获得 目标黄酒制品限制约束。
需要说明的是,为了提高黄酒制品限制约束的准确度,要根据拟合优度 修正黄酒制品限制约束,获得目标黄酒制品限制约束。
对预测阶段获得的拟合优度
Figure BDA0002391897740000152
具体修正方法为:
a计算Δk=Lk-Uk,Δk为范围初始值。
b计算各回归函数的拟合优度Ri 2的“修正因子”:
Figure BDA0002391897740000153
c计算黄酒制品品质指标上下界根据上下界修正量进行同等大小的减小 和增大:
[L′j,U′j]=[Lj+0.5*Δj*∈j,Uj-0.5*Δj*∈j]
其中j=1,2,…,7,表示在制定第k个制品指标的品质标准,0.5表示上下 界修正量在上下界的均摊。
步骤S604,根据多个目标黄酒原料指标构建高维目标空间,并在所述高 维目标空间中设置扩散因子。
步骤S605,根据所述扩散因子和预设目标区域要求确定扩散因子约束。
需要说明的是,所述预设目标区域要求可为目标区域最大化,基于目标 区域最大化的要求,确定第三类约束:扩散因子约束。
在多个黄酒原料指标组成的高维目标空间中设置“扩散因子”,并代入线 性加权法目标中满足以下要求:
(1)范围合理,以确保求得黄酒原料范围是在综合考虑各项制品预测误 差的情况下给出的高可信度范围解。
(2)范围最广泛,追求最终解在“黄酒原料限制约束”与“黄酒制品限制 约束”中尽可能大的覆盖度。
设xlow、xup为各黄酒原料最终求解的下界和上界,δ为“扩散因子”,有9 个这样的指标,则有
Figure BDA0002391897740000161
将黄酒优化模型放在Lingo中编程求解,得到最大的扩散因子和各初始 解:
Figure BDA0002391897740000162
步骤S606,将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩 散因子约束作为约束条件。
步骤S607,根据所述约束条件和预设优化目标构建黄酒原料品质标准优 化模型。
需要说明的是,将初始各指标权重βα设置为0.0625,即目标函数中每个 指标上下界的权重一样,且和为1。依据第三阶段目标分析将β'设置为1000, 以确保δ为首要目标。线性加权法求解的目标为:
Figure BDA0002391897740000163
依据上述数据和目标函数得到黄酒原料的线性加权求解单目标表达式及 初始多目标优化模型为:
Figure BDA0002391897740000164
根据以上优化模型,得出黄酒的三种约束表达式:
Figure BDA0002391897740000171
Figure BDA0002391897740000172
Figure BDA0002391897740000173
其中α=1,2,…8。
进一步地,所述步骤S70,包括:
步骤S701,将所述黄酒原料品质标准化模型转化为单目标品质标准优化 模型。
步骤S702,获取所述单目标品质标准优化模型的结果数据。
步骤S703,根据所述结果数据对所述扩散因子约束进行优化,获得目标 扩散因子约束。
步骤S704,根据所述目标扩散因子约束对所述黄酒原料品质标准优化模 型进行调控,获得调控模型。
需要说明的是,调控阶段分为三个部分:调控范围大小的确定、调控模 型的确定、专用黄酒原料的品质标准的获得。调控阶段具体实施步骤如下。
步骤1:确定调控范围的大小。
利用单目标黄酒原料品质标准优化模型计算的最优解,对第三类约束具 体优化过程为:
求权重。根据四分位数建立各优化目标的权重为
β=(β12345678)
=(0.0692,0.1369,0.4217,0.1554,0.0432,0.0136,0.1145,0.0456)
根据扩散因子δ0调整第三类约束
Figure BDA0002391897740000174
根据上述的优化结论得到 最大扩散因子δ0的值,再在确定扩散因子的基础上设置不同的松弛因子ρ建立 对比试验并分析不同松弛因子对各黄酒原料指标解的影响,将浮动变量和松 弛因子加入后:
Figure BDA0002391897740000181
其中α=1,...,8,r为浮动变量。
步骤2:确定调控模型。
作为迭代调控后优化模型的首要优化目标,其他约束不作修改,松弛因 子ρ∈[0,0.5]。二次建模为:
Figure BDA0002391897740000182
Figure BDA0002391897740000183
其中α=1,2,...,8。xlow,xup为黄酒原料的各项品质指标的标准的下界值和 上界值,ρ为“扩散因子”,γ为“浮动变量”。
步骤3:计算调控模型。
设置步长进行求解。对比实验中,将每一次实验按照设置松弛因子ρ步长 为0.05,一共进行11次优化实验,对以上十一次结论的对比分析可以发现, 松弛因子ρ越大,各指标解范围的和越大。
步骤S705,根据所述调控模型确定黄酒原料品质指标范围。
进一步地,所述步骤S705,包括:
根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上 界值;对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行 反标准化处理;根据处理结果确定黄酒原料品质指标范围。
需要说明的是,采用结论反标准化的方式来确定黄酒原料品质指标范 围。依据数据标准化过程标准差σi及均值
Figure BDA0002391897740000184
i表示第几个原料品质指标,对 求解结果xlow、xup(黄酒原料品质指标下界值和黄酒原料品质指标上界值) 进行反标准化处理,得到各原料指标的优化范围
Figure BDA0002391897740000185
Figure BDA0002391897740000186
反标准化公式为:
Figure BDA0002391897740000187
Figure BDA0002391897740000188
以范围值和最大为标准,选择ρ=0.5时的各指标计算结果进行反标准化得 到最终目标解,最终目标解即代表着黄酒原料品质指标范围。
8种黄酒原料指标最终优化标准
Figure BDA0002391897740000191
本实施例中通过构建黄酒原料品质标准化优化模型来确定黄酒原料品质 指标范围,并且为了在指定的黄酒原料品质指标的变化范围内包含尽可能多 的原料品种,优化调整原料品质指标模型结构和参数,对黄酒原料品质标准 化优化模型进行改进得到调控模型,优化超立方体的形状,从而获得目标制 品最合适的黄酒原料品质指标范围。
此外,参照图5,本发明实施例还提出一种求解黄酒原料指标范围的数 据驱动模型分析装置,所述求解黄酒原料指标范围的数据驱动模型分析装置 包括:
数据获取模块10,用于获取根据黄酒原料指标及黄酒制品指标构建的样 本数据库。
需要说明的是,本实施例的执行主体可为具有数据处理、程序运行以及 网络通信功能的计算服务设备,例如智能手机、平板电脑、个人电脑等,还 可为其他可实现相同或相似功能的求解黄酒原料指标范围的数据驱动模型分 析设备,本实施例对此不作限制,在本实施例中,以求解黄酒原料指标范围 的数据驱动模型分析设备为例进行说明。
应当理解的是,获取样本数据库的方式可为从本地存储器获取,也可为 从网络端获取,还可为其他方式获取,本实施例对此不作限制。
需要说明的是,已知根据黄酒原料指标及黄酒制品指标构建的样本数据 库,该样本数据库为高质量数据库,包括{x1,x2,…,x8,y1,y2,…,y7}
表1各黄酒原料指标对应符号
Figure BDA0002391897740000192
表2各黄酒制品指标对应符号
Figure BDA0002391897740000193
其中{x1,x2,…x8}是可以评价黄酒原料的黄酒原料指标,{y1,y2,…y7}是可以 评价黄酒制品的黄酒制品指标。
数据库D为:
Figure BDA0002391897740000201
其中,DA为黄酒原料的基础信息数据,DM为黄酒原料的指标数据集,即 黄酒原料样本集,DN为黄酒制品的指标数据集,即黄酒制品样本集,其中t 为t中黄酒原料,k为第k个黄酒原料的基础信息数据,黄酒原料的指标数据 集中的8为第8个黄酒原料的指标集数据,黄酒制品的指标数据集中的7为 第7个黄酒制品的指标集数据。
样本提取模块20,用于从所述样本数据库中提取黄酒原料样本集和黄酒 制品样本集。
可以理解的是,样本数据库中包含有黄酒原料样本集和黄酒制品样本集, 因此可从样本数据库中提取黄酒原料样本集和黄酒制品样本集。
数据处理模块30,用于分别对所述黄酒原料样本集和所述黄酒制品样本 集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集。
需要说明的是,对黄酒原料样本集DM和黄酒制品样本集DN进行标准化 处理的计算公式为:
Figure BDA0002391897740000202
其中,xi=(x1i;x2i;…;xti)(i=1,2,…,8)是黄酒原料样本集,yj=(y1j;x2j;…;ytj)(j=1,2,…,7) 是黄酒制品样本集,t种黄酒原料,均值
Figure BDA0002391897740000203
标准差
Figure BDA0002391897740000204
标准化后的标准化黄酒原料样本集和标准化黄酒制品样本集仍记为DM、DN
逐步回归模块40,用于基于所述标准化黄酒原料样本集对黄酒原料品质 指标进行逐步回归处理,获得回归方程。
需要说明的是,获取所述样本数据库中的黄酒原料样本集和黄酒制品样 本集,将黄酒制品样本集中的指标设置为响应变量,将黄酒原料样本集中的 指标设置为预测变量,就可以将对黄酒制品标准的约束转化为对黄酒原料标 准的约束。
应当理解的是,基于所述标准化黄酒原料样本集对黄酒原料品质指标进 行逐步回归处理的步骤具体为:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;从 所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄 酒制品样本集中提取黄酒制品样本集维度;根据所述黄酒原料样本集维度、 所述黄酒制品样本集维度和所述回归模型确定回归方程。
可以理解的是,通过逐步回归的方式,可以对数据进行筛选,使保留在 模型中的解释变量既是重要的,又没有严重的多重共线性,可以使后续的步 骤更加准确。
指标预测模块50,用于根据所述回归方程对黄酒制品品质指标进行预测, 并获取预测过程中的计算数据。
需要说明的是,基于目标数据对黄酒制品品质指标进行预测的步骤具体 为:
首先,根据目标黄酒原料样本数据和标准化黄酒制品样本集生成多元线 性回归模型的训练集,再根据训练集对多元线性回归模型进行训练,获得黄 酒制品品质指标对应的预测模型,预测模型用于根据黄酒原料品质指标预测 黄酒制品品质指标,在后续步骤中,通过预测模型来确定黄酒制品限制约束。
然后,从标准化黄酒制品样本集中提取目标黄酒制品指标,并基于预设 系数矩阵确定目标黄酒制品指标对应的回归函数,并根据回归函数确定拟合 优度。
最后,将预测步骤过程中得到的预测模型和拟合优度作为计算数据,用 于后续的计算和使用,即所述计算数据包括预测模型和拟合优度。
应当理解的是,为了解决精度问题,为黄酒原料标准的约束引入基于回 归预测精度的修正因子来改造约束条件,使得优化后的黄酒原料最大限度地 保证获得符合黄酒品质标准的制品,提高了优化决策的可信度。
模型构建模块60,用于根据所述计算数据和预设优化目标构建黄酒原料 品质标准优化模型。
需要说明的是,所述预设优化目标为以原料品质指标标准的最优化制定 为目标。
需要说明的是,黄酒原料品质标准优化模型的约束条件主要分为两类:
第一类约束:黄酒原料限制约束。此约束按照黄酒原料的指标数值的合 理范围限制求解范围。
第二类约束:黄酒制品限制约束。此约束是通过黄酒原料和黄酒制品的 关系模型的传递,将对黄酒制品的限制转移到对黄酒原料的限制上来,其中 还需考虑关系模型的精度矫正问题。以两项黄酒原料指标和两项黄酒制品指 标为例研究构建黄酒制品限制约束的原理,该原理可以推广到更高维空间的 情形。
建立黄酒制品限制约束:
Figure BDA0002391897740000221
其中,x1、x2为两个黄酒预测变量(黄酒原料指标),y1、y2为两个黄酒 响应变量(黄酒制品指标)训练得到预测模型为y1=f1(x1,x2),y2=f2(x1,x2), y1 low表示该黄酒制品指标标准下界、y1 up表示上界。
如图2中的四条实的斜直线构成黄酒制品限制约束的边界,四条斜直线 所围成的区域为黄酒制品限制约束域,即平行四边形区域,该区域内的坐标 点(x1,x2);表示的黄酒原料品质指标在不考虑第一种黄酒原料约束的情况下, 通过关系模型f映射成制品指标,理论上映射后得到的制品指标都是满足制 品约束的。
如图2所示的黄酒制品限制约束域若再考虑第一类约束就得到符合黄酒 原料品质标准制定的黄酒原料品质,即我们需要的黄酒品质范围的目标区域 就在这个区域内部选取,所求的目标区域就是在黄酒原料的品质范围区域中 的一个矩形。该目标区域应该是在符合黄酒原料品质标准制定的黄酒原料品 质区域中包含尽可能多的黄酒原料品种的矩形区域。
该矩形区域可以通过两个点来确定:矩形区域距离原点最远的点和最近 的点,并依此可以确定矩形区域其他顶点。优化模型的目标是,目标区域的 所有顶点在符合黄酒原料品质标准制定的区域中的前提下,使得距离原点最 远的点达到最远和最近的点达到最近。
例如图2中的A,B两点,此两点的坐标值正是优化建模结果——黄酒原 料品质指标上下界。由A,B两点绘制出的矩形区域即图2中的虚线区域,且 该区域包含的坐标点所表示的黄酒原料指标值在理论上都是可取的。优化模 型的目标就是要找到A,B两点的坐标,将这两点的坐标设置为优化目标。结 合图1中矩形描述优化目标的设置要求:
(1)各边长度表示此边代表的黄酒品质指标取值范围,因此各边要尽量 长。
(2)矩形边长之和也应在可行域内寻求最大。
(3)故对多目标进行加权求解时,各指标的优化权重要根据品质指标的 离散特性来设置,且各权重比例直观表现为虚线矩形的边长之比。
将求解空间维数还原至黄酒原料指标集的指标数,黄酒原料限制约束和 黄酒制品限制约束会形成由一个个超平面界定出来的可行域,建模优化求解 目标就是在此可行域中搜寻一个超立方体。
范围确定模块70,用于根据所述黄酒原料品质标准优化模型确定黄酒原 料品质指标范围。
需要说明的是,可对黄酒原料品质标准优化模型进行优化,获得调控模 型,再根据调控模型确定黄酒原料品质指标范围,应当理解的是指标范围即 指标标准,在本实施例中代表相同的意思。
需要说明的是,优化的主要手段是对优化函数中权值的调整,使调控后 求解结论的样本尽可能多的覆盖,可采用离散性度量指标中的四分位数等方 法来调整权重。计算四分位数的长度并经归一化处理得到权重,代入到建模 步骤的模型中进行二次建模求解。二次建模求得的矩形各边长比例为各指标 离散度之比,再进行灵敏度分析探索各指标范围之和(各边长之和),以观察 是否还有提升的可能,从而取得最合适解。
二次建模在一次建模基础上做如下调控:
(1)将一次建模求解结论中的最大边长代入约束,并设置各边长的优化 权重为样本数据各指标的离散度。
(2)对(1)中最大边长设置缩减步长,进行多次优化求解。
(1)步是在一次建模结果的基础上进行参数优化,重新定义各边长的比 例约束。(2)步是设置对比实验进行灵敏度分析,分析解范围的变化情况并 得到最优解。经以上两步调控后的优化解可以满足建模步骤中优化目标的设 置要求,得到各指标优化后的最佳范围。
本实施例中通过获取根据黄酒原料指标及黄酒制品指标构建的样本数据 库;从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;分别对所 述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒 原料样本集和标准化黄酒制品样本集;基于所述标准化黄酒原料样本集对黄 酒原料品质指标进行逐步回归处理,获得回归方程;根据所述回归方程对黄 酒制品品质指标进行预测,并获取预测过程中的计算数据;根据所述计算数 据和预设优化目标构建黄酒原料品质标准优化模型;根据所述黄酒原料品质 标准优化模型确定黄酒原料品质指标范围。从而通过对样本数据库中的样本 集进行处理,构建黄酒原料品质标准优化模型,根据该模型来确定黄酒原料 品质指标范围,解决了如何确定黄酒原料品质指标的最佳范围,使得在给定 的生产工艺条件下黄酒原料能够生产出合格的黄酒制品的技术问题。
在一实施例中,所述求解黄酒原料指标范围的数据驱动模型分析装置还 包括回归确认模块,用于从所述标准化黄酒原料样本集中提取目标黄酒原料 指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;对所述目 标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的 方差膨胀系数;将所述方差膨胀系数与预设系数阈值进行比较;若所述方差 膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本 集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
在一实施例中,所述逐步回归模块40,还用于根据所述目标黄酒原料指 标和所述目标黄酒制品指标构建回归模型;从所述标准化黄酒原料样本集中 提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品 样本集维度;根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所 述回归模型确定回归方程。
在一实施例中,所述指标预测模块50,还用于生成黄酒制品品质指标对 应的多元线性回归模型;根据所述回归方程对所述多元线性回归模型进行训 练,获得所述黄酒制品品质指标对应的预测模型;从所述标准化黄酒制品样 本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函 数;根据所述回归函数确定拟合优度;将所述预测模型和所述拟合优度作为 计算数据。
在一实施例中,所述模型构建模块60,还用于查找所述黄酒原料品质指 标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒 原料限制约束;基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒 制品限制约束;根据所述拟合优度对所述黄酒制品限制约束进行修正,获得 目标黄酒制品限制约束;根据多个目标黄酒原料指标构建高维目标空间,并 在所述高维目标空间中设置扩散因子;根据所述扩散因子和预设目标区域要 求确定扩散因子约束;将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件;根据所述约束条件和预设优化目标构建黄 酒原料品质标准优化模型。
在一实施例中,所述范围确定模块70,还用于将所述黄酒原料品质标准 化模型转化为单目标品质标准优化模型;获取所述单目标品质标准优化模型 的结果数据;根据所述结果数据对所述扩散因子约束进行优化,获得目标扩 散因子约束;根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型 进行调控,获得调控模型;根据所述调控模型确定黄酒原料品质指标范围。
在一实施例中,所述范围确定模块70,还用于根据所述调控模型计算黄 酒原料品质指标下界值和黄酒原料品质指标上界值;对所述黄酒原料品质指 标下界值和所述黄酒原料品质指标上界值进行反标准化处理;根据处理结果 确定黄酒原料品质指标范围。
在本发明所述求解黄酒原料指标范围的数据驱动模型分析装置的其他实 施例或具体实现方法可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者 装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包 括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况 下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方 法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该估算机软件产品存储在如上所述的一个估算机可读存储介质(如 ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能设备(可以是手 机,估算机,求解黄酒原料指标范围的数据驱动模型分析设备,空调器,或 者网络求解黄酒原料指标范围的数据驱动模型分析设备等)执行本发明各个 实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是 利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间 接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述求解黄酒原料指标范围的数据驱动模型分析方法包括以下步骤:
获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;
根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;
根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
2.如权利要求1所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程之前,还包括:
从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
将所述方差膨胀系数与预设系数阈值进行比较;
若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
3.如权利要求2所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程,具体包括:
根据所述目标黄酒原料指标和所述目标黄酒制品指标构建回归模型;
从所述标准化黄酒原料样本集中提取黄酒原料样本集维度,并从所述标准化黄酒制品样本集中提取黄酒制品样本集维度;
根据所述黄酒原料样本集维度、所述黄酒制品样本集维度和所述回归模型确定回归方程。
4.如权利要求1所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据,具体包括:
生成黄酒制品品质指标对应的多元线性回归模型;
根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;
从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
根据所述回归函数确定拟合优度;
将所述预测模型和所述拟合优度作为计算数据。
5.如权利要求4所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型,具体包括:
查找所述黄酒原料品质指标对应的黄酒原料品质的理化性质数据,并基于所述理化性质数据确定黄酒原料限制约束;
基于所述预测模型和预设目标黄酒制品品质要求,确定黄酒制品限制约束;
根据所述拟合优度对所述黄酒制品限制约束进行修正,获得目标黄酒制品限制约束;
根据多个目标黄酒原料指标构建高维目标空间,并在所述高维目标空间中设置扩散因子;
根据所述扩散因子和预设目标区域要求确定扩散因子约束;
将所述黄酒原料限制约束、所述黄酒制品限制约束和所述扩散因子约束作为约束条件;
根据所述约束条件和预设优化目标构建黄酒原料品质标准优化模型。
6.如权利要求5所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围,具体包括:
将所述黄酒原料品质标准化模型转化为单目标品质标准优化模型;
获取所述单目标品质标准优化模型的结果数据;
根据所述结果数据对所述扩散因子约束进行优化,获得目标扩散因子约束;
根据所述目标扩散因子约束对所述黄酒原料品质标准优化模型进行调控,获得调控模型;
根据所述调控模型确定黄酒原料品质指标范围。
7.如权利要求6所述的求解黄酒原料指标范围的数据驱动模型分析方法,其特征在于,所述根据所述调控模型确定黄酒原料品质指标范围,具体包括:
根据所述调控模型计算黄酒原料品质指标下界值和黄酒原料品质指标上界值;
对所述黄酒原料品质指标下界值和所述黄酒原料品质指标上界值进行反标准化处理;
根据处理结果确定黄酒原料品质指标范围。
8.一种求解黄酒原料指标范围的数据驱动模型分析装置,其特征在于,所述求解黄酒原料指标范围的数据驱动模型分析装置包括:
数据获取模块,用于获取根据黄酒原料指标及黄酒制品指标构建的样本数据库;
样本提取模块,用于从所述样本数据库中提取黄酒原料样本集和黄酒制品样本集;
数据处理模块,用于分别对所述黄酒原料样本集和所述黄酒制品样本集进行标准化处理,获得标准化黄酒原料样本集和标准化黄酒制品样本集;
逐步回归模块,用于基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程;
指标预测模块,用于根据所述回归方程对黄酒制品品质指标进行预测,并获取预测过程中的计算数据;
模型构建模块,用于根据所述计算数据和预设优化目标构建黄酒原料品质标准优化模型;
范围确定模块,用于根据所述黄酒原料品质标准优化模型确定黄酒原料品质指标范围。
9.如权利要求8所述的求解黄酒原料指标范围的数据驱动模型分析装置,其特征在于,所述求解黄酒原料指标范围的数据驱动模型分析装置还包括回归确认模块;
所述回归确认模块,用于从所述标准化黄酒原料样本集中提取目标黄酒原料指标,并从所述标准化黄酒制品样本集中提取目标黄酒制品指标;
所述回归确认模块,还用于对所述目标黄酒原料指标进行多重共线分析处理,获得所述目标黄酒原料指标对应的方差膨胀系数;
所述回归确认模块,还用于将所述方差膨胀系数与预设系数阈值进行比较;
所述回归确认模块,还用于若所述方差膨胀系数大于所述预设系数阈值,则执行所述基于所述标准化黄酒原料样本集对黄酒原料品质指标进行逐步回归处理,获得回归方程的步骤。
10.如权利要求8所述的求解黄酒原料指标范围的数据驱动模型分析装置,其特征在于,所述指标预测模块,还用于生成黄酒制品品质指标对应的多元线性回归模型;
所述指标预测模块,还用于根据所述回归方程对所述多元线性回归模型进行训练,获得所述黄酒制品品质指标对应的预测模型;
所述指标预测模块,还用于从所述标准化黄酒制品样本集中提取目标黄酒制品指标,并确定所述目标黄酒制品指标对应的回归函数;
所述指标预测模块,还用于根据所述回归函数确定拟合优度;
所述指标预测模块,还用于将所述预测模型和所述拟合优度作为计算数据。
CN202010118189.XA 2020-02-25 2020-02-25 求解黄酒原料指标范围的数据驱动模型分析方法及装置 Active CN111340361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010118189.XA CN111340361B (zh) 2020-02-25 2020-02-25 求解黄酒原料指标范围的数据驱动模型分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010118189.XA CN111340361B (zh) 2020-02-25 2020-02-25 求解黄酒原料指标范围的数据驱动模型分析方法及装置

Publications (2)

Publication Number Publication Date
CN111340361A true CN111340361A (zh) 2020-06-26
CN111340361B CN111340361B (zh) 2023-04-28

Family

ID=71186946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010118189.XA Active CN111340361B (zh) 2020-02-25 2020-02-25 求解黄酒原料指标范围的数据驱动模型分析方法及装置

Country Status (1)

Country Link
CN (1) CN111340361B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005106656A2 (en) * 2004-04-16 2005-11-10 Fortelligent, Inc. Predictive modeling
JP2007122418A (ja) * 2005-10-28 2007-05-17 Bioinformatics Institute For Global Good Inc 予測方法、予測装置および予測プログラム
US20070280047A1 (en) * 2006-05-22 2007-12-06 Ohm Ltd Electromagnetic Surveying
US20090177520A1 (en) * 2007-12-31 2009-07-09 Arash Bateni Techniques for casual demand forecasting
CN106021865A (zh) * 2016-05-10 2016-10-12 北京航空航天大学 一种基于d-最优设计的逐批投入试验设计方法
CN108256181A (zh) * 2017-12-31 2018-07-06 西北农林科技大学 融合效率约束的设施二氧化碳目标值的优化调控模型的构建与应用
CN109242341A (zh) * 2018-09-29 2019-01-18 中国农业科学院农产品加工研究所 基于苹果原料指标预测果汁综合品质的方法
CN109325626A (zh) * 2018-09-29 2019-02-12 中国农业科学院农产品加工研究所 基于苹果原料指标预测干制品综合品质的方法
CN109325273A (zh) * 2018-09-06 2019-02-12 天津大学 基于非参数核密度估计的太阳能集热器出力概率建模方法
CN109409579A (zh) * 2018-09-29 2019-03-01 中国农业科学院农产品加工研究所 Bp人工神经网络预测原料加工适宜性的方法
CN109712716A (zh) * 2018-12-25 2019-05-03 广州天鹏计算机科技有限公司 疾病影响因素确定方法、系统和计算机设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005106656A2 (en) * 2004-04-16 2005-11-10 Fortelligent, Inc. Predictive modeling
JP2007122418A (ja) * 2005-10-28 2007-05-17 Bioinformatics Institute For Global Good Inc 予測方法、予測装置および予測プログラム
US20070280047A1 (en) * 2006-05-22 2007-12-06 Ohm Ltd Electromagnetic Surveying
CN101479627A (zh) * 2006-05-22 2009-07-08 Ohm有限公司 电磁勘测
US20090177520A1 (en) * 2007-12-31 2009-07-09 Arash Bateni Techniques for casual demand forecasting
CN106021865A (zh) * 2016-05-10 2016-10-12 北京航空航天大学 一种基于d-最优设计的逐批投入试验设计方法
CN108256181A (zh) * 2017-12-31 2018-07-06 西北农林科技大学 融合效率约束的设施二氧化碳目标值的优化调控模型的构建与应用
CN109325273A (zh) * 2018-09-06 2019-02-12 天津大学 基于非参数核密度估计的太阳能集热器出力概率建模方法
CN109242341A (zh) * 2018-09-29 2019-01-18 中国农业科学院农产品加工研究所 基于苹果原料指标预测果汁综合品质的方法
CN109325626A (zh) * 2018-09-29 2019-02-12 中国农业科学院农产品加工研究所 基于苹果原料指标预测干制品综合品质的方法
CN109409579A (zh) * 2018-09-29 2019-03-01 中国农业科学院农产品加工研究所 Bp人工神经网络预测原料加工适宜性的方法
CN109712716A (zh) * 2018-12-25 2019-05-03 广州天鹏计算机科技有限公司 疾病影响因素确定方法、系统和计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张小燕 等: "不同马铃薯品种用于加工油炸薯片的适宜性" *

Also Published As

Publication number Publication date
CN111340361B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN114678080B (zh) 转炉终点磷含量预测模型及构建方法、磷含量预测方法
CN110378423A (zh) 特征提取方法、装置、计算机设备及存储介质
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
US20230140696A1 (en) Method and system for optimizing parameter intervals of manufacturing processes based on prediction intervals
Kuchemüller et al. Efficient optimization of process strategies with model-assisted design of experiments
Boonstra et al. A small-sample choice of the tuning parameter in ridge regression
CN111291496B (zh) 求解汤圆原料指标范围的数据驱动模型分析方法及装置
CN111340361A (zh) 求解黄酒原料指标范围的数据驱动模型分析方法及装置
CN111325404B (zh) 求解米粉原料指标范围的数据驱动模型分析方法及装置
CN111310127B (zh) 基于食品制品品质范围获取原料品质范围的方法及装置
CN116415177A (zh) 一种基于极限学习机的分类器参数辨识方法
CN116665039A (zh) 基于两阶段因果干预的小样本目标识别方法
CN116047753A (zh) 光学系统正交优化模型的构建及优化方法
CN111967499B (zh) 基于自步学习的数据降维方法
CN115329938A (zh) 一种基于鉴别器森林提高生成对抗网络泛化能力的方法
CN111340369B (zh) 求解食品原料指标范围的数据驱动模型分析方法及装置
CN113656707A (zh) 一种理财产品推荐方法、系统、存储介质及设备
Bourdache et al. Active preference elicitation by bayesian updating on optimality polyhedra
CN114139442A (zh) 基于K-means-LSTM的汽轮机阀门流量特性函数的优化方法
CN111292006A (zh) 基于黄酒制品品质范围获取原料品质范围的方法及装置
CN111353643B (zh) 基于米粉制品品质范围获取原料品质范围的方法及装置
CN111353638B (zh) 基于汤圆制品品质范围获取原料品质范围的方法及装置
Airan et al. Linear machine: A novel approach to point location problem
CN113469244B (zh) 小众app分类系统
Kon et al. Empirical normalization for quadratic discriminant analysis and classifying cancer subtypes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant