CN109636014A - 一种基于成纱质量预测的配棉方法 - Google Patents
一种基于成纱质量预测的配棉方法 Download PDFInfo
- Publication number
- CN109636014A CN109636014A CN201811433186.4A CN201811433186A CN109636014A CN 109636014 A CN109636014 A CN 109636014A CN 201811433186 A CN201811433186 A CN 201811433186A CN 109636014 A CN109636014 A CN 109636014A
- Authority
- CN
- China
- Prior art keywords
- factor
- output
- vector
- cotton
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 229920000742 Cotton Polymers 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000013507 mapping Methods 0.000 claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 238000000556 factor analysis Methods 0.000 claims abstract description 14
- 238000013459 approach Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims abstract description 8
- 238000009333 weeding Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 36
- 238000012937 correction Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 7
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 239000013604 expression vector Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 241001269238 Data Species 0.000 claims description 2
- 238000013461 design Methods 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000011161 development Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000009960 carding Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 230000002860 competitive effect Effects 0.000 description 7
- 239000000835 fiber Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 235000019606 astringent taste Nutrition 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010014173 Factor X Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005025 nuclear technology Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01G—PRELIMINARY TREATMENT OF FIBRES, e.g. FOR SPINNING
- D01G13/00—Mixing, e.g. blending, fibres; Mixing non-fibrous materials with fibres
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Textile Engineering (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Treatment Of Fiber Materials (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于成纱质量预测的配棉方法,用于解决现有样本数据量较少且质量差,成纱质量模型难以训练的问题,本发明的步骤如下:数据预处理:剔除掉数据库中错误的数据,对样本数据进行拟合扩充样本数据;配棉映射关系建模:将成纱的质量指标作为输入因素,原棉的质量指标作为输出因素,通过映射关系矩阵建立样本数据中输入因素和输出因素之间的映射关系模型;基于输出的最优化规则建模:根据建立的映射关系模型,利用主因素分析法或核心因素分析法选择最优输出结果,得到成纱最优的配棉因素。本发明为后续开展以成纱质量预测体系为基础的应用技术提供模型基础,实现成纱质量预测的实际应用,且降低了成本,提高了经济效益。
Description
技术领域
本发明涉及电子信息领域海量信息处理及数据挖掘分析的技术领域,尤其涉及一种基于成纱质量预测的配棉方法,数据预处理、数据分析、特征提取、数据建模、算法分析、模型校正等方法选择较优的配棉方法。
背景技术
在棉纺厂的生产实践中,根据原棉的性能参数需要对成纱质量进行预测。业内的专家学者一直在尝试建立该预测模型,主要有回归统计、竞争神经网络以及模糊数学等方法。数据挖掘的开源软件(Waikato Environment for Knowledge Analysis)利用特征选择法分析了原棉的性能指标对成纱质量的影响,与竞争神经网络相结合对成纱条干、强度等预测。该方法比单一采用竞争神经网络法预测成纱质量相对误差较小。基于遗传算法和主成分分析法与竞争神经网络相结合的棉花性能指标对成纱质量的预测模型。研究中分别采用单一竞争神经网络(模型1)、主成分分析加竞争神经网络(模型2)和主成分分析加遗传算法优化隐层节点数后的竞争神经网络(模型3)。依据实测原棉数据对成纱质量的预报,通过对三个模型预测结果的比较表明:模型3平均相对误差较小;主成分分析降维后最优隐层节点数仍远大于经验公式确定的隐层节点数;基于遗传算法、主成分分析法和竞争神经网络相结合进行原棉成纱质量的预测,在一定程度上能够提高预测精度。在棉纺厂的生产实践中,对成纱质量预测具有重要意义。由于样本数据量较少并且质量参差不齐,不免给成纱质量的预测会带来较大误差,使模型难以训练。
发明内容
针对现有样本数据量较小,成纱质量预测模型难以训练的技术问题,本发明提出一种基于成纱质量预测的配棉方法,通过数据拟合扩充样本数据,利用主因素分析法或核心因素分析法选择最优的输出结果,从而寻找最优地配棉方法。
为了达到上述目的,本发明的技术方案是这样实现的:一种基于成纱质量预测的配棉方法,其步骤如下:
步骤一:数据预处理:剔除掉数据库中冗余的数据,对样本数据进行拓扑拟合,完善各种情况的样本数据;
步骤二:配棉映射关系建模:将成纱的质量指标作为输入因素,原棉的质量指标作为输出因素,通过映射关系矩阵建立样本数据中输入因素和输出因素之间的映射关系模型;
步骤三:最优配棉:基于输出的最优化规则建模实施配棉,即根据步骤二建立的映射关系模型,利用主因素分析法或核心因素分析法选择最优输出结果,得到成纱最优的配棉因素。
所述步骤一中的样本数据的拓扑拟合方法为:把输入因素的样本数据看作xi,输出因素的样本数据看作是yi,样本数据中有n+1数据点:(x0,y0),(x1,y1),(x2,y2),…,(xn,yn);输入因素和输出因素的样本数据拟合的方法为:
a.计算输入因素的步长:
hi=xi+1-xi (1)
b.将数据点(xi,yi)带入矩阵方程求得二次微分值mi;
c.计算拟合曲线的系数:
ai=yi,
其中,i=0,1,…,n-1;
d.在每个输入因素的子区间xi≤x≤xi+1中,创建方程:
gi(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3 (3)
在子区间xi≤x≤xi+1中均匀选择3-5个点,根据方程gi(x)求解相应的输入因素的样本数据,数据点(x,gi(x))就是拟合的新数值。
所述步骤二中的映射关系模型为:
其中,xi=(xi1,xi2,…,xim)是m维的输入因素的向量,yi=(yi1,yi2,…,yin)是n维的输出因素的向量,为输入因素与输出因素之间的映射关系矩阵。
所述主因素分析法的方法为:对输入因素和输出因素表示为(xi,yi),其对应的属性值表示为(φ(xi),pi);使用非线性映射φ,将输入因素xi变换到高维空间后的输入属性值φ(xi),pi表示输出决策属性值并令其取+1或-1;则新的实例为(φ(xi),pi);
为使配棉决策划分对所有样本正确配棉并且具备因素分类间隔,就要求满足以下约束条件:
其中,w表示当前最优决策分类划分界线相对水平线的倾斜程度,b表示初始的决策属性值;满足这些不等式中的等式的实例点就是所得到的特征因素向量或主要因素向量;
上式(5)的分类间隔可计算为:
在约束式的条件下最大化分类间隔2/||w||可以通过最小化||w||2的方法来实现;在上述条件式(5)的约束下,求解最优决策分类划分问题表示成如下的约束优化:定义最小化函数(7),即
对式(7)求最小化,并满足约束式(5),那么可定义一个含约束条件的目标函数L,然后通过对目标函数L求解;
定义目标函数L为:
式中,α≥0表示约束条件的约束权重因子且α=(α1,…,αN),αi≥0是相应第i个输出约束权重因子,N是实例个数,pi是决策属性值;
为使目标函数L最小,对式(8)求解,得到和代入到式(8)中,得到:
其中,L(α)表示目标函数,αi和αj分别表示对第i个和对第j个输出约束权重因子,pi和pj分别表示第i个和第j个输出决策属性值,φ(xi)和φ(xj)分别表示相应于输入样本xi和xj的映射输入属性值;<·>表示向量的内积;
这时,目标函数L(α)变为
这里,K(xi,xj)=<φ(xi),φ(xj)>称为主因素函数;通过极值化式(10)求解,求出的αi为最优解αi*;在实例为特征因素向量或主要因素向量时,αi≠0,且
在得出最优α*后,求出最优的w*和b*:
这里为输出决策pi=1时对应的最优输入数据;
可求得最优因素决策划分:
由于非主要因素向量对应的αi均为0,因此式(11)的求和实际上只对主要因素向量进行;利用最优因素决策划分得出哪些因素是主要因素、哪些因素是次要因素。
所述核心因素分析法为:多条输出因素组成的向量[yi1,yi2,…,yin],选择每列的均值组成一个新的向量把向量看作是核心点向量;
输出的多组向量中元素分别与核心点向量的元素对应作方差:然后用方差分别与核心点向量相比较,即方差分别与设定的阈值相比较进行投票,获得投票多的向量为满足条件的最优输出结果。
所述映射关系矩阵的校正方法为:输入因素与输出因素的关系为:
其中,权重ωi=[ωi1,ωi2,…,ωim]是输入因素和输出因素在数据归一下过程中产生的,且ωi1+ωi2+…+ωim=1;通过校正权值实现校正映射关系矩阵RT的目的;
权重的校正方法为:ωl=ωl-1+μ(ωl-ωl-1);
其中,ωl为当前权值;ωl-1为前一次计算得到的权值,初始权值ω0根据样本训练得到经验值,μ为权重的学习率;通过不同的样本数据逐渐调整映射关系RT。
所述输出因素的校正方法为:y″=y1+η(y″-y1);
其中,y″为当前输出值,y1为样本输出值,η为输出学习率;通过不同的样本数据进行机器学习,一定步长迭代后得到比较理想的输出结果。
本发明的有益效果:提出了数据的筛选、主因素提取、数据延展等预处理方法,这些方法计算简单且稳定性同时收敛性较好等;实施数据建模,充分考虑到输入输出因素之间相互耦合地复杂关系,建立了有效的映射关系模型;对所建立的模型算法进行评估分析,通过针对具体数据模型算法的建立,基本确定了哪些输入因素对输出结果具有主要影响,提出了核心因素或主因素分析配棉建模方法;然后进一步完善模型,实施模型校正,给出了配棉模型误差校正法,使输出结果更加合理准确。本发明为后续开展以成纱质量预测体系为基础的应用技术提供模型基础,实现成纱质量预测的实际应用。在实际的某纺纱厂运行,验证结果为该纺纱厂降低了25%左右的成本,提高了经济效益;为纺纱厂成纱质量预测、管理、资源的合理分配利用、成本管理、高品质棉、科学发展等领域提供精准数据服务支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图。
图2为本发明最优决策分类平面的示意图。
图3为具体实例中成纱预测39个因素的排列图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于成纱质量预测的配棉方法,其步骤如下:
步骤一:数据预处理:剔除掉数据库中冗余的数据,对样本数据进行拓扑拟合,扩充样本数据,完善各种情况的样本数据。
由于样本数据量较少并且质量参差不齐,不免给成纱质量的预测会带来较大误差,使模型难以训练。对于数据预处理,本发明的创新点在于对样本数据分析后采用合适的方法扩充样本数据集。本发明样本数据的拟合计算简单、稳定性且收敛性较好、不仅保证了各小段曲线在连续点的连续性而且也保证了整条曲线的光滑性。
预处理对样本数据集初步筛选之后,也要想办法对数据进行拟合来扩充数据集。本发明的创新点在于在预处理部分采用了曲线拟合的方式对筛选后样本数据插值。接着通过改进的映射关系矩阵、针对数据密集分布的主因素分析以及突出核心、抗噪能力强的核心因素分析算法对输入输出因素进行建模,最后对模型和输出结果进行多次校正。
样本数据的筛选方法一种是人工筛选,即人工剔除掉数据库中明显错误的数据(如相同输入因素产生不同输出结果的数据等);另一种是软件筛选,即在程序中通过编写一个筛选算法实现剔除错误的数据后再放入样本数据。前一种人工筛选的方法适用于数据库数据量较小、数据错误较明显且错误数据量较小的数据环境,后一种采用软件的筛选方法,对数据量没要求(只是数据量较大时,会占用一部分运行时间),但数据库数据自身存在多种缺陷时,造成筛选算法的程序编写复杂。
样本数据经过初步筛选之后,由于样本数据较少导致模型难以训练,所以在这里采用了对样本数据拟合从而扩充数据。根据经验得知,影响强力的主要因素有原棉棉结、马克隆值等,这里把原棉棉结数据看作xi,强力数据看作是yi,则假定有n+1数据点:
(x0,y0),(x1,y1),(x2,y2),…,(xn,yn)。
其算法流程如下:
a.计算步长:
hi=xi+1-xi(i=0,1,…,n-1) (1)
b.将数据点带入拓扑拟合的三次多项式函数(如式(6))的矩阵方程(因为输入输出都是向量,所以这个函数是矩阵函数),对拟合函数求得二次微分值mi。
c.对拟合函数按照级数展开方法,通过求各级微分,可计算拟合曲线的系数ai,bi,ci,di如下:
ai=yi
其中,i=0,1,…,n-1。
d.在每个子区间xi≤x≤xi+1中,创建方程:
gi(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3 (3)
根据此方程完成对数据的拟合。xi,xi+1分别是已知的输入值,x是介于xi和xi+1两者之间的值,通过式(6)求得对应值gi(x),那么数对(x,gi(x))就是拟合的新数值。
步骤二:配棉映射关系建模:将成纱的质量指标作为输入因素,原棉的质量指标作为输出因素,通过映射关系矩阵建立样本数据中输入因素和输出因素之间的映射关系模型。
本发明针对的是多输入多输出的问题,其中输入因素分别为强力、棉结、条干、毛羽以及单强等,输出有梳棉出条线速度、梳棉棉结、梳棉短绒率、梳棉落棉率、精梳棉结、精梳短绒率、精梳落棉率、粗纱捻系数、原棉棉结、原棉马克隆值、原棉强度以及原棉含杂率等输出参数。
生产实践分析可知其输入因素和输出因素之间相互耦合,其映射关系较为复杂。本发明在此处建立了一个输入输出关系,即输入与输出因素之间通过一个关系矩阵建立映射关系。
其中,xi1xi2…xim是一个m维向量,表示强力、棉结、条干、毛羽以及单强等共m个输入因素,yi1yi2…yin是一个n维的向量代表梳棉出条线速度、梳棉棉结、梳棉短绒率、梳棉落棉率、精梳棉结、精梳短绒率、精梳落棉率、粗纱捻系数、原棉棉结、原棉马克隆值、原棉强度以及原棉含杂率等n个输出因素。RT就是建立的输入输出状态转移矩阵。
步骤三:最优配棉:基于输出的最优化规则建模实施配棉,即根据步骤二建立的映射关系模型,利用主因素分析法或核心因素分析法选择最优输出结果,得到成纱最优的配棉因素。
建模包括输入输出映射关系建模以及核心因素或主因素分析算法研究。本发明主要分为两个最优化规则建模,主因素分析法针对较密集的样本数据(如落棉率、原棉棉结、短绒率、马克隆值、原棉强度等),核心因素分析法具有核心突出、抗噪能力较强,两个模型优势互补。
对于多条输出结果如式(8),如何选择最优结果输出显得尤为重要。下面两种分析方法:
(1)主因素分析法
输入因素和输出因素可以表示为(xi,yi),其中xi是一个m维向量,其对应的属性值表示为(φ(xi),pi)。使用非线性映射φ,将输入因素xi变换到高维空间后的输入属性值φ(xi),pi表示输出决策属性值并令其取+1或-1,即分别取值pi=1和-1,分别表示主要因素以及次要因素。分析上述问题后,得到的模型如式(9)所示:
其中,sgn()是常用符号函数,f(x)为模型函数,为最优解,b*为最优的决策属性值。i为起主要作用的向量,起非主要作用的向量对应的αi均为0,上式的求和只对起主要作用的向量进行。由测量值pi=(-1,-1,-1,1,1)经计算α*=(0.202,-0.125,0,1,0),b*=-1。对于一个两类分类问题,假设其是线性可分的,则理论上会有无数个分类平面可以将其分离。如图2所示,o和*代表两个不同的类别,其中两个分类平面A和B可将其分离。由图2可知,分类平面A的决策边缘要大于分类平面B的决策边缘。由于决策边缘较小,则新的未知实例倾向于与训练实例较近,会造成分错类的可能性较大。分类平面A具有最大决策边缘的分类平面为最优分类平面。
本发明中成纱质量预测的逆过程是一个多输入多输出关系,输入因素和输出因素之间相互耦合,根据专家实践经验可得知n个因素里大致哪些因素是对强力、棉结等m个因素会产生主要的影响,其余的只是起到次要影响。这是一个线性不可分的模型,为了分出哪些是主要因素以及次要因素,在这里运用到了核技术,使用函数如式(10)。
在线性不可分模式下,为了得到数据分类挖掘的结果即要得到最优的分类平面。线性不可分意味着对每一个实例xi,无论用什么分类平面进行划分,总有些正例或反例会落在相反的方向。如图3所示。由于39个因素单位不同,数值之间有些差别极大,而有些差别又很小,为画图带来极大不便,在这里横轴表示这39个因素的编号、纵轴表示39个因素数值大小升序排序之后,对应的位置。这样就把39个因素都放进了39*39的网格里了。
那么,最优决策平面的标准除了具有最大决策边缘外,还需要最小化这些分类错误。为此,对每个实例xi,引入非负变量ξi,使式(11)成立:
式(12)中,C是给定的常数,表示对误分类情况的惩罚。可以类似地构造附加条件的函数,即
并对其求导数最小的解为最优w值。
对于线性不可分模式,如果能够通过某种非线性的映射,将每个实例映射到一个高维的空间,在该空间中这些实例变为线性可分模式,从而就可以在该空间中构造最优分类平面。
在高维空间中线性决策配棉因素划分方法。假定原空间中的实例表示为(xi,yi),pi取+1或-1。使用非线性映射φ,将xi变换到高维空间,则新的实例为(φ(xi),yi)。下面给出一种在高维空间中线性决策配棉因素划分方法。为使配棉决策划分对所有样本正确配棉并且具备因素分类间隔,就要求它满足以下约束条件,在该高维空间中线性可分的条件为:
其中,w表示当前最优决策分类划分界线相对水平线的倾斜程度,b表示初始的决策属性值,根据样本训练得到的经验值。在上式中,满足这些不等式中的等式的实例点就是所得到的特征因素向量(或主要因素向量)。
上式(5)的分类间隔可计算为:
在约束式的条件下最大化分类间隔2/||w||可以通过最小化||w||2的方法来实现。那么,为得到清晰的分类,就必须求出,在上述条件式(5)的约束下,求解最优决策分类划分问题可以表示成如下的约束优化:定义最小化函数(7),即
对式(7)求最小化,并满足约束式(5),那么可定义一个含约束条件的目标函数L,然后通过对目标函数L求解。这时的问题就是关于变量w和b,对函数L求极值。
定义目标函数L为:
式中,α≥0表示约束条件的约束权重因子且α=(α1,…,αN),αi≥0是相应第i个输出约束权重因子,N是实例个数,pi是决策属性值。
为使目标函数L最小,对式(8)求解,得到和代入到上式(8)中,得到:
其中,L(α)表示目标函数,αi和αj分别表示对第i个和对第j个输出约束权重因子,pi和pj分别表示第i个和第j个输出决策属性值,φ(xi)和φ(xj)分别表示相应于输入样本xi和xj的映射输入属性值;<·>表示向量的内积。
主因素函数可以将变换后空间的内积转变为原空间的函数,而无需实际进行维度变换,从而解决了维度爆炸问题。由主因素函数的定义,式(9)变为
这里,K(xi,xj)=<φ(xi),φ(xj)>称为主因素函数。通过极值化式(10)求解,求出的αi为最优解αi*。可证明,在实例为特征因素向量或主要因素向量的时候,αi≠0,且
在得出最优α*后,可使用式(16)求出最优的w*和b*,得
这里为输出决策pi=1时对应的最优输入数据。
可求得最优因素决策划分的分类平面,即
由于非主要因素向量对应的αi均为0,因此上式的求和实际上只对主要因素向量进行。利用最优因素决策划分得出哪些因素是主要因素、哪些因素是次要因素。采用主因素分析法构造决策函数的分类器其目的是分出哪些因素是主要因素与次要因素。根据输入因素的重要程度合理调整模型(如在模型的误差校正过程中合理分配权值等)。进一步讲,当需要进一步分出主要因素的重要程度时,只需要增加分类器的个数即可。
(2)核心因素分析法
经过输入输出因素之间映射关系建模之后,算法会输出多条输出因素组成的向量[yi1,yi2,…,yin]。选择每列的均值组成一个新的向量把该向量看作是核心点。输出的多组向量中元素分别与核心点向量元素对应作方差,如式(12)所示。
然后用方差分别与核心点数据比较,即方差分别与设定的阈值相比较,进行投票,获得投票多的向量即可认为满足条件的最优结果并输出。
配棉过程的误差校正部分。
(1)校正映射关系RT
输入因素X到输出因素Y的映射关系模型RT为:
设则
其中,通过将所有数据归一化产生输入因素的权重
ωi1+ωi2+…+ωim=1 (14)
由上可知,可以通过校正权值从而实现校正映射关系矩阵RT的目的。校正时采用如下方法:
ωl=ωl-1+μ(ωl-ωl-1) (15)
其中,ωl为当前权值;ωl-1为前一次计算得到的权值;ω0为初始权值,需要根据样本训练得到经验值;μ为权重的学习率。通过机器学习,逐渐调整映射关系矩阵RT。
(2)校正输出Y,校正模型为:
y″=y1+η(y″-y1) (16)
其中,y″为当前输出值,y1为样本输出值,η为输出的学习率。通过机器学习,有限次(一定步长)地迭代后,得到比较理想的输出结果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于成纱质量预测的配棉方法,其特征在于,其步骤如下:
步骤一:数据预处理:剔除掉数据库中冗余的数据,对样本数据进行拓扑拟合,完善各种情况的样本数据;
步骤二:配棉映射关系建模:将成纱的质量指标作为输入因素,原棉的质量指标作为输出因素,通过映射关系矩阵建立样本数据中输入因素和输出因素之间的映射关系模型;
步骤三:最优配棉:基于输出的最优化规则建模实施配棉,即根据步骤二建立的映射关系模型,利用主因素分析法或核心因素分析法选择最优输出结果,得到成纱最优的配棉因素。
2.根据权利要求1所述的基于成纱质量预测的配棉方法,其特征在于,所述步骤一中的样本数据的拓扑拟合方法为:把输入因素的样本数据看作xi,输出因素的样本数据看作是yi,样本数据中有n+1数据点:(x0,y0),(x1,y1),(x2,y2),…,(xn,yn);输入因素和输出因素的样本数据拟合的方法为:
a.计算输入因素的步长:
hi=xi+1-xi (1)
b.将数据点(xi,yi)带入矩阵方程求得二次微分值mi;
c.计算拟合曲线的系数:
其中,i=0,1,…,n-1;
d.在每个输入因素的子区间xi≤x≤xi+1中,创建方程:
gi(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3 (3)
在子区间xi≤x≤xi+1中均匀选择3-5个点,根据方程gi(x)求解相应的输入因素的样本数据,数据点(x,gi(x))就是拟合的新数值。
3.根据权利要求1或2所述的基于成纱质量预测的配棉方法,其特征在于,所述步骤二中映射关系模型为:
其中,xi=(xi1,xi2,…,xim)是m维的输入因素的向量,yi=(yi1,yi2,…,yin)是n维的输出因素的向量,为输入因素与输出因素之间的映射关系矩阵。
4.根据权利要求3所述的基于成纱质量预测的配棉方法,其特征在于,所述主因素分析法的方法为:对输入因素和输出因素表示为(xi,yi),其对应的属性值表示为(φ(xi),pi);使用非线性映射φ,将输入因素xi变换到高维空间后的输入属性值φ(xi),pi表示输出决策属性值并令其取+1或-1;则新的实例为(φ(xi),pi);
为使配棉决策划分对所有样本正确配棉并且具备因素分类间隔,要求满足以下约束条件:
其中,w表示当前最优决策分类划分界线相对水平线的倾斜程度,b表示初始的决策属性值;满足这些不等式中的等式的实例点就是所得到的特征因素向量或主要因素向量;
上式(5)的分类间隔可计算为:
在约束式的条件下最大化分类间隔2/||w||可通过最小化||w||2来实现;在上述条件式(5)的约束下,求解最优决策分类划分问题表示成如下的约束优化:定义最小化函数(7),即
对式(7)求最小化,并满足约束条件式(5),那么可定义一个含约束条件的目标函数L,然后通过对目标函数L求解;定义目标函数L为:
式中,α≥0表示约束条件的约束权重因子且α=(α1,…,αN),αi≥0是相应第i个输出约束权重因子,N是实例个数,pi是决策属性值;
为使目标函数L最小,对式(8)求解,得到和代入到式(8)中,得到:
其中,L(α)表示目标函数,αi和αj分别表示对第i个和对第j个输出约束权重因子,pi和pj分别表示第i个和第j个输出决策属性值,φ(xi)和φ(xj)分别表示相应于输入样本xi和xj的映射输入属性值;<·>表示向量的内积;
这时,目标函数L(α)变为
这里,K(xi,xj)=<φ(xi),φ(xj)>为主因素函数;
通过极值化式(10)求解,求出的αi为最优解αi *;在实例为特征因素向量或主要因素向量时,αi≠0,且
在得出最优α*后,求出最优的w*和b*:
这里为输出决策pi=1时对应的最优输入数据;
可求得最优因素决策划分:
由于非主要因素向量对应的αi均为0,因此式(11)的求和实际上只对主要因素向量进行;利用最优因素决策划分得出哪些因素是主要因素、哪些因素是次要因素。
5.根据权利要求3所述的基于成纱质量预测的配棉方法,其特征在于,所述核心因素分析法为:多条输出因素组成的向量[yi1,yi2,…,yin],选择每列的均值组成一个新的向量把向量看作是核心点向量;
输出的多组向量中元素分别与核心点向量的元素对应作方差:然后用方差分别与核心点向量相比较,即方差分别与设定的阈值相比较进行投票,获得投票多的向量为满足条件的最优输出结果。
6.根据权利要求3所述的基于成纱质量预测的配棉方法,其特征在于,所述映射关系矩阵的校正方法为:输入因素与输出因素的关系为:
其中,权重ωi=[ωi1,ωi2,…,ωim]是输入因素和输出因素在数据归一下过程中产生的,且ωi1+ωi2+…+ωim=1;通过校正权值实现校正映射关系矩阵RT的目的;
权重的校正方法为:ωl=ωl-1+μ(ωl-ωl-1);
其中,ωl为当前权值;ωl-1为前一次计算得到的权值,初始权值ω0根据样本训练得到经验值,μ为权重的学习率;通过不同的样本数据逐渐调整映射关系RT。
7.根据权利要求3或6所述的基于成纱质量预测的配棉方法,其特征在于,所述输出因素的校正方法为:y″=y1+η(y″-y1);
其中,y″为当前输出值,y1为样本输出值,η为输出学习率;通过不同的样本数据进行机器学习,一定步长迭代后得到比较理想的输出结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811433186.4A CN109636014B (zh) | 2018-11-28 | 2018-11-28 | 一种基于成纱质量预测的配棉方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811433186.4A CN109636014B (zh) | 2018-11-28 | 2018-11-28 | 一种基于成纱质量预测的配棉方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109636014A true CN109636014A (zh) | 2019-04-16 |
CN109636014B CN109636014B (zh) | 2020-05-05 |
Family
ID=66069988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811433186.4A Active CN109636014B (zh) | 2018-11-28 | 2018-11-28 | 一种基于成纱质量预测的配棉方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109636014B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569966A (zh) * | 2019-09-09 | 2019-12-13 | 联想(北京)有限公司 | 一种数据处理方法、装置及电子设备 |
CN114742892A (zh) * | 2022-04-01 | 2022-07-12 | 南通博纳纺织品有限公司 | 基于图像处理的纺织混棉机控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6130746A (en) * | 1994-03-10 | 2000-10-10 | Lawson-Hemphill, Inc. | System and method for electronically evaluating predicted fabric qualities |
CN106097135A (zh) * | 2016-05-30 | 2016-11-09 | 西安工程大学 | 一种面向纺纱质量波动的关键因素提取方法 |
CN107169565A (zh) * | 2017-04-27 | 2017-09-15 | 西安工程大学 | 基于烟花算法改进bp神经网络的纺纱质量预测方法 |
-
2018
- 2018-11-28 CN CN201811433186.4A patent/CN109636014B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6130746A (en) * | 1994-03-10 | 2000-10-10 | Lawson-Hemphill, Inc. | System and method for electronically evaluating predicted fabric qualities |
CN106097135A (zh) * | 2016-05-30 | 2016-11-09 | 西安工程大学 | 一种面向纺纱质量波动的关键因素提取方法 |
CN107169565A (zh) * | 2017-04-27 | 2017-09-15 | 西安工程大学 | 基于烟花算法改进bp神经网络的纺纱质量预测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569966A (zh) * | 2019-09-09 | 2019-12-13 | 联想(北京)有限公司 | 一种数据处理方法、装置及电子设备 |
CN110569966B (zh) * | 2019-09-09 | 2022-09-23 | 联想(北京)有限公司 | 一种数据处理方法、装置及电子设备 |
CN114742892A (zh) * | 2022-04-01 | 2022-07-12 | 南通博纳纺织品有限公司 | 基于图像处理的纺织混棉机控制方法 |
CN114742892B (zh) * | 2022-04-01 | 2023-10-27 | 南通博纳纺织品有限公司 | 基于图像处理的纺织混棉机控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109636014B (zh) | 2020-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Karaboga et al. | Fuzzy clustering with artificial bee colony algorithm | |
CN106779087A (zh) | 一种通用机器学习数据分析平台 | |
CN109492691A (zh) | 一种超图卷积网络模型及其半监督分类方法 | |
CN104809230A (zh) | 一种基于多分类器集成的卷烟感官质量评估方法 | |
CN102622515B (zh) | 一种天气预测方法 | |
CN109118013A (zh) | 一种基于神经网络的经营数据预测方法、可读存储介质和预测系统 | |
CN108351985A (zh) | 用于大规模机器学习的方法和装置 | |
CN107797931A (zh) | 一种基于二次评价的软件质量评价方法及系统 | |
CN109767312A (zh) | 一种信用评估模型训练、评估方法与装置 | |
CN110348608A (zh) | 一种基于模糊聚类算法改进lstm的预测方法 | |
CN106156795A (zh) | 一种可疑洗钱账户的确定方法及装置 | |
CN109214503A (zh) | 基于kpca-la-rbm的输变电工程造价预测方法 | |
CN106874963A (zh) | 一种基于大数据技术的配电网故障诊断方法及系统 | |
CN109636014A (zh) | 一种基于成纱质量预测的配棉方法 | |
CN105930531A (zh) | 一种基于混合模型的农业领域本体知识云维度优选方法 | |
Berntson | The characterization of topology: a comparison of four topological indices for rooted binary trees | |
CN106845696B (zh) | 一种智能优化水资源配置方法 | |
Sun | Real estate evaluation model based on genetic algorithm optimized neural network | |
Sugianto et al. | K-Means Algorithm For Clustering Poverty Data in Bangka Belitung Island Province | |
Iraji et al. | Students classification with adaptive neuro fuzzy | |
CN115660221B (zh) | 基于混合神经网络的油气藏经济可采储量评估方法及系统 | |
Chu et al. | Semantics based substituting technique for reducing code bloat in genetic programming | |
CN113205274A (zh) | 一种施工质量定量化排名方法 | |
TW201816629A (zh) | 多輸出決策屬性選擇暨資料離散化分類方法 | |
Gaber et al. | An entropy-based approach to enhancing Random Forests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |