CN111242363A - 一种基于机器学习的pcb板订单合拼与排版预测方法及系统 - Google Patents

一种基于机器学习的pcb板订单合拼与排版预测方法及系统 Download PDF

Info

Publication number
CN111242363A
CN111242363A CN202010016099.XA CN202010016099A CN111242363A CN 111242363 A CN111242363 A CN 111242363A CN 202010016099 A CN202010016099 A CN 202010016099A CN 111242363 A CN111242363 A CN 111242363A
Authority
CN
China
Prior art keywords
model
order
data
machine learning
splicing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010016099.XA
Other languages
English (en)
Inventor
刘强
肖万余
张�浩
黄礼辉
黄铭溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202010016099.XA priority Critical patent/CN111242363A/zh
Publication of CN111242363A publication Critical patent/CN111242363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Manufacturing & Machinery (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Factory Administration (AREA)

Abstract

本发明公开了一种基于机器学习的PCB板订单合拼与排版预测方法及系统,包括下述步骤:样本数据采样:获取PCB板生产过程的订单数据的历史信息数据作为样本数据;样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;特征数据提取:提取经过质量分析和预处理的样本数据的特征值;模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;模型评估:根据模型评估值生成预测代理模型并导出模型文件;生成预测结果;本发明旨在提供一种基于机器学习的PCB板订单合拼与排版预测方法及系统,通过预测模型能够帮助企业更精确的估算生产成本。

Description

一种基于机器学习的PCB板订单合拼与排版预测方法及系统
技术领域
本发明涉及PCB板生产领域,尤其涉及一种基于机器学习的PCB板订单合拼与排版预测方法及系统。
背景技术
随着计算机、电子、通信等高科技产业的高速发展,PCB板产量与生产需求迅猛增长,PCB板生产厂家已逐渐向大批量,多品种生产模式转变。目前国内外较少有对PCB板合拼优化排样优化问题进行较全面的研究、适用的方法以及成熟的应用软件。都是采用传统的人机交互半自动拼板方式,这种方式已不能满足PCB板日益增长的需求。
传统PCB生产企业都是采用大批量,少品种的PCB生产模式,针对这种模式,PCB生产企业采用PCB单拼拼板生产方法大量生产某种PCB板,即通过人工或简单软件将一种PCB子板排样在一张PNL大板上,然后经过其它工序生产成型后,再将PCB子板从PNL大板上切割/分离下来,从而达到一次生产多个同规格PCB子板的目的。
对PCB子板进行单拼或合拼的方式,其拼板功能相对简单,并且属于半自动拼板,即通过人工导入输入文件,然后通过人机交互拼板,从而得到最终拼板结果,过程复杂、花费时间,且拼板效果差。对于PCB板大规模多批次订单合拼与排版下料问题计算规模大,无法快速(短时间)计算出精确的估算生产原料成本,不能提前精确的进行原料采够,指导订单报价等问题目前尚未出现合适的解决方案。
现有的软件与方法并不能快速得出PCB板排版结果,现有的PCB板订单合拼或单拼排版结果存在诸多不足的地方:交互式合拼效率很低、合拼过程依靠人工经验,生产批次较多且拼板结果不合理,受人工因素影响且不适合推广等问题。
对于PCB板样板生产和试制企业,合拼与排版主要存在以下问题:(1)PCB板种类多,批量大:PCB板种类可达到25000多种,工艺复杂;(2)拼板种类多,板材利用率低:生产调整成本高,人工合拼或单拼使得材料利用率较低;(3)交货时间紧:PCB板生产企业订单利润与交货时间息息相关,合拼生产不合理导致企业难以满足对客户快速反应的需要。(4)系统数据的衔接与贯通:PCB板拼板自动化与信息化需要解决。
发明内容
本发明的目的在于提出一种基于机器学习的PCB板订单合拼与排版预测方法及系统,通过预测模型能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该方法与系统能够实现精确的订单合拼与排版预测结果,提高企业生产效率,降低企业生产成本。
为达此目的,本发明采用以下技术方案:一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,包括下述步骤:
样本数据采样:获取PCB板生产过程的订单数据的历史信息数据作为样本数据;
样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;
特征数据提取:提取经过质量分析和预处理的样本数据的特征值;
模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;
模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;
模型评估:根据模型评估值生成预测代理模型并导出模型文件;
生成预测结果:订单数据导入预测代理模型得出预测结果。
优选的,在样本数据采样步骤中:
对获取的多个订单数据进行筛选分类,筛选出具有相同工艺特征,且能够进行同批次合拼生产的订单集合,每一类的订单集合为一个订单组合,对相同工艺可合拼的订单组合进行合拼排版,选择合拼和排版的历史信息数据作为机器学习的样本数据。
优选的,在样本数据的质量分析和预处理步骤中:
对选出的多个样本数据进行质量分析,检查样本数据中是否存在不符合要求,或不能直接进行质量分析的数据;
对不符合要求的样本数据进行预处理操作,解决样本数据的不一致性。
优选的,在特征数据提取步骤中:
提取经过质量分析和预处理的样本数据的六种特征数据,六种特征数据包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合;
将各个集合的数据按增序或降序排序,各个集合生成九个特征值,九个特征值包括最大与最小值的比值、所有值的平均值、所有值的中位值、所有值的标准差、前十分之一个数之和与后十分之一个数之和的比值、前四分之一个数之和与后四分之一个数之和的比值、前二分之一个数之和与后二分之一个数之和的比值、第十分之一个数的数值与第十分之九个数的数值的比值以及第四分之一个数的数值与第四分之三个数的数值的比值。
优选的,还包括第七组特征值,第七组特征值包括原片长、原片宽、切片数量、切片种类、旋转后种类、Group数量、修边长、锯缝长、最小大板数以及切片总面积。
优选的,在模型选择步骤中:
与具体解决的问题匹配,选择基于决策树的集成学习模型进行回归预测,集成学习模型包括随机森林算法、极端梯度提升算法和轻量梯度提升机算法。
优选的,在模型参数配置与训练步骤中:
集成学习模型的参数包括模型框架参数和决策树参数,机器学习进行模型框架参数和决策树参数的配置:
机器学习通过sklearn库中的网格搜索方法,结合交叉验证进行模型框架参数和决策树参数的寻优,给定寻优参数范围输入到集成学习模型,输出各参数组合及对应的评分值,筛选出对应的集成学习模型针对预测任务的最优参数;
基于网格搜索方法结合交叉验证寻优方法,将参数范围内的组合进行优化,寻找最优的参数组合值,即随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的具体参数组合;把随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的回归器的基学习器个数和决策树的深度作为寻优参数;将每个模型对应的参数范围输入到机器学习的sklearn库的网格搜索的函数中,通过交叉验证后可输出三种算法模型的各个参数的最优值;如果得到最优参数恰好是参数范围的边界值,则返回模型参数配置过程,重新设置参数范围,进行交叉验证输出最优参数组合值;
确定集成学习模型的最优参数组合后,分别代入集成学习模型中,按照对训练数据的要求,划分样本数据集,开始训练机器学习模型。
优选的,在模型评估步骤中:
算法模型的平均绝对误差(MAE),计算公式如下:
Figure BDA0002358927770000051
算法模型的平均绝对误差百分比(MAPE),计算公式如下:
Figure BDA0002358927770000052
测试值与真实值的均方根误差(RMSE),计算公式如下:
Figure BDA0002358927770000053
其中m表示测试样本数,i表示求和的项数,yi表示样本实际标签,
Figure BDA0002358927770000054
表示算法模型预测结果;
对比随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的评估值,根据平均绝对误差、平均绝对误差百分比和均方根误差的数值,选择对PCB板订单合拼排版经验数据回归程度最优的机器学习模型,作为PCB板订单合拼排版的预测代理模型。
优选的,生成预测结果:经过以上步骤的生成的预测代理模型,将新的订单数据作为机器学习模型输入,输出订单组合的排版结果,得到预测拼版种类、版面数和总利用率值。
一种基于机器学习的PCB板订单合拼与排版预测系统,包括订单管理部、合拼筛选与分类模块、订单组合模块、合拼与排样预测模块和合拼审核模块;所述订单管理部用于接收新客户的订单,管理订单数据和PNL原片库存数据,确定生产情况;
所述合拼筛选与分类模块用于对接收订单的所有PCB板进行筛选和分类,筛选出具有相同工艺特征且能同批次合拼生产的订单集合,实现差异化订单批量生产;
订单组合模块为筛选的每一类订单集合,用于根据订单信息与合拼筛选分类的规则,筛选与分类出相同属性的可合拼的订单组合;多个订单组合模块形成订单池;
合拼与排样预测模块用于将订单池的每个可合拼的订单组合的数据输入机器学习的预测代理模型,输出回归预测结果,得出最优的组合与排版方案;
合拼审核模块用于对机器学习的回归预测结果进行合拼审核,评估合拼效果是否达到要求,如果达到要求则进行合拼生产,如果达不到要求,则返回订单池,等待与新的订单进行合拼优化。
本发明采用上述的方法与系统,在实际生产中,运用预测代理模型能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该方法与系统能够实现精确的订单合拼与排版预测结果,提高企业生产效率,提高合拼效率,不需要依靠人工经验,受人工因素影响小,拼板合理程度高,降低企业生产成本。
附图说明
附图对本发明做进一步说明,但附图中的内容不构成对本发明的任何限制。
图1是本发明的PCB板订单合拼与排样预测流程示意图;
图2是本发明中拼板利用率回归模型评估指标的示意图;
图3是本发明系统的连接示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本实施例的一种基于机器学习的PCB板订单合拼与排版预测方法,包括下述步骤:
样本数据采样:获取PCB板生产过程的订单数据的历史信息数据作为样本数据;
样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;
特征数据提取:提取经过质量分析和预处理的样本数据的特征值;
模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;
模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;
模型评估:根据模型评估值生成预测代理模型并导出模型文件;
生成预测结果:订单数据导入预测代理模型得出预测结果。
效果:机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分,从而有效提高学习效率。
通过对历史订单数据进行采样,筛选能够合拼的订单组合的历史信息数据作为样本数据,对样本数据进行质量分析和预处理,得到高质量的历史信息数据,接着,对历史信息数据进行特征值的提取,根据特征值的实际情况和具体所需解决的问题确定模型,对模型进行参数配置后训练机器学习模型,根据三种算法模型的评估值确定预测代理模型,将新获得的订单数据输入预测代理模型,得出预测结果。
本发明提出了一种基于机器学习的PCB板订单合拼与排版预测方法,在实际生产中,运用该预测代理模型能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该方法与系统能够实现精确的订单合拼与排版预测结果,提高企业生产效率,提高合拼效率,不需要依靠人工经验,受人工因素影响小,拼板合理程度高,降低企业生产成本。
优选的,在样本数据采样步骤中:
对获取的多个订单数据进行筛选分类,筛选出具有相同工艺特征,且能够进行同批次合拼生产的订单集合,每一类的订单集合为一个订单组合,对相同工艺可合拼的订单组合进行合拼排版,选择合拼和排版的历史信息数据作为机器学习的样本数据。
采用这种方法,企业的订单管理部获取多个订单数据,并根据合拼工艺规则库对订单数据的PCB板进行筛选分类,筛选出具有相同工艺特征,且能够同批次合拼生产的订单集合,筛选的每一类订单集合为一个订单组合,获取到同工艺可合拼的订单组合后,将这些订单组合分成几个版面进行合拼排版,在长期生产过程中,企业积累大量的合拼与排版的历史信息数据,选择这些历史信息数据作为机器学习的样本数据。
对历史订单数据进行筛选时,通过合拼工艺规则库,即通过板材、层压、板厚、铜厚、阻焊颜色、字符颜色、孔铜、基铜、表面工艺、交货期、以及工艺流程等筛选条件,对所有PCB板进行筛选分类。
优选的,在样本数据的质量分析和预处理步骤中:
对选出的多个样本数据进行质量分析,检查样本数据中是否存在不符合要求,或不能直接进行质量分析的数据;
对不符合要求的样本数据进行预处理操作,解决样本数据的不一致性。
采用这种方法,不符合数据质量分析的要求指的是:样本数据存在缺失值、异常值、不一致的值、重复数据或含有特殊符号的数据。
预处理操作指的是:填写样本数据中缺少的值、光滑噪声数据或识别并删除离群点,对样本数据进行格式化,标准化,清除异常数据,纠正错误,清除重复数据,从而解决样本数据的不一致性,确保选取的所有样本数据都是高质量的历史信息数据。
优选的,在特征数据提取步骤中:
提取经过质量分析和预处理的样本数据的六种特征数据,六种特征数据包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合;
将各个集合的数据按增序或降序排序,各个集合生成九个特征值,九个特征值包括最大与最小值的比值、所有值的平均值、所有值的中位值、所有值的标准差、前十分之一个数之和与后十分之一个数之和的比值、前四分之一个数之和与后四分之一个数之和的比值、前二分之一个数之和与后二分之一个数之和的比值、第十分之一个数的数值与第十分之九个数的数值的比值以及第四分之一个数的数值与第四分之三个数的数值的比值。
采用这种方法,针对基于机器学习预测PCB板订单合拼和排版结果问题的特点,在选择提取特征值时应体现如下关系:特征数据满足样本矩形与母版之间的尺寸对比关系、各样本矩形之间的数据变化程度以及样本矩形与母版之间的对比关系的变化程度。
每个排样任务依据任务数据生成六种数据集合,包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合。面积集合为原片面积与每个切片面积的比值构成的数据集合;周长集合为原片周长与每个切片周长的比值构成的数据集合;长边集合为原片长边与每个切片长边的比值构成的数据集合;短边集合为原片短边与每个切片短边的比值构成的数据集合;长宽比集合为原片长宽比与每个切片长宽比的比值构成的数据集合;数量集合为每个切片数量构成的数据集合。
六种数据集合中每种数据可生成9个特征值,9个特征值包括最大值与最小值的比值;所有值的平均值;所有值的中位值;所有值的标准差;
前十分之一个数之和与后十分之一个数之和的比值;
前四分之一个数之和与后四分之一个数之和的比值;
前二分之一个数之和与后二分之一个数之和的比值;
第十分之一个数的数值与第十分之九个数的数值的比值;
以及第四分之一个数的数值与第四分之三个数的数值的比值,这六组特征值总计有54个特征值。
优选的,还包括第七组特征值,第七组特征值包括原片长、原片宽、切片数量、切片种类、旋转后种类、Group数量、修边长、锯缝长、最小大板数以及切片总面积。
针对PCB板型材排样下料预测问题每个排样任务可提取总计64个特征值。
优选的,在模型选择步骤中:
与具体解决的问题匹配,选择基于决策树的集成学习模型进行回归预测,集成学习模型包括随机森林算法、极端梯度提升算法和轻量梯度提升机算法。
通过熟悉各种模型,如线性模型、决策树、集成模型、SVM等,能够解决的问题类型与特征,与要解决的问题进行匹配,比如样本的数量、特征维度和数据特征等综合考虑。
具体选择模型的过程为:
明确本任务的机器学习的类型,本机器学习的类型是属于监督学习中的回归预测,根据过去历史数据,来回归预测将来数据。选择的机器学习的模型具备回归预测功能,比如:线性模型、决策树回归、集成模型、K近邻、SVN或深度学习模型等。
分析数据分布的复杂性,判断其是否为线性分布。因为本任务的样本数据是非线性分布数据,所以排除机器学习模型中具备线性回归功能的模型。
根据数据的样本的大小,特征维度,初步选择几个符合数据样本的模型,进行模型训练。
根据模型训练评估结果,选定性能最优的模型,做回归预测任务。
采用上述模型,在PCB板订单合拼与排版回归预测问题研究中,为了获取稳定性高,可靠性好,泛化能力强的回归模型,采用基于集成学习模型作回归预测。在集成学习模型输入PCB板订单合拼与排版的样本数据,即可输出PCB板拼版种类、总利用率以及版面数,输出数据集划分结果,即训练集与测试集之比。
随机森林算法(RandomForest)的定义:随机森林是指利用多棵决策树对样本进行训练并预测的一种算法。
极端梯度提升算法(XBGoost)的定义:是Boosting算法的其中一种,Boosting算法的思想是将许多弱分类器集成在一起,形成一个强分类器。
轻量梯度提升机算法(LightGBM)的定义:是一个梯度Boosting框架,使用基于决策树的学习算法。
训练集的定义:帮助训练模型,通过训练集的数据确定拟合曲线的参数。
测试集的定义:测试已经训练好的模型的精确度。
优选的,在模型参数配置与训练步骤中:
集成学习模型的参数包括模型框架参数和决策树参数,机器学习进行模型框架参数和决策树参数的配置:
机器学习通过sklearn库中的网格搜索方法,结合交叉验证进行模型框架参数和决策树参数的寻优,给定寻优参数范围输入到集成学习模型,输出各参数组合及对应的评分值,筛选出对应的集成学习模型针对预测任务的最优参数;
基于网格搜索方法结合交叉验证寻优方法,将参数范围内的组合进行优化,寻找最优的参数组合值,即随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的具体参数组合;把随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的回归器的基学习器个数和决策树的深度作为寻优参数;将每个模型对应的参数范围输入到机器学习的sklearn库的网格搜索的函数中,通过交叉验证后可输出三种算法模型的各个参数的最优值;如果得到最优参数恰好是参数范围的边界值,则返回模型参数配置过程,重新设置参数范围,进行交叉验证输出最优参数组合值;
确定集成学习模型的最优参数组合后,分别代入集成学习模型中,按照对训练数据的要求,划分样本数据集,开始训练机器学习模型。
效果:网格搜索是指定参数值的一种穷举搜索方法,通过将估计函数的参数通过交叉验证的方法进行优化来得到最优的学习算法。
回归模型是一种预测性的建模技术,研究的是因变量和自变量之间的关系。
Sklearn,即scikit-learn,是一个建立在Scipy基础上的用于机器学习的Python模块。scikit-learn包含众多顶级机器学习算法,主要有六大基本功能,分别是分类、回归、聚类、数据将维、模型选择和数据预处理。
优选的,在模型评估步骤中:
算法模型的平均绝对误差(MAE),计算公式如下:
Figure BDA0002358927770000121
算法模型的平均绝对误差百分比(MAPE),计算公式如下:
Figure BDA0002358927770000122
测试值与真实值的均方根误差(RMSE),计算公式如下:
Figure BDA0002358927770000131
其中m表示测试样本数,i表示求和的项数,yi表示样本实际标签,
Figure BDA0002358927770000132
表示算法模型预测结果;
对比随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的评估值,根据平均绝对误差、平均绝对误差百分比和均方根误差的数值,选择对PCB板订单合拼排版经验数据回归程度最优的机器学习模型,作为PCB板订单合拼排版的预测代理模型。
效果:算法模型的平均绝对误差(MAE):将多个订单池内的任务订单的预测值与实际值进行逐一求绝对误差,将所有绝对误差求和之后除以测试样本数得到平均绝对误差;对多个算法模型比较平均绝对误差,选取误差值最小的算法模型作为符合实际生产中排样问题下料的预测结果。
算法模型的平均绝对误差百分比(MAPE):平均绝对误差百分比可以衡量模型的稳定性,数值越小说明预测效果越稳定,与平均绝对误差相似,均能够展示预测结果与实际值误差程度。
测试值与真实值误差平方根的均值(RMSE):一种定量的衡量方法,方根误差对一组测试数据中的特大或特小误差反映非常敏感,均方根误差很好的反映出模型预测的精密度。
如图2所示,将三种算法模型的评估值进行可视化和直观化的显示,选择其中对PCB板订单合拼排版经验数据回归程度最优的机器学习模型,作为PCB板订单合拼排版的预测代理模型,确定预测代理模型后,保存预测代理模型文件,封装对外接口,便于后续做PCB板订单合拼与排版的实际生产应用。
优选的,生成预测结果:
经过以上步骤的生成的预测代理模型,将新的订单数据作为机器学习模型输入,输出订单组合的排版结果,得到预测拼版种类、版面数和总利用率值。
效果:接收到新的订单时,将订单数据输入预测代理模型,即可快速得出预测拼版种类、版面数和总利用率值,预测结果精确度高。
一种基于机器学习的PCB板订单合拼与排版预测系统,包括订单管理部、合拼筛选与分类模块、订单组合模块、合拼与排样预测模块和合拼审核模块;
所述订单管理部用于接收新客户的订单,管理订单数据和PNL原片库存数据,确定生产情况;
所述合拼筛选与分类模块用于对接收订单的所有PCB板进行筛选和分类,筛选出具有相同工艺特征且能同批次合拼生产的订单集合,实现差异化订单批量生产;
订单组合模块为筛选的每一类订单集合,用于根据订单信息与合拼筛选分类的规则,筛选与分类出相同属性的可合拼的订单组合;多个订单组合模块形成订单池;
合拼与排样预测模块用于将订单池的每个可合拼的订单组合的数据输入机器学习的预测代理模型,输出回归预测结果,得出最优的组合与排版方案;
合拼审核模块用于对机器学习的回归预测结果进行合拼审核,评估合拼效果是否达到要求,如果达到要求则进行合拼生产,如果达不到要求,则返回订单池,等待与新的订单进行合拼优化。
效果:本系统通过订单管理部对订单进行管理,通过合拼筛选与分类模块以及订单组合模块对接收订单进行筛选和分类,接着通过合拼与排样预测模块输出最优的组合与排版方案,即输出排版种、版面数和总利用率,最后通过合拼审核模块评估合拼效果是否达到要求,决定是否将订单返回订单池。
在生产中,运用本系统能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该系统能够实现精确的订单合拼与排版预测结果,提高合拼效率,不需要依靠人工经验,受人工因素影响小,拼板合理程度高,从而提高企业生产效率,降低企业生产成本。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (10)

1.一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,包括下述步骤:
样本数据采样:获取PCB板生产过程的订单数据的历史信息数据作为样本数据;
样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;
特征数据提取:提取经过质量分析和预处理的样本数据的特征值;
模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;
模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;
模型评估:根据模型评估值生成预测代理模型并导出模型文件;
生成预测结果:订单数据导入预测代理模型得出预测结果。
2.根据权利要求1所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,在样本数据采样步骤中:
对获取的多个订单数据进行筛选分类,筛选出具有相同工艺特征,且能够进行同批次合拼生产的订单集合,每一类的订单集合为一个订单组合,对相同工艺可合拼的订单组合进行合拼排版,选择合拼和排版的历史信息数据作为机器学习的样本数据。
3.根据权利要求1所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,在样本数据的质量分析和预处理步骤中:
对选出的多个样本数据进行质量分析,检查样本数据中是否存在不符合要求,或不能直接进行质量分析的数据;
对不符合要求的样本数据进行预处理操作,解决样本数据的不一致性。
4.根据权利要求1所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,在特征数据提取步骤中:
提取经过质量分析和预处理的样本数据的六种特征数据,六种特征数据包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合;
将各个集合的数据按增序或降序排序,各个集合生成九个特征值,九个特征值包括最大与最小值的比值、所有值的平均值、所有值的中位值、所有值的标准差、前十分之一个数之和与后十分之一个数之和的比值、前四分之一个数之和与后四分之一个数之和的比值、前二分之一个数之和与后二分之一个数之和的比值、第十分之一个数的数值与第十分之九个数的数值的比值以及第四分之一个数的数值与第四分之三个数的数值的比值。
5.根据权利要求4所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,还包括第七组特征值,第七组特征值包括原片长、原片宽、切片数量、切片种类、旋转后种类、Group数量、修边长、锯缝长、最小大板数以及切片总面积。
6.根据权利要求1所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,在模型选择步骤中:
与具体解决的问题匹配,选择基于决策树的集成学习模型进行回归预测,集成学习模型包括随机森林算法、极端梯度提升算法和轻量梯度提升机算法。
7.根据权利要求6所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,在模型参数配置与训练步骤中:
集成学习模型的参数包括模型框架参数和决策树参数,机器学习进行模型框架参数和决策树参数的配置:
机器学习通过sklearn库中的网格搜索方法,结合交叉验证进行模型框架参数和决策树参数的寻优,给定寻优参数范围输入到集成学习模型,输出各参数组合及对应的评分值,筛选出对应的集成学习模型针对预测任务的最优参数;
基于网格搜索方法结合交叉验证寻优方法,将参数范围内的组合进行优化,寻找最优的参数组合值,即随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的具体参数组合;把随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的回归器的基学习器个数和决策树的深度作为寻优参数;将每个模型对应的参数范围输入到机器学习的sklearn库的网格搜索的函数中,通过交叉验证后可输出三种算法模型的各个参数的最优值;如果得到最优参数恰好是参数范围的边界值,则返回模型参数配置过程,重新设置参数范围,进行交叉验证输出最优参数组合值;
确定集成学习模型的最优参数组合后,分别代入集成学习模型中,按照对训练数据的要求,划分样本数据集,开始训练机器学习模型。
8.根据权利要求1所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,在模型评估步骤中:
算法模型的平均绝对误差(MAE),计算公式如下:
Figure FDA0002358927760000031
算法模型的平均绝对误差百分比(MAPE),计算公式如下:
Figure FDA0002358927760000032
测试值与真实值的均方根误差(RMSE),计算公式如下:
Figure FDA0002358927760000033
其中m表示测试样本数,i表示求和的项数,yi表示样本实际标签,
Figure FDA0002358927760000034
表示算法模型预测结果;
对比随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的评估值,根据平均绝对误差、平均绝对误差百分比和均方根误差的数值,选择对PCB板订单合拼排版经验数据回归程度最优的机器学习模型,作为PCB板订单合拼排版的预测代理模型。
9.根据权利要求1所述的一种基于机器学习的PCB板订单合拼与排版预测方法,其特征在于,生成预测结果:
经过以上步骤的生成的预测代理模型,将新的订单数据作为机器学习模型输入,输出订单组合的排版结果,得到预测拼版种类、版面数和总利用率值。
10.一种基于机器学习的PCB板订单合拼与排版预测系统,其特征在于,包括订单管理部、合拼筛选与分类模块、订单组合模块、合拼与排样预测模块和合拼审核模块;
所述订单管理部用于接收新客户的订单,管理订单数据和PNL原片库存数据,确定生产情况;
所述合拼筛选与分类模块用于对接收订单的所有PCB板进行筛选和分类,筛选出具有相同工艺特征且能同批次合拼生产的订单集合,实现差异化订单批量生产;
订单组合模块为筛选的每一类订单集合,用于根据订单信息与合拼筛选分类的规则,筛选与分类出相同属性的可合拼的订单组合;多个订单组合模块形成订单池;
合拼与排样预测模块用于将订单池的每个可合拼的订单组合的数据输入机器学习的预测代理模型,输出回归预测结果,得出最优的组合与排版方案;
合拼审核模块用于对机器学习的回归预测结果进行合拼审核,评估合拼效果是否达到要求,如果达到要求则进行合拼生产,如果达不到要求,则返回订单池,等待与新的订单进行合拼优化。
CN202010016099.XA 2020-01-08 2020-01-08 一种基于机器学习的pcb板订单合拼与排版预测方法及系统 Pending CN111242363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010016099.XA CN111242363A (zh) 2020-01-08 2020-01-08 一种基于机器学习的pcb板订单合拼与排版预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010016099.XA CN111242363A (zh) 2020-01-08 2020-01-08 一种基于机器学习的pcb板订单合拼与排版预测方法及系统

Publications (1)

Publication Number Publication Date
CN111242363A true CN111242363A (zh) 2020-06-05

Family

ID=70874258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010016099.XA Pending CN111242363A (zh) 2020-01-08 2020-01-08 一种基于机器学习的pcb板订单合拼与排版预测方法及系统

Country Status (1)

Country Link
CN (1) CN111242363A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112130453A (zh) * 2020-07-30 2020-12-25 浙江中控技术股份有限公司 基于机器学习的提高mcs生产平稳性的控制方法及系统
CN112365047A (zh) * 2020-11-10 2021-02-12 山东世纪开元电子商务集团有限公司 一种拼版优化方法及系统
CN112711236A (zh) * 2020-12-29 2021-04-27 安徽捷圆电子科技有限公司 一种反向拼板系统
CN112766620A (zh) * 2021-04-07 2021-05-07 浙江大胜达包装股份有限公司 异形瓦楞纸在线定制生产平台及方法
CN113053476A (zh) * 2021-04-30 2021-06-29 清远欧派集成家居有限公司 一种提升平面材料切割时利用率的方法和系统
CN113743498A (zh) * 2021-09-02 2021-12-03 美视(杭州)人工智能科技有限公司 一种角膜塑形镜验配okai解决方法
CN114723531A (zh) * 2022-04-12 2022-07-08 武汉中潜咨询有限责任公司 一种线上订单创建智能审核方法、系统及计算机存储介质
CN116629520A (zh) * 2023-04-27 2023-08-22 苏州大学 一种瓦楞纸板双刀加工线集成控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678408A (zh) * 2015-12-30 2016-06-15 广州兴森快捷电路科技有限公司 Pcb板合拼方法及合拼系统
CN108811345A (zh) * 2018-08-09 2018-11-13 广东工业大学 一种考虑多种工艺约束的pcb排样优化方法
CN109145423A (zh) * 2018-08-09 2019-01-04 广东工业大学 一种pcb合拼与排样集成优化方法及系统
CN109543899A (zh) * 2018-11-20 2019-03-29 燕山大学 基于深度学习的二维轮廓排样定序方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678408A (zh) * 2015-12-30 2016-06-15 广州兴森快捷电路科技有限公司 Pcb板合拼方法及合拼系统
CN108811345A (zh) * 2018-08-09 2018-11-13 广东工业大学 一种考虑多种工艺约束的pcb排样优化方法
CN109145423A (zh) * 2018-08-09 2019-01-04 广东工业大学 一种pcb合拼与排样集成优化方法及系统
CN109543899A (zh) * 2018-11-20 2019-03-29 燕山大学 基于深度学习的二维轮廓排样定序方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
(法)奥雷利安•杰龙: "《机器学习实战:基于scikit-learn和TensorFlow》", 31 August 2018 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112130453A (zh) * 2020-07-30 2020-12-25 浙江中控技术股份有限公司 基于机器学习的提高mcs生产平稳性的控制方法及系统
CN112365047A (zh) * 2020-11-10 2021-02-12 山东世纪开元电子商务集团有限公司 一种拼版优化方法及系统
CN112365047B (zh) * 2020-11-10 2021-08-27 世纪开元智印互联科技集团股份有限公司 一种拼版优化方法及系统
CN112711236A (zh) * 2020-12-29 2021-04-27 安徽捷圆电子科技有限公司 一种反向拼板系统
CN112766620A (zh) * 2021-04-07 2021-05-07 浙江大胜达包装股份有限公司 异形瓦楞纸在线定制生产平台及方法
CN113053476A (zh) * 2021-04-30 2021-06-29 清远欧派集成家居有限公司 一种提升平面材料切割时利用率的方法和系统
CN113743498A (zh) * 2021-09-02 2021-12-03 美视(杭州)人工智能科技有限公司 一种角膜塑形镜验配okai解决方法
CN114723531A (zh) * 2022-04-12 2022-07-08 武汉中潜咨询有限责任公司 一种线上订单创建智能审核方法、系统及计算机存储介质
CN116629520A (zh) * 2023-04-27 2023-08-22 苏州大学 一种瓦楞纸板双刀加工线集成控制方法
CN116629520B (zh) * 2023-04-27 2024-03-15 苏州大学 一种瓦楞纸板双刀加工线集成控制方法

Similar Documents

Publication Publication Date Title
CN111242363A (zh) 一种基于机器学习的pcb板订单合拼与排版预测方法及系统
CN109597968B (zh) 基于smt大数据的锡膏印刷性能影响因素分析方法
CN111353528B (zh) 一种基于下料利用率预测的组批与排样迭代优化方法
Huang et al. Manufacturing system modeling for productivity improvement
CN114444986B (zh) 产品分析方法及系统及装置及介质
CN105372581A (zh) 挠性电路板制造过程自动监测和智能分析系统及方法
CN111460138A (zh) 一种基于bim的数字化工程监理方法与系统
CN108345670B (zh) 一种用于95598电力工单的服务热点发现方法
CN102479357B (zh) 一种产品开发系统
CN102214261A (zh) 印刷电路板加工数据自动审查方法
CN105260835A (zh) 多来源业务大数据的建模、分析、自我优化的方法
CN112558931A (zh) 一种面向用户工作流模式的智能模型构建及运行方法
CN114048436A (zh) 一种预测企业财务数据模型构建方法及构建装置
CN112232352A (zh) 一种智能识别pcb图纸自动计价系统和方法
CN109299252A (zh) 基于机器学习的股票评论的观点极性分类方法和装置
CN117453764A (zh) 一种数据挖掘分析方法
CN116860720A (zh) 一种面向大数据分析的多源异构数据模型建模系统
CN116611710A (zh) 一种可视化动态展示方法及系统
CN116009495A (zh) 基于数字孪生的资源模型建立方法、装置、设备和介质
CN109300030A (zh) 实现股票投资推荐的方法和装置
CN115169832A (zh) 一种基于曲线形态变化的敏感性分析方法及系统
CN111815125A (zh) 基于技术图谱的创新实体科技评价体系优化方法及装置
Chen et al. Using data mining technology to deign an quality control system for manufacturing industry
CN110533093A (zh) 一种汽车前脸品牌家族化分析方法
CN117435489A (zh) 基于需求文档自动分析软件功能点方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605