一种基于机器学习的PCB板订单合拼与排版预测方法及系统与流程

专利2022-06-29  63


本发明涉及pcb板生产领域,尤其涉及一种基于机器学习的pcb板订单合拼与排版预测方法及系统。



背景技术:

随着计算机、电子、通信等高科技产业的高速发展,pcb板产量与生产需求迅猛增长,pcb板生产厂家已逐渐向大批量,多品种生产模式转变。目前国内外较少有对pcb板合拼优化排样优化问题进行较全面的研究、适用的方法以及成熟的应用软件。都是采用传统的人机交互半自动拼板方式,这种方式已不能满足pcb板日益增长的需求。

传统pcb生产企业都是采用大批量,少品种的pcb生产模式,针对这种模式,pcb生产企业采用pcb单拼拼板生产方法大量生产某种pcb板,即通过人工或简单软件将一种pcb子板排样在一张pnl大板上,然后经过其它工序生产成型后,再将pcb子板从pnl大板上切割/分离下来,从而达到一次生产多个同规格pcb子板的目的。

对pcb子板进行单拼或合拼的方式,其拼板功能相对简单,并且属于半自动拼板,即通过人工导入输入文件,然后通过人机交互拼板,从而得到最终拼板结果,过程复杂、花费时间,且拼板效果差。对于pcb板大规模多批次订单合拼与排版下料问题计算规模大,无法快速(短时间)计算出精确的估算生产原料成本,不能提前精确的进行原料采够,指导订单报价等问题目前尚未出现合适的解决方案。

现有的软件与方法并不能快速得出pcb板排版结果,现有的pcb板订单合拼或单拼排版结果存在诸多不足的地方:交互式合拼效率很低、合拼过程依靠人工经验,生产批次较多且拼板结果不合理,受人工因素影响且不适合推广等问题。

对于pcb板样板生产和试制企业,合拼与排版主要存在以下问题:(1)pcb板种类多,批量大:pcb板种类可达到25000多种,工艺复杂;(2)拼板种类多,板材利用率低:生产调整成本高,人工合拼或单拼使得材料利用率较低;(3)交货时间紧:pcb板生产企业订单利润与交货时间息息相关,合拼生产不合理导致企业难以满足对客户快速反应的需要。(4)系统数据的衔接与贯通:pcb板拼板自动化与信息化需要解决。



技术实现要素:

本发明的目的在于提出一种基于机器学习的pcb板订单合拼与排版预测方法及系统,通过预测模型能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该方法与系统能够实现精确的订单合拼与排版预测结果,提高企业生产效率,降低企业生产成本。

为达此目的,本发明采用以下技术方案:一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,包括下述步骤:

样本数据采样:获取pcb板生产过程的订单数据的历史信息数据作为样本数据;

样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;

特征数据提取:提取经过质量分析和预处理的样本数据的特征值;

模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;

模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;

模型评估:根据模型评估值生成预测代理模型并导出模型文件;

生成预测结果:订单数据导入预测代理模型得出预测结果。

优选的,在样本数据采样步骤中:

对获取的多个订单数据进行筛选分类,筛选出具有相同工艺特征,且能够进行同批次合拼生产的订单集合,每一类的订单集合为一个订单组合,对相同工艺可合拼的订单组合进行合拼排版,选择合拼和排版的历史信息数据作为机器学习的样本数据。

优选的,在样本数据的质量分析和预处理步骤中:

对选出的多个样本数据进行质量分析,检查样本数据中是否存在不符合要求,或不能直接进行质量分析的数据;

对不符合要求的样本数据进行预处理操作,解决样本数据的不一致性。

优选的,在特征数据提取步骤中:

提取经过质量分析和预处理的样本数据的六种特征数据,六种特征数据包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合;

将各个集合的数据按增序或降序排序,各个集合生成九个特征值,九个特征值包括最大与最小值的比值、所有值的平均值、所有值的中位值、所有值的标准差、前十分之一个数之和与后十分之一个数之和的比值、前四分之一个数之和与后四分之一个数之和的比值、前二分之一个数之和与后二分之一个数之和的比值、第十分之一个数的数值与第十分之九个数的数值的比值以及第四分之一个数的数值与第四分之三个数的数值的比值。

优选的,还包括第七组特征值,第七组特征值包括原片长、原片宽、切片数量、切片种类、旋转后种类、group数量、修边长、锯缝长、最小大板数以及切片总面积。

优选的,在模型选择步骤中:

与具体解决的问题匹配,选择基于决策树的集成学习模型进行回归预测,集成学习模型包括随机森林算法、极端梯度提升算法和轻量梯度提升机算法。

优选的,在模型参数配置与训练步骤中:

集成学习模型的参数包括模型框架参数和决策树参数,机器学习进行模型框架参数和决策树参数的配置:

机器学习通过sklearn库中的网格搜索方法,结合交叉验证进行模型框架参数和决策树参数的寻优,给定寻优参数范围输入到集成学习模型,输出各参数组合及对应的评分值,筛选出对应的集成学习模型针对预测任务的最优参数;

基于网格搜索方法结合交叉验证寻优方法,将参数范围内的组合进行优化,寻找最优的参数组合值,即随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的具体参数组合;把随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的回归器的基学习器个数和决策树的深度作为寻优参数;将每个模型对应的参数范围输入到机器学习的sklearn库的网格搜索的函数中,通过交叉验证后可输出三种算法模型的各个参数的最优值;如果得到最优参数恰好是参数范围的边界值,则返回模型参数配置过程,重新设置参数范围,进行交叉验证输出最优参数组合值;

确定集成学习模型的最优参数组合后,分别代入集成学习模型中,按照对训练数据的要求,划分样本数据集,开始训练机器学习模型。

优选的,在模型评估步骤中:

算法模型的平均绝对误差(mae),计算公式如下:

算法模型的平均绝对误差百分比(mape),计算公式如下:

测试值与真实值的均方根误差(rmse),计算公式如下:

其中m表示测试样本数,i表示求和的项数,yi表示样本实际标签,表示算法模型预测结果;

对比随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的评估值,根据平均绝对误差、平均绝对误差百分比和均方根误差的数值,选择对pcb板订单合拼排版经验数据回归程度最优的机器学习模型,作为pcb板订单合拼排版的预测代理模型。

优选的,生成预测结果:经过以上步骤的生成的预测代理模型,将新的订单数据作为机器学习模型输入,输出订单组合的排版结果,得到预测拼版种类、版面数和总利用率值。

一种基于机器学习的pcb板订单合拼与排版预测系统,包括订单管理部、合拼筛选与分类模块、订单组合模块、合拼与排样预测模块和合拼审核模块;所述订单管理部用于接收新客户的订单,管理订单数据和pnl原片库存数据,确定生产情况;

所述合拼筛选与分类模块用于对接收订单的所有pcb板进行筛选和分类,筛选出具有相同工艺特征且能同批次合拼生产的订单集合,实现差异化订单批量生产;

订单组合模块为筛选的每一类订单集合,用于根据订单信息与合拼筛选分类的规则,筛选与分类出相同属性的可合拼的订单组合;多个订单组合模块形成订单池;

合拼与排样预测模块用于将订单池的每个可合拼的订单组合的数据输入机器学习的预测代理模型,输出回归预测结果,得出最优的组合与排版方案;

合拼审核模块用于对机器学习的回归预测结果进行合拼审核,评估合拼效果是否达到要求,如果达到要求则进行合拼生产,如果达不到要求,则返回订单池,等待与新的订单进行合拼优化。

本发明采用上述的方法与系统,在实际生产中,运用预测代理模型能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该方法与系统能够实现精确的订单合拼与排版预测结果,提高企业生产效率,提高合拼效率,不需要依靠人工经验,受人工因素影响小,拼板合理程度高,降低企业生产成本。

附图说明

附图对本发明做进一步说明,但附图中的内容不构成对本发明的任何限制。

图1是本发明的pcb板订单合拼与排样预测流程示意图;

图2是本发明中拼板利用率回归模型评估指标的示意图;

图3是本发明系统的连接示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

本实施例的一种基于机器学习的pcb板订单合拼与排版预测方法,包括下述步骤:

样本数据采样:获取pcb板生产过程的订单数据的历史信息数据作为样本数据;

样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;

特征数据提取:提取经过质量分析和预处理的样本数据的特征值;

模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;

模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;

模型评估:根据模型评估值生成预测代理模型并导出模型文件;

生成预测结果:订单数据导入预测代理模型得出预测结果。

效果:机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分,从而有效提高学习效率。

通过对历史订单数据进行采样,筛选能够合拼的订单组合的历史信息数据作为样本数据,对样本数据进行质量分析和预处理,得到高质量的历史信息数据,接着,对历史信息数据进行特征值的提取,根据特征值的实际情况和具体所需解决的问题确定模型,对模型进行参数配置后训练机器学习模型,根据三种算法模型的评估值确定预测代理模型,将新获得的订单数据输入预测代理模型,得出预测结果。

本发明提出了一种基于机器学习的pcb板订单合拼与排版预测方法,在实际生产中,运用该预测代理模型能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该方法与系统能够实现精确的订单合拼与排版预测结果,提高企业生产效率,提高合拼效率,不需要依靠人工经验,受人工因素影响小,拼板合理程度高,降低企业生产成本。

优选的,在样本数据采样步骤中:

对获取的多个订单数据进行筛选分类,筛选出具有相同工艺特征,且能够进行同批次合拼生产的订单集合,每一类的订单集合为一个订单组合,对相同工艺可合拼的订单组合进行合拼排版,选择合拼和排版的历史信息数据作为机器学习的样本数据。

采用这种方法,企业的订单管理部获取多个订单数据,并根据合拼工艺规则库对订单数据的pcb板进行筛选分类,筛选出具有相同工艺特征,且能够同批次合拼生产的订单集合,筛选的每一类订单集合为一个订单组合,获取到同工艺可合拼的订单组合后,将这些订单组合分成几个版面进行合拼排版,在长期生产过程中,企业积累大量的合拼与排版的历史信息数据,选择这些历史信息数据作为机器学习的样本数据。

对历史订单数据进行筛选时,通过合拼工艺规则库,即通过板材、层压、板厚、铜厚、阻焊颜色、字符颜色、孔铜、基铜、表面工艺、交货期、以及工艺流程等筛选条件,对所有pcb板进行筛选分类。

优选的,在样本数据的质量分析和预处理步骤中:

对选出的多个样本数据进行质量分析,检查样本数据中是否存在不符合要求,或不能直接进行质量分析的数据;

对不符合要求的样本数据进行预处理操作,解决样本数据的不一致性。

采用这种方法,不符合数据质量分析的要求指的是:样本数据存在缺失值、异常值、不一致的值、重复数据或含有特殊符号的数据。

预处理操作指的是:填写样本数据中缺少的值、光滑噪声数据或识别并删除离群点,对样本数据进行格式化,标准化,清除异常数据,纠正错误,清除重复数据,从而解决样本数据的不一致性,确保选取的所有样本数据都是高质量的历史信息数据。

优选的,在特征数据提取步骤中:

提取经过质量分析和预处理的样本数据的六种特征数据,六种特征数据包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合;

将各个集合的数据按增序或降序排序,各个集合生成九个特征值,九个特征值包括最大与最小值的比值、所有值的平均值、所有值的中位值、所有值的标准差、前十分之一个数之和与后十分之一个数之和的比值、前四分之一个数之和与后四分之一个数之和的比值、前二分之一个数之和与后二分之一个数之和的比值、第十分之一个数的数值与第十分之九个数的数值的比值以及第四分之一个数的数值与第四分之三个数的数值的比值。

采用这种方法,针对基于机器学习预测pcb板订单合拼和排版结果问题的特点,在选择提取特征值时应体现如下关系:特征数据满足样本矩形与母版之间的尺寸对比关系、各样本矩形之间的数据变化程度以及样本矩形与母版之间的对比关系的变化程度。

每个排样任务依据任务数据生成六种数据集合,包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合。面积集合为原片面积与每个切片面积的比值构成的数据集合;周长集合为原片周长与每个切片周长的比值构成的数据集合;长边集合为原片长边与每个切片长边的比值构成的数据集合;短边集合为原片短边与每个切片短边的比值构成的数据集合;长宽比集合为原片长宽比与每个切片长宽比的比值构成的数据集合;数量集合为每个切片数量构成的数据集合。

六种数据集合中每种数据可生成9个特征值,9个特征值包括最大值与最小值的比值;所有值的平均值;所有值的中位值;所有值的标准差;

前十分之一个数之和与后十分之一个数之和的比值;

前四分之一个数之和与后四分之一个数之和的比值;

前二分之一个数之和与后二分之一个数之和的比值;

第十分之一个数的数值与第十分之九个数的数值的比值;

以及第四分之一个数的数值与第四分之三个数的数值的比值,这六组特征值总计有54个特征值。

优选的,还包括第七组特征值,第七组特征值包括原片长、原片宽、切片数量、切片种类、旋转后种类、group数量、修边长、锯缝长、最小大板数以及切片总面积。

针对pcb板型材排样下料预测问题每个排样任务可提取总计64个特征值。

优选的,在模型选择步骤中:

与具体解决的问题匹配,选择基于决策树的集成学习模型进行回归预测,集成学习模型包括随机森林算法、极端梯度提升算法和轻量梯度提升机算法。

通过熟悉各种模型,如线性模型、决策树、集成模型、svm等,能够解决的问题类型与特征,与要解决的问题进行匹配,比如样本的数量、特征维度和数据特征等综合考虑。

具体选择模型的过程为:

明确本任务的机器学习的类型,本机器学习的类型是属于监督学习中的回归预测,根据过去历史数据,来回归预测将来数据。选择的机器学习的模型具备回归预测功能,比如:线性模型、决策树回归、集成模型、k近邻、svn或深度学习模型等。

分析数据分布的复杂性,判断其是否为线性分布。因为本任务的样本数据是非线性分布数据,所以排除机器学习模型中具备线性回归功能的模型。

根据数据的样本的大小,特征维度,初步选择几个符合数据样本的模型,进行模型训练。

根据模型训练评估结果,选定性能最优的模型,做回归预测任务。

采用上述模型,在pcb板订单合拼与排版回归预测问题研究中,为了获取稳定性高,可靠性好,泛化能力强的回归模型,采用基于集成学习模型作回归预测。在集成学习模型输入pcb板订单合拼与排版的样本数据,即可输出pcb板拼版种类、总利用率以及版面数,输出数据集划分结果,即训练集与测试集之比。

随机森林算法(randomforest)的定义:随机森林是指利用多棵决策树对样本进行训练并预测的一种算法。

极端梯度提升算法(xbgoost)的定义:是boosting算法的其中一种,boosting算法的思想是将许多弱分类器集成在一起,形成一个强分类器。

轻量梯度提升机算法(lightgbm)的定义:是一个梯度boosting框架,使用基于决策树的学习算法。

训练集的定义:帮助训练模型,通过训练集的数据确定拟合曲线的参数。

测试集的定义:测试已经训练好的模型的精确度。

优选的,在模型参数配置与训练步骤中:

集成学习模型的参数包括模型框架参数和决策树参数,机器学习进行模型框架参数和决策树参数的配置:

机器学习通过sklearn库中的网格搜索方法,结合交叉验证进行模型框架参数和决策树参数的寻优,给定寻优参数范围输入到集成学习模型,输出各参数组合及对应的评分值,筛选出对应的集成学习模型针对预测任务的最优参数;

基于网格搜索方法结合交叉验证寻优方法,将参数范围内的组合进行优化,寻找最优的参数组合值,即随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的具体参数组合;把随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的回归器的基学习器个数和决策树的深度作为寻优参数;将每个模型对应的参数范围输入到机器学习的sklearn库的网格搜索的函数中,通过交叉验证后可输出三种算法模型的各个参数的最优值;如果得到最优参数恰好是参数范围的边界值,则返回模型参数配置过程,重新设置参数范围,进行交叉验证输出最优参数组合值;

确定集成学习模型的最优参数组合后,分别代入集成学习模型中,按照对训练数据的要求,划分样本数据集,开始训练机器学习模型。

效果:网格搜索是指定参数值的一种穷举搜索方法,通过将估计函数的参数通过交叉验证的方法进行优化来得到最优的学习算法。

回归模型是一种预测性的建模技术,研究的是因变量和自变量之间的关系。

sklearn,即scikit-learn,是一个建立在scipy基础上的用于机器学习的python模块。scikit-learn包含众多顶级机器学习算法,主要有六大基本功能,分别是分类、回归、聚类、数据将维、模型选择和数据预处理。

优选的,在模型评估步骤中:

算法模型的平均绝对误差(mae),计算公式如下:

算法模型的平均绝对误差百分比(mape),计算公式如下:

测试值与真实值的均方根误差(rmse),计算公式如下:

其中m表示测试样本数,i表示求和的项数,yi表示样本实际标签,表示算法模型预测结果;

对比随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的评估值,根据平均绝对误差、平均绝对误差百分比和均方根误差的数值,选择对pcb板订单合拼排版经验数据回归程度最优的机器学习模型,作为pcb板订单合拼排版的预测代理模型。

效果:算法模型的平均绝对误差(mae):将多个订单池内的任务订单的预测值与实际值进行逐一求绝对误差,将所有绝对误差求和之后除以测试样本数得到平均绝对误差;对多个算法模型比较平均绝对误差,选取误差值最小的算法模型作为符合实际生产中排样问题下料的预测结果。

算法模型的平均绝对误差百分比(mape):平均绝对误差百分比可以衡量模型的稳定性,数值越小说明预测效果越稳定,与平均绝对误差相似,均能够展示预测结果与实际值误差程度。

测试值与真实值误差平方根的均值(rmse):一种定量的衡量方法,方根误差对一组测试数据中的特大或特小误差反映非常敏感,均方根误差很好的反映出模型预测的精密度。

如图2所示,将三种算法模型的评估值进行可视化和直观化的显示,选择其中对pcb板订单合拼排版经验数据回归程度最优的机器学习模型,作为pcb板订单合拼排版的预测代理模型,确定预测代理模型后,保存预测代理模型文件,封装对外接口,便于后续做pcb板订单合拼与排版的实际生产应用。

优选的,生成预测结果:

经过以上步骤的生成的预测代理模型,将新的订单数据作为机器学习模型输入,输出订单组合的排版结果,得到预测拼版种类、版面数和总利用率值。

效果:接收到新的订单时,将订单数据输入预测代理模型,即可快速得出预测拼版种类、版面数和总利用率值,预测结果精确度高。

一种基于机器学习的pcb板订单合拼与排版预测系统,包括订单管理部、合拼筛选与分类模块、订单组合模块、合拼与排样预测模块和合拼审核模块;

所述订单管理部用于接收新客户的订单,管理订单数据和pnl原片库存数据,确定生产情况;

所述合拼筛选与分类模块用于对接收订单的所有pcb板进行筛选和分类,筛选出具有相同工艺特征且能同批次合拼生产的订单集合,实现差异化订单批量生产;

订单组合模块为筛选的每一类订单集合,用于根据订单信息与合拼筛选分类的规则,筛选与分类出相同属性的可合拼的订单组合;多个订单组合模块形成订单池;

合拼与排样预测模块用于将订单池的每个可合拼的订单组合的数据输入机器学习的预测代理模型,输出回归预测结果,得出最优的组合与排版方案;

合拼审核模块用于对机器学习的回归预测结果进行合拼审核,评估合拼效果是否达到要求,如果达到要求则进行合拼生产,如果达不到要求,则返回订单池,等待与新的订单进行合拼优化。

效果:本系统通过订单管理部对订单进行管理,通过合拼筛选与分类模块以及订单组合模块对接收订单进行筛选和分类,接着通过合拼与排样预测模块输出最优的组合与排版方案,即输出排版种、版面数和总利用率,最后通过合拼审核模块评估合拼效果是否达到要求,决定是否将订单返回订单池。

在生产中,运用本系统能够帮助企业更精确的估算生产成本,指导订单报价,引导采购部门准确的进行原料板材采购,协助生产计划人员进行预排产等功能。该系统能够实现精确的订单合拼与排版预测结果,提高合拼效率,不需要依靠人工经验,受人工因素影响小,拼板合理程度高,从而提高企业生产效率,降低企业生产成本。

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。


技术特征:

1.一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,包括下述步骤:

样本数据采样:获取pcb板生产过程的订单数据的历史信息数据作为样本数据;

样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;

特征数据提取:提取经过质量分析和预处理的样本数据的特征值;

模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;

模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;

模型评估:根据模型评估值生成预测代理模型并导出模型文件;

生成预测结果:订单数据导入预测代理模型得出预测结果。

2.根据权利要求1所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,在样本数据采样步骤中:

对获取的多个订单数据进行筛选分类,筛选出具有相同工艺特征,且能够进行同批次合拼生产的订单集合,每一类的订单集合为一个订单组合,对相同工艺可合拼的订单组合进行合拼排版,选择合拼和排版的历史信息数据作为机器学习的样本数据。

3.根据权利要求1所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,在样本数据的质量分析和预处理步骤中:

对选出的多个样本数据进行质量分析,检查样本数据中是否存在不符合要求,或不能直接进行质量分析的数据;

对不符合要求的样本数据进行预处理操作,解决样本数据的不一致性。

4.根据权利要求1所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,在特征数据提取步骤中:

提取经过质量分析和预处理的样本数据的六种特征数据,六种特征数据包括面积集合、周长集合、长边集合、短边集合、长宽比集合和数量集合;

将各个集合的数据按增序或降序排序,各个集合生成九个特征值,九个特征值包括最大与最小值的比值、所有值的平均值、所有值的中位值、所有值的标准差、前十分之一个数之和与后十分之一个数之和的比值、前四分之一个数之和与后四分之一个数之和的比值、前二分之一个数之和与后二分之一个数之和的比值、第十分之一个数的数值与第十分之九个数的数值的比值以及第四分之一个数的数值与第四分之三个数的数值的比值。

5.根据权利要求4所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,还包括第七组特征值,第七组特征值包括原片长、原片宽、切片数量、切片种类、旋转后种类、group数量、修边长、锯缝长、最小大板数以及切片总面积。

6.根据权利要求1所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,在模型选择步骤中:

与具体解决的问题匹配,选择基于决策树的集成学习模型进行回归预测,集成学习模型包括随机森林算法、极端梯度提升算法和轻量梯度提升机算法。

7.根据权利要求6所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,在模型参数配置与训练步骤中:

集成学习模型的参数包括模型框架参数和决策树参数,机器学习进行模型框架参数和决策树参数的配置:

机器学习通过sklearn库中的网格搜索方法,结合交叉验证进行模型框架参数和决策树参数的寻优,给定寻优参数范围输入到集成学习模型,输出各参数组合及对应的评分值,筛选出对应的集成学习模型针对预测任务的最优参数;

基于网格搜索方法结合交叉验证寻优方法,将参数范围内的组合进行优化,寻找最优的参数组合值,即随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的具体参数组合;把随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的回归器的基学习器个数和决策树的深度作为寻优参数;将每个模型对应的参数范围输入到机器学习的sklearn库的网格搜索的函数中,通过交叉验证后可输出三种算法模型的各个参数的最优值;如果得到最优参数恰好是参数范围的边界值,则返回模型参数配置过程,重新设置参数范围,进行交叉验证输出最优参数组合值;

确定集成学习模型的最优参数组合后,分别代入集成学习模型中,按照对训练数据的要求,划分样本数据集,开始训练机器学习模型。

8.根据权利要求1所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,在模型评估步骤中:

算法模型的平均绝对误差(mae),计算公式如下:

算法模型的平均绝对误差百分比(mape),计算公式如下:

测试值与真实值的均方根误差(rmse),计算公式如下:

其中m表示测试样本数,i表示求和的项数,yi表示样本实际标签,表示算法模型预测结果;

对比随机森林算法、极端梯度提升算法和轻量梯度提升机算法三种算法模型的评估值,根据平均绝对误差、平均绝对误差百分比和均方根误差的数值,选择对pcb板订单合拼排版经验数据回归程度最优的机器学习模型,作为pcb板订单合拼排版的预测代理模型。

9.根据权利要求1所述的一种基于机器学习的pcb板订单合拼与排版预测方法,其特征在于,生成预测结果:

经过以上步骤的生成的预测代理模型,将新的订单数据作为机器学习模型输入,输出订单组合的排版结果,得到预测拼版种类、版面数和总利用率值。

10.一种基于机器学习的pcb板订单合拼与排版预测系统,其特征在于,包括订单管理部、合拼筛选与分类模块、订单组合模块、合拼与排样预测模块和合拼审核模块;

所述订单管理部用于接收新客户的订单,管理订单数据和pnl原片库存数据,确定生产情况;

所述合拼筛选与分类模块用于对接收订单的所有pcb板进行筛选和分类,筛选出具有相同工艺特征且能同批次合拼生产的订单集合,实现差异化订单批量生产;

订单组合模块为筛选的每一类订单集合,用于根据订单信息与合拼筛选分类的规则,筛选与分类出相同属性的可合拼的订单组合;多个订单组合模块形成订单池;

合拼与排样预测模块用于将订单池的每个可合拼的订单组合的数据输入机器学习的预测代理模型,输出回归预测结果,得出最优的组合与排版方案;

合拼审核模块用于对机器学习的回归预测结果进行合拼审核,评估合拼效果是否达到要求,如果达到要求则进行合拼生产,如果达不到要求,则返回订单池,等待与新的订单进行合拼优化。

技术总结
本发明公开了一种基于机器学习的PCB板订单合拼与排版预测方法及系统,包括下述步骤:样本数据采样:获取PCB板生产过程的订单数据的历史信息数据作为样本数据;样本数据的质量分析和预处理:对选出的样本数据的进行质量分析和预处理;特征数据提取:提取经过质量分析和预处理的样本数据的特征值;模型选择:根据特征值数据的实际情况和具体要解决的问题来选择模型;模型参数配置与训练:对模型参数进行寻优并进行训练机器学习模型;模型评估:根据模型评估值生成预测代理模型并导出模型文件;生成预测结果;本发明旨在提供一种基于机器学习的PCB板订单合拼与排版预测方法及系统,通过预测模型能够帮助企业更精确的估算生产成本。

技术研发人员:刘强;肖万余;张浩;黄礼辉;黄铭溪
受保护的技术使用者:广东工业大学
技术研发日:2020.01.08
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-52109.html

最新回复(0)