本发明涉及带钢板形控制领域,特别涉及到一种基于深度学习的冷轧带钢板形预测方法。
背景技术:
加工技术的发展对金属板带产品的质量标准要求越来越高,板形研究一直是带钢生产技术的前沿和热点,工业上,通常为了更加直观的衡量出板形,用带钢的翘曲程度来表示板形,假设带钢的翘曲波形按正弦波变化,波长为l,波幅为r,则翘曲程度
技术实现要素:
本发明的目的在于,提出一种预测精度高且可实时预测当前以及后续多个时刻板形的板形预测方法。
为了实现上述目的,本发明所采用的技术方案为:
一种基于深度学习的冷轧带钢板形预测方法,具体包括以下步骤:
s1:通过分析轧钢生产设备生产过程中积累的数据,确定影响板形的因素;将确定出的影响板形的因素作为神经网络输入层的输入特征,机架出口板形值作为神经网络输出层的输出结果;从生产过程积累的数据中提取出输入特征和输出结果数据作为数据集并将数据集进行划分以分别建立神经网络的训练样本和测试样本;
s2:训练出板形预测模型,具体步骤如下:
s21:确定神经网络模型结构:神经网络采用dnn深度神经网络,采用全连接结构,包括输入层、5层隐藏层和输出层;
设计神经网络的激活函数,以使神经网络被搭建为自归一化的神经网络;所述神经网络的激活函数公式为:
其中,λ为一固定参数;
s22:使用训练样本对神经网络进行训练,使用adam算法对神经网络进行优化,选择均方误差作为损失函数,训练出损失函数符合预期的最优模型;
s23:使用测试样本对训练出的最优模型进行评估,若测试样本的损失函数符合预期,则最优网络为板形预测模型,反之,则重复步骤s22直至测试样本的损失函数值符合预期;
s3:调整轧钢生产设备的输入特征,将输入特征参数输入到板形预测模型中,预测输出的板形值,并以此为依据来调整轧钢生产设备的参数。
其中,所述步骤s1中确定影响板形因素的方法具体为:选择冷轧过程中的多个调控参数作为输入参数,对应的出口板形值作为输出,通过建立lasso模型得到多个输入参数与输出的相关关系,将上述相关关系数值大于0.6的输入参数确定为影响板形的因素。
其中,所述步骤s1中的轧钢设备为具有多个机架的冷轧机,所述确定出的影响板形的因素包括:机架中间辊弯辊力,机架轧制力,机架传出张力,机架传入张力,机架卷曲张力,机架中间辊横移量,入口处多个传感器测得的入口板形以及生产时间。
其中,所述步骤s1中还包括输入数据预处理,将数据集中的输入特征进行尺度标准化,使输入特征的数据均值为0,方差为1。
其中,所述步骤s1中的数据预处理还包括:将生产时间靠前的50000条数据剔除。
其中,所述步骤s2中,神经网络激活函数中,λ取值为2.9046。
其中,所述步骤s22中神经网络的参数设置为:学习率=0.05,每次传入模型的数据批大小为128,迭代次数为1000次。
其中,所述步骤s3后还包括步骤s4:模型线下再训练及模型更新,根据新生产环境下获得的数据,输入步骤s21中的神经网络模型中进行训练,并更新参数,获得更新的板形预测模型。
其中,所述步骤s1中的轧钢设备为具有5个机架的冷轧机,所述确定出的影响板形的因素包括:第一至第五机架中间辊弯辊力,第一至第五机架轧制力,第一至第五机架传出张力,第一至第五机架传入张力,机架卷曲张力,第一至第五机架中间辊横移量,入口处多个传感器测得的入口板形以及时间点,每间隔0.08秒选取一个时间点。
本发明的有益效果为:
通过设计神经网络的激活函数,使得神经网络实现自归一化,使得训练过程更加简单高效;构建的dnn网络模型预测准确率高,精度高,精度达到并高于工业要求,可通过模型预报板形结果辅助和指导工业生产过程,减少废钢产出率,降低工业成本。
利用已有的数据对影响板形的因素进行确认,剔除一些对板形无影响或影响极小的因素,而后再将确定出的影响板形的因素作为训练样本进行神经网络的训练,一方面可以降低网络训练的复杂性,另一方面,在对实际生产过程中的板形调整减少需要控制的因素,减少不必要的干扰,使得调整过程更加容易;
在影响板形的因素中选取了时间点作为影响因子,参加神经网络的训练,因此,板形预测模型可以预测到当前时刻以及一个时间段内的板形,可以实时监测板形以及预测若干时间段的板形;
附图说明
图1为本发明冷轧带钢板形预测方法的流程图;
图2为本发明板形预测模型的构建方法的流程图;
图3为本发明一种实施例中随机取一个生产时间点,各个传感器区域板形的预测值和真实值的比较图;
图4为本发明一种实施例中传感器区域f9314在不同生产时间的预测值和真实值的比较结果;
图5为本发明一种实施例中的dnn神经网络模型出口处的36个传感器区域的板形预测值拟合的3d效果图;
图6为本发明一种实施例中不同激活函数分别代入dnn模型得出的结果比较图。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
本实施例中,冷轧机采用唐钢1250mm冷轧机,具有第1到第5共计5个机架,在实际生产过程中,利用安装在机架上的传感器测得数据信息,本实施例中,累计的数据包括了第1机架的板形、第5机架的出口板形以及各个机架工作辊弯辊力和中间辊弯辊力以及各机架的轧制力等。
对已有的数据进行分析,列出可能影响板形的各个因素数据,通过建立lasso模型得到各个因素与板形的相关关系,将相关系数绝对值高于0.6的影响因素作为神经网络输入层的输入特征。确定出的影响因素具体为:第1-5机架工作辊弯辊力,第1-5机架中间辊弯辊力,第1-5机架轧制力,1-5机架传出张力,1-5机架传入张力,卷曲张力,1-5机架中间辊横移量,生产时间,第1机架各传感器区域测得的板形,即,冷轧机编号第13-31传感器位置的入口板形(第1-12区域入口板形为0,特征不显著系数小于0.6,不作为特征),共计51个影响因素。
根据已确定出的影响板形的因素,采集用于测试的数据。每隔0.08s依次采集一组数据序列,生产时间的变化也是影响板形的重要因素,我们取出冷轧机生产中中12分钟的数据,生产时间等51个影响因素为一行作为特征变量,为一组51维的向量,即输入特征;对应每个生产时间在第5机架的各个传感器区域测得的出口板形作为目标变量,即输出结果,本实施例中,第5机架合计设置有36个传感器,即每个生产时间的36个目标变量为输出结果,即一组36维的向量。
冷轧机前12分钟的每个0.08s采集一组输入特征和输出结果的数据,由于前50000条数据是在冷轧机生产的不稳定过程中产生的,因此进行剔除,因此,最终选取了184527条数据,即数据集的维度为(184527,51)和(184527,36)。将采集到的数据集的输入特征x数据和输出结果y数据进行清理和加工后,对数据集进行分割成训练样本和测试样本,划分比例为7:3。
划分后训练样本输入特征x1维度为(129168,51),训练样本输出结果y1维度为(129168,36),测试样本输入特征x2维度为(55359,51),测试样本输出结果y2维度为(55359,36)。
在数据进行训练前,先对数据进行标准化,即对数据集输入特征x即维度为(184527,51)的各列数据做标准化,标准化公式如下:
其中,x为输入特征,m为输入特征的行数,u为每一列的均值,σ2为每一列的方差。经过标准化后,输入特征x的各列的数据分布接近,数据围绕原点分布,数据的均值为0,方差为1。
s2:使用训练样本,训练出板形预测模型,具体步骤如下:
s21:神经网络模型结构确定,本实施例中,选择dnn神经网络模型,神经网络包括输入层、5个隐藏层和输出层,神经网络采用全连接结构;
对于深度学习神经网络,更深的网络,能学到数据中包含的更多信息和特征,因此能够更好地拟合数据,得到更高的预测准确率。但是随着网络层数的不断加深,后层的梯度很难经过过多的层数传递回前层或者后层的梯度经过过多层数的传递导致梯度数值呈现指数级别的增大,此时就产生了梯度消失或者梯度爆炸的问题,导致训练无法有效进行.在深层网络里,为了防止梯度消失或梯度爆炸的情况出现,就必须将网络参数的初始化值设定得较小并且使用批归一化(batchnormalization)等手段来限制各层的输出大小。
本实施例中,所述神经网络的激活函数设计为新型的激活函数,根据深度学习中batchnormalization的思想,考虑设计新型的激活函数,能够实现和代替batchnormalization,带有输出均值为0的激活函数的神经网络,可以被称为自归一化的神经网络,自归一化的神经网络通过激活函数的作用实现batchnormalization,使得训练过程更加简单高效。
设计的激活函数为improvednormalizationswish激活函数,简称为ins激活函数,公式为:
λ的具体计算规则如下:
假设每层的输入是均值为0,方差为1的标准正态分布,每层权重的初始化值服从标准正态分布。
定义一个映射g,g将该层输入的均值u映射为该层输出的均值
则可以具体写为:
假设映射g存在一个不动点(0,0),即g(0)=0,将g(0)=0代入上式,由于上式没有解析解,用numpy生成正态随机数拟合计算,得出λ=2.9046。
接下来证明映射g存在不动点,给出下面的定理:
定理1(布劳威尔不动点定理):设
定理2:实数空间r中每一个有界闭区间[a,b]都是r的紧凸集。
对于
通过numpy生成正态随机数拟合计算,得:
当u∈[-1,1]时,有g(u)∈[-1,1],
由定理2,[-1,1]为非空的紧凸集,而g:[-1,1]→[-1,1]是连续映射,由定理1,g在[-1,1]内存在不动点,假设成立。
因此求得λ=2.9046,ins激活函数公式为:
ins激活函数是非单调的,在x轴正半轴梯度保持为1,大于原swish函数在x轴正半轴的梯度,使得梯度下降更快;在x轴负半轴,在原有函数基础上加大了负梯度的绝对值,使得在负半轴也保持有较快的梯度下降速度,并且在负半轴的输出为负数,用参数λ调节输出负数的大小,使得输出均值为0,加快训练速度。
这样做的有益效果如下:1、减小了网络每层输出内部协变量的偏移,让网络的权重更新更加稳健,尤其在深层神经网络中更加明显,使得网络后层的权重对前层的权重包容性更强,即前层权重的变化对后层权重造成的影响很小,整体网络更加稳健,从而提高了网络的泛华能力;2、对每层的输出进行规范化,使得梯度处于不饱和区域,可以有效规避梯度爆炸和梯度消失的问题;3、保持了权重整体更新的一致性,有效加速了网络的训练过程。
本实施例中,影响出口板形的因素有51个,即输入层神经元个数为51,输入为一个51维的向量,预测的板形值为第五机架出口处的36个传感器竖直,即为36个值,输出为一个36为向量。神经网络构建如下:
第一层:输入层,输入训练样本,单个样本为1个51维的向量;
第二层:隐藏层第一层,输入51维的向量,激活函数为新型激活函数ins,神经元个数为128个,输出128维的向量;
第三层:隐藏层第二层,输入128维的向量,激活函数为新型激活函数ins,神经元个数为128个,输出128维的向量;
第四层:隐藏层第三层,输入128维的向量,激活函数为新型激活函数ins,神经元个数为64个,输出64维的向量;
第五层:隐藏层第四层,输入64维的向量,激活函数为新型激活函数ins,神经元个数为64个,输出64维的向量;
第六层:隐藏层第五层,输入64维的向量,激活函数为新型激活函数ins,神经元个数为36个,输出36维的向量;
第七层:输出层,输入36维的向量,输出36维的向量。
s22:使用训练样本x1和y1导入上述构建的网络模型,使用的损失函数为均方误差mse,采用l2正则化方法,采用的优化方法为adam算法,每次传入模型的数据批大小bitch-size为128,迭代次数为1000次。训练出多个模型,选出其中训练样本均方误差mse最小的模型作为最优模型,本实施例中,选出的最优模型的均方误差mse=1.281。
s23:使用测试样本x2和y2对选出的最优模型进行预测,将测试样本x2导入最优模型中进行测试,得出预测结果y^与y2进行比较,本实施例中,得到的测试样本的均方误差mse为1.305,与训练集的均方误差mse1.281相差较小,模型没有过拟合,上述最优模型即为训练完成的板形预测模型。
随机取一个生产时间的数据进行预测,预测值y^和真实值y的比较结果参见图3,其中,数据单位为i(i为该传感器区域横截面与基准长度的差值和横截面基准长度的比值乘以10的5次方)两个向量在第1维数值相差较大,在其他维的数值相差较小,差值都在区间(0,2)之内,即该样本点的板形预测数值和该点真实数值相比,在传感器区域f939的数值相差较大,在其他传感器区域的数值相差较小。
用百分比误差来评估图3中每一列的预测,f939列的百分比误差最大,为45.14%;f947列的百分比误差最小,几乎为0,百分比误差除了在f939列上较大,在其余列均小于5%,因此该样本点的预测准确率较高.该样本点的预测均方误差为1.166,即各传感器区域的板形预测值与真实值差值的平方平均为1.166.即各传感器测出的出口板形预测值与真实值的差值的平方平均为1.166,预测的准确率较高。
将整个数据集的x导入模型进行预测,得到的预测结果与y做比较,图4展示了预测数组y的第6列与data_y第6列的比较结果,即在f9314传感器区域预测的板形数值与真实板形数值的比较结果:图4显示了f9314列的预测值与真实值情况,即在传感器区域f9314随着生产时间的真实值和预测值的对比,其中,横向坐标的数据单位为t(0.08s=1t),纵坐标的数据单位为i(i为该传感器区域横截面与基准长度的差值和横截面基准长度的比值乘以10的5次方),其中,连续阴影部分为板形真实值,点状标出的为板形的预测值,可以看出模型对于真实值的拟合能力较好,改进后的dnn模型的预测值基本反映了真实值的情况。
上述模型对出口的36个传感器区域的板形数值拟合3d效果图如图5所示,其中数据所取的单位,x轴为t(0.08s=1t),y轴为传感器区间1-35,z轴为板形i(i为该传感器区域横截面与基准长度的差值和横截面基准长度的比值乘以10的5次方)。
s3:利用构建好的板形预测模型,预先输入轧钢生产设备的参数,得到各个时间点的实时板形预测值,以此作为依据,调整轧钢生产设备输入的参数。
对于本发明中对dnn网络设计ins激活函数,对dnn网络性能的提高作用,我们设计对dnn网络选择不同的激活函数,分别测试网络模型的损失率以及准确率,具体如下:
使用mnist科学数据集对改进的swish激活函数(即本发明的ins激活函数,下同)进行测试,与之一同比较的还有sigmoid、relu、swish、elu激活函数.mnist[53]数据集是google实验室的corinnacortes和纽约大学柯朗研究所的yannlecun建立的一个手写数字数据库,训练库60,000张手写数字图像,测试库有10,000张;mnist数据集广泛地用于深度学习领域算法创新和改进的性能评估,是学界公认的能够评估算法性能的标准科学数据集.mnist数据集将通过训练集准确率、测试集准确率以及损失函数的大小和下降情况这四个指标来说明算法的效果.首先设计性能测试所使用的dnn:
第一层:输入层,输入训练样本,单个样本点为1个784维的向量;
第二层:隐藏层第一层,输入784维的向量,包含512个神经元,激活函数为具体测试所用的激活函数,输出512维的向量;
第三层:隐藏层第二层,输入512维的向量,包含512个神经元,激活函数为具体测试所用的激活函数,输出512维的向量;
第四层:输出层,输入512维的向量,输出1个10维的向量,该向量各位置分别代表该输入样本取1-10各数字的概率,使用的激活函数是softmax函数.dnn会将最终输出的10维向量中概率最大数值所对应的位置作为最终的预测结果,通过将预测结果与真实结果做比较,相同记为1,不同记为0,从而计算出最后的准确率.。
将训练数据x_train和y_train导入模型,使用的损失函数为交叉熵损失函数,采用的优化方法为rmsprop算法,每次传入模型的数据批大小batch_size为128,迭代次数为400次,共进行20个epoch,即所有训练样本参与循环迭代共20轮。
首先对改进后的swish激活函数与sigmoid激活函数以及relu激活函数进行性能比较,将上述三种激活函数分别代入构建好的dnn模型,得到结果如图6所示。
从图6可以很明显看出,随着模型从bp网络到dnn再到改进后的dnn(即本发明的dnn网络,下同),模型在训练集和测试集上的mse呈现下降过程.dnn和改进后的dnn模型在预测能力方面大大优于bp网络;而与dnn相比,改进后的dnn模型预测准确率更高,mse更小,通过上述比较可以得出结论,对dnn做出的改进取得了较好的效果,实现了模型损失的进一步下降.将训练好的改进后的dnn模型作为最终的冷轧带钢板形预测模型,与先前其他学者的实验结果和本文实现的传统dnn模型的结果相比,改进后的dnn模型预测精度更高,准确性更高.改进后的dnn模型精度达到并高于工业要求,可通过该模型预报板形结果辅助和指导工业生产过程,减少废钢产出率、降低工业成本,具有显著的实际意义。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
1.一种基于深度学习的冷轧带钢板形预测方法,其特征在于:具体包括以下步骤:
s1:通过分析轧钢生产设备生产过程中积累的数据,确定影响板形的因素;将确定出的影响板形的因素作为神经网络输入层的输入特征,机架出口板形值作为神经网络输出层的输出结果;从生产过程积累的数据中提取出输入特征和输出结果数据作为数据集并将数据集进行划分以分别建立神经网络的训练样本和测试样本;
s2:训练出板形预测模型,具体步骤如下:
s21:确定神经网络模型结构:神经网络采用dnn深度神经网络,采用全连接结构,包括输入层、5层隐藏层和输出层;
设计神经网络的激活函数,以使神经网络被搭建为自归一化的神经网络;所述神经网络的激活函数公式为:
其中,λ为一固定参数;
s22:使用训练样本对神经网络进行训练,使用adam算法对神经网络进行优化,选择均方误差作为损失函数,训练出损失函数符合预期的最优模型;
s23:使用测试样本对训练出的最优模型进行评估,若测试样本的损失函数符合预期,则最优网络为板形预测模型,反之,则重复步骤s22直至测试样本的损失函数值符合预期;
s3:调整轧钢生产设备的输入特征,将输入特征参数输入到板形预测模型中,预测输出的板形值,并以此为依据来调整轧钢生产设备的参数。
2.如权利要求1所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s1中确定影响板形因素的方法具体为:选择冷轧过程中的多个调控参数作为输入参数,对应的出口板形值作为输出,通过建立lasso模型得到多个输入参数与输出的相关关系,将上述相关关系数值大于0.6的输入参数确定为影响板形的因素。
3.如权利要求2所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s1中的轧钢设备为具有多个机架的冷轧机,所述确定出的影响板形的因素包括:机架中间辊弯辊力,机架轧制力,机架传出张力,机架传入张力,机架卷曲张力,机架中间辊横移量,入口处多个传感器测得的入口板形以及生产时间。
4.如权利要求1所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s1中还包括输入数据预处理,将数据集中的输入特征进行尺度标准化,使输入特征的数据均值为0,方差为1。
5.如权利要求4所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s1中的数据预处理还包括:将生产时间靠前的50000条数据剔除。
6.如权利要求1所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s2中,神经网络激活函数中,λ取值为2.9046。
7.如权利要求6所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s22中神经网络的参数设置为:学习率=0.05,每次传入模型的数据批大小为128,迭代次数为1000次。
8.如权利要求1所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s3后还包括步骤s4:模型线下再训练及模型更新,根据新生产环境下获得的数据,输入步骤s21中的神经网络模型中进行训练,并更新参数,获得更新的板形预测模型。
9.如权利要求2所述的一种基于深度学习的冷轧带钢板形预测方法,其特征在于:所述步骤s1中的轧钢设备为具有5个机架的冷轧机,所述确定出的影响板形的因素包括:第一至第五机架中间辊弯辊力,第一至第五机架轧制力,第一至第五机架传出张力,第一至第五机架传入张力,机架卷曲张力,第一至第五机架中间辊横移量,入口处多个传感器测得的入口板形以及时间点,每间隔0.08秒选取一个时间点。
技术总结