基于聚类分析和随机森林回归的核电机组电功率预测方法与流程

专利2022-06-29  55


本发明属于电力系统领域,涉及一种基于聚类分析和随机森林回归的核电机组电功率预测方法。



背景技术:

核能因其清洁、发电稳定的特性,在世界能源结构中占有重要地位。以法国、美国、德国为首的一批发达国家早已大力发展核电技术。面对日趋严重的资源、环境压力,我国能源形势日渐严峻,调整能源结构刻不容缓。2020年核电装机容量有望达到5800万千瓦,持续上升的装机规模促使人们关注核电机组运行中产生的问题。

近年来,国内某核电站由于取、排水口的布置问题,机组夏季运行时全潮平均温升偏大于设计温升,海水温度的变化引起机组背压的变化,出现了夏季工况机组输出电功率偏低的现象,具体表现为涨落潮期间凝汽器海水入口温度快速变化。为了避免机组在海水温度上升最高期间反应堆热功率超过100%,需要在日常运行时限制机组出力。针对这个问题,对机组运行数据进行监测,利用机组运行的历史数据,建立机组运行参数对机组电功率影响关系,从而准确预测机组电功率变化,对汽轮机高压调节阀开度调整提供运行指导。

在核电机组实际运行时,影响机组电功率的参数多种多样,并且这些参数间具有很强的相关性和共线性,从理论上很难分析各个参数单独作用于机组电功率的机理,而传统的多元线性回归模型又难以达到较高的拟合精度;随机森林回归模型相较于传统的回归模型,具有泛化能力强、训练速度快、实现简单、预测准确等优势,现已应用于风电领域预测,但未在核电机组得到应用,因此对于随机森林回归模型在核电站常规岛的应用研究具有重要意义。



技术实现要素:

本发明采用的是基于聚类分析和随机森林回归的核电机组电功率预测方法。通过聚类分析对机组的历史运行数据进行特征提取,用以训练随机森林回归模型,从而可以根据机组实时运行数据预测机组电功率。由于通过聚类分析实现了数据降维,通过构建随机森林回归模型避免了构建机理模型,本发明具有预测精度高、预测速度快、泛化能力强的优点。

本发明采用如下技术方案:

基于聚类分析和随机森林回归的核电机组电功率预测方法,包括以下步骤:

(1)获取机组历史运行数据。

(2)对机组历史运行数据进行清洗,剔除异常数据。

(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值。

(4)采用标准化的方法对特征值和目标值(电功率)进行无量纲化处理,由此得到用于随机森林回归的数据集。

标准化的公式可表达为:

式中,x为标准化后的样本值,x为原样本值,为原样本的均值,s为原样本的标准差。

(5)对步骤(4)得到的数据集进行拆分,得到训练集和测试集。训练集用于训练随机森林回归模型,测试集用于评估随机森林回归模型的预测效果。

(6)建立随机森林回归模型,使用训练集对其进行训练。

(7)使用测试集对随机森林回归模型进行测试,采用平均绝对误差(mae)、均方误差(mse)、r平方值三种评估指标,评估随机森林回归模型的预测效果。

(8)优化随机森林回归模型,调整随机森林的最小叶子数和决策树个数(较小的最小叶子数使模型更容易捕捉训练集中的噪声,较大的决策树个数使模型拥有更好的性能,但同时也使模型的训练速度变慢)重复步骤(6)至(8),直至随机森林回归模型的r平方值大于0.999。

(9)使用随机森林回归模型根据机组实时运行数据进行机组电功率预测。

进一步的,步骤(1)中,所述机组历史运行数据为核电站常规岛的历史运行数据,包括主蒸汽参数、凝汽器运行参数、回热器再热器运行参数等。

进一步的,步骤(2)中,所述异常数据为测点异常数据和操作过程数据,后者如机组启停机时产生的数据等。

进一步的,步骤(5)中,数据集进行拆分前,应打乱其顺序使其随机排序,再进行拆分。

进一步的,步骤(7)中,r平方值又称为决定系数,反映因变量的全部变异能通过回归关系被自变量解释的比例。

本发明由于采用以上技术方案,使之与现有技术相比,具有以下的优点:

在机组实际运行时,影响机组电功率的因素多种多样,并且这些参数间具有很强的相关性和共线性,从理论上很难分析各个参数单独作用于机组电功率的机理,本发明引入统计学习的方法,采用聚类分析对机组的历史运行数据进行特征提取,实现了数据降维,再通过随机森林回归对特征值和目标值进行训练,避免了构建机理模型。采用随机森林回归模型进行机组电功率预测,大大提高了预测精度,缩短了预测所用的时间。随机森林回归模型的泛化能力强,可以适应不同的核电机组。

附图说明

图1是本发明基于聚类分析和随机森林回归的核电机组电功率预测方法流程图。

图2是本发明实施例中聚类分析结果局部图。

图3是本发明实施例中随机森林回归模型预测值与机组运行实际值对比局部图。

具体实施方式

下面结合附图,通过一个某1000mw核电站机组电功率预测的实施例,对本发明做进一步说明。

如图1所示,本发明提供了一种基于聚类分析和随机森林回归的核电机组电功率预测方法,具体包括以下步骤:

(1)获取机组历史运行数据。在本实施例中,获取某1000mw核电站常规岛2016年1月至2019年8月的历史运行数据,共200个运行数据测点,采样间隔10min。

(2)对机组历史运行数据进行清洗,剔除异常数据。在本实施例中,剔除异常数据后,共有174410个样本。

(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值。图2是本发明实施例中聚类分析结果局部图。由图可知,凝汽器循环水入、出口温度为一类,分别取凝汽器循环水入口温度和出口温度的测点的平均值作为特征值。基于同样的理由,取凝汽器入口压力的测点的平均值作为特征值。

结合理论和电厂运行的实际经验,最终选取本实施例的特征值如表1所示。

表1.特征值列表(同一特征存在多个测点则取其均值)

(4)采用标准化的方法对特征值和目标值(电功率)进行无量纲化处理,由此得到用于随机森林回归的数据集。标准化的公式可表达为:式中,x为标准化后的样本值,x为原样本值,为原样本的均值,s为原样本的标准差。

(5)对上一步骤得到的数据集进行随机拆分,得到训练集和测试集。训练集用于训练随机森林回归模型,测试集用于评估随机森林回归模型的预测效果。在本实施例中,取测试集样本数为数据集总样本数的30%。

(6)建立随机森林回归模型,使用训练集对其进行训练。在本实施例中,选取最小叶子数为1,决策树个数为100。

(7)使用测试集对随机森林回归模型进行测试,评估随机森林回归模型的预测效果。在本实施例中,该随机森林回归模型的平均绝对误差(mae)为0.01066、均方误差(mse)为0.00043、r平方值为0.99957。

(8)优化随机森林回归模型,调整随机森林的最小叶子数和决策树个数。在本实施例中,由于随机森林回归模型的r平方值已大于0.999,故不再对随机森林回归模型的参数进行调整。

(9)使用随机森林回归模型根据机组实时运行数据进行机组电功率预测。图3是本发明实施例中随机森林回归模型预测值与机组运行实际值对比局部图。图中电功率实际值为散点,电功率预测值为实线,可以看到电功率预测值与电功率实际值几乎重合,这说明随机森林回归模型能够实现机组电功率的准确预测。

除随机森林回归模型之外,本实施例还尝试了其他回归模型,现将本实施例所尝试的回归模型及其预测效果列于表2。

表2.回归模型及其预测效果

由表可以看出,随机森林回归模型具有最小的mae和mse以及最接近1的r平方值,因此随机森林回归模型在上述回归模型中对机组电功率预测的精确度最高,可以更好地对机组运行提供指导。


技术特征:

1.基于聚类分析和随机森林回归的核电机组电功率预测方法,包括以下步骤:

(1)获取机组历史运行数据;

(2)对机组历史运行数据进行清洗,剔除异常数据;

(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值;

(4)采用标准化的方法对特征值和目标值进行无量纲化处理,由此得到用于随机森林回归的数据集;

标准化的公式表达为:

式中,x′为标准化后的样本值,x为原样本值,为原样本的均值,s为原样本的标准差;

(5)对步骤(4)得到的数据集进行拆分,得到训练集和测试集;训练集用于训练随机森林回归模型,测试集用于评估随机森林回归模型的预测效果;

(6)建立随机森林回归模型,使用训练集对其进行训练;

(7)使用测试集对随机森林回归模型进行测试,采用平均绝对误差(mae)、均方误差(mse)、r平方值三种评估指标,评估随机森林回归模型的预测效果;

(8)优化随机森林回归模型,调整随机森林的最小叶子数和决策树个数;重复步骤(6)至(8),直至随机森林回归模型的r平方值大于0.999;

(9)使用随机森林回归模型根据机组实时运行数据进行机组电功率预测。

2.根据权利要求1所述的核电机组电功率预测方法,其特征在于:步骤(1)中,所述机组历史运行数据为核电站常规岛的历史运行数据,包括主蒸汽参数、凝汽器运行参数和回热器再热器运行参数。

3.根据权利要求1所述的核电机组电功率预测方法,其特征在于:所述步骤(1)中所述异常数据为测点异常数据和操作过程数据。

4.根据权利要求1所述的核电机组电功率预测方法,其特征在于:步骤(3)中,特征值包括主给水流量、高压调节阀开度、主蒸汽母管压力、主蒸汽母管温度、凝汽器真空度、低压缸排汽温度、循环水入口温度、循环水出口温度、凝汽器入口压力、和凝汽器出口压力的一种或多种。

5.根据权利要求1所述的核电机组电功率预测方法,其特征在于:步骤(3)中,同一特征存在多个测点则取其均值作为特征值。

6.根据权利要求1所述的核电机组电功率预测方法,其特征在于:步骤(5)中数据集进行拆分前,应打乱其顺序使其随机排序,再进行拆分。

7.根据权利要求1所述的核电机组电功率预测方法,其特征在于:步骤(7)中,r平方值又称为决定系数,反映因变量的全部变异能通过回归关系被自变量解释的比例。

技术总结
本发明属于电力系统领域,涉及一种基于聚类分析和随机森林回归的核电机组电功率预测方法。本发明通过聚类分析对机组的历史运行数据进行特征提取,用以训练随机森林回归模型,从而可以根据机组实时运行数据预测机组电功率。由于通过聚类分析实现了数据降维,通过构建随机森林回归模型避免了构建机理模型,本发明具有预测精度高、预测速度快、泛化能力强的优点。

技术研发人员:李蔚;吴恺逾;盛德仁;陈坚红;鲍旭东;胡跃华;蔡超;骆雪莲
受保护的技术使用者:浙江大学
技术研发日:2019.12.26
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-52300.html

最新回复(0)