基于自编码器和GRU神经网络的热带气旋轨迹预测方法与流程

专利2022-06-29  82


本发明涉及大气科学技术领域,尤其是涉及一种基于自编码器和gru神经网络的热带气旋轨迹预测方法。



背景技术:

热带气旋是在热带和亚热带海洋表面产生的一种中尺度或天气暖性气旋,强热带气旋即台风(飓风),是最具破坏性的不可预测的自然灾害之一,是造成生命和财产损失的原因。热带气旋每年都给沿海国家带来许多灾难性的影响。因此,为了更好地应对极端自然灾害,对热带气旋路径进行准确预测是非常重要的。然而,热带气旋的形成受到许多因素的影响,包括气象环境以及热带气旋系统的热力学和动力学因素。热带气旋登陆后,其轨迹也会受到复杂的海洋探测、沿海岸线和内陆地形的影响。这些复杂的问题使得热带气旋的轨迹预测成为一个巨大的挑战。因此,考虑到热带气旋对社会的影响和预测的复杂性,探索和应用新的技术来进行轨迹的预测是非常重要的。

目前国内外许多学者都对热带气旋轨迹预测进行了研究,大多使用的仍为传统的非深度学习方法。如weber,harryc等人构建了处理复杂动态方程的数值模型,生成一个网格系统对热带气旋内部结构进行建模,并进行实时仿真。demaria,mark等从历史数据中构建了计算热带气旋行为模式的统计模型。张守峰等用多元线性回归、递归正权决策和算术平均方法,分别建立热带气旋路径和强度多模式集成预报方程,并用2004年西北太平洋和南海生成的热带气旋资料进行预报试验,同时对其他预报和集成预报方法进行了对比和分析。这些传统的方法曾在这类预测工作中有着突出的表现,但是随着越来越多的气象卫星、海洋站和地面站的建立,气象数据量越来越大,利用传统模型从海量时空数据中寻找热带气旋的非线性模式是一项困难的工作。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种能有效处理和利用越来越大的气象数据的基于自编码器和gru神经网络的热带气旋轨迹预测方法。

本发明的目的可以通过以下技术方案来实现:

一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,该方法具体为,获取待预测数据,并进行预处理,将预处理后的待预测数据载入预训练后的气旋轨迹预测模型中,获取气旋轨迹预测结果,所述气旋轨迹预测模型包括自编码器和gru神经网络,所述自编码器的输出作为gru神经网络的输入,所述待预测数据包括热带气旋位置数据和气象因子数据。

模型以自编码器为底层,压缩和提取输入数据的重要特征。

gru是一类专门处理时序数据样本的神经网络,它的每一层不仅输出给下一层,同时还输出一个隐藏态,能够考虑轨迹在时间上的关联性,提取时间序列特征,产生最终的预测结果。

进一步地,所述气旋轨迹预测模型的预训练过程包括以下步骤:

训练数据预处理步骤:获取训练数据,对训练数据进行预处理;

训练数据划分步骤:从预处理后的训练数据划分出训练集;

自编码器训练步骤:将训练集载入自编码器中,获取自编码器的输出,根据预建立的自编码器损失函数,对自编码器进行训练,直到满足预设的自编码器训练条件;

gru神经网络训练步骤:将训练完成后的自编码器的输出转化为时序性的一维向量,作为gru神经网络的输入,获取预测结果,根据预建立的gru损失函数,对gru神经网络进行训练,直到满足预设的gru神经网络训练条件;

所述训练数据包括热带气旋位置数据和气象因子数据。

进一步地,所述预处理包括将待预测数据或训练数据转化为二维矩阵,该二维矩阵的行坐标为热带气旋的编号,列坐标为时刻,某一行某一列的元素为某个热带气旋在某个时刻的热带气旋位置数据和气象因子数据。

进一步地,所述预处理包括对待预测数据或训练数据依次进行异常值处理和归一化处理。归一化后数据均在[0,1]之间。对与非数值型数据,采用one-hot编码进行处理。

进一步地,所述自编码器损失函数的表达式为:

式中,为损失函数计算结果,为经过自编码器编码之后的数据,x为训练集数据,n为训练的总记录数。损失函数越小,说明自编码网络对数据造成的损失越小,得到的编码特征可以更好的描述原始数据集。

进一步地,所述gru损失函数的表达式为:

式中,mse为gru损失函数计算结果,oi为第i个热带气旋轨迹的实际位置,pi为第i个热带气旋轨迹的预测位置,n为训练数据中热带气旋轨迹的数量。

进一步地,所述自编码器训练步骤和gru神经网络训练步骤中,均采用反向传播算法对自编码器或gru神经网络进行训练。

进一步地,所述训练数据划分步骤还划分出测试集,所述气旋轨迹预测模型的预训练过程还包括模型测试步骤,该步骤具体为,将测试集载入经过自编码器训练步骤和gru神经网络训练步骤的气旋轨迹预测模型中,获取气旋轨迹预测结果,并计算结果误差,判断是否满足预设的模型测试条件,若满足模型测试条件,则采用此气旋轨迹预测模型进行气旋轨迹预测。

进一步地,模型测试步骤中,所述计算结果误差包括计算平均绝对误差、平方根绝对误差和平均绝对百分数误差,所述平均绝对误差mae的计算表达式为:

所述平方根绝对误差rmse的计算表达式为:

所述平均绝对百分数误差mape的计算表达式为:

式中,oi为第i个热带气旋轨迹的实际位置,pi为第i个热带气旋轨迹的预测位置,n为训练数据中热带气旋轨迹的数量。

进一步地,所述训练数据划分步骤还划分出验证集,所述气旋轨迹预测模型的预训练过程还包括模型验证步骤,该步骤具体为,将验证集载入,满足模型测试条件的气旋轨迹预测模型中,验证气旋轨迹预测模型的泛化能力。

与现有技术相比,本发明具有以下优点:

(1)本发明结合大量历史数据,对数据进行预处理后,载入气旋轨迹预测模型进行训练,从而进行热带气旋轨迹的预测,相对于以往建立动力学、热力学模型方法,该方法更能适合如今气象数据量越来越大的特点,还能利用该特点提高预测精度,并且在气旋轨迹预测模型中的gru神经网络是一类专门处理时序数据样本的神经网络,实现充分考虑了热带气旋的时空特性,满足实际的预测要求,提高了预测精度和可靠性。

(2)本发明所构建的基于自编码器和gru神经网络的预测模型是建立已存在的两种深度神经网络的研究之上,利用这两种网络的优点,建立了一种可以预测未来一定时间内目标热带气旋位置的模型,所使用的损失函数也是以往的研究中存在的,且被证明具有良好的评估结果准确性的作用,所以本发明针对以往的预测轨迹的方法的不足,充分利用已有的研究成果,提出了基于两种深度神经网络的预测模型,该模型以自编码器为底层,对输入数据进行重要特征的提取和压缩,其输出结果作为高层gru网络的输入,提取热带气旋的时间序列特征,充分考虑到了气象信息与热带气旋位置的时间关联性,得到了更为具有精确的预测结果,因而具有实际性的应用前景。

(3)本发明通过自编码器对多个气象因子特征能够进行压缩重构,从而提高模型的训练效率。

附图说明

图1为本发明热带气旋轨迹预测方法的流程示意图;

图2为本发明所构建的气旋轨迹预测模型的结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1

本实施例首先对热带气旋轨迹的相关背景进行说明:

热带气旋轨迹预测:主要通过历史热带气旋数据和气象因子数据,对热带气旋在未来一定时间内的位置进行预测,是海洋科学、气象科学、计算机科学等多个学科都在重点研究的课题之一,因而具有一定的学科交叉性。

传统预测法:非深度学习的热带气旋轨迹预测方法又称为传统的预测方法,包括建模热带气旋内部结构并处理复杂的热力学公式的数值模型、基于历史数据从历史记录中发现热带气旋特征的统计方法、将多个模型、多个物理参数和多个初始条件组合在一个预测模型的综合模型以及基于传统机器学习建立的预测模型都属于传统预测模型。

如图1所示,本实施例提供一种基于自编码器(auto-encoder)和gru神经网络的热带气旋轨迹预测方法,该方法包括以下步骤:

s1:基于深度学习原理和auto-encoder及gru网络的特点,根据检测到的热带气旋最佳轨迹数据和气象因子数据,以热带气旋位置为目标,构建其未来轨迹预测的模型,模型以auto-encoder为底层,压缩和提取输入数据重要特征;其编码层的输出特征向量作为高层gru神经网络的输入,提取时间序列特征,产生最终的预测结果。gru是一类专门处理时序数据样本的神经网络,它的每一层不仅输出给下一层,同时还输出一个隐藏态,能够考虑轨迹在时间上的关联性,提取时间序列特征,产生最终的预测结果。

s2:根据构建的联合神经网络模型的特点,从热带气旋最佳轨迹数据中选择合适的训练和测试数据,完成对预测模型的初始化。

s201:选取西北太平洋热带气旋最佳轨迹数据进行异常值处理和数据的归一化处理,本实施例对用于建模的数据进行归一化处理或one-hot编码,提高模型的训练速度和预测精度,本实施例所选取的归一化方法为min-maxnormalization方法,该方法的计算表达式为:

该方法实现对原始数据的等比例缩放,normrk为归一化后的数据,rk为原始数据,maxrk和minrk分别为原始数据集中的该属性的最大值和最小值。归一化后数据均在[0,1]之间。对与非数值型数据,采用one-hot编码进行处理。

s202:将数据集按80%,10%,10%的比例划分为训练集、验证集和测试集,提高模型的泛化能力。

s203:对预测模型的初始化过程包括合理设置模型的误差阈值,取值范围为0.01-0.0001之间,学习率为0.01-0.1之间取值,最大迭代次数为100次,gru网络的层数为3层,神经元数量为100,auto-encoder的编码器和解码器的层数均为1层,隐藏层神经元的个数为2。

s204:将输入训练集的经纬度位置数据和气象因子数据转化为二维矩阵,该二维矩阵的行坐标为热带气旋的编号,列坐标为时刻,某一行某一列的元素为某个热带气旋在某个时刻的热带气旋位置数据和气象因子数据。

s205:对于auto-encoder网络,定义其训练阶段的损失函数如下:

其中,为auto-encoder经过编码解码之后的数据,x′为原始数据气象信息与位置信息。n为训练的总记录数。损失函数越小,证明自编码网络对数据造成的损失越小,得到的编码特征可以更好的描述描述原始数据集。

取上述ae的隐藏层向能量作为gru网络的输入,该训练阶段的损失函数如下:

其中oi为目标实际热带气旋轨迹的位置,pi为目标热带预测的预测位置,n为训练数据的数量。

s3:训练预测模型,整个模型的训练具体可以分为以下两步:

s301:对auto-encoder的训练:将被转化为二维矩阵的输入特征输入到auto-encoder中。ae的训练过程分为两部分,编码器和解码器。其中编码器和解码器具有相同和层数ζ和结构。

编码器的计算表达式为:

e1=f(w1×x′ b1)(4)

e2=f(w2×e1 b2)(5)

…(6)

eζ=f(wζ×eζ-1 bζ)(7)

解码器的计算表达式为:

d1=f(w′1×eζ b′1)(8)

…(9)

dζ-1=f(w′ζ-1×dζ-2 b′ζ-1)(10)

dζ=f(w′ζ×dζ-1 b′ζ)(11)

其中,ei为编码层的第i层网络输出,di为解码层的第i层网络输出。wi,w′i,bi和b′i分别表示编码层和解码层在第i层网络的权重和偏置值。这一阶段输入的二维矩阵中,主要包括以下数据{热带气旋经度、纬度、最大持续风速、最小海平面压力、半径风的强度、最后一个闭合等压线的压强、最后一个闭合等压线的半径、强度、最大风速的半径、风眼直径、风暴方向、风暴速度、象限内半径浪高},将输入的二维矩阵进行压缩,得到真正的数据特性。以公式(2)衡量预测的准确性,采用反向传播算法,对模型进最小化损失函数,减少预测值和观测值之间的误差。当网络符合要求之后,利用训练好的模型,处理整个数据集,得到auto-encoder编码层的输出特征eζ作为gru层的输入。

s302:gru层的训练,二维输入矩阵经auto-encoder压缩提取特征之后转化为时序性的一维向量作为gru的输入,gru具有时序预测功能。将t时刻之前d小时的值(et-d,et-d 1,…,et,)作为模型的输入,预测的目标是t时刻之后一个时间步长的热带气旋经纬度数据。令et表示输入,w权值矩阵,h为隐藏层信息,b为偏置值。可用以下公式表示gru的训练过程。

1)gru更新门决定上一层隐藏层状态有多少信息传递到当前隐藏状态中,即前一时刻的多少信息是需要继续传递的,gru更新门的表达式为:

zt=σ(wzen,t uzht-1 bz)(13)

其中σ是激活函数,en,t为t时刻的输入向量,ht-1表示t-1时刻最后一个gru单元的输出,该单元存储了时间戳t-1处的信息。w,u和b分别为参数矩阵和偏置向量。

2)gru重置门是决定上一时刻隐藏状态的信息中有多少是需要被遗忘的,即用于确定当前时刻的候选状态将从之前时刻继承多少,gru重置门的表达式为:

rt=σ(wren,t urht-1 br)(14)

3)更新门的输出乘以历史状态ht-1和候选状态并将其相加,通过计算得到当前时间戳t的最终内存信息,该计算过程的表达式为:

gru的输出的预测值经过全连接层得到最终的预测结果。在整个模型中使用随机梯度下降算法,以防止过拟合。通过反向传播计算误差函数对网络全部权重和偏置值进行更新,以达到最优结果。模型训练完成之时,各参数值也就确定了。

s4:利用验证集训练所得到的预测模型的泛化能力,对于测试集,将其输入模型得到预测结果,利用平均绝对误差、平方根误差和比较绝对百分数误差衡量实际观测值和预测值的误差。计算公式如下:

其中pi表示预测值,oi表示实际值。n为测试集所含记录数数量。若计算的误差优于传统方法,说明模型满足预期,可以用于预测未来一定时间内热带气旋的位置。

s5:对训练所得到的预测模型进行性能评估。经实验分析对比,相比于其他已有的方法,本实施例的模型在时间效率上和预测精度上都有很好的提升。且能够处理大量的热带气旋轨迹及气象数据。

具体实施方式:

如图2所示,先将气象因子数据和热带气旋位置数据构成一个二维矩阵,经过预处理后作为auto-encoder层的输入,压缩数据并提取特征生成特征向量。然后将auto-encoder层生成的特征向量作为输入数据,输入gru。输入之前为了适配批量输入多个不等长热带气旋,设置了定制的batch(批处理),即以填零的方式使得一个batch内的热带气旋长度达到一致。然后训练gru预测层,得到热带气旋在t 1时刻的经纬度。损失函数使用公式(3),并采用随机梯度下降将误差反向传播到整个模型,更新各层和个节点的参数。

综上所述,本实施例所构建的基于auto-encoder和gru神经网络的预测模型是建立已存在的两种深度神经网络的研究之上,利用这两种网络的优点,建立了一种可以预测未来一定时间内目标热带气旋位置的模型。所使用的损失函数也是以往的研究中存在的,且被证明具有良好的评估结果准确性的作用。所以本实施例针对以往的预测轨迹的方法的不足,充分利用已有的研究成果,提出了基于两种深度神经网络的预测模型,该模型以auto-encoder为底层,对输入数据进行重要特征的提取和压缩,其输出结果作为高层gru网络的输入,提取热带气旋的时间序列特征,充分考虑到了气象信息与热带气旋位置的时间关联性,得到了更为具有精确的预测结果,因而具有实际性的应用前景。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。


技术特征:

1.一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,该方法具体为,获取待预测数据,并进行预处理,将预处理后的待预测数据载入预训练后的气旋轨迹预测模型中,获取气旋轨迹预测结果,所述气旋轨迹预测模型包括自编码器和gru神经网络,所述自编码器的输出作为gru神经网络的输入,所述待预测数据包括热带气旋位置数据和气象因子数据。

2.根据权利要求1所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述气旋轨迹预测模型的预训练过程包括以下步骤:

训练数据预处理步骤:获取训练数据,对训练数据进行预处理;

训练数据划分步骤:从预处理后的训练数据划分出训练集;

自编码器训练步骤:将训练集载入自编码器中,获取自编码器的输出,根据预建立的自编码器损失函数,对自编码器进行训练,直到满足预设的自编码器训练条件;

gru神经网络训练步骤:将训练完成后的自编码器的输出作为gru神经网络的输入,获取预测结果,根据预建立的gru损失函数,对gru神经网络进行训练,直到满足预设的gru神经网络训练条件;

所述训练数据包括热带气旋位置数据和气象因子数据。

3.根据权利要求1或2所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述预处理包括将待预测数据或训练数据转化为二维矩阵,该二维矩阵的行坐标为热带气旋的编号,列坐标为时刻,某一行某一列的元素为某个热带气旋在某个时刻的热带气旋位置数据和气象因子数据。

4.根据权利要求1或2所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述预处理包括对待预测数据或训练数据进行异常值处理和归一化处理。

5.根据权利要求2所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述自编码器损失函数的表达式为:

式中,为损失函数计算结果,为经过自编码器编码之后的数据,x′为训练集数据,n为训练的总记录数。

6.根据权利要求2所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述gru损失函数的表达式为:

式中,mse为gru损失函数计算结果,oi为第i个热带气旋轨迹的实际位置,pi为第i个热带气旋轨迹的预测位置,n为训练数据中热带气旋轨迹的数量。

7.根据权利要求2所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述自编码器训练步骤和gru神经网络训练步骤中,均采用反向传播算法对自编码器或gru神经网络进行训练。

8.根据权利要求2所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述训练数据划分步骤还划分出测试集,所述气旋轨迹预测模型的预训练过程还包括模型测试步骤,该步骤具体为,将测试集载入经过自编码器训练步骤和gru神经网络训练步骤的气旋轨迹预测模型中,获取气旋轨迹预测结果,并计算结果误差,判断是否满足预设的模型测试条件,若满足模型测试条件,则采用此气旋轨迹预测模型进行气旋轨迹预测。

9.根据权利要求8所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,模型测试步骤中,所述计算结果误差包括计算平均绝对误差、平方根绝对误差和平均绝对百分数误差,所述平均绝对误差mae的计算表达式为:

所述平方根绝对误差rmse的计算表达式为:

所述平均绝对百分数误差mape的计算表达式为:

式中,oi为第i个热带气旋轨迹的实际位置,pi为第i个热带气旋轨迹的预测位置,n为训练数据中热带气旋轨迹的数量。

10.根据权利要求8所述的一种基于自编码器和gru神经网络的热带气旋轨迹预测方法,其特征在于,所述训练数据划分步骤还划分出验证集,所述气旋轨迹预测模型的预训练过程还包括模型验证步骤,该步骤具体为,将验证集载入,满足模型测试条件的气旋轨迹预测模型中,验证气旋轨迹预测模型的泛化能力。

技术总结
本发明涉及一种基于自编码器和GRU神经网络的热带气旋轨迹预测方法,该方法具体为,获取待预测数据,并进行预处理,将预处理后的待预测数据载入预训练后的气旋轨迹预测模型中,获取气旋轨迹预测结果,所述气旋轨迹预测模型包括自编码器和GRU神经网络,所述自编码器的输出作为GRU神经网络的输入,所述待预测数据包括热带气旋位置数据和气象因子数据。与现有技术相比,本发明能有效处理和利用越来越大的气象数据,预测精度高,具有实际性的应用前景。

技术研发人员:廉洁;董萍萍
受保护的技术使用者:上海师范大学
技术研发日:2019.12.31
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-52235.html

最新回复(0)