基于气象大数据的径流预报改进方法与流程

专利2022-06-29 183

本发明涉及一种改进方法，尤其涉及一种基于气象大数据的径流预报改进方法。
背景技术：
：：在众多的自然灾害中，极端降水所引起的洪涝灾害是最严重的自然灾害，目前已经成为制约社会经济可持续发展的主要因素之一。精确的水文模拟和预报对于水资源评估和洪水预警是至关重要的。但水文预报存在很多不确定性，主要分为水文模型输入的不确定性、流域初始条件和下边界条件不确定性、水文模型结构和参数不确定性。其中降水作为主要的水文模型输入是水文不确定性的最重要来源。同时，气象模式输出降水(预报降水)因其本身存在的系统误差原因使得水文的径流预报存在较大误差，尤其对于大径流预报(洪水预警)等误差严重。目前，现有技术提供了一种基于流式大数据处理方式的降雨径流预测计算方法(201610808770)，具体来说：其首先设计基于实时水量的子流域及时预测算法和基于scs模型洪水预测算法，然后使用流式大数据处理方式对这两个算法进行处理。流域划分与断面流量计算原理通过把大、中流域划分为不同子流域，利用scs模型及其改进模型对每个子流域进行径流计算，获取每个子流域的径流。大、中型流域划分为不同子流域的方法。但是，其参考的参数较少，只能针对特定流域进行实施，实际预测效果较差。并且预报时效有限，不能为洪水的提前防护提供更多时间。同时，现有技术还提供了一种降雨径流预报方法(201810632402)。其包括：通过水雨情数据库存储降雨径流预报演算模块所需的时间、水位、雨量、流量数据，并根据用户需要设置未来时段假拟数据，用以实时降雨洪水预报，短期、中期、长期降雨径流预报；通过用户参数配置模块存储和计算降雨径流预报所需参数及降雨径流资料供降雨径流预报演算模块调用，用于用户设置、调整预报参数，调整预报精度；通过降雨径流预报演算模块根据水雨情数据库提供的水雨情数据及用户参数配置模块提供的配置参数，对未来的径流过程进行预报，并根据涨水和退水情况对预报结果进行修正；通过降雨径流预报成果统计模块根据降雨径流预报演算模块的预报过程，对径流或洪水过程进行统计评估，统计评估的内容包括，短期、中期、长期预报的洪峰、洪量、峰现时间、及洪峰洪量精度；通过降雨径流预报图形模块形成降雨径流预报图，所述预报图包括短期降雨径流预报图、中期降雨径流预报图及长期降雨径流预报图。但是，这种方法基于预报图为基准，过度依赖于先前已产生的洪水数据，偏重高水位的降水数据，无法实现较为完整的降雨径流预报。并且，目前业内也有采用历史相似法来进行判别，获取相关的预测数值。然而，现有的历史相似法只能用于单纯的气象预报数据的订正，对历史数据数量的需求非常大，最理想的情况是假设用于训练的数据是无穷多的，使得可以在历史数据中找到完全相同的预报天数，这在现实情况中是不可能实现的。单纯以实现气象误差(如均方根误差等)最小找寻历史相似预报，将其输入进水文模型并不能得到较好的径流预报结果，甚至有时是负效果，这是因为水文模型更关注整个流域的面雨量误差以及降水的空间分布情况。有鉴于上述的缺陷，本设计人，积极加以研究创新，以期创设一种基于气象大数据的径流预报改进方法，使其更具有产业上的利用价值。技术实现要素：为解决上述技术问题，本发明的目的是提供一种基于气象大数据的径流预报改进方法。本发明的基于气象大数据的径流预报改进方法，其特征在于包括以下步骤：步骤一，获取特定区域、时间的数据，所述数据包括降水数据、其他水文输入数据；步骤二，进行降水订正；步骤三，获取观测径流数据，运用dream参数率定方法进行水文参数率定步骤四，运行水文模式，得到径流模拟结果；步骤五，进行径流集合平均检验与概率性检验。进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述降水数据，包括观测降水数据、预报降水数据；所述其他水文输入数据，至少包括数字高程数据、植被数据、土壤输入数据、其他气象强迫数据，所述其他气象强迫数据包括风速、日最高和最低气温；所述观测降水数据为chinagauge-baseddailyprecipitationanalysis(cgdpa)，即中国逐日网格降水资料；所述预报降水数据是ncepgefs第二代reforecast数据所产生的24小时累计降水(00utc-00utc)集合预报，包含1个控制预报和10个扰动成员，但计算集合平均的时候仅使用扰动成员。数据存储的分辨率为1°。更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述集合平均检验为，选用定量分析gefsreforecast数据预报的整体水平的度量标准，包括systematicbias(bias)，pearsoncorrelationcoefficient(cc)andrelativeerror(re)，它们的计算公式如下：其中，n是事件的总数，oi和si是第i对被检验的观测降水分析和降水预报量；和分别是它们相对应的平均值。在次期间，采用四种评分标准对gefsreforecast数据的二分事件的预报能力进行评估，分别为equitablethreatscore(ets)，frequencybias，probabilityofdetection(pod)和falsealarmratio(far)。它们的最优值分别是1，1，1，0，变化范围分别为-1/3-1，0-1，0-1，0-∞。equitablethreatscore(ets)评估去掉随机因素的发生的事件被正确预报出的比率，probabilityofdetection(pod)为命中率，评估发生的事件被正确预报出的比率，falsealarmratio(far)为假警率，评估实际没发生但预报有的事件的比率，frequencybias为频率偏差，评估预报发生的事件和实际发生的事件的比率。它们的计算公式如下：其中，h表示正确预报的格点数，m表示漏报格点数，f表示空报格点数，c表示正确预报出未存在降水事件格点数。更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述概率性检验为通过rmsevssprd，之后获取roc面积，再进行bss评分。更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述比较集合成员的集合离散度与集合平均的均方根误差可以分析集合离散度误差关系，检验集合预报系统成员的离散状态，记fi(n)代表第i个样本的第n个集合成员的预报值，其中i＝1，2，3，…，m；n＝1，2，3，…，n；m为总的样本数，n为集合成员数；记oi代表第i个样本的观测；采用的集合平均为均方根误差为集合离散度为更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述roc为relativeoperatingcharacteristic，其曲线是信号检测理论中一种描述灵敏度的图像，用于衡量预报系统区别二分类事件的能力；首先设定一个概率阈值，大于等于此阈值的预报概率认为此事件发生，否则不发生，从而将概率预报转换成常见的二分类确定性预报，计算相应的命中率和假警报率：实际实施的时候，将二分类确定性预报中的假警率和命中率分别作为横、纵坐标轴，画图得到一系列点，连接这些点得到的曲线即为roc曲线；roc曲线越接近于上x轴和左y轴，预报技巧越高。相对作用特征曲线下的面积rocarea也是模式检验的重要指标，rocarea越接近于1，预报技巧越高；当rocarea小于等于0.5时，不具有预报技巧。更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述bss评分是在brier评分(bs)的基础之上，考虑了样本的气候频率，对某一事件预报概率和实际发生概率之间的比较；对于完美的预报，bss＝1，bss大于0表示概率预报有技巧，bss小于等于0则不存在技巧；记pi为样本i的预报概率，oi为样本i实际发生概率，对于给定的降水阈值，如果该样本实际降水大于此阈值，那么oi＝1，否则oi＝0；具体来说，bs评分为将bs评分分为三部分，包括可靠性(reliability)、精确性(resolution)、不确定性(uncertainty)，可采用如下公式表示：bss评分，更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述径流检验采用nash系数与覆盖率获取，所述nash系数为公式中，qobs指观测值，qsim指模拟值，表示观测值的总平均nse取值为负无穷到1，nse接近1，表示模式质量好，模型可信度高；nse接近0，表示模拟结果接近观测值的平均值水平，即总体结果可信，但过程模拟误差大；nse远远小于0，则模型为不可信；所述覆盖率为，表示日观测径流量落在模拟径流量集合成员界内的频率，等于1时最佳；上述的公式表示径流预报集合成员界内的平均宽度，可表示观测径流的标准差，d-factor越小越好；通常d-factor和cr配合使用，在达到cr最大时，d-factor越小越好。更进一步地，上述的基于气象大数据的径流预报改进方法，其中，所述降水订正选用历史相似法，并根据流域特征对该方法进行了改进，具体来说，所述历史相似法基于寻找历史相似预报，通过用当日的观测数据代替今日的预报数据以减小系统误差并同时进行空间降尺度的订正方法；设在特定时间内有一组网格预测模型状态向量，并假设状态向量有n个分量，并且有m个集合成员，从集合成员的预测中得到了一个有m*n个分量的预测向量xf：假设p维观测到的大气状态如下：这代表网格点或特定位置的大气状态量，得到大气的概率预报如下：f(xt)|xf(2.19)；其中f表示概率密度函数；如果观测大气状态由与预报大气状态相同的位置处的变量相同，并且预报模型是完美的，则来自集合成员的相对概率将是提供任何事件概率的唯一来源，在抽样误差范围内可表示为：其中t是某个选定事件的阈值，当时，否则为0。借由上述方案，本发明至少具有以下优点：1、基于气象预报降水大数据的长期系统误差分析，对流域从量级和空间分布上订正集合降水预报，提高径流模拟能力。2、基于径流模拟对流域面雨量较为敏感的特性，对历史相似法寻找历史相似预报的标准进行了改进，提高了集合降水预报的订正效果，实现了在有限气象数据中得到最优径流预报结果的目的。3、本方法首次流域特征作为将气象降水预报大数据的订正标准，并用集合预报大数据进行了综合统计分析，论证了改进的历史相似法在径流预报中的正效果。上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。附图说明图1至图4是步骤二处理后获取的改进的历史相似法示意图。其中：图1为原始降水预报示意图。图2为根据找到的历史相似预报示意图。图3为图2相对应的观测预报示意图。图4是图3构成的集合预报产生的特定阈值降水的概率预报示意图。图5是步骤五处理后获取的订正前后的nash系数示意图。图6是淮河流域2003年6-7月历史上第二大洪水的数据示意图。图7是通过本发明模拟后淮河流域2003年6-7月历史上第二大洪水预警示意图。图8是本发明的处理步骤示意图。具体实施方式下面结合实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。如图1-8所示的基于气象大数据的径流预报改进方法，其与众不同之处在于包括以下步骤：步骤一，获取特定区域、时间的数据，数据包括降水数据、其他水文输入数据。本发明选用的降水数据，包括观测降水数据、预报降水数据。同时，选用的其他水文输入数据，至少包括数字高程数据、植被数据、土壤输入数据、其他气象强迫数据。该其他气象强迫数据包括风速、日最高和最低气温。具体来说，观测降水数据为chinagauge-baseddailyprecipitationanalysis(cgdpa)，即中国逐日网格降水资料。它是新发展的中国大陆上的高分辨率(0.25°×0.25°lat./lon.)格点降水分析资料。它用的资料处理方法是基于气候背景场的最优插值进行地形改进后的方法。cgdpa地面观测数据为1955年至今中国大陆2400多个地面气象站为基础生成的日降水分析场。输入的日降水记录经过三重严格的质量检测。cgdpa提供24小时累计降水(00utc-00utc)和0.25°×0.25°格点的观测站数。cgdpa的评估报告显示cgdpa是中国大陆范围内高质量的定量降水产品。由于使用了更多观测降水站点，地面观测数据能够捕捉更多的强降水预报降水数据是ncepgefs第二代reforecast数据所产生的24小时累计降水(00utc-00utc)集合预报，包含1个控制预报和10个扰动成员，但计算集合平均的时候仅使用扰动成员。数据存储的分辨率为1°。结合实际实施来看，reforecast数据使用的是gefs9.0.1版。在运行的gefs预报的前8天，该模型以t254l42分辨率运行，其具有二次高斯变换网格，在40°纬度处具有大约40km的网格间距，以及42个垂直层。从第 7.5天开始，预报集合数据的分辨率是t190l42，即纬度为40°时网格间距约为54公里，从预报时效8天到预报时效16天，数据以此分辨率保存。同时，数字高程数据(digitalelevationdata，dem)是nasacgiar(consultativegroupforinternationalagriculturalresearch)-csi(consortiumforspatialinformation)的srtm(shuttleradartopographymission)90mdigitalelevationdatabasev4.1数据集，它能够提供全球90m的数字高程数据集，垂直误差不超过16m，具有很好的空间连续性。植被数据是马里兰大学(theuniversityofmaryland，umd)地理系由noaa-avhrr数据制备而成的全球1km陆地覆盖分类数据，植被参数库使用的是全球陆面数据同化系统(globallanddataassimilationsystem，gldas)的s1静态植被参数(staticvegetationparametersforvic)。土壤输入数据是fao(foodandagricultureorganization)的全球土壤数字地图资料dsmw(digitalsoilmapoftheworld)3.6版本，该资料提供了0-30cm和30-100cm的土壤数据，分辨率是5′。本发明在制作土壤参数文件时，最上层土壤参数取自该数据库0-30cm土壤数据，第二，三层土壤参数取自该数据库30-100cm土壤数据。先得到每个网格各层土壤的含砂量以及粘土含量，进一步根据usda(u.s.departmentofagriculture)对土壤的分类标准，按照砂和粘土含量得到每个网格各层土壤的质地类型。利用saxton[88]的公式可以根据含砂量与粘土含量计算得到土壤的饱和水力传导度，凋萎点，田间持水量等参数。其他一些参数则需要根据土壤质地类型来确定，其取值可以参考vic官网。vic水文模型土壤参数文件中还有6个参数需要率定，分别是:(1)b:饱和容量曲线形状参数。它显示网格内饱和区域的下渗能力，通常取值范围为0-0.4。(2)dsmax(mm/day)：最底层土壤能产生的最大基流。它与土壤水力传导度有关，通常取值范围为0-30。(3)ds：基流出现快速非线性增长时占dsmax的比例。通常取值范围为0-1。(4)ws：基流出现快速非线性增长时底层土壤含水量占该层最大土壤含水量的百分比。通常取值范围为0-1。(5)d2(m)：第二层土壤厚度。通常取值范围为0.1-2.0。(6)d3(m)：第三层土壤厚度。通常取值范围为0.1-2.0。对于其他气象强迫数据来看，其来自中国国家级地面气象站基本气象要素日值数据集(v3.0)，该数据集包含了中国基本气象站、基准气候站、一般气象站在内的主要2474个站点1951年1月以来本站的气象要素数据。该数据集经过严格的质量控制，各项要素数据的实有率普遍在99％以上，数据的正确率均接近100％。步骤二，进行降水订正。具体来说：本发明采用的改进的历史相似法，基于寻找历史相似预报，通过用当日的观测数据代替今日的预报数据以减小系统误差并同时进行空间降尺度的订正方法；设在特定时间内有一组网格预测模型状态向量，并假设状态向量有n个分量，并且有m个集合成员，从集合成员的预测中得到了一个有m*n个分量的预测向量xf：假设p维观测到的大气状态如下：这代表网格点或特定位置的大气状态量，得到大气的概率预报如下：f(xt)|xf；。其中，f表示概率密度函数；如果观测大气状态由与预报大气状态相同的位置处的变量相同，并且预报模型是完美的，则来自集合成员的相对概率将是提供任何事件概率的唯一来源，在抽样误差范围内可表示为：其中，t是某个选定事件的阈值，当时，否则为0。但是，由于模型误差和构造集合成员方法的不足，集合预报通常是不完美的。即使存在模型误差，如果气候状态稳定并且可以使用相关的验证数据计算几乎无限时间长度的预报数据，仍然可以直接计算得到式。通过这个几乎无限的集合，可以简单地找到与当前预测状态几乎相同的过去预测状态，然后从那些日期观测到的状态的分布确定式。假设有相同预报时效的历史预报数据与当前预报数据几乎完全相同。设xt|r＝(xt|r(1)，…，xt|r(s))。表示在几乎相同的历史预报数据的日期上s个相关的过去观测状态的集合，然后找到给定位置的事件概率。所涉及的公式如下：其中当时否则为0。如果观测到的状态实际上是以比原始预测小得多的尺度描述大气状态，则该过程相当于统计降尺度。设样本量为10000天的重新预报数据集。创建一个时间序列的重新预测和相应的观测数据；考虑真实状态>0的事件，状态是标量，预报是确定性的，因此问题可以二维化。假设对当前预测的重新预测接近程度的标准是在0.5个单位的窗口内，在这个宽度的垂直列中找到预测点，然后用观测数据>0计算分数。具体来说，当预报技巧增加或减少时，需要考虑这种预测方法的渐近误差特征。如果预测与观测数据完全不相关，则公式将在采样误差内重现气候分布特征。如果预测系统的精确性提高，即预测和观测方法相关性为1，概率预报将变得越来越尖锐而不会失去可靠性。在预测误差逐渐向零逼近时，概率预报将接近完美的确定性预报。在这种情况下，重新预测是不必要的，但由于这个极限仅仅是理论上的，所以可以知道历史相似法在公式中的表现随着预测模型的改进而改进。同时，历史相似方法的过程较为简单。但是，假设模型状态量是由100个成员的集合预报组成，其可包括全球数百万个网格点的风，温度，湿度和位势高度。即使经过数十亿年的重新预测，也很难找到许多接近全球的类似情况。甚至在如此长的时间内进行重新预测，气候，甚至大陆本身都不是很稳定。因此，需要先进行一些简化处理。具体来说，本发明采用的简化过程如下：(1)如果重点研究的是特定位置的预报情况，则可能只需要该位置周围的预报模型状态即可。(2)如果应用的数据是集合预报，则可能没有必要匹配集合预报的所有成员；对集合平均进行寻找历史相似预报即可。(3)如果重点研究的是关于地表温度的天气事件，仅仅匹配地表温度的历史相似就足够，可以忽略其他大气状态量，例如风或温度。步骤三，为了更好的实现本发明的方法，还可以加入参数率定方法。具体来说，参数率定方法为dream(differentialevolutionadaptivemetropolis)算法，融合了差分进化算法(shuffledcomplexevolutionmetropolis，scem-ua)和自适应马尔可夫链蒙特卡罗算法各自的优势，能够有效地解决了群体多样性和收敛速度、马尔可夫链蒙特卡罗方法中选取合适搜索步长和准确定位搜索方向，发挥了在马尔可夫链中保持细节平衡和遍历性的优点。同时，显示出在复杂、高非线性和多峰分布中良好的效率。该参数率定方法提出了一种用于水文模型参数后验概率密度函数贝叶斯推理的通用马尔可夫链蒙特卡罗(mcmc)算法。该方法可以并行运行多个不同的马尔可夫链，利用离散的最优分布将采样器演化为后验分布。dream方法保持了较稳定的平衡，在复杂的多模态搜索问题上表现出优异的性能。当根据一些历史数据记录校准数百(数千)个参数时，这种算法可以得到较好的表现结果。dream的基本方法是通过贝叶斯原理推导求出参数的后验分布。贝叶斯原理是概率学中一个非常重要的定理，在水文领域，贝叶斯原理常常被用来进行概率预报以及推求参数的后验分布。以参数估计为例，贝叶斯原理可以表示为：其中，x代表参数，y代表模型输出所对应的观测。p(x)和p(x|y)分别是参数的先验分布(priordistribution)与后验分布(posteriordistribution)，p(y|x)代表似然函数(likelihoodfunction)。p(y)通常作为一个归一化的常量，使得参数的后验分布在整个参数空间的积分为1，而在实际推求参数后验分布时，并不需要p(y)。由此可得：p(x|y)∝p(x)p(y|x)。假设我们已知先验信息，或者通过假设获得先验分布，进一步构建似然函数来反映样本信息，这样便可以利用贝叶斯原理估计参数的后验分布。在实际应用过程中，贝叶斯理论框架下的后验分布几乎没有解析解，因此不能应用解析近似的手段来进行求解。但是，随着计算机技术的不断发展，利用采样方法使得推求贝叶斯后验分布成为可能。而马尔科夫蒙特卡洛方法(mcmc)在推求贝叶斯理论中的后验分布的广泛应用使之成为可能，极大的提高了计算效率。mcmc方法的基本思想是构造一个平稳分布为π(θ)的马尔科夫链，通过不断对参数空间中前一状态的参数进行更新，使得马尔科夫链最终收敛于其平稳分布，进而就可以通过马尔科夫链从复杂分布π(θ)中取样。最早的mcmc方法由metropolis提出，他构造了一个关于π(θ)可逆，即满足细致平衡(detailedbalance)条件的马尔科夫链。由马尔科夫链的性质可以知道，如果马尔科夫链关于π(θ)是可逆的，则π(θ)就是该链的平稳分布。为了构造关于π(θ)可逆的马尔科夫链，metropolis通过运用“接受/拒绝”的思想，引入了接受准则，并成为后续众多mcmc方法的基本构成要素。假设xt-1为t-1时刻的参数值，则下一时刻参数要变为状态xt被接受的概率为：metropolis假设下一时刻的参数值从建议分布的(proposaldistribution)q(xt|xt-1)中产生，并且该建议分布式对称的，即q(xt|xt-1)＝q(xt-1|xt)。在此假设下，容易证明：π(xt-1)q(xt|xt-1)pacc(xt-1→xt)＝π(xt)q(xt-1|xt)pacc(xt→xt-1)。同时，上述mcmc方法的使用效率与适用性能和建议分布相关性很大，因此之后的很多研究对此进行了改进。其中dream是一种非常高效的改进mcmc方法，它基于de-mc(differentialevolutionmarkovchain)的思想，利用差分演化的方法代替了假设的建议分布，可同时运行多条马尔科夫链同步对参数进行更新，并利用metropolis接受准则来判断是否接受更新后的参数。dream方法在对参数更新时，利用子空间抽样的思想只对随机选出的部分参数进行更新，并且对马尔科夫链演化过程中的异常值进行修正，从而能够比de-mc更快地收敛于平稳分布。dream从参数的历史状态值中进行抽样差分并更新当前时刻的参数值。这样，可以有效地减少所需要的马尔科夫链数量，在高维参数率定问题中可以加快收敛速度。此外，dream(zs)还使用了斯诺克更新(snookerupdate)来增加更新后参数样本的多样性，使得算法可以更好地对参数空间进行搜索。结合实际实施来看，使用dream参数率定方法对六个最敏感的土壤参数进行自动率定。参数优化的目标函数分别设置为nash系数，相对误差，绝对误差。把观测降水和订正前后的预报降水分别进行率定(率定期为1985年-1999年)，通过对比观测降水验证期(验证期为2000年-2010年)设定不同目标函数时径流的模拟结果发现，将流域面雨量相对误差作为目标函数的径流模拟结果最优。同时，本发明重点讨论降水输入的不确定性对径流模拟的影响，因此不同目标函数导致的参数不确定性影响在本发明中不做过多研究，在此不再赘述。为了更好的解释本发明，本发明使用的淮河流域土壤参数的目标函数为相对误差。其中水文模式的spinup时间分别为1985年1–5月和2000年1–5月，便于参考理解。步骤四，运行水文模式，并得到径流模拟结果。具体来说，采用可变下渗容量模型(variableinfiltrationcapacity，vic)，它是一种基于空间分布网格和土壤植被大气传输方案(svat)的大尺度分布式水文模型。最初，vic模型将土壤分为两层，称为vic-2l模型。由于vic-2l模型缺乏对土壤水分动态变化过程和各土层间水分扩散过程的描述。因此，可以将vic-2ll模型改进为vic-3l模型，在表层土壤中定义了另一薄层。它是基于svat(soilvegetationatmospherictransferscheme)思想的次网格模型，可同时对水量平衡和能量平衡进行计算。同时，考虑了径流的超渗产流机制和蓄满产流机制，还需要考虑基流退水的非线性问题。由于vic模型是一个大尺度，分布式的水文模型。因此，它与其他陆面模型(lsm)具有一些共同的特征，这些模型通常与全球循环模型(gcm)相耦合：(1)假设陆地表面很大(>>1km)，为平坦，均匀的网格。可通过统计分布处理子网格的不同特征(例如，高程，土地覆盖)。(2)输入为气象要素的时间序列(例如降水，气温，风速，辐射等)。(3)陆地-大气通量以及陆地表面的水和能量平衡在日尺度进行模拟。(4)水只能通过大气进入网格单元，忽略网格单元之间的交换。一旦水到达水流通道，就假定它停留在通道中(它不会流回到土壤中)。最后，对vic模型的实施有两个影响：网格单元彼此独立地模拟，网格单元之间没有水交换；流动的水流与陆地表面模拟分开进行，使用单独的模型。在vic运行过程中除了需要输入降水数据外，还需要输入土壤参数文件，土壤参数文件主要有以下三个作用：(1)定义每个网格单元的单元id号。此id号本质上是一个数据库键，用于将网格单元链接到各种参数文件中的代码。(2)定义网格单元土壤参数，以及网格单元中心点的纬度和经度信息。(3)定义初始土壤湿度条件，在没有初始状态文件的情况下使用此信息。在实际实施的时候，土壤参数作为单个ascii文件提供给vic，每个网格单元具有单独的行，每个字段包含不同的参数值。本发明在实施的时候，运行vic模型进行产流，再将用vic模型得到的runoff输入到汇流模型中。汇流模型是由lohmann开发的与vic模型耦合以计算流域出口流量。汇流模型独立于陆面模型，是分开运行的。同时，在汇流模型里，汇入河道的水不再回到网格，因此不参与水量平衡的计算。将订正前后的reforecast数据由1°分辨率通过双线性插值到0.25°，然后把订正前后的reforecast数据，cgdpa数据输入到时间分辨率为1天，空间分辨率为0.25°的vic模型中，再通过汇流模型得到径流模拟结果。步骤五，进行径流集合平均检验与概率性检验。本发明采用的集合平均检验为，选用定量分析gefsreforecast数据预报的整体水平的度量标准，包括systematicbias(bias)，pearsoncorrelationcoefficient(cc)andrelativeerror(re)，它们的计算公式如下：其中，n是事件的总数，oi和si是第i对被检验的观测降水分析和降水预报量；和分别是它们相对应的平均值；采用四种评分标准对gefsreforecast数据的预报能力进行评估，分别为equitablethreatscore(ets)，frequencybias，probabilityofdetection(pod)和falsealarmratio(far)；它们的最优值分别是1，1，1，0，变化范围分别为-1/3-1，0-1，0-1，0-∞；equitablethreatscore(ets)评估去掉随机因素的发生的事件被正确预报出的比率，probabilityofdetection(pod)为命中率，评估发生的事件被正确预报出的比率，falsealarmratio(far)为假警率，评估实际没发生但预报有的事件的比率，frequencybias为频率偏差，评估预报发生的事件和实际发生的事件的比率；它们的计算公式如下：其中，h表示正确预报的格点数，m表示漏报格点数，f表示空报格点数，c表示正确预报出未存在降水事件格点数。具体描述可参考下表：本发明采用的概率性检验为通过rmsevssprd评估集合数据的成员离散度，之后进行roc面积检验以评估预报数据的分辨能力，再获取bss评分以评断其概率预报技巧。具体来说：比较集合成员的集合离散度与集合平均的均方根误差可以分析集合离散度误差关系，检验集合预报系统成员的离散状态：记fi(n)代表第i个样本的第n个集合成员的预报值，其中i＝1，2，3，…，m；n＝1，2，3，…，n；m为总的样本数，n为集合成员数；记oi代表第i个样本的观测。采用的集合平均为均方根误差为集合离散度为选用的roc为relativeoperatingcharacteristic，其曲线是信号检测理论中一种描述灵敏度的图像，用于衡量预报系统区别二分类事件的能力；首先设定一个概率阈值，大于等于此阈值的预报概率认为此事件发生，否则不发生，从而将概率预报转换成常见的二分类确定性预报，计算相应的命中率和假警报率：也就是说，将二分类确定性预报中的假警率和命中率分别作为横、纵坐标轴，画图得到一系列点，连接这些点得到的曲线即为roc曲线；roc曲线越接近于上x轴和左y轴，预报技巧越高。相对作用特征曲线下的面积rocarea也是模式检验的重要指标，rocarea越接近于1，预报技巧越高；当rocarea小于等于0.5时，不具有预报技巧。其中，bss评分是在brier评分(bs)的基础之上，考虑了样本的气候频率，对某一事件预报概率和实际发生概率之间的比较；对于完美的预报，bss＝1，bss大于0表示概率预报有技巧，bss小于等于0则不存在技巧。记pi为样本i的预报概率，oi为样本i实际发生概率，对于给定的降水阈值，如果该样本实际降水大于此阈值，那么oi＝1，否则oi＝0；。bs评分为将bs评分分为三部分，包括可靠性(reliability)、精确性(resolution)、不确定性(uncertainty)。bss评分，对于径流检验来看，其采用nash系数与覆盖率获取，nash系数为公式中，qobs指观测值，qsim指模拟值，表示观测值的总平均nse取值为负无穷到1，nse接近1，表示模式质量好，模型可信度高；nse接近0，表示模拟结果接近观测值的平均值水平，即总体结果可信，但过程模拟误差大；nse远远小于0，则模型为不可信。本发明采用的覆盖率为，表示日观测径流量落在模拟径流量集合成员界内的频率，等于1时最佳；表示径流预报集合成员界内的平均宽度，可表示观测径流的标准差，d-factor越小越好；通常d-factor和cr配合使用，在达到cr最大时，d-factor越小越好。通过图5可以看到，改进的历史相似法使得在提前五天的预报时效内均有显著改善，有着更高的nash系数。进一步结合图6来看：以针对淮河流域2003年6-7月历史上第二大洪水的预警进行模拟来看。通过运用淮河流域1985-2010历史数据。能够有效获取预报径流数据。其中1985-1999数据用于预报降水订正，2000-2010数据用于检验此改进方法的结果。并且，由于采用了改进的历史相似法，根据流域特征选择了同时满足空间相关系数>0.7，面雨量相对误差>-0.2条件下，降水rmse最小作为寻找相似标准。获取的径流集合平均nash系数对比如下表所示：观测降水原始预报改进的历史相似法基础历史相似法nash系数0.650.440.460.39针对vic分布式水文模型对降水空间分布和流域面雨量敏感的特点，以及原始预报低估径流峰值的现象对找相似标准进行了改进。通过上述的文字表述并结合附图可以看出，采用本发明后，能针对现有的气象预报数据订正方法无法得到较好径流预报结果的问题，结合水文模型自身的特点(对流域内面雨量和空间分布敏感)，对降水预报的订正方法进行了创新。使得在有限的大数据范围内最大程度满足水文模式对降水预报数据的精度需求(更小的面雨量和更精确的降水空间分布)，以达到提高径流预报精度和增加预报时效的效果，为预报洪涝灾害提供技术支撑。拥有如下优点：1、基于气象预报降水大数据的长期系统误差分析，对流域从量级和空间分布上订正集合降水预报，提高径流模拟能力。2、基于径流模拟对流域面雨量较为敏感的特性，对历史相似法寻找历史相似预报的标准进行了改进，提高了集合降水预报的订正效果，实现了在有限气象数据中得到最优径流预报结果的目的。3、本方法首次流域特征作为将气象降水预报大数据的订正标准，并用集合预报大数据进行了综合统计分析，论证了改进的历史相似法在径流预报中的正效果。以上所述仅是本发明的优选实施方式，并不用于限制本发明，应当指出，对于本
技术领域：
：的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变型，这些改进和变型也应视为本发明的保护范围。当前第1页1 2 3 当前第1页1 2 3
技术特征：

1.基于气象大数据的径流预报改进方法，其特征在于包括以下步骤：

步骤一，获取特定区域、时间的数据，所述数据包括降水数据、其他水文输入数据；

步骤二，进行降水订正；

步骤三，获取观测径流数据，运用dream参数率定方法进行水文参数率定；

步骤四，运行水文模式，得到径流模拟结果；

步骤五，进行径流集合平均检验与概率性检验。

2.根据权利要求1所述的基于气象大数据的径流预报改进方法，其特征在于：所述降水数据，包括观测降水数据、预报降水数据；

所述其他水文输入数据，至少包括数字高程数据、植被数据、土壤输入数据、其他气象强迫数据，

所述其他气象强迫数据包括风速、日最高和最低气温；

所述观测降水数据为chinagauge-baseddailyprecipitationanalysis(cgdpa)，即中国逐日网格降水资料；所述预报降水数据是ncepgefs第二代reforecast数据所产生的24小时累计降水(00utc-00utc)集合预报，包含1个控制预报和10个扰动成员，但计算集合平均的时候仅使用扰动成员。数据存储的分辨率为1°。

3.根据权利要求1所述的基于气象大数据的径流预报改进方法，其特征在于：所述集合平均检验为，选用定量分析gefsreforecast数据预报的整体水平的度量标准，包括systematicbias(bias)，pearsoncorrelationcoefficient(cc)andrelativeerror(re)，它们的计算公式如下：

其中，n是事件的总数，oi和si是第i对被检验的观测降水分析和降水预报量；和分别是它们相对应的平均值；

采用四种评分标准对gefsreforecast数据的预报能力进行评估，分别为equitablethreatscore(ets)，frequencybias，probabilityofdetection(pod)和falsealarmratio(far)；它们的最优值分别是1，1，1，0，变化范围分别为-1/3-1，0-1，0-1，0-∞；equitablethreatscore(ets)评估去掉随机因素的发生的事件被正确预报出的比率，probabilityofdetection(pod)为命中率，评估发生的事件被正确预报出的比率，falsealarmratio(far)为假警率，评估实际没发生但预报有的事件的比率，frequencybias为频率偏差，评估预报发生的事件和实际发生的事件的比率；

它们的计算公式如下：

其中，h表示正确预报的格点数，m表示漏报格点数，f表示空报格点数，c表示正确预报出未存在降水事件格点数。

4.根据权利要求1所述的基于气象大数据的径流预报改进方法，其特征在于：所述概率性检验为通过rmsevssprd，之后获取roc面积，再进行bss评分。

5.根据权利要求4所述的基于气象大数据的径流预报改进方法，其特征在于：所述比较集合成员的集合离散度与集合平均的均方根误差可以分析集合离散度误差关系，检验集合预报系统成员的离散状态，

记fi(n)代表第i个样本的第n个集合成员的预报值，其中i＝1，2，3，…，m；n＝1，2，3，…，n；m为总的样本数，n为集合成员数；记oi代表第i个样本的观测；

采用的集合平均为

均方根误差为

集合离散度为

6.根据权利要求4所述的基于气象大数据的径流预报改进方法，其特征在于：所述roc为relativeoperatingcharacteristic，其曲线是信号检测理论中一种描述灵敏度的图像，用于衡量预报系统区别二分类事件的能力；首先设定一个概率阈值，大于等于此阈值的预报概率认为此事件发生，否则不发生，从而将概率预报转换成常见的二分类确定性预报，计算相应的命中率和假警报率：

将二分类确定性预报中的假警率和命中率分别作为横、纵坐标轴，画图得到一系列点，连接这些点得到的曲线即为roc曲线；roc曲线越接近于上x轴和左y轴，预报技巧越高；相对作用特征曲线下的面积rocarea是模式检验的指标，rocarea越接近于1，预报技巧越高；当rocarea小于等于0.5时，不具有预报技巧。

7.根据权利要求4所述的基于气象大数据的径流预报改进方法，其特征在于：所述bss评分是在brier评分(bs)的基础之上，考虑了样本的气候频率，对某一事件预报概率和实际发生概率之间的比较；对于完美的预报，bss＝1，bss大于0表示概率预报有技巧，bss小于等于0则不存在技巧；记pi为样本i的预报概率，oi为样本i实际发生概率，对于给定的降水阈值，如果该样本实际降水大于此阈值，那么oi＝1，否则oi＝0；

bs评分为将bs评分分为三部分，包括可靠性、精确性、不确定性；

bss评分，

8.根据权利要求1所述的基于气象大数据的径流预报改进方法，其特征在于：所述径流检验采用nash系数与覆盖率获取，

所述nash系数为

公式中，qobs指观测值，qsim指模拟值，表示观测值的总平均nse取值为负无穷到1，nse接近1，表示模式质量好，模型可信度高；nse接近0，表示模拟结果接近观测值的平均值水平，即总体结果可信，但过程模拟误差大；nse远远小于0，则模型为不可信；

所述覆盖率为，表示日观测径流量落在模拟径流量集合成员界内的频率，等于1时最佳；

通过公式，

表示径流预报集合成员界内的平均宽度，可表示观测径流的标准差，d-factor越小越好；d-factor和cr配合使用，在达到cr最大时，d-factor越小越好。

9.根据权利要求1所述的基于气象大数据的径流预报改进方法，其特征在于：所述降水订正选用历史相似法，并根据流域特征对该方法进行了改进，所述历史相似法基于寻找历史相似预报，通过用当日的观测数据代替今日的预报数据以减小系统误差并同时进行空间降尺度的订正方法；设在特定时间内有一组网格预测模型状态向量，并假设状态向量有n个分量，并且有m个集合成员，从集合成员的预测中得到了一个有m*n个分量的预测向量x^f：

假设p维观测到的大气状态如下：

这代表网格点或特定位置的大气状态量，得到大气的概率预报如下：

f(x^t)|x^f(2.19)；

其中f表示概率密度函数；如果观测大气状态由与预报大气状态相同的位置处的变量相同，并且预报模型是完美的，则来自集合成员的相对概率将是提供任何事件概率的唯一来源，在抽样误差范围内可表示为：

其中t是某个选定事件的阈值，当时，否则为0。

技术总结
本发明涉及一种基于气象大数据的径流预报改进方法，其包括以下步骤：获取特定区域、时间的数据，所述数据包括降水数据、其他水文输入数据；进行降水订正；获取历史观测径流数据，运用DREAM参数率定方法进行水文参数率定；运行水文模式，得到径流模拟结果；进行径流集合平均检验与概率性检验。由此，基于气象预报降水大数据的长期系统误差分析，对流域从量级和空间分布上订正集合降水预报，提高径流模拟能力。基于径流模拟对流域面雨量较为敏感的特性，对历史相似法寻找历史相似预报的标准进行了改进，提高了集合降水预报的订正效果，实现了在有限气象数据中得到最优径流预报结果的目的。

技术研发人员：杨春蕾;袁慧玲;顾明剑
受保护的技术使用者：中国科学院上海技术物理研究所苏州研究院;南京大学
技术研发日：2020.01.08
技术公布日：2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-15293.html

专利

最新回复(0)