本发明涉及气象数据处理,尤其涉及一种考虑均值方差一致性的气象数据延长方法。
背景技术:
1、受气象站建站年份不一致或者收集数据困难等多方面因素影响,实际使用的气象数据系列存在长短不一的现象。在气象或水文分析研究中,一般需要相同长度系列数据,通常采用数据系列长的站点(参考站)对数据系列短的站点(插补站)的数据进行插补。然而,由于参考站和插补站的变化规律和趋势不完全一致,使得基于参考站得到的插补序列和插补站原有序列的数值存在统计上的不一致性,从而在插补过程中额外引入误差,特殊情况下甚至出现明显的均值跃迁现象,影响分析研究结论准确性。
技术实现思路
1、本发明的目的在于提供一种考虑均值方差一致性的气象数据延长方法,从而解决现有技术中存在的前述问题。
2、为了实现上述目的,本发明采用的技术方案如下:
3、一种考虑均值方差一致性的气象数据延长方法,包括如下步骤,
4、s1、根据数据序列完整性,将收集的气象站点数据分为序列完整的参考站初始数据序列和数据缺失的插补站初始数据序列;
5、s2、根据插补站初始数据序列中的数据缺失情况,对其进行简单插补,获取插补站简单插补序列y;
6、s3、将插补站和参考站日数据生成的月尺度数据序列或者直接使用对应年或月尺度序列分别作为插补站相关关系计算序列和参考站相关关系计算序列;
7、s4、计算插补站相关关系计算序列和参考站相关关系计算序列之间的相关系数,并根据相关系数与预设阈值之间的大小关系,确定各个插补站所采用的插值参考站列表;
8、s5、基于插补站的插值参考站列表中参考站初始数据序列对插补站进行插值计算,获取插补站初步插值序列x;
9、s6、根据插补站简单插补序列y和插补站初步插值序列x都有数据的序列的方差和均值,计算相应的插补修正参数;
10、s7、根据插补修正参数对插补站初步插值序列x进行修正,获取插补站修正插值序列y’;
11、s8、根据插补站修正插值序列y’对插补站简单插补序列y中缺失数据的部分进行替换,获取最终的插补站补全数据序列。
12、优选的,所述插补站初始数据序列包括有数据部分子序列和缺失数据部分子序列;缺失数据部分最终需要利用上述步骤进行补全;
13、初始数据序列中所包含的气象数据为降水、气温、日照、风速、相对湿度;所述气象数据的时间尺度为年、月、日。
14、优选的,步骤s2具体为,对于插补站初始数据序列中缺失1~2个数据的情况,以降水数据用0、其他气象数据采用线性插值的方式进行插补,得到插补站简单插补序列y;
15、所述插补站简单插补序列y包括插补站有数据子序列y0和插补站无数据子序列y1。
16、优选的,步骤s3具体为,对日数据进行插值时,先按月对初始数据序列进行统计得到月尺度数据,并设定缺数据个数超过7天的月没有月数据,将插补站和参考站日数据生成的月尺度数据序列分别作为插补站相关关系计算序列和参考站相关关系计算序列;
17、对于年、月尺度进行插值时,直接使用插补站和参考站对应年或月尺度序列分别作为插补站相关关系计算序列和参考站相关关系计算序列。
18、优选的,步骤s4具体为,计算插补站与参考站数据序列的相关系数,根据相关系数选择相应的参考站作为插值使用的参考站,以确定所使用的插值参考站列表;
19、计算插补站与参考站相关关系时,采用的是两个站相关关系计算序列中都有数据的子序列,且对某个插补站而言需要与所有的参考站一一建立关系,并将所有可使用的参考站作为插补站插值使用的参考站,并加入插值参考站列表;
20、可使用参考站的选择标准为,选择相关系数大于预设阈值的参考站作为插值使用的参考站,若所有参考站相关系数都小于预设阈值,则选择最临近的参考站作为插值使用的参考站;
21、所述相关系数的计算公式为,
22、
23、其中,r为相关系数;cov()为对应序列的协方差;var()为对应序列的方差;a为参考站相关关系计算序列;b为插补站相关关系计算序列。
24、优选的,步骤s5具体为,采用插值方法基于插值参考站列表中参考站初始数据序列对各插补站全系列数据进行插值,获取插补站初步插值序列x,该系列中的数据都由参考站数据计算得到;
25、采用的插补方法为泰森多边形法、反距离平方法、克里金法、样条法;根据相关算法要求使用部分或全部插值参考站列表中参考站点进行插值。
26、优选的,步骤s6具体为,筛选插补站简单插补序列y和插补站初步插值序列x都有数据的序列,并按月进行分组,分别计算插补修正参数,计算公式为,
27、
28、bi=avg(y0,i)-ai*avg(x0,i)
29、其中,y0,i为插补站有数据子序列y0的第i个月组成的序列;x0,i为插补站初步插值序列x中时间系列和插补站有数据子序列y0一致的第i个月组成的序列;ai,bi分别为逐月插补修正参数;var()为对应序列的方差;avg()为对应序列的均值;若气象数据时间尺度是月和日,则分月计算,i=1~12;若时间尺度是年,则按年计算,不再细分为月,i=1。
30、优选的,步骤s7具体为,利用插补修正参数,对插补站初步插值序列x中与插补站无数据子序列y1时间系列一致的数值进行修正,获取插补站修正插值序列y’,计算公式为,
31、y′=aix1+bi
32、其中,y′为插补站修正插值序列,时间系列对应插补站无数据子序列y1,数据尺度为年、月或日;x1为插补站初步插值序列x中时间系列和插补站无数据子序列y1一致的部分,数据尺度和y′一致。
33、优选的,步骤s8具体为,将插补站修正插值序列y’和插补站有数据子序列y0合并,获取最终的插补站补全数据序列。
34、本发明的有益效果是:本发明方法通过对传统插值后的数据进行修正,解决了短系列气象站点的插补延长数据系列和原数据系列在统计上不一致的问题,使插补延长数据系列的均值和方差与原数据系列的均值和方差处于一个水平或者具有比较合理的变化趋势,避免明显的突变或跃迁现象,提高插补数据的准确性。
1.一种考虑均值方差一致性的气象数据延长方法,其特征在于:包括如下步骤,
2.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:所述插补站初始数据序列包括有数据部分子序列和缺失数据部分子序列;缺失数据部分最终需要利用上述步骤进行补全;
3.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s2具体为,对于插补站初始数据序列中缺失1~2个数据的情况,以降水数据用0、其他气象数据采用线性插值的方式进行插补,得到插补站简单插补序列y;
4.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s3具体为,对日数据进行插值时,先按月对初始数据序列进行统计得到月尺度数据,并设定缺数据个数超过7天的月没有月数据,将插补站和参考站日数据生成的月尺度数据序列分别作为插补站相关关系计算序列和参考站相关关系计算序列;
5.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s4具体为,计算插补站与参考站数据序列的相关系数,根据相关系数选择相应的参考站作为插值使用的参考站,以确定所使用的插值参考站列表;
6.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s5具体为,采用插值方法基于插值参考站列表中参考站初始数据序列对各插补站全系列数据进行插值,获取插补站初步插值序列x,该系列中的数据都由参考站数据计算得到;
7.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s6具体为,筛选插补站简单插补序列y和插补站初步插值序列x都有数据的序列,并按月进行分组,分别计算插补修正参数,计算公式为,
8.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s7具体为,利用插补修正参数,对插补站初步插值序列x中与插补站无数据子序列y1时间系列一致的数值进行修正,获取插补站修正插值序列y’,计算公式为,
9.根据权利要求1所述的考虑均值方差一致性的气象数据延长方法,其特征在于:步骤s8具体为,将插补站修正插值序列y’和插补站有数据子序列y0合并,获取最终的插补站补全数据序列。
