本发明涉及超级计算机,特别涉及一种超级计算机数据交换及分解方法、装置、设备及介质。
背景技术:
1、乔列斯基分解在数值计算和科学工程领域应用广泛,对于高效线性方程组分解,数值优化,协方差矩阵分解,随机数生成,信号和图像处理等多个领域都有非常重要的作用。但是随着近年来众多领域的问题变得庞大复杂,传统的乔列斯基分解效率变得逐渐低下。在超级计算机上运行的并行程序,通常会因为频繁的数据交换导致计算机处理器的运行速度远超过内存的读取速度,也就是常说的访存受限。
2、由上可见,如何提高超级计算机中的缓存的使用效率,实现缓存数据和内存数据之间的数据交换,提高超级计算机中对称正定矩阵的分解及计算,以便充分发挥超级计算机的性能是本领域有待解决的问题。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种超级计算机数据交换及分解方法、装置、设备及介质,能够提高超级计算机中的缓存的使用效率,实现缓存数据和内存数据之间的数据交换,提高超级计算机中对称正定矩阵的分解及计算,以便充分发挥超级计算机的性能。其具体方案如下:
2、第一方面,本申请公开了一种超级计算机数据交换及分解方法,包括:
3、对预设的乔列斯基分解法进行算子融合,以得到融合后的所述乔列斯基分解法;
4、采用基于固定步长的迭代优化算法对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法;
5、获取对称正定矩阵,从超级计算机的内存数据中调取与所述对称正定矩阵对应的数据,并存储至缓存数据中,利用优化融合后的所述乔列斯基分解法和所述缓存数据对所述对称正定矩阵进行分解,以实现所述内存数据与所述缓存数据之间的数据交换以及对所述对称正定矩阵的分解。
6、可选的,所述对预设的乔列斯基分解法进行算子融合,以得到融合后的所述乔列斯基分解法,包括:
7、利用非临时存储带宽对预设的乔列斯基分解法进行算子融合,以得到融合后的所述乔列斯基分解法。
8、可选的,所述采用基于固定步长的迭代优化算法对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法,包括:
9、采用基于固定步长的迭代优化算法并基于任务并行化的方式对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法。
10、可选的,所述采用基于固定步长的迭代优化算法并基于任务并行化的方式对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法,包括:
11、采用基于固定步长的迭代优化算法将融合后的所述乔列斯基分解法划分为各分解步骤;
12、基于任务并行化的方式对各所述分解步骤进行迭代优化,以得到优化融合后的所述乔列斯基分解法。
13、可选的,所述利用优化融合后的所述乔列斯基分解法和所述缓存数据对所述对称正定矩阵进行分解,包括:
14、利用优化融合后的乔列斯基分解法和缓存数据绘制出与对称正定矩阵对应的计算流程图;
15、基于所述计算流程图对所述对称正定矩阵进行分解及计算。
16、可选的,所述基于所述计算流程图对所述对称正定矩阵进行分解及计算,包括:
17、基于所述计算流程图确定所述对称正定矩阵中的待计算变量;
18、对所述待计算变量进行分解及计算,以得到下三角形,根据所述下三角形确定目标对称正定矩阵。
19、第二方面,本申请公开了一种超级计算机数据交换及分解装置,包括:
20、算子融合模块,用于对预设的乔列斯基分解法进行算子融合,以得到融合后的所述乔列斯基分解法;
21、优化模块,用于采用基于固定步长的迭代优化算法对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法;
22、数据交换及分解模块,用于获取对称正定矩阵,从超级计算机的内存数据中调取与所述对称正定矩阵对应的数据,并存储至缓存数据中,利用优化融合后的所述乔列斯基分解法和所述缓存数据对所述对称正定矩阵进行分解,以实现所述内存数据与所述缓存数据之间的数据交换以及对所述对称正定矩阵的分解。
23、可选的,所述优化模块,包括:
24、并行优化模块,用于采用基于固定步长的迭代优化算法并基于任务并行化的方式对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法。
25、第三方面,本申请公开了一种电子设备,包括:
26、存储器,用于保存计算机程序;
27、处理器,用于执行所述计算机程序,以实现前述的超级计算机数据交换及分解方法。
28、第四方面,本申请公开了一种计算机存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的超级计算机数据交换及分解方法的步骤。
29、可见,本申请提供了一种超级计算机数据交换及分解方法,包括对预设的乔列斯基分解法进行算子融合,以得到融合后的所述乔列斯基分解法;采用基于固定步长的迭代优化算法对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法;获取对称正定矩阵,从超级计算机的内存数据中调取与所述对称正定矩阵对应的数据,并存储至缓存数据中,利用优化融合后的所述乔列斯基分解法和所述缓存数据对所述对称正定矩阵进行分解,以实现所述内存数据与所述缓存数据之间的数据交换以及对所述对称正定矩阵的分解。本申请对乔列斯基分解法进行算子融合,并且基于固定步长的迭代优化算法进行迭代优化,所以能够在不影响正确性的前提下,加快算法速度,将超级计算机的内存数据调取并存储至缓存数据,能够解决因频繁的数据交换导致计算机处理器的运行速度远超过内存的读取速度的问题,从而不仅超级计算机中的缓存的使用效率,还实现缓存数据和内存数据之间的数据交换,利用优化融合后的乔列斯基分解法和缓存数据对对称正定矩阵进行分解,提高超级计算机中对称正定矩阵的分解及计算,充分发挥超级计算机的性能。
1.一种超级计算机数据交换及分解方法,其特征在于,包括:
2.根据权利要求1所述的超级计算机数据交换及分解方法,其特征在于,所述对预设的乔列斯基分解法进行算子融合,以得到融合后的所述乔列斯基分解法,包括:
3.根据权利要求1所述的超级计算机数据交换及分解方法,其特征在于,所述采用基于固定步长的迭代优化算法对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法,包括:
4.根据权利要求3所述的超级计算机数据交换及分解方法,其特征在于,所述采用基于固定步长的迭代优化算法并基于任务并行化的方式对融合后的所述乔列斯基分解法进行迭代优化,以得到优化融合后的所述乔列斯基分解法,包括:
5.根据权利要求1至4任一项所述的超级计算机数据交换及分解方法,其特征在于,所述利用优化融合后的所述乔列斯基分解法和所述缓存数据对所述对称正定矩阵进行分解,包括:
6.根据权利要求5所述的超级计算机数据交换及分解方法,其特征在于,所述基于所述计算流程图对所述对称正定矩阵进行分解及计算,包括:
7.一种超级计算机数据交换及分解装置,其特征在于,包括:
8.根据权利要求7所述的超级计算机数据交换及分解装置,其特征在于,所述优化模块,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的超级计算机数据交换及分解方法。
