留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

GRAPES全球模式MPI与OpenMP混合并行方案

蒋沁谷 金之雁

蒋沁谷, 金之雁. GRAPES全球模式MPI与OpenMP混合并行方案. 应用气象学报, 2014, 25(5): 581-591..
引用本文: 蒋沁谷, 金之雁. GRAPES全球模式MPI与OpenMP混合并行方案. 应用气象学报, 2014, 25(5): 581-591.
Jiang Qingu, Jin Zhiyan. The hybrid MPI and OpenMP parallel scheme of GRAPES_global model. J Appl Meteor Sci, 2014, 25(5): 581-591.
Citation: Jiang Qingu, Jin Zhiyan. The hybrid MPI and OpenMP parallel scheme of GRAPES_global model. J Appl Meteor Sci, 2014, 25(5): 581-591.

GRAPES全球模式MPI与OpenMP混合并行方案

资助项目: 

国家自然科学基金项目 61361120098

详细信息
    通信作者:

    金之雁, email: jinzy@cma.gov.cn

The Hybrid MPI and OpenMP Parallel Scheme of GRAPES_Global Model

  • 摘要: 随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为主流架构。为适应这种既有分布式又有共享内存的硬件体系架构,使用MPI与OpenMP混合编程模型,可以实现节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式,MPI用于节点间通信,OpenMP用于节点内并行计算。该文采用MPI与OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行MPI与OpenMP混合并行方案设计和优化。试验结果表明:MPI与OpenMP混合并行方法可以在MPI并行的基础上提高模式的并行度,在计算核数相同的情况下,4个线程内的MPI与OpenMP混合并行方案比单一MPI方案效果好,但在线程数量大于4时,并行效果显著下降。
  • 图  1  GRAPES混合并行水平区域分解方案[18]

    Fig. 1  The horizontal domain decomposition scheme of GRAPES hybrid parallel (from Reference [18])

    图  2  GRAPES模式计算流程图[19]

    Fig. 2  The calculation flow chart of GRAPES model (from Reference [19])

    图  3  单一积分步内带有ILU预条件子的GCR算法平均时间

    Fig. 3  The average time of GCR algorithm with ILU preconditioner in a single integrate step

    图  4  短波辐射使用多种并行方法时间对比

    Fig. 4  The comparsion of different parallel scheme computional time

    图  5  积分计算程序混合并行加速比情况

    Fig. 5  The speedup of integral computation in hybrid parallelization

    图  6  积分计算中主要子程序不同试验方案计算时间对比

    Fig. 6  The comparison of main subroutine integral computation time in each experiment scheme

    图  7  不同计算核数积分35步计算时间情况

    Fig. 7  The integral time of 35 steps with different computing cores

    表  1  不同二级分区划分方案并行计算时间对比

    Table  1  The comparison of parallel computational time with different tile-decomposition schemes

    二级分区划分方案 经向×纬向二级分区数 计算时间/ms
    一维经向划分 8×1 20.3
    水平二维划分 (1) 4×2 17.1
    水平二维划分 (2) 2×4 14.3
    一维纬向划分 1×8 12.3
    下载: 导出CSV

    表  2  不同一级分区划分方案下计算时间对比

    Table  2  The comparison of computational time with different patch-decomposition schemes

    经向×纬向一级分区数 二级分区数 计算时间/ms
    8×2 4 28.1
    4×4 4 19.1
    2×8 4 19.3
    下载: 导出CSV

    表  3  3种线程调度方式下插值与积云对流参数化计算时间

    Table  3  The comparison of interpolation and cumulus convection scheme computational time with three thread scheduling policies

    进程数 线程数 插值程序计算时间/ms 积云对流参数化计算时间/ms
    静态调度 动态调度 指导调度 静态调度 动态调度 指导调度
    16 1 48.4 47.7 47.9 75.0 75.1 75.0
    16 2 28.7 27.7 28.0 40.4 38.2 38.5
    16 4 17.2 17.5 16.9 21.3 20.0 19.8
    16 8 11.6 12.2 11.8 11.1 10.4 10.7
    下载: 导出CSV

    表  4  二级分区并行和循环并行结果对比

    Table  4  The comparison of tile-level and loop-level parallelization results

    进程数 线程数 计算时间/ms
    二级分区并行 循环并行
    16 1 50.8 48.4
    16 2 31.0 28.7
    16 4 18.3 17.2
    16 8 12.3 11.6
    下载: 导出CSV

    表  5  GCR算法混合并行结果对比

    Table  5  The comparison of hybrid parallel results of GCR algorithm

    计算节点数 进程数 线程数 计算时间/s
    16 64 1* 0.6875
    16 64 1 0.6937
    16 32 2 0.6777
    16 16 4 0.7622
    8 8 8 0.8230
    注:*表示单一MPI方案未开启OpenMP编译选项。
    下载: 导出CSV
  • [1] Gysi T, Fuhrer O, Osuna C, et al.Porting COSMO to Hybrid Architectures.[2013-04-14]. http://data1.gfdl.noaa.gov/multi-core/2012/presentations/Session_2_Messmer.pdf.
    [2] 冯云, 周淑秋.MPI+OpenMP混合并行编程模型应用研究.计算机系统应用, 2006(2):33-35. http://cdmd.cnki.com.cn/Article/CDMD-10530-2008180946.htm
    [3] 樊志杰, 赵文涛.GRAPES四维变分同化系统MPI和OpenMP混合算法研究.计算机光盘软件与应用, 2012(19):21-23. http://www.cnki.com.cn/Article/CJFDTOTAL-GPRJ201219008.htm
    [4] The Weather Research and Forecasting (WRF) Model.[2013-01-09].http://wrf-model.org/.
    [5] The Users Home Page for the Weather Research and Forecasting (WRF) Modeling System.[2013-01-09]. http://www.mmm.ucar.edu/wrf/users/.
    [6] Skamarock W C, Klemp J B, Dudhia J, et al.A Description of the Advanced Research WRF Version 3.NCAR Tech Note NCAR/TN-475+STR, 2005.
    [7] Šipková V, Lúcny A, Gazák M.Experiments with a Hybrid-Parallel Model of Weather Research and Forecasting (WRF) System.GCCP 2010 Book of Abstracts, 2010:37. doi:  10.1175/2008MWR2445.1
    [8] Epicoco I, Mocavero S, Giovanni A.NEMO-Med:Optimization and Improvement of Scalability.CMCC Research Paper, 2011. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1959924
    [9] 张昕, 季仲贞, 王斌.OpenMP在MM5中尺度模式中的应用试验.气候与环境研究, 2001, 6(1):84-90. http://www.cnki.com.cn/Article/CJFDTOTAL-QHYH200101009.htm
    [10] 朱政慧, 施培量, 颜宏.用OpenMP并行化气象预报模式试验.应用气象学报, 2002, 13(1):102-108. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20020112&flag=1
    [11] 朱政慧.并行高分辨率有限区预报系统在IBM SP上的建立.应用气象学报, 2003, 14(1):119-121. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20030114&flag=1
    [12] 朱政慧.一个数值天气预报模式的并行混合编程模型及其应用.数值计算与计算机应用, 2005, 26(3):203-204. http://www.cnki.com.cn/Article/CJFDTOTAL-SZJS200503005.htm
    [13] 郭妙, 金之雁, 周斌.基于通用图形处理器的GRAPES长波辐射并行方案.应用气象学报, 2012, 23(3):348-354. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20120311&flag=1
    [14] 郑芳, 许先斌, 向冬冬, 等.基于GPU的GRAPES数值预报系统中RRTM模块的并行化研究.计算机科学, 2012, 39(6):370-374. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJA2012S1100.htm
    [15] OpenMP Specications.OpenMP Application Programing Interface.V3.0, 2008.[2013-01-09]. http://www.openmp.org/mp-documents/spec30.pdf.
    [16] Chapman B, Jost G, Van Der Pas R.Using OpenMP:Portable Shared Memory Parallel Programming.London:MIT Press, 2008.
    [17] Blaise Barney.OpenMP.[2013-01-09].https://computing.llnl.gov/tutorials/openMP/.
    [18] 薛纪善, 陈德辉.数值预报系统GRAPES的科学设计与应用.北京:科学出版社, 2008.
    [19] 伍湘君.GRAPES高分辨率气象数值预报模式并行计算关键技术研究.北京:国防科学技术大学, 2011.
    [20] 伍湘君, 金之雁, 黄丽萍, 等.GRAPES模式软件框架与实现.应用气象学报, 2005, 16(4):539-546. doi:  10.11898/1001-7313.20050415
    [21] Fowler R F, Greenough C.Mixed MPI:OpenMP Programming:A Study in Parallelisation of a CFD Multiblock Code.CCLRC Rutherford Appleton Laboratory, 2003. http://www.softeng.rl.ac.uk/st/archive/SoftEng/SESP/Publications/mpi_openmp/mpi_openmp/
    [22] 金之雁, 王鼎兴.一种在异构系统中实现负载平衡的方法.应用气象学报, 2003, 14(4):410-418. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20030451&flag=1
    [23] 陈德辉, 沈学顺.新一代数值预报系统GRAPES研究进展.应用气象学报, 2007, 17(6):773-777. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=200606125&flag=1
    [24] 刘宇, 曹建文.适用于GRAPES数值天气预报软件的ILU预条件子.计算机工程与设计, 2008, 29(3):731-734. http://www.cnki.com.cn/Article/CJFDTOTAL-SJSJ200803062.htm
  • 加载中
图(7) / 表(5)
计量
  • 摘要浏览量:  2819
  • HTML全文浏览量:  1269
  • PDF下载量:  973
  • 被引次数: 0
出版历程
  • 收稿日期:  2013-10-25
  • 修回日期:  2014-04-30
  • 刊出日期:  2014-09-30

目录

    /

    返回文章
    返回