留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于通用图形处理器的GRAPES长波辐射并行方案

郭妙 金之雁 周斌

郭妙, 金之雁, 周斌. 基于通用图形处理器的GRAPES长波辐射并行方案. 应用气象学报, 2012, 23(3): 348-354..
引用本文: 郭妙, 金之雁, 周斌. 基于通用图形处理器的GRAPES长波辐射并行方案. 应用气象学报, 2012, 23(3): 348-354.
Guo Miao, Jin Zhiyan, Zhou Bin. GPGPU accelerated massive parallel design of long wave radiation process in GRAPES-global model. J Appl Meteor Sci, 2012, 23(3): 348-354.
Citation: Guo Miao, Jin Zhiyan, Zhou Bin. GPGPU accelerated massive parallel design of long wave radiation process in GRAPES-global model. J Appl Meteor Sci, 2012, 23(3): 348-354.

基于通用图形处理器的GRAPES长波辐射并行方案

资助项目: 

国家高技术研究发展计划 2009AA01A138

详细信息
    通信作者:

    金之雁, E-mail:jinzy@cma.gov.cn

GPGPU Accelerated Massive Parallel Design of Long Wave Radiation Process in GRAPES-Global Model

  • 摘要: 随着通用图形处理器 (GPGPU) 计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有重要影响。该文依托NVIDIA公司计算统一设备架构 (CUDA) 技术平台,以GRAPES全球模式中长波辐射传输方案为例,对其进行了大规模并发设计和优化,在保持系统结果一致的前提下,对比单颗高端CPU,Tesla C1060 GPGPU具有11倍的加速效果,明显提升了GRAPES全球模式的执行速度和预报时效。研究表明:使用通用图形处理器技术提升数值预报模式的执行速度非常有潜力。
  • 图  1  通用图形处理器并行系统架构

    Fig. 1  The architecture of GPGPU parallel system

    图  2  CPU集群粗粒度 (a) 和GPU细粒度 (b) 并发方案(t0,……,tm为线程数)

    Fig. 2  CPU coarse-grained parallelism (a) and GPU fine-grained parallelism (b)

    (t0, …, tm denote the number of thread)

    图  3  长波辐射方案执行模型

    Fig. 3  The execute model of the long-wave radiation scheme

    图  4  长波辐射方案流程图

    Fig. 4  The flow chart of the long-wave radiation scheme

    图  5  随着气柱数目增加CPU与GPGPU计算耗时比较

    Fig. 5  The comparison of computational speed between CPU and GPGPU with the increase number of columns

    图  6  CPU计算的全球长波辐射通量 (a) 与GPGPU计算输出值 (b) 对比

    Fig. 6  The comparison of the long-wave radiation fluxes results between CPU (a) and GPGPU (b)

    表  1  并行结果对比

    Table  1  The comparison of parallel results

    核函数 并行计算气柱
    用时/ms
    并行计算空间点
    用时/ms
    inatm_d () 17.41 2.16
    cldprmc_d () 16.21 6.63
    setcoef_d () 2.65 0.85
    taumol_d () 23.06 3.68
    rtrnmc_d () 37.14 37.14
    下载: 导出CSV
  • [1] 伍湘君, 金之雁, 黄丽萍, 等.GRAPES模式软件框架与实现.应用气象学报, 2005, 16(4):540-546. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20050468&flag=1
    [2] 陈德辉, 沈学顺.新一代数值预报系统GRAPES研究进展.应用气象学报, 2006, 17(6):773-777. doi:  10.11898/1001-7313.20060614
    [3] Xia Y, Kaufmann H. and Guo X F. 2002. Differential SAR Interferometry Using Corner Reflectors//IEEE 2002 International Geoscience and Remote Sensing Symposium, Washington, USA:IEEE computer society, 1243-1246. http://www.realworldtech.com/page.cfm?ArticleID=RWT090808195242.
    [4] Michalakes J, Hacker J, Loft R, et al. WRF Nature Run//Proceedings of the 2007 ACM/IEEE conference on Supercomputing, 2007:1-6.
    [5] Michalakes John, Vachharajani Manish. GPGPU Acceleration of Numerical Weather Prediction. [2011-06-12]. http://cuda.csdn.net/showcase.html.
    [6] Govett Mark. Using GPUs to Run Weather Prediction Models. 14th ECMWF Workshop on High Performance Computing in Meteorology, 2010.
    [7] Henderson Tom. Progress on GPGPU Parallelization of the NIM Prototype Numerical Weather Prediction Dynamical Core. 14th ECMWF Workshop on High Performance Computing in Meteorology, 2010.
    [8] Ruetsch Greg, Phillips Everett, Massimiliano Fattca. GPGPU Acceleration of the Long-wave Rapid Radiative Transfer Model in WRF Using CUDA Fortran. [2011-06-09]. http://www.pgroup.com/resources/accel_ files/ index.htm.
    [9] NVIDIA.CUDA_C_Programming_Guide.[2010-6-15]. http://developer.nvidia.com/cuda-toolkit-40.
    [10] NVIDIA.Fermi Compute Architecture Whitepaper.[2011-06-19]. http://www.nvidia.com/content/PDF/fermi_white_ papers/NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf.
    [11] The Portland Group. CUDA FORTRAN Programming Guide and Reference. [2011-06-21]. http://www.pgroup.com/resources/cudafortran.htm.
    [12] 黄丽萍, 伍湘君, 金之雁.GRAPES模式标准初始化方案设计实现.应用气象学报, 2005, 16(3):374-383. doi:  10.11898/1001-7313.20050312
    [13] 金之雁, 王鼎兴.大规模数据并行问题的可扩展性分析.应用气象学报, 2003, 14(3):369-374. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20030345&flag=1
    [14] 朱政惠, 施培量.用OpenMP并行化气象预报模式试验.应用气象学报, 2002, 13(1):102-108. http://qikan.camscma.cn/jams/ch/reader/view_abstract.aspx?file_no=20020112&flag=1
    [15] 杨学胜, 伍湘君, 金之雁.我国新一代全球有限区通用数值预报模式GRAPES的并行计算设计与实现.高性能计算发展与应用, 2007, 44(3):510-515. http://cdmd.cnki.com.cn/Article/CDMD-90002-1011303256.htm
    [16] 杨学胜, 沈元芳, 徐国强.辐射方案对GRAPES全球模式的影响.大气科学, 2009, 33(3):593-595. http://www.cnki.com.cn/Article/CJFDTOTAL-DQXK200903015.htm
  • 加载中
图(6) / 表(1)
计量
  • 摘要浏览量:  3384
  • HTML全文浏览量:  1074
  • PDF下载量:  1227
  • 被引次数: 0
出版历程
  • 收稿日期:  2011-07-05
  • 修回日期:  2012-03-22
  • 刊出日期:  2012-06-30

目录

    /

    返回文章
    返回