留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

大量气象数据小文件自适应优化传输

陆颖华 马廷淮 曹浩 李德泉

陆颖华, 马廷淮, 曹浩, 等. 大量气象数据小文件自适应优化传输. 应用气象学报, 2014, 25(5): 629-637..
引用本文: 陆颖华, 马廷淮, 曹浩, 等. 大量气象数据小文件自适应优化传输. 应用气象学报, 2014, 25(5): 629-637.
Lu Yinghua, Ma Tinghuai, Cao Hao, et al. Adaptive optimization in small size file transmission of massive meteorological data. J Appl Meteor Sci, 2014, 25(5): 629-637.
Citation: Lu Yinghua, Ma Tinghuai, Cao Hao, et al. Adaptive optimization in small size file transmission of massive meteorological data. J Appl Meteor Sci, 2014, 25(5): 629-637.

大量气象数据小文件自适应优化传输

资助项目: 

江苏省“六大人才高峰”高层次人才项目 2012-WLW-022

详细信息
    通信作者:

    马廷淮, email: thma@nuist.edu.cn

Adaptive Optimization in Small Size File Transmission of Massive Meteorological Data

  • 摘要: 为满足气象实时资料传输中大量气象数据小文件的高时效传输需求,对其中的数据传输服务进行优化,提出一种基于实时网络状况的自适应数据传输优化方法。该方法采用优化网络传输协议并使用文件压缩技术,通过获取网络传输线路上的实时参数,实时调整压缩参数和网络传输参数以优化传输性能。在自适应压缩时,通过试验分析和归纳,确立了气象数据小文件标准为文件小于50 KB;根据网络实时状况,设计了基于实时网络状况自适应调整压缩等级的算法。在自适应传输参数调优中,研究了TCP缓冲区大小和TCP并发连接数在GridFTP协议中的重要性,针对实时网络状况,分别设计了自适应调整TCP缓冲区大小和TCP并发连接数的算法,算法提升传输性能65%。对以上提出各自适应参数调整算法进行试验验证表明,融合压缩和网络传输的自适应调优方法能显著提升气象小数据文件的传输性能近500倍。
  • 图  1  不同大小文件压缩后传输性能提升情况

    Fig. 1  Different transmission performances with different file sizes

    图  2  自适应压缩算法流程图

    Fig. 2  Flow chart of adaptive compression algorithm

    图  3  自适应TCP缓冲区调整算法流程图

    Fig. 3  Flow chart of adaptive TCP buffer size adjustment

    图  4  自适应TCP缓冲区调整试验结果

    Fig. 4  Result of adaptive buffer size adjustment

    图  5  自适应综合传输算法流程

    Fig. 5  Flow chart of combined adaptive transmission algorithm

  • [1] 李集明, 熊安元.气象科学数据共享系统研究综述.应用气象学报, 2004, 15(增刊Ⅰ):1-9. http://www.cnki.com.cn/Article/CJFDTOTAL-YYQX2004S1001.htm
    [2] 高梅, 接连淑, 张文华.气象科研数据共享系统建设.应用气象学报, 2004, 15(增刊Ⅰ):17-25. http://www.cnki.com.cn/Article/CJFDTOTAL-YYQX2004S1003.htm
    [3] [2012-05-12]. http://zh.wikipedia.org/wiki/LZO.
    [4] 邓莉, 王国复, 孙超, 等.基本气象资料共享系统建设.应用气象学报, 2004, 15(增刊Ⅰ):33-38. http://www.cnki.com.cn/Article/CJFDTOTAL-YYQX2004S1005.htm
    [5] 祝婷, 李湘.WMO信息系统中气象元数据的设计与实现.应用气象学报, 2012, 23(2):238-244. doi:  10.11898/1001-7313.20120213
    [6] Ma Tinghuai, Ge Jian, Cao Hao, et al.Design and Implementation of Virtual Resources Management in Meteorology Grid. 9th International Conference on Grid and Cooperative Computing (GCC), 2010:58-63.
    [7] 高峰, 王国复, 喻雯, 等.气象数据文件快速下载服务系统的设计与实现.应用气象学报, 2010, 21(2):243-249. doi:  10.11898/1001-7313.20100215
    [8] 周铮嵘, 王铮, 何文春.分布式气象元数据同步系统的探索研究.应用气象学报, 2010, 21(1):121-128. doi:  10.11898/1001-7313.20100117
    [9] Allcock W.GridFTP:Protocol Extensions to FTP for the Grid//Global Grid Forum.2003.
    [10] Tian Y, Yu W K, Vetter J S.RXIO:Design and implementation of high performance RDMA-capable GridFTP.Computers & Electrical Engineering, 2012, 38(3):772-784.
    [11] Alberto S, María S P, Pierre G, et al.A Parallel Data Storage Interface to Gridftp//Robert M, Zahir T.OTM Conferences (2), Lecture Notes in Computer Science.2006:1203-1212.
    [12] Takeshi I, Hiroyuki O, Makoto I.Automatic Parameter Configuration Mechanism for Data Transfer Protocol GridFTP.2006 International Symposium on Applications and the Internet (SAINT'06), 2006:32-38.
    [13] Thulasidasan S, Feng W, Gardner M K.Optimizing GridFTP Through Dynamic Right-sizing.Proceedings of IEEE International Symposium on High Performance Distributed Computing, 2003. http://dl.acm.org/citation.cfm?id=822087.823405
    [14] Ma Teng, Luo Junzhou.Optimizing Large File Transfer on Data Grid.Lecture Notes in Computer Science, 2005:455-460. doi:  10.1007/11590354_57
    [15] Ito T, Ohsaki H, Imase M.On Parameter Tuning of Data Transfer Protocol GridFTP in Wide-area Grid Computing.Proceedings of Second International Workshop on Networks for Grid Applications (GridNets 2005), 2005:415-421. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.73.9187
    [16] Ito T, Ohsakih I.GridFTP-APT:Automatic Parallelism Tuning Mechanism for Data Transfer Protocol GridFTP.Proceedings of the Sixth IEEE International Symposium on Cluster Computing and the Grid, 2006:454-461. http://ieeexplore.ieee.org/document/1630857/
    [17] Patrick M, Ezra K, Martin S, et al.MNEMONIC:A Network Environment for Automatic Optimization and Tuning of Data Movement over Advanced Networks.Proceedings of 18th International Conference on Computer Communications and Networks, 2009:1-7.
    [18] Chen X, Jukan A.Optimized Parallel Transmission in OTN/WDM Networks to Support High-Speed Ethernet with Multiple Lane Distribution (MLD).IEEE/OSA Journal of Optical Communications and Networking (JOCN), 2012:248-258. http://ieeexplore.ieee.org/document/6171949/?arnumber=6171949&filter%3DAND(p_IS_Number:6171936)
    [19] Yildirim E, Yin D P, Kosar T.Prediction of optimal parallelism level in wide area Data transfers.IEEE Trans Parallel Distrib Syst, 2011, 22(12):2033-2045. doi:  10.1109/TPDS.2011.228
    [20] Yin D P, Yildirim E, Kulasekaran S, et al.A data throughput prediction and optimization service for widely distributed many-task computing.IEEE Trans Parallel Distrib Syst, 2011, 22(6):899-909. doi:  10.1109/TPDS.2010.187
    [21] [2012-02-15]. http://www.globus.org/ datagrid/gridftp.html.
    [22] Bresnahan J, Link M, Kettimuthu R, et al.GridFTP Pipelining.Teragrid Conference, 2007:1-6.
  • 加载中
图(5)
计量
  • 摘要浏览量:  3106
  • HTML全文浏览量:  1162
  • PDF下载量:  1327
  • 被引次数: 0
出版历程
  • 收稿日期:  2013-11-07
  • 修回日期:  2014-05-26
  • 刊出日期:  2014-09-30

目录

    /

    返回文章
    返回