MT Occam反演的CPU/GPU异构混合并行算法研究

2018 
由于观测频率数有限, 传统的基于频率划分的电磁法正反演并行计算方式不具有可扩展并行性, 难以通过扩大集群规模以提高计算速度。为此, 以大地电磁(MT)Occam反演为例, 通过挖掘线性方程组求解、矩阵运算等细粒度并行分量, 对传统的大粒度分频方式进行扩展, 设计了MPI-OpenMP-CUDA多层次混合并行算法。第一层采用消息传递接口(MPI)以消息传递的方式实现节点间大粒度任务的分发, 第二层采用OpenMP以共享内存方式实现节点内中小粒度任务的并行处理, 底层采用统一计算设备架构(CUDA)实现节点内GPU的核心计算。给出了理论背景和并行性分析, 设计了并行处理流程, 对方案的适用性进行了讨论。多个理论模型的试算验证了代码的正确性, 评估了计算精度, 比较了加速性能。实验结果表明, 所设计的算法合理高效, 仅利用4个节点, 就使较大规模的模型(文中类型2)反演平均加速比达到16倍, 最高加速比可达23倍。
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []