Cooperative Computing Techniques for a Deeply Fused and Heterogeneous Many-Core Processor Architecture

2015 
由于在半导体技术的进展,许多核心处理器广泛地在高效计算被使用了。然而,许多应用程序不能仍然高效地被执行由于存储器围处理器,它在许多核心成为了一个瓶颈。在这篇论文,我们在场深深地说出的新奇异构的许多核心处理器体系结构为计算系统的高效熔化了许多核心(DFMC ) 。DFMC 集成处理元素(MPE ) 和计算处理元素(用户终端设备) 的管理,它是为不同应用程序特征与的异构的处理器核心支持的统一 ISA (指令集体系结构) ,一个统一执行模型,和份额记忆缓冲连贯。DFMC 处理器能由联合用户终端设备的一系列合作计算技术减轻记忆墙问题,例如多模式数据溪流转移,有效收款机级的通讯机制,和快硬件同步技术。这些技术能改进在薄片上数据复用并且优化存储器存取性能。这份报纸与四 MPE 和 256 台用户终端设备基于 FPGA 说明一个完整的系统原型的实现。我们的试验性的结果证明计算用户终端设备的技术的合作社的效果是重要的,与完成 94% 的效率的 DGEMM (双精确矩阵增加) ,获得获得 27 GFLOPS 的表演的 207 GFLOPS 和 FDTD (有限差别的时间域) 的表演的快速傅里叶变换(快 Fourier 变换) 。
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []