据报道,中国研究人员发明了一种创新的高性能算法,可以大大提高NVIDIA消费级GPU的科学计算性能,达到惊人的800倍!
该算法来自深圳北理莫斯科大学的团队,由北京理工大学和莫斯科国立罗蒙诺索夫大学联合创立。
新算法增强了近场动力学(Peridynamics)计算效率是一种前沿的非局部理论,可以解决材料断裂、损坏等复杂的物理问题,广泛应用于航空、工程、军事等领域。
然而,近场动力学的计算非常复杂,传统的模拟方法效率不够高。
基于NVIDIA的深圳北理莫斯科大学团队 CUDA编程技术创建了一个新的PDGeneral框架,优化了算法设计和内存管理,充分利用了GPU的大规模并行计算能力。
一块普通的RTX 在4070显卡上,新算法比传统串行算法快800倍,与新OpenMP并行算法相比也快100倍。
新算法完成4000步迭代所需的时间不到5分钟,涉及数百万粒子的大规模模拟。
在大规模2D单轴拉伸问题中,新算法在不到2分钟的时间内完成了695万次单精度迭代。
新算法具有广阔的应用前景,包括但不限于:
- 航空和国防领域:改进航空器结构材料应力和失效模型。
- 工程与制造领域:提高建筑与工业材料试验效率。
- 军事研究:加快防御材料抗冲击研究。
最重要的是,这种算法不需要高性能的GPU芯片,也不受美国制裁的限制,只需要普通的消费家用GPU就可以完成。
如果能迁移支持国产GPU硬件,那就更完美了!
【本文结尾】如需转载,请务必注明出处:快科技。
负责编辑:上面的文Q。
。