多重网格算法广泛用于求解大规模稀疏线性系统,这对于许多高性能应用至关重要。对称高斯-赛德尔(SYMGS)方法通常是多重网格MG性能瓶颈。本次报告提出在多核CPU上增强SYMGS和MG算法的并行化和计算率的新方法。我们的策略是采用矩阵分裂策略和改进计算公式来减少SYMGS中的计算运算和内存访问。除此之外,我们提出一种新的异步并行化方案,以减少并行化SYMGS时的同步开销。通过将我们的技术与HPCG基准和实际应用程序相结合来展示所提算法的优势。在四种架构平台(包括三种 ARMv8 和一种 x86)上进行的评估表明,我们的技术可显著优于商业库的性能。
报告人简介:李胜国,男,计算数学博士,国防科技大学计算机学院副研究员,2010年在美国加州大学伯克利分校联合培养两年,2020年访问西班牙UPV大学10个月。2013年参加工作以来,主要从事并行算法设计、共性算法库研制、HPCG程序测试与优化工作,参与天河2A、银河系统研制与调试。主持国家青年和湖南省面上项目、重点研发和基础加强项目的课题各1项,发表高水平SCI论文30多篇,分别发表在SIAM J. Sci. Comput., SIAM J. Matrix Anal. Appl., Numer. Math., Numer. Linear Algebra Appl. Parallel Computing, IEEE TPDS, SC, IPDPS, ICS, ICPP等国际期刊和会议。