万维读者网>世界时事论坛>帖子
全球下一代处理器峰会在京举行 中国能领跑异构计算吗
送交者: 围棋 2016-08-24 18:15:42 于 [世界时事论坛]

全球下一代处理器峰会在京举行 中国能领跑异构计算吗

发表时间:2016-08-24 14:36:35

字号:A-AA+

关键字: 异构计算天河二号神威太湖之光球异构计算HSA峰会APU

2016年全球异构计算HSA峰会于8月22日在北京拉开帷幕,本次峰会由全球异构系统架构(HSA)联盟和中国半导体行业协会(CSIA)共同主办,并 得到了网信办、工信部和北京经济技术开发区的大力支持。本次在京全球HSA峰会,一方面是推动形成统一的计算标准,另一方面也为国内厂商互相合作、共谋发 展搭建一个良好的平台。

同构计算是使用相同类型指令集和体系架构的计算单元组成系统的计算方式。而异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式, 常见的计算单元类别包括CPU、GPU、DSP、ASIC、FPGA等。异构计算用简单的公式可以表示为“CPU+XXX”。举例来说,AMD着力发展的 APU就属于异构计算,用公式表示就是CPU+GPU。

由于术业有专攻,CPU、GPU、DSP、ASIC、FPGA各有所长,在一些场景下,引入特定计算单元,让计算系统变成混合结构,就能让CPU、 GPU、DSP、FPGA执行自己最擅长的任务。如果能做到无缝地将运行于CPU之上的通用计算、运行于GPU之上的并行计算、运行于DSP之上或者 ASIC/FPGA之上的优化计算整合在一起,就能获得更好的应用性能,更低的功耗等特性,相对于同构计算而言也可能有一定性能优势。

事实上,最近几年曾经在TOP500刷榜,或者排名靠前的超算都采用了异构计算——中国神威太湖之光、美国超算泰坦、中国天河1号和天河2号都属于异构超算。

泰坦有18688个运算节点,每个运算节点由1个16核心AMD Opteron 6274处理器和1个NVIDIA Tesla K20加速器组成,共计299008个运算核心,属于CPU+GPU。

天河2号有16000个计算节点,每个节点由2片Intel的E5 2692和3片Xeon PHI组成,共使用了32000片Intel的E5 2692和48000片Xeon PHI,属于CPU+众核芯片。

天河1A使用了14336片Intel Xeon X5670处理器和7168片NVIDIA Tesla M2050高性能计算卡,属于CPU+GPU。

神威太湖之光则比较特殊,虽然太湖之光只使用了40960片申威26010,按照之前说的定义,应该属于同构计算,但实际上,由于申威26010的设计思 想非常先进,单片芯片就相当于一个计算节点,其所拥有的4个管理核心发挥着类似CPU的作用,而256个运算核心发挥着类似于众核加速器的作用。因此,神 威太湖之光也是属于异构超算,而这种独特的设计还是想了内存共享,避免了显式拷贝,从而降低了对内存的压力,并减小了性能损失。

在参会单位中,除了华为、中科院、北大、申威等数十家国内处理器设计公司、科研院所、IP及工具供应商、软件及操作系统厂商、应用厂商外,包括许多手机整 机厂商、无人机和机器人等应用开发商、大学和科研院所、投资机构等都踊跃参会。大会讨论的主题除HSA专题研讨外,还包括了HSA的不同应用领域:如人工 智能、深度学习、软件无线电、物联网等。

本次HSA峰会最大的意义在于确立一个统一的技术标准,正如全球异构系统架构联盟主席John Glossner表示,“几个月前,我们发布了异构系统架构HSA 1.1规范,极大地提高了在异构设计中整合开放或专有IP模块的能力。我们现在已经可以看到一系列的HSA兼容解决方案进入市场,峰会期间与会成员公司还 将展示进一步的技术细节和HSA兼容系统演示。”

峰会的另一个意义在于为国内厂商互相合作、共谋发展搭建一个良好的平台,让各家公司能够互相协助,形成合力,为中国在异构计算领域抢占创新高地。正如国家 信息化专家委常务副主任周宏仁所言,“中国现在已经具备了成为CPU+ 创新高地的条件,比如继天河2号之后,国产超级计算机神威太湖一号再次登顶世界TOP500,成为世界上运算速度最快的计算机”,周宏仁认为,“在异构计 算领域,中国与国际先进水平差距小,甚至在某些领域还处于领先”,在此情形下,如果国内科研院所、大学、企业通力合作,未尝不能实现在异构计算方面和欧美 分庭抗礼的局面。

(作者微信公众号:tieliu1988)

0.00%(0) 0.00%(0) 0.00%(0)
当前新闻共有0条评论
笔  名 (必选项):
密  码 (必选项):
注册新用户
标  题 (必选项):
内  容 (选填项):