HPC 的速度与激情
- 来源:计算机世界 smarty:if $article.tag?>
- 关键字:HPC,计算机,云计算 smarty:/if?>
- 发布时间:2011-11-01 10:27
2011年10月27日,新一期中国高性能计算Top100排行榜在2011年高性能计算学术年会上颁布。国家超级计算天津中心的天河一号A仍旧蝉联冠军,刚刚落户国家超级计算济南中心的神威蓝光名列第二,国家超级计算长沙中心的天河一号A-HN排在季军位置。
中国HPC进入持续发展期中国计算机学会高性能计算专委会张云泉秘书长在接受《计算机世界》报记者采访时表示,中国HPC Top100 榜单上系统总体Linpack 性能达到了11.85Pflops(每秒所执行的浮点运算次数)。上榜系统中有98% 采用的是机群架构,前10 名中有4 套系统采用CPU+GPU 的异构机群。
在所有系统中,51% 由国产厂商提供,曙光公司继续保持份额第一的位置。在上榜系统的行业分布上,主要集中在互联网服务、政府部门、教育、超算中心、电信、工程、科学计算、游戏、大气气象、能源、云计算、电力、半导体、生物信息、视频计算、地震等18 个领域。传统应用大户能源行业的份额大幅减少,只有4 套系统上榜。而来自互联网服务领域的用户数量达到了第一,一共有21 套系统,此外,来自云计算、半导体等新兴应用领域系统,首次出现在这份榜单中。
自从去年天河一号拿下全球超级计算机TOP 排行榜的冠军,中国整个HPC 领域都为之振奋。张云泉告诉记者,和2010 年的榜单相比,今年的Top100 排行中,有67% 是新上榜的。而且在应用方面,用户的积极性也在不断高涨。来自西部某计算中心的一位负责人透露,受到经济实力限制,近年来他们在高性能计算方面投入并不大,但是每当计算能力提升后,马上就会满载,用户的积极性非常高。“除了传统的科学计算对高性能计算有需求,近年来新能源、生物制药对于高性能计算的需求也很旺盛。比如,西部地区有大量的风力发电,但是发出来的电却是‘垃圾电’,用户不愿意接受。如何把这些电利用起来,在相应的模拟仿真计算上有很大的需求。”
中国科学院院士徐冠华在此次高性能计算学术年会发言时表示,未来中国高性能计算的发展还有很大的空间。“以当前备受瞩目的地球变化研究为例,地球系统模式是全球变化研究的重要内容,而高性能计算是地球系统模式不可或缺的支持技术。以提高分辨率为例,100公里的全球模拟需要10TFlops 的计算能力,而5 公里的全球模拟,则需要达到100PFlops 的水平。”
百亿亿次不是水中捞月
自从“走鹃”这只大鸟在突破“PFlops 障碍”之后,人们已经把目光投向了更远的百亿亿次。随着突破千万亿次的超级计算机不断出现,以及富士通“K computer”这样的“怪兽”横空出世,我们似乎已经能够看到百亿亿次的影子了。
不过要想见到百亿亿次高性能计算机的真身,以当前的技术似乎还是“ 不可能完成的任务”。不过越是这样, 越能激发人们的欲望和激情。正在建设中的TEXASadvanced computing center, 将会采用基于英特尔Sandy Bridge 处理器的服务器加集成众核(MIC)的架构,同时集成Mellanox FDR Infiniband端到端解决方案, 中心预计2013年建成, 届时计算能力能够达到15petaflops。中科院计算技术研究所霍志刚研究员根据自己的研究得出结论,未来3 年内将会有计算能力达到100PFlops 这样级别的高性能计算机出现。
国际高性能计算专业委员会主席Gilad Shainer 对于百亿亿次更是充满期待,在他看来,2020 年前后实现百亿亿次是有可能的,只是对于这样宏大的目标,还是要一步步来实现。“随着更高性能的CPU 不断出现,加上诸如GPGPU、MIC、Infiniband 这样的技术促进,百亿亿次肯定会实现,只是要在一个成本、能耗等方面都可以接受的代价下实现。另外,除了关注实现百亿亿次,我们更应该关注如何实现这个目标的过程,如何在合理的投入、能耗下搭建这样一个超级系统。”
对于实现百亿亿次,美国橡树岭国家实验室Richard Graham 博士认为,未来超级计算机的体系架构研发要注重Co-Design(联合设计)。“目前高性能计算机研发过程中存在着这样的现象,做硬件的人只了解硬件,做算法只了解算法。在过去,这样的情况还不算太糟糕,但是在通往百亿亿次规模的道路上,两者分开是很不利的。只有硬件和算法充分结合在一起,才能挖掘硬件的性能,有效地提高HPC 应用水平。”
至于未来,中、美、欧谁会第一个实现百亿亿次,Gilad Shainer笑称这样的预测就如同是买彩票。不过在他看来,HPC 在中国的快速发展,能够在科研创新、产品研发等方面给中国能带来更大的竞争力。“在全世界范围内,各个国家都在高性能计算方面投入不少。在过去5 年,中国发展非常迅速,中国在HPC 技术研发方面的进展,将会影响整个产业的进展,同时产业的进展也会促进相关技术研究更进一步,只是要处理好两者之间的关系。基础架构的建设和真实应用之间是一种相辅相成、互相促进的平衡关系。”
同时,Gilad Shainer 并不赞成花大量的金钱去研发专有产品,他认为这对于HPC 应用发展是不利的。“ 美国的一些大学曾经特别喜欢应用专有的系统来建设自己的高性能计算机集群,随着时间的推移,过高的成本、低下的应用性能迫使他们最后都放弃了这些系统,既浪费时间也浪费金钱。我认为,标准化的技术在实现百亿亿次的过程中将会发挥重要的作用,不仅在成本上有其优势,应用的领域也会更广,驱动力更强劲。如果我们把更多精力放在推动标准化技术的前进上,必将会使百亿亿次更早到来。”
院士观点
中国工程院院士陈左宁:中国高性能计算需要建立起新的生态系统,尽可能联合国内相关单位,建立起中国标准指令集,其中包括核心指令集和扩展指令集。基于这些指令集,建立相关高性能软硬件标准体系,引导企业投入,形成完整生态链,促进产业发展。同时还需要联合国内相关单位,建立HPC 网络互联标准,基于这些标准框架,突破普适性高端计算机关键技术,促进HPC阶梯形发展。
中国科学院院士徐冠华:未来高性能计算要想进一步发展,必须强化交叉人才的培养。高性能计算需要学科交叉,需要有更多的高性能计算专业人才了解相关应用,并和相关研究人员经常合作,这样才会有更大的机会取得重大的突破。
背景资料
神威蓝光
神威蓝光千万亿次高性能计算机系统是中国第一台全部采用自主研发的高性能多核通用处理器构建的千万亿次系统。系统以高带宽全互联256 超节点为基础, 采用分层高速计算网络连接和自主设计高效能软件。神威蓝光采用的申威1600CPU 具有16 个核心,集成DDR3存储控制器和标准I/O接口,双精度浮点峰值运算速度为140.8GFlops。
本报记者 汤铭
