当前位置:首页 » 算力简介 » 神威太湖之光的算力

神威太湖之光的算力

发布时间: 2021-12-21 18:48:41

A. 神威·太湖之光用的是什么操作系统

采用了国产系统神威睿思(RaiseOS 2.0.5),基于Linux开源代码,已经过十多年的磨砺,非常成熟,主要面向高性能计算和通用计算领域。
神威睿思操作系统的主要优势在于自主可控度高和安全性强等方面。对Linux系统内核进行了全面的剖析,进行了安全性增强和特殊改造,结合申威处理器自主指令系统特点和国产处理器新增安全特性,极大提升了基础硬件平台和核心软件系统的安全性。

B. 神威 太湖之光

开机一分钟地球人算32年
今年6月,“神威·太湖之光”成为世界最快超级计算机,运算速度全球第一。这是全球首个突破10亿亿次的超级计算机,该套系统包括处理器在内的所有核心部件全国产化。中国超算是否已经迈上世界之巅?“神威·太湖之光”运算速度到底有多快?据悉,其运算一分钟相当于地球人算32年。
“简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”国家超级计算无锡中心主任杨广文介绍。“神威·太湖之光”由40个运算机柜和8个网络机柜组成。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。“每一块处理器相当于20多台常用笔记本电脑的计算能力,4万多块再组装到一起,速度之快可想而知。”杨广文说。

C. 神威太湖之光已统连续第四次成为全球最快超算了吗

据报道,北京时间17日凌晨4时,在美国丹佛举行的全球超级计算大会上,基于我国“神威·太湖之光”超算系统的“非线性大地震模拟”应用获得“戈登·贝尔”奖,神威·太湖之光”超算系统连续第四次成为全球最快超算。

未来“神威·太湖之光”将围绕世界重大科技需求,持续不断地开展高性能计算应用服务,为世界科技创新做贡献,支持国家高性能计算发展战略及创新型国家建设,特别将在能源环境、先进制造等领域发挥重要作用。

D. “神威·太湖之光”有多牛

开机一分钟地球人算32年

今年6月,“神威·太湖之光”成为世界最快超级计算机,运算速度全球第一。这是全球首个突破10亿亿次的超级计算机,该套系统包括处理器在内的所有核心部件全国产化。中国超算是否已经迈上世界之巅?“神威·太湖之光”运算速度到底有多快?据悉,其运算一分钟相当于地球人算32年。

“简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”国家超级计算无锡中心主任杨广文介绍。“神威·太湖之光”由40个运算机柜和8个网络机柜组成。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。“每一块处理器相当于20多台常用笔记本电脑的计算能力,4万多块再组装到一起,速度之快可想而知。”杨广文说。

E. 神威太湖之光有多厉害

“神威·太湖之光”是由中国国家并行计算机工程技术研究中心研制的超级计算机。是世界首台运行速度超十亿亿次的超级计算机,其峰值性能达每秒12.5亿亿次、持续性能为每秒9.3亿亿次,均居世界第一,被称为“国之重器”。

神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比普通家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。

一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GBDDR3-2133。

至于机房摆放,太湖之光采用了两侧各20个计算机柜和存储机柜、中间单列网络系统机柜的布局。

重要特点

高性能:神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65Pflops。

高效率:“神威太湖之光”整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19%,而河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难,“神威太湖之光”在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦。

低功耗:“神威太湖之光”的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,“神威太湖之光”的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。

性能功耗比高:“神威太湖之光”的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌,天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算“京”整机性能功耗比为0.830/W,美国超算Mira整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)。

小体积:“神威太湖之光”机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米

主要性能

1、峰值性能125.436PFlops,世界第二

2、持续性能93.015PFlops,世界第一

3、性能功耗比6051MFlops/W,世界第一

F. 神威太湖之光名字含义

开机一分钟地球人算32年今年6月,“神威·太湖之光”成为世界最快超级计算机,运算速度全球第一。这是全球首个突破10亿亿次的超级计算机,该套系统包括处理器在内的所有核心部件全国产化。中国超算是否已经迈上世界之巅?“神威·太湖之光”运算速度到底有多快?据悉,其运算一分钟相当于地球人算32年。“简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”国家超级计算无锡中心主任杨广文介绍。“神威·太湖之光”由40个运算机柜和8个网络机柜组成。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。“每一块处理器相当于20多台常用笔记本电脑的计算能力,4万多块再组装到一起,速度之快可想而知。”杨广文说。

G. 居于世界第一名位置的中国神威太湖之光超级计算机的运算速度

理论浮点数运算性能为125,435.9TFlops(每秒浮点运算次数),而LINPACK测试中的实际性能为93,014.6TFlops(每秒浮点运算次数)。

有74%的效率,相比天河二号(62%)以及排名第三的泰坦(65.8%)都要高。本机组的图形性能也较为突出,在Graph500排名中位列亚军。不过遇上存储器访问较为频繁的运算处理操作、整数数值较多的运算,存储器访问的樽颈效应就开始显现了。

相较天河二号系统功耗达17.8百万瓦(开启散热系统全速运转时则高达24百万瓦),神威·太湖之光仅使用15.3百万瓦,且每瓦性能达到 6 GFLOPS/W,截至2017年11月为止,在Green 500能效比排名中排名第20位。

(7)神威太湖之光的算力扩展阅读:

应用

清华大学地球系统科学研究中心与计算机系合作,利用“神威·太湖之光”首次实现了百万核规模、高分辨率的地球系统数值模拟。此前,中国大陆的地球模拟系统模式只能达到200公里网格规模的分辨率,但现在已可开展25公里网格分辨率的地球系统模拟工作,在海洋上可达到10公里分辨率。

目前,三十多家用户单位在天气气候、航空航天、海洋科学、新药创制、先进制造、新材料等领域与国家超算无锡中心开展了合作。

2016年神威·太湖之光超级电脑上的“全球大气非静力云分辨模拟”应用软件得戈登贝尔奖,该奖项是颁发给超级电脑上的应用软件设计奖,因为硬件性能的有效发挥最终还是取决于软件设计,此前30年该奖都由美日两国获得,首次有第三国打破此规则。

H. 超算神威太湖之光仅仅跑分强劲

11月14日,新一期全球超级计算机500强(TOP500)榜单在美国盐湖城公布,中国神威太湖之光蝉联冠军,中国天河二号屈居次席。除神威太湖之光和天河二号外,中国也在TOP500上榜总数上与美国持平。

正如天河2号获得6连冠后却因为使用了Intel公司的至强Phi计算卡而被一些别有用心之徒百般诋毁,在神威太湖之光实现了包括处理器在内的所有核心部件全部国产化后,网络上又传来了不和谐的音符——有媒体认为,神威太湖之光的“可用性能与理论性能相去甚远”,并以“HPL效率是74.16%”,“HPCG测试只有0.371PFLOPS,效率则只有0.3%,这比天河2号的1.1%还要低”来质疑神威太湖之光。

言下之意,就是神威太湖之光的可用性能与理论性能相去甚远,只能用来跑分,根本就用不来。那么什么是Linpack和HPCG,神威太湖之光真的只能用来跑分么?

什么是Linpack?

上面媒体的一段话引用了几个测试的结果,并以74.16%、0.3%、1.1%等实际数据来说明中国超算可用性能与理论性能相去甚远,非常具有迷惑性。笔者简单的就Linpack测试和HPCG测试做个简要说明。

Linpack指的是矩阵求解,在科学计算中把实际问题抽象成方程组,然后离散成矩阵计算矩阵倍,代表的是传统的以矩阵为基础的数值计算方法,常用于理科和工科的数值求解和数值模拟。那么为何超算大多以Linpack测试成绩论高低呢?原因就在于很多科学计算模型都包含了矩阵求解,比如解微分方程,因此在超算任务中具有不可取代性——像辐射流体力学就是求解微分方程;而核爆炸模拟其实就是辐射流体力学+蒙特卡洛预测;雷达截面的矩量法计算也有赖于解微分方程;业内专家还告诉笔者“现在的深度学习算法的核心算法与Linpack的是一个”.......因此,linpack测试并非是一些跑分软件那样:不服跑个分,而是真正具有实战价值的测试。

Linpack效率指的是实际计算时的次数除以理论计算,举例来说:

神威太湖之光的理论性能为125.4 PFlops,Linpack浮点性能93PFlops,Linpack效率为74.16%。

天河2号的理论性能54.9Pflops,Linpack双精浮点性能33.8PFlops, Linpack效率61.5%

泰坦的理论性能27 Pflops,Linpack双精浮点性能17.6 PFlops,Linpack效率为65.19%。

红杉的理论性能为20.1Pflops,Linpack测试双精浮点性能为16.3P,Linpack效率高达81%。

这里要说明一点,就是超算的规模越大,Linpack测试效率的提高就越难——规模大到如一定程度,维持一段时间的稳定运行是非常难的,何况是太湖神威之光93PFlops的高性能。而神威太湖之光在Linpack测试性能是美国超算泰坦5倍以上的情况下,Linpack测试效率大幅领先于泰坦,这就非常可贵了!至于红杉的Linpack测试效率为何会高达81%,笔者会在下文做讲解。

另外还要说明的的一点,天河2号Linpack效率低于美国泰坦的原因——一方面是因为天河2号的规模更大,影响了效率;另一方面是因为天河2号采用的是Intel的至强PHI计算卡,而该计算卡就以理论性能强大,但稳定性能相对偏低著称——同样使用E5和至强PHI计算卡的美国超算Stampede,不仅运算能力仅为天河2号的五分之一左右(未升级前,升级后为三分之一),整机效率比天河2号更低,只有60.7%。

总而言之,以神威太湖之光的规模,取得Linpack效率达到74.16%已经非常厉害了,在采用异构计算的超算中属于顶尖水平,大家千万不要被一些无良媒体误导了。

异构超算在Linpack效率上天然低于同构超算

对于笔者认为的神威太湖之光Linpack效率达到74.16%属于顶尖水平的结论,也许某些人会提出异议,比如会列举出TOP500排名第四的美国超算红杉,红杉的理论性能为20.1Pflops,Linpack测试双精浮点性能为16.3P,Linpack效率高达81%。

那么为何红杉的Linpack效率如此之高呢?原因就在于和神威太湖之光、天河2号、泰坦等采用异构计算的超算不同,红杉采用的依旧是传统的同构计算技术。

超算可以分为两种架构。采用同构计算架构的超算只需要单纯使用一种处理器,在同一类型的处理器上执行计算任务。举例来说,中国超算神威蓝光采用了申威1600,美国的米拉和红杉采用了PowerPC-A2处理器,这些超算都没有采用GPU或其它类型的众核芯片等加速器。因此,红杉、米拉、神威蓝光都是采用同构计算架构超算的代表。

异构计算使用CPU、GPGPU、GPDSP、ASIC、FPGA和其它类型的众核处理器来处理不同类型的计算任务。采用异构计算架构的超算会使用至少2种类型的处理器,其中异构计算架构中通用CPU负责逻辑复杂的调度和串行任务,加速器负责并行度高的任务,实现计算加速。具体来说,采用异构计算架构的超算在运算中既使用处理器,又使用GPU或众核芯片等加速器。以中国天河2号和神威太湖之光为例,天河2号有16000个计算节点,每个节点由2片Intel-E5-2692和3片Xeon-Phi组成,共使用了32000片Intel-E5-2692和48000片Xeon-Phi。神威太湖之光虽然只采用了申威26010众核处理器,看起来像同构超算,但由于申威26010集成了4个管理核心和256个运算核心,一片申威26010就是一个计算节点,管理核心执行类似于天河计算节点中E5的功能,而256个运算核心则发挥了类似于Xeon-Phi的加速作用,因此也属于异构超算。

由于异构编程需要提前预知模型并做特殊优化,而且很多应用未必适合异构模型,使得采用异构计算的超算对于编程和优化的要求更高——一位业内人士就评价,“异构编程太劳心劳力了,高端人才的精力应该用在关注自己的专业上来,而不是当代码狗......年纪大一点的科研人员就不愿自己编代码了,一些年青但不愿劳思费神的科研人员也不愿意编写异构代码......”。因此,采用异构计算的超算在Linpack效率上天然低于采用同构计算的超算。

那么既然同构超算在编程方便和效率上具有优势,为何全球超算都转向异构计算呢?原因就在于,这样超算可以获得更高的性能,之前抱怨异构编程太劳心劳力的业内朋友就表示,“超算方面众核是近些年的趋势,虽然编程劳心费力,但是在性能面前我们还是得忍,相同成本谁不想性能更好,科研对性能的需求可以用饥渴来形容”。

唠唠叨叨说这么多,主要是为了打一个补丁,防止别有用心之徒用美国同构超算和中国异构超算比Linpack效率,进而抹黑中国超算Linpack效率低下,何况前者的规模远远小于后者。

什么是HPCG

目前,评价超算的指标有不少,除了测试Linpack的TOP500,还有强调的是内存带宽和延迟的Graph500,Graph500对全系统的内存带宽和内存延迟有很高的要求,而计算能力本身已经不影响测试结果了,这种测试偏向于访存密集型运算,在大数据分析等场景下比较有意义。

除Graph500之外,还有强调节能环保的Green500。那么,在Graph500和Green500排行榜上,神威太湖之光的表现如何呢?Graph500名列第二,Green500名列第三。

不过,也有工程师认为无论是TOP500,还是Graph500都过于极端——TOP500过于强调计算性能,Graph500过于强调带宽和延迟等因素,因此采用了新的标准HPCG。

HPCG是美国正在推的一个新测试标准,目前还没有被业界广泛接受,HPCG代表了共轭梯度迭代法的一类应用的计算和通信特征,仅仅代表了某一个方面的特征,并不能涵盖超算的所以特征。HPCG比较重视计算性能和通信的平衡,如果计算性能和通信不是一个量级的,即便两项指标分开看都很强,但也会导致HPCG偏低的结果。

另外,HPCG也存在一些缺陷,据业内人士介绍,“由于针对具体硬件结构修改共轭梯度算法很容易得到高得多的成绩,为了避免这一点,HPCG代码目前还在锁定状态,不准修改算法本身。但在使用中,用户是会修改算法的,这使得这一测试会脱离实际”。

在某媒体的报道中,“但在更具实战意义的HPCG性能(高性能共轭梯度基准测试)中,太湖之光只有0.371PFLOPS,效率则只有0.3%,这比天河2号的1.1%还要低”,0.3%和1.1%的数据和该媒体的这种表述很容易让人误认为,天河2号和神威太湖之光的HPCG测试结果非常差,但实际上,在HPCG测试排行榜中,天河2号位列第一,而神威太湖之光为列第三,这其实是很不错的成绩。而且一位业内人士猜测,“也许神威还没有好好进行优化”。

必须指出的是,神威太湖之光的HPCG低于天河2号,并非是因为计算性能或在通信上不如天河2号,恰恰相反,在计算性能上神威太湖之光大幅领先于天河2号,而在互联网络方面,神威太湖之光也不逊色于天河2号——虽然在带宽上有差距,但在实际应用中,带宽指标比较延迟等指标而言并不太重要(延时指的是1个CPU把自己的计算结果交给其他CPU,如及时送到,其他CPU就能继续计算,否则就要等待了,芯片、链路、协议等都会影响延时)。因此,神威太湖之光在HPCG上逊色于天河2号,原因就在于计算性能实在是过于强悍,以至于产生了计算和通信上的不平衡,并最终导致自HPCG上逊色于天河2号。

神威太湖之光能否用得起来?

对于神威太湖之光根本用不起来的说法,其实只要关注新闻,就能明白这是彻头彻尾的谎言。凭借“神威?太湖之光”强悍的计算性能,国内科研单位在天气气候、航空航天、海洋科学、新药创制、先进制造、新材料等重1要领域取得了一批应用成果——由中科院软件所、清华大学和北京师范大学申报的“全球大气非静力云分辨模拟”课题,由国家海洋局海洋一所和清华大学申报的“全球高分辨率海浪数值模式”课题,由中科院网络中心申报的“钛合金微结构演化相场模拟”课题分别入围了戈登贝尔奖,使中国在该领域实现零的突破。戈登贝尔奖是高性能计算应用领域的最高奖,神威太湖之光用事实说明,完全自主研发的超算不仅可以用起来,还能用的好。

另外,笔者介绍几个神威太湖之光的具体应用:

应用一:基于国产平台的国产地球系统模式。

“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。

本文由科普中国融合创作出品,转载请注明出处。

热点内容
币圈交易所返佣比例 发布:2024-11-17 14:37:46 浏览:934
邮件比特币勒索曝光 发布:2024-11-17 14:07:38 浏览:156
哪里能找到比特币矿池 发布:2024-11-17 14:01:56 浏览:290
区块链红皮书 发布:2024-11-17 14:01:41 浏览:328
区块链powposdapp 发布:2024-11-17 13:55:55 浏览:21
一个比特币挖矿成本 发布:2024-11-17 13:39:54 浏览:595
韩元怎么买usdt 发布:2024-11-17 13:30:01 浏览:257
奥特曼宇宙英雄30元买罗布值吗 发布:2024-11-17 13:24:56 浏览:822
我的世界峡谷挖矿视频 发布:2024-11-17 13:23:44 浏览:766
比特币调查最新消息 发布:2024-11-17 13:22:04 浏览:691