当前在线人数8309
首页 - 分类讨论区 - 电脑网络 - 计算机硬件版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
当前世界上最快的超算就是ARM的处理器
[版面:计算机硬件][首篇作者:ToyotaYaris] , 2020年11月22日21:58:38 ,978次阅读,10次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
ToyotaYaris
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: ToyotaYaris (丰田雅力士), 信区: Hardware
标  题: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Sun Nov 22 21:58:38 2020, 美东)

为什么会有人说这机子只能用来看油管?



--
☆ 发自 iPhone 买买提 1.24.11
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 208.]


此主题相关图片如下:

[删除]

此主题相关图片如下:
[删除]

 
ABCNBC
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: ABCNBC (小李飞刀), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Tue Nov 24 18:52:16 2020, 美东)

这个叫做路径依赖

【 在 ToyotaYaris (丰田雅力士) 的大作中提到: 】
: 为什么会有人说这机子只能用来看油管?



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
ToyotaYaris
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: ToyotaYaris (丰田雅力士), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Sat Sep  4 22:08:34 2021, 美东)

地大弟想明白了吗
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 172.]

 
didadida
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: didadida (滴滴嗒嗒), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Sun Sep  5 09:56:52 2021, 美东)

疯舔鸭梨屎re自己快一年前的文章,看来是时间充裕


个例无法说明问题,等到ARM在超算百强里的比例上去了再说


【 在 ToyotaYaris (丰田雅力士) 的大作中提到: 】
: 地大弟想明白了吗




--
※ 修改:·didadida 於 Sep  5 09:57:35 2021 修改本文·[FROM: 72.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 72.]

 
ABCNBC
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: ABCNBC (小李飞刀), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Sun Sep  5 11:42:38 2021, 美东)

截至2020年6月23日,目前全球最快的超级电脑是日本理化学研究所(Riken)与富士通
(Fujitsu)共同研发的“富岳”(Fugaku)。

“富岳”的运算能力是每秒415千兆次,和第二名的美国IBM超级电脑“高峰”(Summit
)的148千兆次相差三倍。

Fugaku采用了Arm架构为基础的富士通48核心A64FX SoC,共有158,976个节点,尖峰性
能可达到1 exaflops(1,000 petaflops)这也是全球500大超级电脑中首次由Arm架构
系统夺下第一名,除了在Linpack中拿到好成绩,Fukagu也在HPL-AI中获得1.421
exaflops。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
ABCNBC
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 6 ]

发信人: ABCNBC (小李飞刀), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Sun Sep  5 11:45:33 2021, 美东)

Arm架构为基础的富士通48核心A64FX, 7nm制程,台积电代工。

没有台积电,全世界超算就是一坨屎。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
ToyotaYaris
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 7 ]

发信人: ToyotaYaris (丰田雅力士), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Sun Sep  5 13:54:10 2021, 美东)

aws里的arm节点
速度秒杀x86



【 在 didadida (滴滴嗒嗒) 的大作中提到: 】
: 疯舔鸭梨屎re自己快一年前的文章,看来是时间充裕
: 个例无法说明问题,等到ARM在超算百强里的比例上去了再说




--
☆ 发自 iPhone 买买提 1.24.11
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
ABCNBC
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 8 ]

发信人: ABCNBC (小李飞刀), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Mon Sep  6 12:47:49 2021, 美东)

&name=large


【 在 ToyotaYaris (丰田雅力士) 的大作中提到: 】
: 地大弟想明白了吗



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
didadida
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 9 ]

发信人: didadida (滴滴嗒嗒), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Mon Sep  6 14:04:18 2021, 美东)

兲五之类的果轮就是这种死人和蠢人


【 在 ABCNBC (小李飞刀) 的大作中提到: 】
: https://pbs.twimg.com/media/E-ibOZTWYAAE1WI.jpg &name=large





--
※ 修改:·didadida 於 Sep  6 14:14:55 2021 修改本文·[FROM: 72.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 72.]

 
PBSNPR
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 10 ]

发信人: PBSNPR (大刀王五), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Wed Sep  8 13:36:23 2021, 美东)

ARM超算向x86体系发起挑战

2019年11月12日,惠普公司HPE事业部(即Cray)宣布与日本富士通公司开展合作,推
出基于富士通的A64FX超算处理器,目前已经获得美国洛斯阿拉莫斯国家实验室(Los
Alamos National Laboratory)、美国橡树岭国家实验室(Oak Ridge National
Laboratory)、日本理化研究所(RIKEN)计算科学中心、纽约州立大学石溪分校(The
State University of New York at Stony Brook)、布里斯托大学(University of
Bristol)的订单。富士通的A64FX处理器在2018年8月正式发布,2019年4月正式量产,
2019年11月进入商用市场。这是全球首个采用ARMv-8A SVE扩展指令集的芯片。而在
2019年11月19号的全球超算大会上,英伟达(NVIDIA)也宣布了一套用于构建GPU加速
ARM服务器的参考设计。目前,英伟达正在与ARM、安培(Ampere)、富士通美满电子(
Marvell)、HPE及其旗下Cray等生态伙伴展开合作,许多高性能计算软件公司已开始使
用NVIDIA CUDA-X库为ARM生态带来基于GPU的管理和监控工具。


目前全球基于ARM的超算芯片厂家主要有Marvell(Cavium)、富士通和Ampere,其中
Cavium在2017年11月被Marvel以大约61亿美元的价格收购。Cavium的核心产品是
ThunderX2处理器,最知名的应用包括Cray为英国气象局推出的Isambard系统。
Isambard是一台拥有10000个内核的Cray XC50超级计算机,在全球气象局超算系统中排
名第二(中国气象局的“派-曙光”全球排名第三)法国原子能委员会(CEA)推出了
Atos BullSequana X1310高性能计算系统,该系统采用ThunderX2ARM处理器,设计用于
模拟核武器系统和核衰变每台超算大约拥有8832核。由于成本太高,法国已经22年没有
进行核试验,因此改用了模拟试验的形式。该项目是欧盟委员会资助的Mont-Blanc3项
目的一部分,旨在评估基于ARM的集群对于exascale高性能计算(HPC)的适用性,并帮
助建立exascale系统所需的软件生态系统。同样是用于模拟核试验,美国桑迪亚国家实
验室(Sandia National Laboratories)选用了一套由惠普提供的ARM超算系统,也就
是Astra。Astra由2592台服务器组成,每台服务器都配置有两颗ThunderX2处理器,峰
值性能可达到2.3PFlops,是超算500强名单中唯一一个ARM系统,在2019年排名第156。
西班牙国家超算中心也采用了基于ThunderX2处理器的系统。




另外一个就是富士通,富士通在超算领域曾经有相当辉煌的成就。2011年,日本理化所
与富土通联合打造了超算“京”,Linpack测试的最大计算性能达到了10.51PFlops,也
就是每秒钟1.051亿亿次浮点计算,这是人类首次跨越1亿亿次计算大关,是当年最快的
超算,但是其自2011年以后的排名下滑却很快,2016年排名滑至了全球第7位。2019年2
月,日本理化所宣布“京”将在2019年8月停用并拆除。接替“京”的是“Post-K”,
指令集从SPARC指令集转换为ARM指令集。为何换为ARM指令集?答案是采用了SPARC之后
,使用何种操作系统成了一个现实问题。SPARC有采用“Solaris”系统的先例,但是商
用的Solaris如果作为大规模并行超级计算机系统使用,处理的负担会比较重。于是,
富士通决定将曾经应用于PC集群式超级计算机的Linux系统移植到SPARC。但是,使用
SPARC版Linux的只有富士通自己,既没有提供商用软件的供应商,也没有支持这一平台
的“伙伴”。另外,SPARC版Linux也不是完全支持Linux原本具有的所有软件库,虽然
大部分软件库在经过重新编译后都能正常运行,但也有例外。一句话,生态系统太差。
除日本内部使用外,其海外客户仅有一个,那就是台湾“中央气象局”。2012年,台湾
“中央气象局”花费了14亿日元(约1亿元人民币)购置日本超级计算机“京”的商用
机型,与日本共同进行地震和海啸模拟实验。

从2013年开始,富士通就决定放弃SPARC不选用x86的原因很简单,如果采用英特尔的
x86架构,富士通自己就不能独立设计处理器,无法与其他厂商形成差异。ARM服务器是
为了降低功耗吗?答案是否定的,决定功耗性能的不是指令集,而CPU微架构(即从软
件角度看不到的管线、寄存器配置等CPU内部设计)的贡献要大得多,指令集与微架构
之间的关系并不算太密切。当然,ARM指令集的功耗相对x86略微低一点。如果是特性相
似的指令集(如RISC型等),除了解析指令的解码器电路,其他的结构都基本一样,因
此转到ARM指令集上并不困难。

Cray已经决定将富士通的A64FX用在CS500的“storm”产品线上。Cray也将继续使用
Marvell的ThunderX2和ThunderX3,主要用在“CPU+GPU”系统或运算量不太大的纯CPU
系统上,而A64FX将用在需要超大规模数学运算的超算系统上。ThunderX2和ThunderX3
主打高性价比市场,A64FX主打高性能市场。据说原本使用ThunderX2的美国桑迪亚国家
实验室也用A64FX取代ThunderX2,而不是等待ThunderX3。布里斯托大学与英国气象局
的二代Isambard系统也将使用A64FX。
富士通A64FX的核心技术之一是与ARM联合开发的可伸缩矢量扩展(Scalable vector
Extensions,SVE)指令集ARM的首个64位架构核心Cortex-A57曾一度瞄准服务器市场,
但因为各方面的原因无功而返。随后,ARM将重心转回到移动领域,最新ARM处理器的核
心Cortex-A73就只字不提服务器应用。2016年8月,ARM又宣布ARMv8-A增加了SVE指令集
,专为高性能计算、数据中心而生。

全球首次使用SVE的超算芯片是富士通的A64FX。SVE将作为ARMv8-A指令集的可选扩展,
支持SIMD最低128bt、最高2048bit。SVE对应32个寄存器,较低的128bits与ARMv8-
ASIMD&FP共用寄存器。预测寄存器有16个,带宽为SVE寄存器的1/8。A64FX不仅支持128
、256、512bit三种单指令多数据流(Single Instruction Multiple Data,SIMD),
还支持双精度、单精度、半精度、INT8和INT16,同时支持上一代SPARC64。

SVE与英特尔的AVX512非常相似,也是SIMD用的指令集。但不同的是,目前英特尔AVX最
高到512位,英特尔顶级的服务器芯片和9代上消费级CPU都支持AVX512。不过在理论上
,每以增加1倍的向量数据宽度,将带来2倍的晶体管数量的增加。目前,英特尔的AVX
指令集只实现在片上每个核里,作为核中的一个功能部件,若扩展到1024位,将增加4
倍的晶体管数量。因此,AVX1024意味着成本极高,SVE也是如此,因此富士通选择了
512位。

SVE的另一特点是无须知道矢量的长度(Vector Length Agnostic,VLA),系统可以自
动适应任何带宽的矢量,同时也保护了二进制,无须再进行检查。SVE还可以转换循环/
中断语法(do- while loops/break syntax)使之适合SIMD。因为在通常情况下,循环
/中断受到失效检测(fault detected)介入后就会退出循环。SVE采用首次失效负载(
first fault load)指令集和首次失效寄存器(First Fault Register,FFR)解决了
这个问题,这个寄存器在16个预测寄存器之中,一旦检测到失效,FFR寄存器就会禁止
内存对后续元素的访问,从而避免循环退出。SVE还有搜集/发散(gather/scatter)指
令,应对非连续的数据系统。在硬件方面,A64FX这种高性能处理器采用了HBM2内存,
使用了台积电的 CoWes(Chip on Wafer on Substrate)封装工艺和7纳米制造工艺。

A64FX处理器内部构造中,CPU与HBM2之间通过Mcro-bump连接,线宽仅为55微米,比传
统的PCB板级线宽密度高20倍。A64FX包含4片HBM2,每片HBM2包含8层堆叠,即8个独立
的128bits通道带宽,总带宽达1024GB/s,是全球AI芯片中最高的存储带宽,而排名第
二的英伟达Tesla V100存储带宽为900GB/s。

A64FX内部有48个运算内核和4个辅助内核。为了提高并行计算效率,减少因为操作系统
造成的时基误差(jitter)累积造成的延迟,富士通特别加入了4个辅助核。在存储方
面设置了核心存储组(Core Memory Group,CMG)。CMG分为4组,每组包含12个计算核
、1个辅助核、1个L2缓存和1个存储控制器。系统软件可以像非统一内存访问架构(Non
Uniform Memory Access Architec ture,NUMA)那样处理CMG。A64FX包含87.86亿个
晶体管。

A64FX单精度浮点运算可达6.7854Tflops,大约是英特尔至强铂金8180处理器(28核)
浮点运算(3.57Tflops)的两倍。“天河二号A”用的加速卡Matrix2000(128核)是4.
916Tflops,此性能是在2.2GHz频率下取得的,8180处理器的默认主频是2.5GHz。A64FX
也可以运行在1.8GHz或2.0GHz上,此时只需要风冷即可,而2.2GHz则需要水冷。

台积电和ARM曾经推出采用小芯片(chiplet)设计的8核ARM Cortex-A72设计,整个芯
片的面积只有27.88平方毫米(4.4×6.2),运行频率高达4GHz(风冷)。ARM芯片一般
运行频率都不超过2.2GHz,而小芯片设计突破了这个上限,大大提升了ARM芯片的性能
。这样,未来ARM服务器的发展空间就有望得到大发展,ARM就可以不仅主打低功耗,也
主打高性能。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
PBSNPR
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 11 ]

发信人: PBSNPR (大刀王五), 信区: Hardware
标  题: Re: 当前世界上最快的超算就是ARM的处理器
发信站: BBS 未名空间站 (Wed Sep  8 13:39:53 2021, 美东)


--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

[分页:1 ]
[快速返回] [ 进入计算机硬件讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996