光脑计算机与量子计算机(曾经排名第一的超级计算机系统)
光脑计算机与量子计算机(曾经排名第一的超级计算机系统)Paragon XP/S是加州理工学院于1992年推出的试金石三角洲实验系统的产品化版本。Paragon系列基于Intel i860 RISC微处理器。在2D网格中连接了多达4000个I860。系统体系结构是一个分区系统,大多数系统由无盘计算节点和少量I/O节点交互服务节点组成。由于大部分节点没有永久存储,因此可以通过断开一组具有机密磁盘的I/O节点的连接,然后连接一个非机密I/O分区,将计算分区从机密“红/黑切换”到非机密。1993年,桑迪亚国家实验室安装了一台英特尔XP/S 140 Paragon超级计算机,该计算机在1994年6月的名单上名列第一。该系统拥有3680个处理器,以143.40千兆次/秒的速度运行Linpack基准测试。它是第一台大规模并行处理器超级计算机,无疑是世界上速度最快的系统。英特尔为Paragon提供的操作系统OSF-1无法很好地扩展。Sandia工程师将其轻量
CM-5:1993年6月排名第一
1993年6月,当今天的第二个超级计算机TOP500榜单的前身首次发布时,第一的位置被Thinking Machines Corporation制造并安装在洛斯阿拉莫斯国家实验室的CM-5超级计算机占据。CM-5拥有1,024个处理器,运行Linpack基准测试,性能为59.7 gigaflop / s。Thinking Machines不仅获得了最高荣誉,而且该公司还建造了榜单上排名前10位的系统中的5个。
Numerical Wind Tunnel: 1993年11月排名第一
当第二个超级计算机TOP500名单在1993年超级计算会议上公布时,排名第一的系统:日本国家航空航天实验室的Numerical Wind Tunnel。Numerical Wind Tunnel是日本国家航空航天实验室和富士通公司在一个联合项目中开发的矢量并行架构的早期实现。第一次部署采用了140个矢量处理器,运行Linpack基准测试时达到了124.2千兆次/秒的性能。
该系统在1994年6月失去了第一名的位置,但随着167个处理器的升级,Numerical Wind Tunnel以170千兆次/秒的Linpack性能重新夺回了第一名,并一直保持在榜首直到1995年12月。这是第一台在广泛的流体动力学应用程序中持续性能接近100 Gflop/s的超级计算机。该系统的矢量处理器在Ga as芯片中具有低至60 ps的门延迟。产生的循环时间为9.5 ns。该处理器有四个独立的管道,每个管道都能够并行执行两条乘法加法指令,从而使每个处理器的峰值速度达到1.7 Gflop/s。每个处理器板都配备了256 MB的中央内存。
Intel XP/S 140 Paragon: 1994年6月排名第一
1993年,桑迪亚国家实验室安装了一台英特尔XP/S 140 Paragon超级计算机,该计算机在1994年6月的名单上名列第一。该系统拥有3680个处理器,以143.40千兆次/秒的速度运行Linpack基准测试。它是第一台大规模并行处理器超级计算机,无疑是世界上速度最快的系统。英特尔为Paragon提供的操作系统OSF-1无法很好地扩展。Sandia工程师将其轻量级内核SUNMOS移植到Paragon。SUNMOS和相关的运行时软件成为机器上操作的基础。与此同时,Sandia开始开发第二代轻量级内核PUMA,该内核最终取代了SUNMOS,Intel和Sandia后来将其用作Cougar的基础,Cougar是支持ASCI-Red的轻量级内核。
Paragon XP/S是加州理工学院于1992年推出的试金石三角洲实验系统的产品化版本。Paragon系列基于Intel i860 RISC微处理器。在2D网格中连接了多达4000个I860。系统体系结构是一个分区系统,大多数系统由无盘计算节点和少量I/O节点交互服务节点组成。由于大部分节点没有永久存储,因此可以通过断开一组具有机密磁盘的I/O节点的连接,然后连接一个非机密I/O分区,将计算分区从机密“红/黑切换”到非机密。
Hitachi SR2201:1996年3月排名第一
前六次榜单以美国和日本争夺第一的拉锯战为特色。1996年在曼海姆举行的超级计算机发布的第七份名单显示,日本保持了其在榜首的位置,但东京大学取代了日本国家航空航天实验室。排名第一的系统是日立制造的1024处理器SR2201。它在运行Linpack基准测试时达到232.4千兆次。
Hitachi SR2201是一款分布式内存并行系统,于1996年3月推出。其处理器150 MHz HARP-1E基于PA-RISC 1.1体系结构,通过伪向量处理(PVP)解决了缓存未命中惩罚问题。在PVP中,数据通过预取加载到一个特殊的寄存器组,绕过缓存。每个处理器的峰值性能为300 Mblop/s,使SR2201的峰值性能达到600 Gblop/s。多达2048个RISC处理器可以通过高速三维交叉网络连接,该网络能够在每条链路上以300 MB/s的速度传输数据。
1996年,TOP500榜单的作者指出了某些趋势。在第一份清单(1993年6月)中,66%的已安装系统基于ECL(发射极耦合逻辑),在1996年6月的清单中,所列500个系统中只有20%采用ECL。
与此同时发展的是,使用直接来自工作站的板构建计算节点,并与工作站系统二进制兼容的趋势。最主要的例子是Power Challenge、IBM SP/2和Convex SPP。总之,这些系统占所有500个系统的53%。
CP-PACS:1996年11月排名第一
第八届TOP500榜单由日立公司制造并安装在日本筑波大学计算科学中心的2048处理器CP-PAC名列前茅。该系统是日立SR2201的非商业扩展,在运行Linpack基准测试时实现了368.20千兆次浮点运算。CP-PACS项目旨在开发一种大规模并行计算机,旨在实现计算物理学主要问题的数值研究的高性能。1991年夏天开始规划,1992年春,向教育、科学和文化部提交的一份提案被批准为教育、科学和文化部学术研究新发展计划的一个项目。这项为期五年的项目于1992年4月正式启动。
CP-PACS并行计算机的开发涉及该项目计算机科学家和物理学家的密切合作。一方面,就物理学家的计算需求进行了联合讨论,另一方面,就在技术可行的范围内满足这些需求的可能架构进行了联合讨论。通过此次合作,CP-PACS计算机的基本设计得以实现。1992年夏天,日立有限公司通过正式招标程序,被选中制造CP-PACS计算机。项目成员与日立有限公司密切合作开发该计算机。
ASCI Red:1997年6月至2000年6月排名第一
Intel的ASCI-Red超级计算机是第一台teraflop/s计算机,以1.068 teraflop/s的Linpack性能在1997年6月的第九届TOP500排行榜上排名第一。
英特尔的ASCI红色标志着一个新的超级计算机时代的开始。90年代中期,当向量计算机开始变得不那么重要时,美国能源部的ASCI(加速战略计算倡议)计划(专注于国防应用)开辟了一个全新的资金来源。ASCI Red是这一倡议的第一个产品,为美国在超级计算机的生产和实施方面的主导地位奠定了基础。从技术角度来看,ASCI Red也是一台卓越的超级计算机:
它是一台基于网格(38 X 32 X 2)的MIMD大规模并行计算机,最初由7264个计算节点、1212 GB的总分布式内存和12.5 TB的磁盘存储组成。这台机器的最初版本使用Intel Pentium Pro处理器,每个处理器的时钟频率为200 MHz。这些处理器后来升级到奔腾II OverDrive处理器。该系统升级到总共9632个奔腾II Over-Drive处理器,每个处理器的时钟频率为333 MHz。
它由104个机柜组成,占地约2500平方英尺(230平方米)。该系统旨在使用大宗商品市场组件,并且具有很强的可扩展性。
ASCI Red在八年内跻身17次500强榜单之后,于2005年9月退役。1997年6月至2000年6月,它是前500强中速度最快的计算机,2000年11月,劳伦斯·利弗莫尔国家实验室的IBM的ASCI-White取代他成为排名第一的计算机。
ASCI Red是最后一台完全由英特尔设计和组装的超级计算机;当ASCI Red发布时,英特尔的超级计算机部门已经关闭。
ASCI White :2000年11月至2001年11月排名第一
2000年11月,位于劳伦斯·利弗莫尔国家实验室的IBM ASCI-White系统以4.9万亿次/秒的Linpack性能位居第一。该系统由512个节点组成,每个节点包含16个使用共享内存的IBM Power3处理器。这种层次结构在HPC中使用的系统中越来越普遍。
到2001年6月,Linpack在ASCI White上的性能已提高到7.2万亿次/秒,在另外两个列表中保持第一的位置。
阿西·怀特位于劳伦斯·利弗莫尔国家实验室的一个机密区域,被安置在200多个橱柜中,占地面积有两个篮球场那么大,重达106吨。它包含6万亿字节(TB)的内存,拥有超过160 TB的IBM TotalStorage 7133串行磁盘系统容量。
ASCI White位于劳伦斯利弗莫尔国家实验室的一个机密区域,被安置在两百多个橱柜中,并覆盖了一个空间......
The Earth Simulator supercomputer (地球模拟器):2002年6月至2004年6月排名第一
位于日本横滨的地球模拟器中心的地球模拟器超级计算机于2002年6月以35.86 Tflop/s(每秒数万亿次计算)的性能位居榜首,运行Linpack基准测试,几乎是IBM ASCI White系统性能的五倍,而IBM ASCI White系统在前三个列表中一直位居榜首。与前一个顶级系统相比,该系统以如此之快的速度跃升至顶级,这在500强历史上是无与伦比的。性能差距也使地球系统连续五次蝉联榜首。
地球模拟器是一台运行全球气候模型的高度并行向量超级计算机评估全球变暖的影响和固体地球物理学中的问题。该系统于1997年为日本航空航天局、日本原子能研究所和日本海洋科学技术中心(JAMSTEC)开发。1999年10月开工,2002年3月11日正式对外开放。该项目耗资600亿日元。
由NEC建造的地球模拟器基于其SX-6架构。它由640个节点组成,每个节点有8个向量处理器和16GB的内存,总共有5120个处理器和10TB的内存。每1米x 1.4米x 2米机柜安装两个节点。每个机柜耗电20千瓦。该系统的磁盘存储容量为700 TB(系统为450 TB,用户为250 TB),磁带机中的大容量存储容量为1.6 PB。它能够对大气和海洋中的全球气候进行整体模拟,分辨率达10公里。
DOE/IBM BlueGene/L beta:2004年11月至2007年11月排名第一
2004年11月,DOE/IBM BlueGene/L beta系统以其创纪录的70.72万亿次/秒的Linpack基准性能位居第一。该系统在IBM Rochester现场组装和测试。完成后,机器被转移到加利福尼亚州利弗莫尔的劳伦斯·利弗莫尔国家实验室。按照大家熟悉的模式,BlueGene/L升级了三次,连续七次位居榜首。
2005年6月,该系统的规模比原来的配置扩大了一倍,并达到了创纪录的Linpack基准性能136.8 TFlop/s。到2005年11月,BlueGene/L的规模再次扩大了一倍,并达到了创纪录的Linpack基准性能280.6 TFlop/s)。当时,还没有其他系统超过100 TFlop/s的水平,因此预测BlueGene/L将继续稳居未来几届TOP500榜首。
当2007年11月的榜单发布时,BlueGene/L仍位居榜首,其规模已大幅扩大,达到了Linpack 478.2 TFop/s的基准性能。但在连续七个榜单领先后,BlueGene/L的排名将告一段落。
Roadrunner:2008年6月至2009年6月排名第一
2008年6月,美国能源部洛斯阿拉莫斯国家实验室安装的名为“Roadrunner” IBM超级计算机系统的性能达到了1.026petaflop/s,成为有史以来第一台达到这一里程碑的超级计算机。同时,Roadrunner也是500强中最节能的系统之一。
Roadrunner系统基于IBM QS22刀片,该刀片采用索尼PlayStation 3中处理器的高级版本构建。Roadrunner与许多当代超级计算机的不同之处在于,它是一个混合系统,使用两种不同的处理器架构。该设计由AMD双核Opteron服务器处理器组成,每个Opteron核心上都连接有一个IBM PowerXCell 8i处理器。Roadrunner自2002年开始开发,2006年上线。由于其新颖的设计和复杂性,分三个阶段建造,并于2008年全面投入使用。
到2008年11月,Roadrunner的性能略有提高,Linpack的基准性能为1.105万亿次。这使得该系统能够勉强抵挡住橡树岭国家实验室克雷XT5超级计算机捷豹的挑战。
Jaguar :2009年11月至2010年6月排名第一
2009年11月,Cray XT5超级计算机在TOP500超级计算机排行榜上第三次将IBM超级计算机“Roadrunner”的从TOP500超级计算机从榜首赶下来,最终在2009年11月的第34版超级计算机Top500上占据了榜首。这是它第三次打破IBM超级计算机在500强超级计算机排行榜上的排名。捷豹位于美国能源部橡树岭领导力计算设施。捷豹的Linpack性能达到1.759 PB/s,成为第二台突破PB/s的计算机。
捷豹系统自2005年作为25万亿次的Cray XT3安装以来,经历了一系列升级。到2008年初,捷豹已成为263万亿次的Cray XT4。2008年,捷豹扩展了1.4-petaflop Cray XT5。到2009年,由此产生的系统有超过200000个处理核心与Cray的Seastar2 网络进行内部连接。捷豹的XT4和XT5部件使用InfiniBand网络组合成一个单一系统。
2010年6月,捷豹以其1.759 PB/s的Linpack性能保持了其第一大系统的地位,尽管另一个系统的理论峰值性能更高。
天河-1A:2010年11月排名第一
第36版超级计算机Top500证实了中国天河-1A系统在天津国家超级计算机中心夺冠的传闻,其性能达到2.57万亿次/秒。这一事件标志着中国系统首次登上榜首。
2010年10月,有关天河一号(意思是天空中的河流)性能的传言开始流传,并在该系统于当月在中国HPC 2010上揭幕时得到证实。这台超级计算机由中国国防科技大学(NUDT)设计,用于解决石油勘探和大型飞机设计模拟的研究问题。
天河一号是一款混合设计,采用14336个Intel Xeon处理器和7168个NVIDIA Tesla GPU作为加速器。每个节点由连接到两个Xeon处理器的两个GPU组成。虽然处理器由美国公司生产,但天河1A互连由中国研究人员开发,能够以大约两倍于普通商业互连的速度处理数据。
京(K):2011年6月至2011年11月排名第一
2011年6月,一台能够每秒执行816万亿次计算(PB/s)的日本超级计算机成为新的排名第一的系统,这是自2004年11月地球模拟器退役以来,日本首次重返榜首。该系统名为京(K)计算机,位于神户理研计算科学高级研究所(AICS)。K计算机是以日语单词“kei”命名的,它代表1000亿万亿。
富士通(Fujitsu)制造的K计算机最初由68544个SPARC64 VIIIfx CPU组合而成,每个CPU有8个核,总计548352个核,几乎是当时任何其他系统的两倍。京(K)计算机的功能也比列表中接下来五个系统的功能加起来还要强大。
2011年11月,K计算机保持了第一的位置,成为第一台使用705024 SPARC64处理内核进行全面构建后,速度达到10petaflop/s的计算机。升级后的系统在Linpack基准测试上达到了令人印象深刻的10.51 petaflop/s。京(K)计算机也是名单上最节能的系统之一。
Sequoia: 2012年6月排名第一
自2009年11月以来,2012年6月,美国超级计算机首次跻身500强榜首。安装在美国能源部劳伦斯·利弗莫尔国家实验室(LawrenceLivermore National Laboratory)的IBM BlueGene/Q系统名为红杉(Sequoia),通过使用1572864核运行Linpack基准测试,其性能达到16.32petaflop/s。Sequoia是第一个使用100多万个内核构建的系统。
Sequoia(红杉)主要采用水冷式,由96个机架组成;98304个计算节点;160万芯;和1.6 PB的内存。虽然比ASC紫色和蓝色基因/L、Sequoia(红杉)相对于这些系统的峰值速度,它的能效大约是紫色的90倍,大约是BG/L的8倍。
Sequoia将使模拟能够以前所未有的细节水平探索现象。Sequoia致力于国家核安全局的高级模拟和计算(ASC)项目,以管理国家核武器储备,这是LLNL、洛斯阿拉莫斯国家实验室和桑迪亚国家实验室的共同努力。
Titan: 2012年11月排名第一
当SC12开始发布第40版超级计算机Top500名单时,排名第一的是一个560640处理器系统Titan,其Linpack性能为17.6 PB/s。橡树岭国家实验室的Titan是一个Cray XK7系统,它依赖GPU和传统CPU的组合,使其成为世界上最强大的超级计算机。Titan的18688个节点中的每个节点都包含一个NVIDIA Tesla K20 GPU和一个16核AMD Opteron 6274 CPU处理器,使系统的峰值性能超过27 PB。Titan还有超过700 TB的内存。
Titan对GPU的使用也为未来的科学超级计算机指明了方向。由于GPU提供了高性能和节能的计算能力,它们将允许超级计算系统变得更加强大,同时避免规模和功耗不断增长所固有的障碍。
研究团队已经为Titan做了两年的准备,优化他们的代码以利用GPU。关于泰坦的早期项目包括模拟材料的磁性、内燃机中的湍流燃烧、核动力反应堆中的中子输运以及长期气候变化。
天河二号(Tianhe-2):2013年6月至2015年11月排名第一
中国国防科技大学开发的超级计算机天河二号(Tianhe-2)保持着世界第一的地位,在Linpack基准上的性能为33.86万亿次/秒(每秒计算万亿次)。它是由中国国防科技大学(NUDT)与中国It公司浪潮(Inspur)合作建造的。
据NUDT称,天河二号将用于模拟、分析和政府安全应用。它拥有16000个计算机节点,每个节点由两个Intel Ivy Bridge Xeon处理器和三个Xeon Phi芯片组成,是世界上安装Ivy Bridge和Xeon Phi芯片最多的节点,总计312000个核。16000个节点中的每个节点都拥有88 GB的内存(Ivy Bridge处理器使用64 GB,Xeon Phi处理器使用8 GB)。总CPU加上协处理器内存为1375 TiB(约1.34 PiB)
神威·太湖之光:2016年6月至2017年11月排名第一
神威·太湖之光目前正在无锡市的国家超级计算中心投入运行,该中心是一个制造和技术中心,距上海西面两小时车程。该系统将用于气候、天气和地球系统建模、生命科学研究、先进制造和数据分析等领域的各种研究和工程工作。
这台超级计算机是由国家并行计算机工程与技术研究中心(NRCPC)开发的,该组织设计了泰胡莱特的前身,即安装在济南国家超级计算中心的神威·蓝光系统。BlueLight是一台796兆每秒的超级计算机,于2011年部署。
BlueLight由较旧版本的神威处理器(ShenWei processor)提供动力,神威处理器是第三代16核芯片,称为SW1600,最高可达140千兆次。在该系统上线后的五年里,NRCPC开发了一种功能更强大的处理器SW26010,这是一种260核的芯片,可以产生3兆次以上的浮点运算。神威·太湖之光在其40960个节点中的每一个节点中都有一个SW26010,这在整个机器(超过1000万个内核)中累积了125个峰值PB。当然,Linpack会留下一些失败的机会,但93 PB的失败代表了相当高的74%的峰值性能收益率。
Summit:2018年6月至2019年11月排名第一
Summit是一台IBM制造的超级计算机,目前在美国能源部橡树岭国家实验室(ORNL)运行,它在高性能Linpack(HPL)上以122.3 PB的性能位居榜首,Linpack是排名前500名的基准。Summit有4356个节点,每个节点配备两个22核Power9 CPU和六个NVIDIA Tesla V100 GPU。这些节点通过Mellanox双轨EDR InfiniBand网络连接在一起。
富岳(Fugaku):2020年6月以来排名第一
该超算由日本理化学研究所和制造商富士通共同推进开发。Fugaku由富士通的48核A64FX SoC提供支持,成为名单上第一个由ARM处理器提供支持的系统。
Frontier :2022年6月以来排名第一
美国橡树岭国家实验室(ORNL)的前沿系统基于最新的HPE Cray EX235a体系结构,并配备AMD EPYC 64C 2GHz处理器,该系统共有8730112个核,功率效率额定值为52.23千兆次/瓦,并依赖千兆以太网进行数据传输。