3月4日,业界期待已久的7纳米全新一代Ampere Altra处理器正式发布。
业界首款专为云和边缘设计的云原生CPU
这是业界首款专为新一代云和边缘计算数据中心应用而设计的云原生中央处理器。直击现代云计算中心的痛点需求。
回看过去十到十五年来,云计算的需求已经与从前基于企业级计算演进而来的云计算发生了很大的变化。
从软件角度看,更多地向容器、微服务等云原生计算模型快速转变;硬件方面,超大规模的云和边缘计算高速增长,迫切需要延时、散热、功耗等方面取得创新突破,尤其对于CPU的部署密度和能耗的要求越来越高。
此外,机器学习和人工智能不断发展,在IT基础设施的各个层面都有非常巨大的需求。而随着定制化和异构计算越来越多,GPU用于AI,smartNIC(智能网卡)用于网络的工作负载也与日俱增。
所有这些变化,呼唤一种新型的算力:它需要更高效的CPU,更低的功耗,更高的可扩展性,更加开放的架构,更高的可预测性。
以性能和能效为例,它们会直接影响到运营成本,而且绿色可持续发展正逐渐被全球所重视。
然而,目前全球数据中心的电力消耗总量,从过去5-10年占全球总电量的3%左右,预计到2030年将上升到11%,而x86芯片厂商的创新速度已经跟不上数据中心规模高速发展所造成的能耗增长速度。
简单的节能创新措施已经基本用过,因此,现在到了一个重要的节点:业界需要性能更好且能耗更低的新型处理器,而云计算专属的更高能效处理器将成为希望。
为什么ARM架构处理器是希望之光
为什么说基于ARM架构的处理器是希望之光?
首先,近年来ARM架构的综合能力已经逐步达到现代数据中心性能和能效所需的要求。相对于x86而言,ARM采用的精简指令集(RISC)可以在提供高性能性能的同时,功耗更低,整体效率更高。
其次,ARM的生态也日趋成熟,软件方面,不论是操作系统、中间件,还是应用程序几乎所有数据中心的软件都可以在ARM上运行;硬件方案,7纳米先进工艺制程技术已经成熟,可以支持ARM架构为现代数据中心设计能效更好的CPU。
目前已有大约1200亿ARM设备成功部署在移动、物联网以及消费电子领域,使ARM形成了CPU领域最大的生态系统。近年来,ARM在服务器领域的生态系统也加速成熟,所有大型的操作系统,如Linux、BSD、windows都能够支持ARM;容器,以及包括虚拟化工具如Docker、Vmware、KVM和Kubernetes都可以在ARM上运行;语言方面,包括CUDA和Java也都支持ARM。
Ampere Altra带来了什么
云计算领域发生的重大变化,主要带来了三方面的需求:
首先,云计算需要可预测的高性能;
其次,需要从内核、IO到内存等整个平台的高可扩展性;
第三,需要高密度和高能效。
考虑到新一代云计算所需要的新需求,世界首款云原生处理器Ampere Altra应运而生。这款CPU是世界上第一款,从一开始就面向云而设计制造,为了满足云计算新需求的CPU处理器。
为了提供可预测的高性能,Ampere Altra处理器可以提供单路80个计算内核,利用Monolithic die(即单芯片设计)工艺,让所有内核在Mesh网络互连下相互连结,并且具有高内存带宽和高密度特性。
此外,该处理器还能提供了迄今为止最高的可扩展性,从边缘计算到超大规模云计算中心的不同部署环境下,可提供多种可选的处理器配置,还能提供多路支持,具有非常灵活的IO连接以及高带宽,而且功耗非常低,单核功耗或每瓦性能业内最高。
该处理器在安全、电源管理等方面也非常先进。可提供充分的服务质量的保障,更高的IO和内存带宽。
因此,这款CPU特别用于现代云计算所需要的计算模型,在包括像容器、微服务,函数即服务等计算模型中性能优异。所有内核都能在Turbo模式下持续运行。单核单线程的设计,执行引擎、寄存器,一级、二级缓存闪存都是内核独享,不必和其他线程分享,消除了单物理核多线程设计中多用户共享资源的争夺引起的 “相邻干扰” 问题,实现了100%的性能可预测,降低了被侧信道攻击的风险。
Altra处理器还提供了两个128BT的SIMD单元用于浮点计算。随着推理变得越来越重要,并且广泛运行在所有基础设施上,Altra处理器提供INT8和FP16支持,提高AI推理加速性能。
而八个DDR4通道,每一个通道能插两个DIMM,运行时能够提供总带宽单路200GB/秒的速度。单路4TB的内存或双路8TB的内存容量,非常好的IO子系统,单路128条PCIe Gen4通道,两路192条PCIe Gen4,达到行业最高水平。
此外,Ampere Altra还提供了四个支持CCIX协议,x16的PCIe接口,用于缓存一致性连接。还有一个控制处理器来控制服务器,提供云所需要的散热、电源管理等相关服务。这个处理器提供了SBSA 规范4级的水平,这样云服务商可以把处理器轻松地整合到自己的云环境中。
测试数据显示,Ampere Altra的性能超过了AMD的64核EPYC处理器,以及28核的Intel 至强(Xeon)处理器的性能,尤其是对于搜索、AI推理、解码、数据库等基于云的应用场景,能够提供更好的效果性能,更低的功耗。
这样不仅使数据中心的容量不断增大,还能够横向扩展到边缘,对于以能耗为中心(power-centered)的应用,如存储网页游戏、边缘云、Web主机等应用是一种完美的解决方案。
而由于单核功耗更低,所以每一个机架能够部署的核数密度比其他解决方案更高,每个机架能够部署3500个Altra内核,机架的单核密度比AMD EPYC高38%,比Intel至强高173%。
由于性能更好,功耗更低,所以Altra的总体应用成本TCO也更低,优于AMD EPYC 41%,优于Intel至强2月24日公布的最新版本63%。
目前,Altra已经推出两款样机:一是双路的Mt. Jade,一是单路的Mt. Snow,在市场上正在被微软、Oracle等客户试用,也包括一些中国的处理器供应商。
而且,Ampere 的年度产品开发规划显示,2021年、2022年将陆续推出Mystique和Siryn新品。
中国科学院院士、绿色计算产业联盟(OpenGCC)主席梅宏院士表示:“云计算、大数据、AI的快速发展对数据中心算力的需求不断提升,数据中心已成为能耗大户。实现更高的能源效率,推动绿色计算平台的产业发展一直是OpenGCC的目标。作为OpenGCC的重要成员之一,Ampere新一代处理器所表现的出色能效比将为绿色计算标准的建设提供重要的参考;该新产品多达80个计算核心,其性能处于业内领先水平,为数据中心高性能,高能效的绿色计算平台提供又一选择,也期待看见Ampere方案在大数据分析、Web、高性能数据库和存储、Arm原生、AI异构等应用中实现规模部署。OpenGCC祝贺Ampere新一代产品的推出,这将非常有助于OpenGCC协同产业界伙伴共同推动绿色计算的产业发展和生态建设。”
受邀出席Ampere美国发布会的ARM资深专家魏东表示:“祝贺Ampere公司正式发布业界第一款80核服务器基于Arm Neoverse N1的芯片Altra。感谢Ampere和我们合作使用Arm的SBSA和SBBR标准以保证其完全符合Arm系统架构而达到用户无缝的开箱即用体验。今年晚些时候我们会合作以使基于Altra的系统通过ServerReady 2.0的认证。”
衷心期待Ampere Altra的推出,能够为业界带来一股清风,扫荡云计算和边缘计算服务商所面临的高能耗、高成本等弊端,让新一代基础设施在企业数字化转型中发挥更加出色的支撑作用。