亚马逊发力自研芯片！推Graviton2服务器芯片，性能翻7倍_IDC整机柜服务器

12月4日消息，亚马逊今日在AWS re：invent大会上发布了基于Arm架构的Graviton2服务器芯片，同时公布了Inferentia芯片的最新进展。AWS表示，Graviton2相较x86同类产品计算量提升4倍，性价比提升高达40%。基于Inferentia芯片的Inf1实例相比Nvidia G4实例，吞吐量提高3倍，且成本降低40％。

Graviton2已经针对AWS云的原生应用进行了优化，并且每个核心的浮点性能有2倍提升。Inferentia是用于AI推理的高性能芯片，于去年推出。AWS CEO Andy Jassy今天在会上表示，目前AWS已经储备了人才力量，将在自研芯片领域持续发力，为用户提供更多高性价比产品。

一、Inf1吞吐量超英伟达G4 3倍

▲AWS首席执行官Andy Jassy于2019年12月3日在拉斯维加斯的re：Invent大会上，图片来源：Techcrunch

亚马逊AWS今天推出了Inf1实例，该实例由Inferentia芯片提供支持，是一个在云中为AI推理提供支持的实例，AWS CEO Andy Jassy称之为云中可用的成本最低的推理产品。

Andy Jassy表示，“与Nvidia G4实例相比，Inf1具有更低的延迟，吞吐量将提高3倍，并且每个实例的成本降低40％。”“使用云服务为AI解决方案提供动力的运营成本绝大多数来自推理，而推理芯片可能会很昂贵，并且要求低延迟和高吞吐量。”

Inf1还将由Annapurna Labs制造的Inferentia芯片提供支持，该芯片企业是2015年被以色列AWS收购的。Inferentia芯片拥有4的个NeuronCore，可以提供128TOPS的算力，而每个Inf1实例可以提供2000 TOPS的算力。

Inf1实例目前已经上市，并将与PyTorch，MXNet和TensorFlow集成。2020年，Inf1将可以用于EKS实例和Amazon的SageMaker，来进行机器学习的推理运算。

二、Graviton2成为英特尔AMD劲敌

亚马逊今日还推出了基于Arm架构的Graviton2服务器芯片，与基于x86的同类实例相比，该处理器的性价比高提升可达40%，计算量提升4倍。基于Arm架构的Graviton2可能会对云工作负载、AWS的成本结构以及数据中心Arm架构的应用产生重大影响。

AWS加大了对Graviton2的投注，它们对Arm架构的数据中心处理器研发和稳步推进云基础架构创新都非常重视。AWS正在启动新的基于Arm的Amazon EC2实例，包括M6g、R6g、C6g系列。

Graviton2针对云原生应用进行了优化，并且基于64位Arm Neoverse内核和AWS的片上定制系统设计。Graviton2的每核浮点性能提高了2倍，可用于科学和高性能工作负载领域，最多支持64个虚拟CPU，25Gbps网络和18Gbps EBS带宽。

AWS CEO Andy Jassy在主题演讲中说：“我们决定设计芯片来为您提供更多功能。尽管许多公司使用x86已有很长时间，但我们希望为您提高性价比。”不过他补充说，英特尔和AMD仍然是AWS的主要合作伙伴。

结语：亚马逊服务器芯片重点发力，自研已成主攻方向

通过目前亚马逊发布的Inf1实例和Graviton2芯片，以及AWS CEO的发言我们不难看出，打造高性价比的自研芯片是亚马逊目前和今后的主要发展策略，而Arm架构在服务器领域的声量也将越来越大。

不过Andy Jassy也提到，英特尔、AMD后续将继续作为AWS的主要合作伙伴。在AI芯片和服务器芯片两大战场，格局似乎变得不再单一，英特尔、AMD、亚马逊等巨头后续会展开怎样的竞争与合作，我们拭目以待