1. 首页 > 人工智能

亚马逊“雷尼尔”超算投入运行:50万颗自研芯片驱动,剑指AI基础设施霸主

作者:小小 更新时间:2025-11-03
摘要:亚马逊云服务迎来重要转折点,部署近50万颗Trainium2芯片的“雷尼尔”超级计算机正式投入使用,为AI合作伙伴Anthropic提供五倍算力提升。亚马逊公司在人工智能领域的重大布局取得关键进展。其名为“雷尼尔”(Rainier)的超级计算机已正式投入使用,该系统由近50万个Tr,亚马逊“雷尼尔”超算投入运行:50万颗自研芯片驱动,剑指AI基础设施霸主

 

亚马逊云服务迎来重要转折点,部署近50万颗Trainium2芯片的“雷尼尔”超级计算机正式投入使用,为AI合作伙伴Anthropic提供五倍算力提升。

亚马逊公司在人工智能领域的重大布局取得关键进展。其名为“雷尼尔”(Rainier)的超级计算机已正式投入使用,该系统由近50万个Trainium2芯片驱动,分布在美国境内多个数据中心,通过NeuronLink技术连接数万台超级服务器以最小化延迟。

这一里程碑事件标志着亚马逊网络服务(AWS)在AI基础设施竞赛中迈出决定性一步。美国银行证券公司分析师Justin Post维持对亚马逊的“买入”评级,并预测其股价将达到272美元,他指出雷尼尔系统将显著增强AWS实力,预计2026年AWS营收同比增长19%,增量营收可达60亿美元。

01 超算规模与技术架构

雷尼尔系统作为全球最大的人工智能训练计算机之一,其架构设计体现了亚马逊在AI基础设施领域的雄心。该系统基于分层式集群架构,每个服务器配备16颗Trainium2芯片,每4个服务器组合为一个UltraServer,数以万计的UltraServer互联构成最终的超级集群。

在互联技术方面,雷尼尔系统采用双路径设计。蓝色电缆的NeuronLinks负责Tn2 UltraServer内部高速互联,带宽达到1.6Tbps;而黄色电缆的Elastic Fabric Adapter(EFA)技术则负责单一数据中心内部和跨数据中心互联。这种设计确保了整个系统的高效通信和数据交换。

Trainium2芯片本身采用台积电的芯片级封装技术(CoWoS),将一对5nm计算核心集成,由四个HBM堆栈供电。每个Trainium2加速器可提供1.3 petaFLOPS的密集FP8性能、96GB HBM和2.9TB/s的内存带宽。虽然单芯片性能不及英伟达的B200,但其集群整体效能通过优化架构得到了最大化发挥。

雷尼尔项目的建设速度令人瞩目。从项目宣布到正式投入运行仅用了不到一年时间,展现了亚马逊在大型AI基础设施部署上的高效执行能力。该系统目前已完成近50万颗芯片的部署,并计划在年底前扩展到超过100万颗Trainium2芯片。

02 战略意义与行业竞争

雷尼尔系统的上线标志着AWS在AI算力竞赛中进入了新阶段。这一系统规模比AWS以往任何AI计算平台都大约70%,为其在与微软Azure、谷歌云等对手的竞争中提供了重要筹码。

亚马逊的自研芯片战略在这一项目中得到充分体现。通过控制从芯片组件到软件再到数据中心设计的整个技术栈,AWS减少了对外部硬件供应商的依赖,在建设速度和技术优化方面获得了显著优势。Trainium2芯片专门为训练复杂的AI模型所需的海量数据而设计,单颗芯片每秒可完成数万亿次计算。

与OpenAI的Stargate项目相比,雷尼尔系统在部署进度上已取得领先。虽然Stargate计划到2026年中期将计算能力扩展到1.2吉瓦,但雷尼尔已经投入实际运行。这种先发优势为AWS在吸引大型AI企业客户方面创造了有利条件。

亚马逊首席执行官安迪·贾西将这一项目视为公司发展的“AI转折点”,并透露当前Trainium2产能已全部被预订。这表明市场对专用AI算力的需求极为旺盛,也验证了亚马逊技术路线的正确性。

03 商业价值与市场预期

雷尼尔系统带来的商业价值已经开始显现。AWS在2025年第三季度财报中显示,其云服务收入达到330亿美元,同比增长20.2%,增速较上一季度明显提升。这一定程度上得益于AI算力需求的快速增长。

分析师对雷尼尔系统的商业潜力持乐观态度。Justin Post估计,到2026年,仅Anthropic一家合作伙伴就可能为AWS带来60亿美元的增量收入,使整体增长率提高4个百分点。富国银行更为乐观,预测在满负荷运行情况下,雷尼尔项目每年可为AWS带来约140亿美元的营收。

摩根士丹利在最新研报中将亚马逊列为“Top Pick”,目标价从300美元上调至315美元,较当前股价有约25%的上涨空间。该行指出AWS正迎来一个“AI增长加速周期”,并预计AWS未来两年收入增速将分别达到23%与25%。

亚马逊自身也加大了资本开支投入。2025年全年现金资本开支预计将达到1250亿美元,同比增长60%,2026年将继续增加,到2027年底整体产能将提升一倍。这些投资反映了公司对AI算力市场前景的坚定看好。

04 合作伙伴与应用前景

雷尼尔系统的主要合作伙伴Anthropic正在利用该计算集群构建和部署其AI模型Claude。亚马逊与Anthropic的合作关系深远,已向这家OpenAI竞争对手投资80亿美元,是后者最大的支持者之一。

目前,Anthropic在雷尼尔系统上获得的计算能力是其之前最大训练集群的五倍以上。公司计划在2025年底前,在超过100万个Trainium2芯片上运行Claude模型的训练和推理工作负载。这种算力飞跃将显著加速Claude模型的迭代优化。

除了AI模型训练,雷尼尔系统还将支持推理工作负载。Trainium2芯片设计上既可用于训练也可用于推理,这对于使用强化学习的客户特别有用,因为这类工作负载在训练步骤中需要大量推理验证。

随着雷尼尔系统的全面运行,AWS正将其AI服务从“头部客户”向更广泛的企业市场扩展。预计即将推出的Trainium3芯片将进一步降低AI计算门槛,使更多中小企业能够负担得起大规模模型训练和推理。

雷尼尔超级集群的正式运行标志着亚马逊已将其AI基础设施扩张从战略布局转向产能兑现。当Anthropic在年底用上100万颗Trainium2芯片时,AWS在AI算力市场的领先地位将更加稳固。对亚马逊而言,雷尼尔不仅是技术里程碑,更是其全球AI战略的核心支点。

在AI算力竞赛中,亚马逊通过自研芯片和超大规模集群建设,正从“云服务提供商”向“AI基础设施霸主”转变。雷尼尔项目印证了安迪·贾西的判断:“算力才是AI时代的终极货币”。