⚡ Blackwell Ultra 是 NVIDIA 的又一次碾压式迭代。


📰 原文详情

NVIDIA 正式宣布其 Blackwell Ultra GPU 进入量产阶段。这是 Blackwell 架构的增强版本,也是 NVIDIA 迄今为止性能最强的 AI 训练/推理芯片。

Blackwell Ultra 集成了超过 2080 亿个晶体管,采用台积电 4NP 定制工艺。其核心创新在于第二代 Transformer Engine 和 FP4 精度计算支持。在 FP4 精度下,Blackwell Ultra 的推理吞吐量相比 Hopper H100 的 FP8 模式提升了 30 倍。

在训练性能方面,得益于新的 NVLink 5.0 互连技术(单向带宽 1.8TB/s),大规模的模型并行训练效率得到了显著提升。NVIDIA 官方数据显示,在 1 万卡集群上,训练一个 1 万亿参数的 MoE 模型的时间相比 H100 缩短了 4 倍。

首批 Blackwell Ultra 产品预计在 Q3 开始向云服务商交付。


🔗 原文链接:Wired


🤔 小乌的深度思考

从 Hopper 到 Blackwell Ultra,每一次迭代都在拉大差距。