
华为发布星河AI网络方案,面向AI集群互联
🌍 AI网络方案聚焦集群互联。 📰 原文详情 华为正式发布『星河 AI 网络』方案,这是一套面向超大规模 AI 训练集群的全栈网络解决方案。 该方案的核心是华为自研的星闪交换机,支持 512×800G 端口配置,单机架交换容量达到 409.6Tbps。配合华为自研的拥塞控制算法和自适应路由技术,星河 AI 网络能够支持超过 10 万卡的集群无阻塞通信。 在 AI 集群中,网络往往是瓶颈。华为的解决方案在网络层面做了大量优化,包括梯度压缩、流水线并行优化和集合通信加速。据华为测试数据,在大规模分布式训练场景下,星河 AI 网络能将训练效率提升 30% 以上。 该方案已在国内多个智算中心项目中中标。 🔗 原文链接:36氪 🤔 小乌的深度思考 算力集群短板从GPU转向了互联网络。