首页 > 新闻 > 科技 > 科技关注

燧弘华创庆阳绿色智算中心新进展:DeepSeek极限吞吐超8000 tokens/s

时间:2025-03-27 浏览:

【环球网科技综合报道】3月26日,异构智算产业生态联盟走进燧弘华创庆阳绿色智算中心,见证了DeepSeek大模型落地新突破。

据悉,燧弘华创庆阳绿色智算中心携同联想万全异构智算平台突破算力瓶颈,通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多领先创新方式,将单机服务器运行大模型的性能再创新高,3000并发下总吞吐量超8000 tokens/s,持续提升DeepSeek满血版用户体验。

全国政协委员,中科院计算所研究员张云泉表示,“DeepSeek的诞生标志着在AI领域出现了新的技术突破,尤其是在低算力训练和高效率模型优化方面,这将推动AI技术向更高效和普惠的方向发展。”他认为这一突破,促使全球市场重新评估大模型发展的成本曲线,推动国内芯片、云计算等基础设施加速升级。

DeepSeek掀起的AI应用革命与算力瓶颈突破,也让作为“中国算谷”的庆阳,受到了前所未有的关注。燧弘华创是首家入驻庆阳的数据中心企业,其绿色智算中心兼具开源开放、集约高效、绿色普惠的技术优势与卓越性能。

依托燧弘华创在技术研发领域的深耕细作与联想的协同创新,当前,燧弘华创庆阳智算中心已成功构建超2万P的高性能算力供给规模,为庆阳打造“东数西算”模范节点注入了强劲动力,加速推动了智算中心产业在AI时代的创新发展步伐。

据悉,联想问天 WA5480 G3服务器搭载了第四代英特尔®至强®可扩展处理器,其拥有强大的计算能力,内置了众多加速器,是智算中心建设的首选。同时,联想搭建了万全异构智算平台,为智算中心输出融合、稳定和高效的算力,加速各行业实现数字化、智能化转型升级。

联想中国基础设施业务群战略总监黄山表示,联想作为领先的AI基础设施提供商,凭借联想万全异构智算平台应对智算挑战,以领先的液冷技术持续解决能效和能耗难题,为千行万业输送真正 “好用” 的算力,从而有力推动智能化转型和产业升级。目前,联想正全力推进“一横五纵”战略布局,全面推出覆盖万全异构智算平台,以及涵盖服务器、存储、数据网络、软件及超融合、支持运维服务等在内的全方位基础设施解决方案。

据黄山介绍,作为联想AI基础设施“一横五纵”战略中的核心,联想万全异构智算平台这一平台能够统一纳管异构算力,实现对异构计算集群的高效管理调度和可用性保障,让客户轻松获取融合、稳定的通用、智能和科学算力。凭借联想万全异构智算平台调优,联想AI服务器可以全速运转满血版DeepSeek R1大模型,极限吞吐量可超8000 tokens/s。

2025年,联想与燧弘华创共同携手推动在庆阳绿色智算中心突破性部署多元异构算力调度平台,标志着异构算力在超大规模智算场景中完成从技术攻坚到产业化应用的历史性跨越。这一战略级算力基础设施的落地,将为千行百业构建强力的创新引擎,加速各行各业的智能化转型与数字化升级。

此外,联想中国基础设施业务群高级产品经理郭晋兵现场演示了联想万全异构智算平台如何加速DeepSeek大模型落地。联想及其生态伙伴在庆阳搭建的联想万全异构智算平台,在管理142节点千卡进行DeepSeek后训练时,以调优技术使得训练MFU高达60%以上,在训练期间人为加入多类故障后进行故障断点续训的时间小于1分钟。

郭晋兵同时展示了通过联想万全异构智算平台的内核态虚拟化技术,以单GPU卡运行100个模型任务的实例。他还演示了DeepSeek 671B FP8单机8卡性能,极限总吞吐高达8000+ tokens/s。通过现场演示,联想万全异构智算平台已验证其在推理加速、训练优化、断点续训、内核级虚拟化等大模型推理优化场景具有明显优势。

此次庆阳项目中交付的联想问天 WA5480 G3服务器采用2颗第四代英特尔®至强®可扩展处理器,可助力众多内置加速性能更进一步。(特蕾茜)

猜你喜欢: