联想将单台服务器运行大模型性能推向新高

时间：2025-03-18 08:34 来源: 中国经济网阅读量：18689

今天，联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版) DeepSeek大模型时，可实现极限吞吐量6708token/s，将单台服务器运行大模型的性能推向了新高。

据悉，依托联想万全异构智算平台，联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式，对大模型从预训练、后训练到推理的全流程进行持续优化，在单台部署DeepSeek 671B大模型的联想问天WA7785a G3上实测最高吞吐量达6708 token/s。

在模拟问题对话场景时，最高可支持并发数158，TPOT 93毫秒, TTFT 2.01秒；而在模拟代码生成(上下文序列长度512/4K )时，并发数可达140，TPOT 100毫秒, TTFT 5.53秒。意味着单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用，是继联想问天WA7780 G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500 token/s之后，单机部署该大模型推理性能的又一次突破。

此次突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD联合设计、协同调优、共同实现的。此结果也并非最终结果，联想与AMD还在持续尝试深度调优新方法，实现更高调优突破。

免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。

热点精选

多型可重复使用火箭今年将迎首飞或试验2025-03-17 23:34
追觅H40Ultra洗地机：「双高温」洗地黑科技重新定义地面清洁标准2025-03-17 23:17
博通AI芯片营收超预期引行业股价现分化走势2025-03-17 23:04
京东携头部品牌举办高端手机壳品鉴沙龙共探行业创新未来2025-03-17 23:02
国内独有“玻璃光盘”技术发布：理论容量最高360TB成本仅1/102025-03-17 22:08
楼市延续回稳态势：房地产开发投资降幅收窄，房企在核心城市积极拿地2025-03-17 22:08
产教融合、科教融汇激发世界级成果，西安交通大学鲲鹏昇腾科教创新孵化中心揭2025-03-17 20:21
具身智能获突破，人形机器人量产加速引领行业变革2025-03-17 16:45
2025 年 315 行业风险洞察：用大数据守护消费安全2025-03-17 16:44
光伏业面临内卷挑战，需供需两端综合发力促良性竞争2025-03-17 16:05

频道：网站首页 > 互联快讯 > >文章内容

联想将单台服务器运行大模型性能推向新高

热点精选

热门内容

推荐阅读