频道:网站首页 > 互联快讯 > >文章内容

豆包提出全新稀疏架构推理成本较MoE最高可降83%

时间:2025-02-13 07:34   来源: 科技快报网   阅读量:8504   

近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍。

更重要的是,该架构能够将推理成本最高降低83%。

该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

ad

关于我们 | 联系我们 | 投稿合作 | 网站地图 | RSS订阅
 

版权所有©IT产业网
 

所载文章、数据仅供参考,使用前务请仔细阅读网站声明。本站不作任何非法律允许范围内服务!
 

联系我们: jokerdeyouxiang@sina.com
 

备案号:皖ICP备2023005497号