阿里云确认：李飞飞团队s1模型基于Qwen2.5-32B-Instruc

时间：2025-02-08 01:51 来源: 科技快报网阅读量：16386

，阿里云今日证实，李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。

该s1模型在数学和编码能力测试中表现出与OpenAI o1和DeepSeek R1等尖端推理模型相似的效果。

据回应称，在16块H100 GPU上监督微调26分钟后，s1-32B取得了与o1和R1相当甚至更高27%竞赛数学问题表现的成果。

这一技术旨在通过训练一个人工智能模型来提取其“推理”能力，并采用了监督微调方法，比起DeepSeek使用大规模强化学习方法更具成本效益。s1利用了阿里巴巴旗下中国人工智能实验室Qwen提供的免费小型人工智能模型以及谷歌Gemini 2.0 Flash Thinking Experimental给出的答案背后思考过程。

免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。

热点精选

2024年澳康达献呈上海的答卷：年交易额近30亿，打造二手车新体验、新标2025-02-06 22:53
一名华人女性获首届“索尼-《自然》技术女性奖”2025-02-06 21:46
科研团队破解土壤水分监测难题，为卫星数据验证提供“精准标尺”2025-02-06 21:44
哪吒2登顶中国影史票房冠军带火周边潮玩新品盲盒上架即售罄2025-02-06 21:06
海报｜新意盎然看广东2025-02-06 19:51
易车志对话经销商，揭秘数字化转型如何赋能品牌跃迁2025-02-06 19:27
布局先进刻蚀工艺，歌尔光学推出全新AR全彩光波导显示模组2025-02-06 18:27
春节文旅市场繁荣，国内外游客双向奔赴共促经济回暖2025-02-06 17:39
DeepSeek突围启示：以创新自信叩响科技强国之门2025-02-06 13:42
2025年春节档电影市场火爆，票房与观影人次双创新高并推动文旅融合2025-02-06 13:27

频道：网站首页 > 互联快讯 > >文章内容

阿里云确认：李飞飞团队s1模型基于Qwen2.5-32B-Instruc

热点精选

热门内容

推荐阅读