阿里云确认:李飞飞团队s1模型基于Qwen2.5-32B-Instruc
时间:2025-02-08 01:51 来源: 科技快报网 阅读量:16386
,阿里云今日证实,李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。
该s1模型在数学和编码能力测试中表现出与OpenAI o1和DeepSeek R1等尖端推理模型相似的效果。
据回应称,在16块H100 GPU上监督微调26分钟后,s1-32B取得了与o1和R1相当甚至更高27%竞赛数学问题表现的成果。
这一技术旨在通过训练一个人工智能模型来提取其“推理”能力,并采用了监督微调方法,比起DeepSeek使用大规模强化学习方法更具成本效益。s1利用了阿里巴巴旗下中国人工智能实验室Qwen提供的免费小型人工智能模型以及谷歌Gemini 2.0 Flash Thinking Experimental给出的答案背后思考过程。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
热点精选
- 2024年澳康达献呈上海的答卷:年交易额近30亿,打造二手车新体验、新标2025-02-06 22:53
- 一名华人女性获首届“索尼-《自然》技术女性奖”2025-02-06 21:46
- 科研团队破解土壤水分监测难题,为卫星数据验证提供“精准标尺”2025-02-06 21:44
- 哪吒2登顶中国影史票房冠军带火周边潮玩新品盲盒上架即售罄2025-02-06 21:06
- 海报|新意盎然看广东2025-02-06 19:51
- 易车志对话经销商,揭秘数字化转型如何赋能品牌跃迁2025-02-06 19:27
- 布局先进刻蚀工艺,歌尔光学推出全新AR全彩光波导显示模组2025-02-06 18:27
- 春节文旅市场繁荣,国内外游客双向奔赴共促经济回暖2025-02-06 17:39
- DeepSeek突围启示:以创新自信叩响科技强国之门2025-02-06 13:42
- 2025年春节档电影市场火爆,票房与观影人次双创新高并推动文旅融合2025-02-06 13:27
