传DeepSeek跳出英伟达限制,绕过CUDA!或为适配中国国产GPU做
#8203;DeepSeek自发布以来,迅速攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中同样占据榜首位置。
DeepSeek的全球爆火,再一次引发外界对GPU算力限制话题的关注。
据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。
众所周知,英伟达的CUDA能大幅降低研发大模型的难度,获全球开发商使用,一举将英伟达推上AI芯片领域的垄断地位。
但最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX语言,而非高级编程语言CUDA。
这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。
对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。
而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。DeepSeek把优化做到了极致。
据媒体报道,北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。
这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
热点精选
- 西诺稀贵终止北交所IPO原拟募资1.3亿中信建投保荐2025-02-09 08:27
- HarmonyOS官网上线“稳定性”专栏助力更稳定流畅的鸿蒙原生应用开发2025-02-09 07:53
- 文远知行发布无人物流车RobovanW5:L4级无人驾驶、续航达220k2025-02-09 06:59
- 美图公司:预计2024年经调归母净利润同比增长52%至60%2025-02-09 04:57
- 继华为之后,上海最西端的科创小镇又有新动作2025-02-09 04:52
- 中国电子云上线DeepSeek-R1/V3全量模型2025-02-09 03:43
- 海康机器人取得多项专利,进一步提升机器人在生产中的实用2025-02-09 03:00
- 首航新能亮相2024AllEnergyAustralia展会2025-02-09 02:25
- 天津邮轮旅游迎新春“开门红”1月以来3.3万余人次出入境2025-02-09 02:20
- HTXDAOx路遥LOYAL慈善纪录片正式上线:以去中心化理念书写Web2025-02-09 01:04
