支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源

时间：2025-04-03 00:38 来源: 科技快报网阅读量：8641

在当今数字化时代，语音识别技术已成为人机交互的关键桥梁，广泛应用于智能客服、语音助手、会议转录等众多领域。然而，对于东方语言的识别如越南语、缅甸语等，现有模型往往表现不佳，难以满足用户的需求。为解决这一难题，海天瑞声携手清华大学电子工程系语音与音频技术实验室，共同推出了Dolphin —— 一款专为东方语言设计的语音大模型。

Dolphin核心亮点:

· 支持东方40个语种的语音识别，中文语种支持22方言;

· 训练数据总时长21.2万小时:其中海天瑞声高质量专有数据13.8万小时，开源数据7.4万小时;

· 在3个测试集下，与Whisper同等尺寸模型相比:

- base版本平均WER降低63.1%;

- small版本平均WER降低68.2%;

- medium版本平均WER降低67.7%;

- large版本平均WER降低60.6%

·base与small版本模型与推理代码全面开源;Dolphin 开源的small版本与Whisper large v3相比，平均WER降低54.1%。

Dolphin的开源只是起点。未来，海天瑞声与清华大学电子工程系语音与音频技术实验室将继续探索更大规模模型的训练，以实现更广泛的语言覆盖和更卓越的性能。同时，我们也将优化模型以适应低延迟和实时应用场景，使其在更多领域发挥价值。此外，海天瑞声计划进一步加大对稀缺语言语种数据集的研发支持，为全球语音识别技术的均衡发展贡献力量。

Dolphin不仅是一款技术先进的语音识别模型，更是推动东方语言语音识别技术发展的重要力量。海天瑞声期待与全球研究者和开发者共同携手，开创语音识别技术的新篇章。

欢迎前往Github、HuggingFace、Modelscope、OpenI启智社区等社区搜索「Dolphin」进行体验~!

免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。

热点精选

2025款五菱缤果焕新登场，复古魅力全面升级2025-04-02 11:39
马自达推精益资产战略，多管齐下推进电气化转型2025-04-02 11:34
韩国发力研发2D半导体传感器，多元应用前景广阔2025-04-02 11:30
AI眼镜迈向生态构建新阶段，我国现存超过440家AI眼镜相关企业2025-04-02 11:14
魔方首款端游《暗区突围：无限》国服定档4月29日，给射击玩家来点真刺激2025-04-02 10:53
云南小粒咖啡产业蓬勃发展，占全国咖啡相关企业总数的11.87%2025-04-02 10:29
预包装牛羊肉需加强监管，全国肉类加工相关企业已超22.8万家2025-04-02 10:29
小鹏汽车2025款G6将于3月19日开启全国交付引发市场期待热潮2025-04-02 10:19
创维汽车全球经销商大会发布2025款新车推动全球化战略进程2025-04-02 10:13
小鹏汽车2025年第一季度交付量预将大幅增长展现强劲发展势头2025-04-02 10:05

频道：网站首页 > 互联快讯 > >文章内容

支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源

热点精选

热门内容

推荐阅读