新型人工智能工具可翻译200种语言
时间:2024-06-09 12:32 来源: 光明网 阅读量:9240
人类有超过7000种语言,其中包括使用人数不多、相关资料稀少的“小众语言”。美国“元”公司新研发的一个人工智能模型,能翻译200种不同语言,实现了对较多“小众语言”在线翻译。
人工智能翻译目前多利用基于人工神经网络的模型翻译各种语言。这些模型通常需要大量可在线获取的训练数据。不过,有些特定语言的数据尚不能公开和低成本获取或普遍可及,这类语言又被称为“低资源语言”。
“元”公司团队新研发的一种跨语言技术,能让基于人工神经网络的翻译模型学习如何利用已有的翻译高资源语言的能力来翻译低资源语言。团队应用该技术开发了一个名为NLLB-200的在线多语言翻译工具,可容纳200种语言,其能翻译的低资源语言的数量是高资源语言数量的3倍。这一研究成果近期发表在英国《自然》杂志上。
由于研究团队在许多低资源语言上只能获取1000至2000例样本,为扩大NLLB-200的训练数据量,他们利用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘这些语言与英语的双语文本数据,帮助提升模型的翻译质量。
研究者称,该翻译工具可帮助低资源语言使用者使用互联网等技术,且这一模型还可用于教育,帮助这类人群获取更多图书和论文资料。不过研究者也表示,这一工具的误译情况仍有可能出现。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
热点精选
- 京东五金城面向中小企业推出集采服务助力新余银龙水务降低10%工业品采购成2024-06-07 22:58
- 星曜十五载丨TCL华星砥砺奋进15年历程回顾2024-06-07 20:37
- 从“尝新”到“常新”俏生元用匠心品质赋能女性健康美好生活2024-06-07 19:16
- 安吉尔出席家装下午茶六六盛典,携手装企共享全屋净水新红利2024-06-07 18:33
- 宜搜科技港股首日涨92%净募4070万港元净利连降2年2024-06-07 18:07
- 跑腿应急、免费文具、降暑物资、随身AED……饿了么“社区侠”志愿队护航高2024-06-07 17:47
- “青创北京”2024年首都大学生挑战赛在京启动2024-06-07 16:19
- 《科技会客厅》第一期:“新能源汽车,2024迈向新纪元”Part22024-06-07 14:29
- GfK中国联合上海市眼镜行业协会举办高层论坛:探索眼镜市场机遇共筑视觉健2024-06-07 14:08
- 海绵动物早期演化研究获重要进展2024-06-07 12:50