最近,Facebook 开源了目前世界上最大的多语言语音数据集,VoxPopuli:这一数据集共涵盖了 23 种语言,时长超过 40 万小时。其中,每种语言都有 9000 到 18000 小时的无标签语音数据。此外,还包括了共 1800 小时,16 种语言的转录语音数据,以及 17300 小时,15 种目标语言的口译语音数据。国外网友很快为这一行为点赞:显然,如果数据集已经存在,那么它应该被利用,并以一种道德的方式来改善人类社会。这一数据集庞大的无标签数据量和广泛的语言覆盖率,对改进自监督模型有着很大的帮助。而 Facebook 也希望能够帮助提高语音数据集的质量和鲁棒性,使训练语音转换神经网络更加可靠。最终加速新的 NLP 系统的开发,使 AI 翻译的效果越来越好。而数据集的名字,VoxPopuli 的直译“人民的心声”也表示了其原始数据的来源 ——即源语音全都收集自 2009-2020 年欧洲议会的活动录音。来自 10 年欧
世界最大的多语言语音数据集现已开源:超 40 万小时,共 23 种语言
2021-08-06 14:25:42来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama2024-09-19 14:21:51
- Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制2024-09-18 08:58:57
- “最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱2024-09-13 18:38:35
- 元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B2024-09-13 20:49:18
- 开源鸿蒙 OpenHarmony 社区累计已超 8000 名贡献者,9 月 26 日举办生态主题演讲2024-09-10 04:05:08
- 打击网络谣言:上海警方将反谣语音植入共享单车,日均播放约 240 万次2024-09-08 18:53:45
- “国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布,号称中文效果比 GPT-4o 更出色2024-09-06 18:59:42
- 国内航天领域首款智慧物联操作系统“天鸿”发布,基于开源鸿蒙打造2024-09-01 17:23:23
- 最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
- 微软向 Wine 团队捐赠 Mono 开源项目2024-08-28 08:54:30
- 1GGA电竞学院携手延世大学培养游戏行业人才
- 2全球顶级足球俱乐部齐聚卡塔尔沙漠之星参加卡塔尔精英学院第10届全球峰会
- 3点亮你的四季生活 解锁中国大陆地区8家四季酒店会籍专属礼遇
- 4宜鼎专为边缘服务器应用推出E1.S固态硬盘
- 5SGS携手京东养车共推机油鉴真服务
- 6AI如何赋能可持续发展?IBM 最新调研揭秘现状:企业投资热情不减,但行动尚未跟上
- 72024年度「邵逸夫奖」颁奖典礼 庆祝科研成就二十一载
- 8玩家多年要求下,《魔兽世界》下一个资料片 12.0 版本将迎来家宅系统
- 9微软庆祝 Windows 预览体验计划 10 周年,纪念壁纸开放下载
- 10从意外发现到效率革命:亚马逊云科技大规模应用自动推理提升系统效率