IT之家 12 月 4 日消息,Meta 日前推出了一款 AI 声音生成模型 Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。据悉,这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型,据称 Audiobox 能生成各种环境音、自然对话语音,并整合了音频生成和编辑能力,以便于用户自由生成自己所需的音频。Meta 介绍称,生成高品质音频需要有大量音频库及深厚的领域知识,但大众难以获得这些资源,而该公司推出这个模型旨在降低声音生成门槛,让任何人都更容易制作视频、游戏等应用场景的音效。IT之家发现,这款 Audiobox 模型基于 Voicebox 的“引导声音”机制,以便于生成目标音频,并配合“流量比对(flow-matching)”扩散模型生成方法,以实现“声音填充(audio infilling)”功能,从而生成多层次的音频。Meta 测试生成带有雷暴声的
Meta 推出 AI 音频模型 Audiobox:支持语音及文字同时输入、可生成多层次声音
2023-12-04 15:06:51来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 传音与联发科共建人工智能联合实验室,聚焦手机端侧 AI 技术创新2024-09-19 14:43:55
- 《幻兽帕鲁》开发商 Pocket Pair 回应任天堂诉讼:游戏运营及服务不受影响2024-09-19 17:24:31
- SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器2024-09-19 17:26:57
- 保卫厨房,A.O.史密斯AI-LiNK厨房安全套系助您畅享安全美好生活2024-09-18 16:21:00
- it.com Domains持续增长,宣布通过GMO在亚太推出创新域名解决方案2024-09-18 18:14:00
- 90%东南亚用户偏爱Instagram等购物便利性:Gen AI塑造电商未来2024-09-18 18:18:00
- 英矽智能AI赋能开发的TNIK抑制剂获IIa期临床试验积极结果2024-09-19 09:00:00
- 微软、贝莱德、GIP、MGX 宣布成立超 300 亿美元 AI 基础设施投资基金,英伟达提供专业知识支持2024-09-18 08:53:40
- Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制2024-09-18 08:58:57
- 谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片2024-09-18 09:10:59