听一遍曲子,就能知道乐谱,还能马上演奏,而且还掌握“十八般乐器”,钢琴、小提琴、吉他等都不在话下。这就不是人类音乐大师,而是谷歌推出的“多任务多音轨”音乐转音符模型 MT3。首先需要解释一下什么是多任务多音轨。通常一首曲子是有多种乐器合奏而来,每个乐曲就是一个音轨,而多任务就是同时将不同音轨的乐谱同时还原出来。事实上,谷歌 MT3 在还原多音轨乐谱这件事上,达到了 SOTA 的结果。谷歌已将该论文投给 ICLR 2022。还原多音轨乐谱相比与自动语音识别 (ASR) ,自动音乐转录 (AMT) 的难度要大得多,因为后者既要同时转录多个乐器,还要保留精细的音高和时间信息。多音轨的自动音乐转录数据集更是“低资源”的。现有的开源音乐转录数据集一般只包含一到几百小时的音频,相比语音数据集动辄几千上万小时的市场,算是很少了。先前的音乐转录主要集中在特定于任务的架构上,针对每个任务的各种乐器量身定制。
谷歌推出全能扒谱 AI:只要听一遍歌曲,钢琴小提琴的乐谱全有了
2022-01-03 12:36:06来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 传音与联发科共建人工智能联合实验室,聚焦手机端侧 AI 技术创新2024-09-19 14:43:55
- 《幻兽帕鲁》开发商 Pocket Pair 回应任天堂诉讼:游戏运营及服务不受影响2024-09-19 17:24:31
- SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器2024-09-19 17:26:57
- 保卫厨房,A.O.史密斯AI-LiNK厨房安全套系助您畅享安全美好生活2024-09-18 16:21:00
- it.com Domains持续增长,宣布通过GMO在亚太推出创新域名解决方案2024-09-18 18:14:00
- 90%东南亚用户偏爱Instagram等购物便利性:Gen AI塑造电商未来2024-09-18 18:18:00
- 英矽智能AI赋能开发的TNIK抑制剂获IIa期临床试验积极结果2024-09-19 09:00:00
- 微软、贝莱德、GIP、MGX 宣布成立超 300 亿美元 AI 基础设施投资基金,英伟达提供专业知识支持2024-09-18 08:53:40
- Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制2024-09-18 08:58:57
- 谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片2024-09-18 09:10:59