作者:子渝编辑:沈筱Meta实现自动化对齐,Humpback击败现有LLaMa模型8月15日,据消息,Meta AI 的研究者提出了一种可扩展的方法即指令回译(instruction backtranslation),该方法通过自动注释相应的指令来构建高质量的指令跟随语言模型。该研究从一个语言模型开始,并作为种子模型,该模型在少量的种子数据以及 web 语料库上进行了微调。种子模型的作用是用来构建训练样本,然后这些样本中的一些高质量样本将会被筛选出来,接着,这些数据被用来微调一个更强大的模型。经过两轮迭代的数据集对 LLaMa 进行微调,所产生的模型 Humpback 在 Alpaca 排行榜上优于其他现有的非蒸馏模型,如 LIMA、Claude、Guanaco 等。https://k.sina.com.cn/article_3996876140_ee3b7d6c027011dpc.html讯飞星火V2.0发布,升级代码能力和多
OpenAI宣布收购Global Illumination,字节、快手AI对话产品“组团”亮相,Meta实现自动化对齐 …
2023-08-21 20:51:41来源: 36氪
关注公众号
赞
你的鼓励是对作者的最大支持
- Meta AR 眼镜项目前负责人将加入 OpenAI,领导机器人和消费硬件部门2024-11-05 15:03:46
- 估值超140亿、OpenAI贝佐斯下场,这家让机器人装AI“大脑”的公司获28亿新融资|钛媒体AGI2024-11-05 08:34:22
- 印尼严控iPhone 16销售2024-10-27 13:07:23
- OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍2024-10-27 15:28:19
- 丹麦首台 AI 超级计算机 Gefion 推出,由 1528 个英伟达 H100 GPU 驱动2024-10-27 15:29:08
- Nexon 虚幻 5 游戏新作「Project RX」公开,《蔚蓝档案》开发人员制作2024-10-26 17:50:27
- 微软CEO在2024财年获得价值7910万美元的总薪酬;奥尔特曼辟谣OpenAI新模型消息|Do早报2024-10-26 10:19:32
- Chinese Automakers Asked to Halt Expansion in Europe amid Ch…2024-10-26 09:45:02
- Tim Cook Hopes Apple Intelligence Soon Come to China Followi…2024-10-26 11:19:43
- OpenAI解散AGI团队 | 最前线2024-10-25 18:31:17