微比恩 > 信息聚合 > 院士领衔推出大模型的第 3 种记忆：比参数存储和 RAG 都便宜，2.4B 模型越级打 13B

院士领衔推出大模型的第 3 种记忆：比参数存储和 RAG 都便宜，2.4B 模型越级打 13B

2024-07-08 23:09:43来源: IT之家

院士领衔推出大模型的第 3 种记忆：比参数存储和 RAG 都便宜，2.4B 模型越级打 13B

图片地址：https://img.ithome.com/newsuploadfiles/2024/7/7ebabc62-038b-48e8-a7af-70ea446028de.png

给大模型加上第三种记忆格式，把宝贵的参数从死记硬背知识中解放出来！中科院院士鄂维南领衔，上海算法创新研究院等团队推出 Memory3，比在参数中存储知识以及 RAG 成本都更低，同时保持比 RAG 更高的解码速度。在实验中，仅有 2.4B 参数的 Memory3模型不仅打败了许多 7B-13B 的模型，在专业领域任务如医学上的表现也超过了传统的 RAG 方法，同时推理速度更快，“幻觉”问题也更少。目前相关论文已上传到 arXiv，并引起学术界关注。知识按使用频率分类这一方法受人脑记忆原理启发，独立于存储在模型参数中的隐性知识和推理时的短期工作工作记忆，给大模型添加了显式记忆。具体来说，人类的记忆大致可以分为三部分:显式记忆：可以主动回忆的长期记忆，比如读过的文章。获取显式记忆很容易，但提取时需要一定的回忆过程。隐式记忆：无意识使用的长期记忆，比如骑自行车的技能。获取隐式记忆需要大量重复练习，但使用时毫不费力。外部信息：存在大脑之

关注公众号

标签：大模型

提示：支持键盘“← →”键翻页

上一篇凯华“风雨晦暝”系列轴体开售：全 POM 材质、三种手感可选，13.72 元起

下一篇火狐 Firefox 浏览器 128 稳定版发布：改进清除数据功能、隐私浏览模式支持 Netflix 等受保护内容

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片