微比恩 > 信息聚合 > Llama3-8B 秒杀 700 亿巨兽?北大博士生等全新 BoT 框架推理暴涨 70 倍,24 点图形推理一步成神

Llama3-8B 秒杀 700 亿巨兽?北大博士生等全新 BoT 框架推理暴涨 70 倍,24 点图形推理一步成神

2024-06-08 20:39:16来源: IT之家

24 点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC 伯克利、斯坦福研究者最近提出了一种全新的 BoT 方法,用思维模板大幅增强了推理性能。而 Llama3-8B 在 BoT 的加持下,竟多次超越 Llama3-70B!大语言模型不擅长推理怎么办?用思维缓冲区(Buffer of Thoughts,BoT)来解决!最近,北大、UC 伯克利、斯坦福的研究人员提出了一种元缓冲区(meta-buffer)。它可以存储一系列信息丰富的高级思维,也就是所谓的「思维模板」,它是从各种任务的问题解决过程中蒸馏出来的。论文地址:https://arxiv.org/ abs / 2406.04271然后,对于每个问题,都可以检索相关的思维模板,然后用特定的推理结构让它自适应,这样就可以进行有效的推理了!在以往,24 点游戏(Game of 24)、几何图形任务(Geometric Shapes)、一步将死

关注公众号