微比恩 > 信息聚合 > 专治大模型说胡话:华科大等高校提出首个“故障 token”检测方法,精确度 100%

专治大模型说胡话:华科大等高校提出首个“故障 token”检测方法,精确度 100%

2024-04-19 21:24:36来源: IT之家

针对大模型偶发脑回路故障难题,最新研究 GlitchHunter 收集了大量故障词元,并针对不同情况进行分类,极大改善了大模型的输出质量。如今,大型语言模型(LLM)已经成为了我们生活中的好帮手。当用户使用大模型时,模型首先会将输入的内容拆分成一个个的词元(token),通过分析这些词元来生成答案,为我们解答疑惑、提供建议、翻译外语、撰写报告・・・・・・但是,你能想象大模型也会出错吗?想象一下,你正在使用最新款的智能手机,它快速、聪明、几乎可以做任何你想要的事情。但偶尔,你发现手机的一两个按键不按常理出牌 —— 比如说,你按下「S」,它偏偏跳出「E」,或者干脆点了没反应,那估计用的时候就只想砸手机了。大模型中存在一些故障词元(glitch token),一个个本应协助模型流畅运行的小小词元,偏偏要搞点小破坏。针对这个情况,由华中科技大学、南洋理工大学等高校联合组成的研究团队近日发表了一项研究,该工作已经被软件工程领域国际顶级会议

关注公众号
标签: 大模型