IT之家 9 月 7 日消息,斯坦福大学的一项新研究发现,热门生成式人工智能(AI)聊天机器人 ChatGPT 的能力在几个月内有所波动。斯坦福大学的团队评估了 ChatGPT 在几个月内如何处理不同的任务。他们发现,ChatGPT 的能力随时间的推移而出现了不一致。目前,ChatGPT 有两个版本 —— 免费的 GPT-3.5 模型和更智能、更快速的付费 GPT-4 版本。 研究人员发现,GPT-4 在 3 月份能够有效地解决数学问题,识别质数的准确率为 97.6%。三个月后,其准确率下降到了 2.4%。而另一方面,GPT-3.5 却变得更好,从 7.4% 的准确率提高到了 86.8%。研究人员还注意到,在编写代码和视觉推理方面也有类似的波动。斯坦福大学计算机科学教授 James Zou 称:“当我们调整一个大型语言模型来提高它在某些任务上的表现时,那可能会有很多意想不到的后果,可能会损害这个模型在其他任务上的表现…
斯坦福大学研究发现,AI 聊天机器人 ChatGPT 的表现很不稳定
2023-09-07 23:14:18来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 9点1氪|美邦创始人回应开淘宝直播想当网红;纸制火车票11月1日起成为历史;ChatGPT上线搜索功能2024-11-02 09:00:30
- 多日等待终补货:石头 P20 Pro 扫拖机器人国补后 2743 元探底2024-10-24 16:36:40
- 机器人,“蔚小理们”逃离价格战的新出路 | 焦点分析2024-10-23 14:44:43
- 首发直降 900 元:云鲸 J5 扫拖机器人上下水版 2957 元 + 3 期免息2024-10-23 11:07:28
- 2659 元 3 期免息:小米米家全能扫拖机器人 M30 Pro 补贴新低(上下水)2024-10-23 13:45:45
- 全球首次:AI 机器人画作首登苏富比拍卖,预估成交价 12~18 万美元2024-10-23 14:04:50
- 小米米家扫拖机器人 M40 开售:伸缩式双机械臂,2999 元起2024-10-21 18:46:34
- 5999 → 3757 元:石头 G20S 智能扫拖机器人上下水版 3 期免息2024-10-21 11:53:14
- 电影《荒野机器人》总票房破5000万2024-10-19 15:40:15
- 开普勒通用人形机器人先行者K2在GITEX GLOBAL 2024首度公开亮相2024-10-18 20:34:00