微比恩 > 信息聚合 > 文字序顺不响影 GPT-4 阅读理解,别的大模型都不行

文字序顺不响影 GPT-4 阅读理解,别的大模型都不行

2023-12-04 15:51:36来源: IT之家

研表究明,汉字序顺并不定一影阅响读(对于英文来说,则是每一个单词中的字母顺序)。现在,日本东京大学的一项实验发现,这个“定理”居然也适合 GPT-4。比如面对这样一段“鬼画符”,几乎里面每一个单词的每一个字母都被打乱:oJn amRh wno het 2023 Meatsrs ermtnoTuna no duySan taatgsuAu ntaaNloi Gflo bClu, gnelcinhi ish ifsrt nereg ecatkjnad ncedos raecer jroam。但 GPT-4 居然完美地恢复出了原始句子(红框部分):原来是一个叫做 Jon Rahm 的人赢得了 2023 年美国大师赛(高尔夫)的故事。并且,如果你直接就这段乱码对 GPT-4 进行提问,它也能先理解再给出正确答案,一点儿也不影响阅读:对此,研究人员感到非常吃惊:按理说乱码单词会对模型的 tokenization处理造成严重干扰,GPT-4

关注公众号
标签: 大模型