(原标题:人类评估已不是 NLG 的最佳标准,华盛顿大学提出全新观点,网友:那是评估人水平不行)AI 生成的文本好不好,最权威的评估者竟然不是人类自己?最近,华盛顿大学和艾伦人工智能研究院的学者们在研究中发现:未经过训练的人类评估文本时,往往过分关注生成文本像不像人话,而忽略了生成文本更重要的问题,即它的内容是否正确、合乎逻辑。研究人员就给出了一个例子:他们分别让未经训练的人类和机器来评价一段 GPT-3 生成的文字。这段文字翻译过来为:从前,有一个海盗。他是那种宁愿把时间花在驱赶在船周围游泳的鲨鱼上,也不愿驶向外国港口寻找战利品的海盗。他是个好海盗,高尚的海盗,诚实的海盗。他是个宁愿和妻儿呆在家里也不愿出海的海盗。人类评估员认为这段文字除了有些啰嗦外,没什么大毛病。这可能就是一个海盗想回家陪老婆孩子吧,AI 可能没理解,但是这也没什么稀奇的。机器评估也认为这段文字很啰嗦,不过它对文段的内容提出了质疑:海盗会有老婆孩子?还不和他
AI 所生成文本的最权威评估者并非人类
2021-07-17 12:56:13来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 传音与联发科共建人工智能联合实验室,聚焦手机端侧 AI 技术创新2024-09-19 14:43:55
- 《幻兽帕鲁》开发商 Pocket Pair 回应任天堂诉讼:游戏运营及服务不受影响2024-09-19 17:24:31
- SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器2024-09-19 17:26:57
- 保卫厨房,A.O.史密斯AI-LiNK厨房安全套系助您畅享安全美好生活2024-09-18 16:21:00
- it.com Domains持续增长,宣布通过GMO在亚太推出创新域名解决方案2024-09-18 18:14:00
- 90%东南亚用户偏爱Instagram等购物便利性:Gen AI塑造电商未来2024-09-18 18:18:00
- 英矽智能AI赋能开发的TNIK抑制剂获IIa期临床试验积极结果2024-09-19 09:00:00
- 微软、贝莱德、GIP、MGX 宣布成立超 300 亿美元 AI 基础设施投资基金,英伟达提供专业知识支持2024-09-18 08:53:40
- Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制2024-09-18 08:58:57
- 谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片2024-09-18 09:10:59