微比恩 > 信息聚合 > 谷歌 Gemini 刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

谷歌 Gemini 刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

2023-12-07 15:53:06来源: IT之家

谷歌 Gemini 刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

图片地址：https://img.ithome.com/newsuploadfiles/2023/12/8c47e96f-22f9-4fbc-9315-d3e1c378f97a.png?x-bce-process=image/format,f_auto

谷歌憋了许久的大招，双子座 Gemini 大模型终于发布！其中一图一视频最引人注目：一图，MMLU 多任务语言理解数据集测试，Gemini Ultra 不光超越 GPT-4，甚至超越了人类专家。一视频，AI 实时对人类的涂鸦和手势动作给出评论和吐槽，流畅还很幽默，最接近贾维斯的一集。然鹅当大家从惊喜中冷静下来，仔细阅读随之发布的 60 页技术报告时，却发现不妥之处。（没错，没有论文，OpenAICloseAI 你开了个什么坏头啊）MMLU 测试中，Gemini 结果下面灰色小字标称 CoT@32，展开来代表使用了思维链提示技巧、尝试了 32 次选最好结果。而作为对比的 GPT-4，却是无提示词技巧给 5 个示例，这个标准下 Gemini Ultra 其实并不如 GPT-4。以及原图比例尺也有点不厚道了，90.0% 与人类基准 89.8% 明明只差一点，y 轴上却拉开很远。HuggingFace 技术主管 Philipp Schm

关注公众号

标签：谷歌视频

提示：支持键盘“← →”键翻页

上一篇《黎明杀机》“单机版”将于 TGA 2023 颁奖典礼公布，为互动剧情游戏

下一篇英伟达 RTX 3050 6G 显卡爆料：75W 功耗，售价 179-189 美元

赞

你的鼓励是对作者的最大支持

相关阅读

消息称谷歌 10 月 15 日向 Pixel 6 及后续机型推送安卓 15 更新2024-09-19 14:16:18
阿里通义万相视觉生成大模型升级，支持文生视频、图生视频等2024-09-19 14:35:09
谷歌搜索将整合 C2PA 2.1 标准，标注 AI 生成 / 编辑图片2024-09-18 09:10:59
谷歌发布 Chrome 浏览器 129 稳定版：降低延迟，含 9 项安全修复2024-09-18 10:04:15
华为 WATCH GT5 智能手表开箱视频曝光：银白表圈 + 蓝色表带、家族式功能旋钮表冠2024-09-16 13:41:04
谷歌 Pixel 平板升级至 Android 15 QPR1 Beta 2 将喜提桌面模式，类似三星 Dex / Chr…2024-09-13 21:07:19
快手：可灵 AI 已累计生成超 2700 万个视频，正内测全新 1.5 版本基础模型2024-09-13 18:31:32
网易 Filmly 播放器应用计划本月推出 Apple TV 版客户端，演示视频现公开2024-09-12 15:21:20
谷歌搜索“关于此结果”面板新增互联网档案馆网页缓存链接，替代已移除第一方功能2024-09-12 17:31:06
华为官方 YouTube 频道发布 Mate XT Ultimate 非凡大师宣传视频，暗示全球发售2024-09-12 19:24:52

热门排行榜

1日1周1月

免费发布分类信息

最新图片