IT之家 10 月 12 日消息,据 AAAI(国际先进 AI 协会)官网,由学而思牵头,联合谷歌、暨南大学等多家科技企业、高校的专家和学者,将共同举办 AAAI 2024 全球大模型数学推理竞赛。该比赛分为中文数学解题、英文数学解题两个方向,由学而思提供比赛所用的中英文数据集 TAL-SAQ7K-CN、TAL-SAQ6K-EN。据称,该数据集囊括了国内外多个中小学数学竞赛真题。这次竞赛也将是全球首次数学大模型解题竞赛,主办方提供了 3 个作为参考的测评基准:GPT-3.5、GPT-4、好未来自研数学大模型 MathGPT。在比赛期间,参赛者需使用大模型对给定的数学题目生成推理步骤、答案,主办方将通过对比参赛模型输出答案与正确答案之间的准确率,来进行排名。主办方表示,希望在本次竞赛中要求参赛者使用大语言模型来解决 K-12 数学问题。(IT之家注:K-12 代指学前教育至高中教育,普遍用来代指基础教育。在美国教育体系中,指的是从
学而思联合谷歌、暨南大学,共同举办 2024 全球大模型数学推理竞赛
2023-10-12 10:29:32来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 中信建投:零一万物发布Yi-Lightning,国产大模型迭代加速2024-10-25 07:57:29
- 加速大模型上车 浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
- 国内首个应用临床眼科大模型 “伏羲慧眼”发布,可检测、预测眼部健康状态2024-10-21 09:28:33
- 字节跳动大模型遭实习生攻击,损失超千万美元?相关人士回应2024-10-19 14:18:35
- 1任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 2阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 3Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 4中国网络视听协会:今年微短剧市场规模有望首超内地电影票房
- 5亚马逊将向意大利数据中心业务投资13亿美元
- 6人民币兑美元中间价报7.1433,调升226个基点
- 7创业板指涨超2%,沪指涨近1%
- 8小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 9多口插拔不断连:酷态科 10 号 CP 超级闪充块单体版 105 元新低
- 10安徽高新投先进材料投资基金登记成立 出资额3亿