微比恩 > 信息聚合 > 月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

2024-07-01 21:10:48来源: IT之家

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

图片地址：https://img.ithome.com/newsuploadfiles/2024/7/2b9cd65e-ba31-4147-a305-01085d72b827.jpg?x-bce-process=image/format,f_auto

IT之家 7 月 1 日消息，月之暗面今日官宣 Kimi 开放平台上下文缓存（Context Caching）功能开启公测。官方表示，该技术在 API 价格不变的前提下，可为开发者降低最高 90% 的长文本旗舰大模型使用成本，并提升模型响应速度。IT之家附 Kimi 开放平台上下文缓存功能公测详情如下：技术简介据介绍，上下文缓存是一种数据管理技术，允许系统预先存储会被频繁请求的大量数据或信息。当用户请求相同信息时，系统可以直接从缓存中提供，无需重新计算或从原始数据源中检索。适用场景上下文缓存适用于频繁请求，重复引用大量初始上下文场景，可降低长文本模型费用，提高效率。官方表示费用最高降低 90 %，首 Token 延迟降低 83%。适用业务场景如下：提供大量预设内容的 QA Bot，例如 Kimi API 小助手针对固定的文档集合的频繁查询，例如上市公司信息披露问答工具对静态代码库或知识库的周期性分析，例如各类 Copi

关注公众号

提示：支持键盘“← →”键翻页

上一篇 7 月 14 日拍卖，玛莎拉蒂推出 GranCabrio Folgore Tignanello 特别版敞篷纯电跑车

下一篇零跑汽车 6 月交付达 20116 台创历史新高，同比增长 52.3%，首次迈入“两万俱乐部”

赞

你的鼓励是对作者的最大支持

相关阅读

卡普空收购动画工作室 Minimum，曾参与《龙之信条 2》《生化危机 8：村庄》开发2024-07-01 20:43:10
携程公布员工生育补贴 1 周年成果：550 位新生儿“喜提”2750 万元2024-07-01 20:43:14
世嘉《疯狂出租车》重启作信息曝光：大型多人驾驶游戏、以美国西海岸为蓝本2024-07-01 20:45:03
工信部脑机接口标准化技术委员会筹建方案公示，成立后有三大工作计划2024-07-01 20:52:54
长安汽车 6 月新能源汽车销量 6.4 万辆，同比增长超 61%2024-07-01 20:58:44
OpenAI CEO 阿尔特曼：GPT-5 将带来“巨大飞跃”2024-07-01 21:26:01
优派 27 英寸 2K 185Hz 显示器 VX2779-2K-PRO-W 开售，1099 元2024-07-01 21:26:27
极氪 007 全新发布星际紫配色，新老用户免费升级高速 NZP，售价 20.99 万元起2024-07-01 21:29:24
极越汽车 x 能链智电达成充电合作，累计覆盖全国 350 + 城市2024-07-01 21:34:55
哪吒汽车 6 月全系整车交付 10206 台，同比下滑 15.88%2024-07-01 21:40:32

热门排行榜

1日1周1月

免费发布分类信息

最新图片