IT之家 7 月 1 日消息,月之暗面今日官宣 Kimi 开放平台上下文缓存(Context Caching)功能开启公测。官方表示,该技术在 API 价格不变的前提下,可为开发者降低最高 90% 的长文本旗舰大模型使用成本,并提升模型响应速度。IT之家附 Kimi 开放平台上下文缓存功能公测详情如下:技术简介据介绍,上下文缓存是一种数据管理技术,允许系统预先存储会被频繁请求的大量数据或信息。当用户请求相同信息时,系统可以直接从缓存中提供,无需重新计算或从原始数据源中检索。适用场景上下文缓存适用于频繁请求,重复引用大量初始上下文场景,可降低长文本模型费用,提高效率。官方表示费用最高降低 90 %,首 Token 延迟降低 83%。适用业务场景如下:提供大量预设内容的 QA Bot,例如 Kimi API 小助手针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具对静态代码库或知识库的周期性分析,例如各类 Copi
月之暗面 Kimi 开放平台“上下文缓存”开启公测:首 Token 延迟降低 83%、适用于文本重复引用场景
2024-07-01 21:10:48来源: IT之家
![](/images/qrcode_for_gh_5f0dab6cf0de_258.jpg)
关注公众号
赞
你的鼓励是对作者的最大支持
- 卡普空收购动画工作室 Minimum,曾参与《龙之信条 2》《生化危机 8:村庄》开发2024-07-01 20:43:10
- 携程公布员工生育补贴 1 周年成果:550 位新生儿“喜提”2750 万元2024-07-01 20:43:14
- 世嘉《疯狂出租车》重启作信息曝光:大型多人驾驶游戏、以美国西海岸为蓝本2024-07-01 20:45:03
- 工信部脑机接口标准化技术委员会筹建方案公示,成立后有三大工作计划2024-07-01 20:52:54
- 长安汽车 6 月新能源汽车销量 6.4 万辆,同比增长超 61%2024-07-01 20:58:44
- OpenAI CEO 阿尔特曼:GPT-5 将带来“巨大飞跃”2024-07-01 21:26:01
- 优派 27 英寸 2K 185Hz 显示器 VX2779-2K-PRO-W 开售,1099 元2024-07-01 21:26:27
- 极氪 007 全新发布星际紫配色,新老用户免费升级高速 NZP,售价 20.99 万元起2024-07-01 21:29:24
- 极越汽车 x 能链智电达成充电合作,累计覆盖全国 350 + 城市2024-07-01 21:34:55
- 哪吒汽车 6 月全系整车交付 10206 台,同比下滑 15.88%2024-07-01 21:40:32
- 1亿纬锂能:孙公司拟在马来西亚投资建设储能电池及消费类电池制造项目
- 236氪首发丨「潜龙咖啡」完成千万级首轮融资,聚焦做中国味的“专业黑咖”
- 3realme 真我 GT6 手机首发搭载全新“NEXT AI”,支持 AIGC 消除、AI 手势操控等
- 4地方产业基金加速“上新”,更多耐心资本“陪跑”科技创新
- 5AI搜索新贵弯道超车难
- 6消息称比亚迪与土耳其政府达成协议,投资 10 亿美元在当地建电动汽车工厂
- 7整月无休收入难过万,广州网约车司机日均营收降至 311.63 元新低
- 8理想 L6 提车 9 天后要换电机,官方回应:不符合“三包”退换车规定
- 92024 电竞世界杯《英雄联盟》T1 战队 2:1 TL,总决赛对战 TES
- 102024 电竞世界杯《DOTA2》AR 战队 1 胜 9 负出局,LGD 2:1 淘汰 G2xiG