IT之家 7 月 1 日消息,月之暗面今日官宣 Kimi 开放平台上下文缓存(Context Caching)功能开启公测。官方表示,该技术在 API 价格不变的前提下,可为开发者降低最高 90% 的长文本旗舰大模型使用成本,并提升模型响应速度。IT之家附 Kimi 开放平台上下文缓存功能公测详情如下:技术简介据介绍,上下文缓存是一种数据管理技术,允许系统预先存储会被频繁请求的大量数据或信息。当用户请求相同信息时,系统可以直接从缓存中提供,无需重新计算或从原始数据源中检索。适用场景上下文缓存适用于频繁请求,重复引用大量初始上下文场景,可降低长文本模型费用,提高效率。官方表示费用最高降低 90 %,首 Token 延迟降低 83%。适用业务场景如下:提供大量预设内容的 QA Bot,例如 Kimi API 小助手针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具对静态代码库或知识库的周期性分析,例如各类 Copi
月之暗面 Kimi 开放平台“上下文缓存”开启公测:首 Token 延迟降低 83%、适用于文本重复引用场景
2024-07-01 21:10:48来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 卡普空收购动画工作室 Minimum,曾参与《龙之信条 2》《生化危机 8:村庄》开发2024-07-01 20:43:10
- 携程公布员工生育补贴 1 周年成果:550 位新生儿“喜提”2750 万元2024-07-01 20:43:14
- 世嘉《疯狂出租车》重启作信息曝光:大型多人驾驶游戏、以美国西海岸为蓝本2024-07-01 20:45:03
- 工信部脑机接口标准化技术委员会筹建方案公示,成立后有三大工作计划2024-07-01 20:52:54
- 长安汽车 6 月新能源汽车销量 6.4 万辆,同比增长超 61%2024-07-01 20:58:44
- OpenAI CEO 阿尔特曼:GPT-5 将带来“巨大飞跃”2024-07-01 21:26:01
- 优派 27 英寸 2K 185Hz 显示器 VX2779-2K-PRO-W 开售,1099 元2024-07-01 21:26:27
- 极氪 007 全新发布星际紫配色,新老用户免费升级高速 NZP,售价 20.99 万元起2024-07-01 21:29:24
- 极越汽车 x 能链智电达成充电合作,累计覆盖全国 350 + 城市2024-07-01 21:34:55
- 哪吒汽车 6 月全系整车交付 10206 台,同比下滑 15.88%2024-07-01 21:40:32
- 1安徽高新投先进材料投资基金登记成立 出资额3亿
- 2中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 3小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 4本月开测,微软网页版和 Win11 新版 Outlook 可固定收藏夹
- 5任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 6阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 7Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 8全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节
- 9小鹏宣布老用户芯片焕新众筹计划:单 Orin 升至双 Orin,座舱 820A 升级 8295
- 10小鹏汇天全倾转旋翼飞行汽车 X5 亮相:500km+ 续航、360km+/h 航速