微比恩 > 信息聚合 > 揭秘DeepSeek:一个更极致的中国技术理想主义故事 |36氪独家

揭秘DeepSeek:一个更极致的中国技术理想主义故事 |36氪独家

2024-07-22 10:36:10来源: 36氪

文 | 于丽丽编辑 | 刘旌中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。这背后,是DeepSeek对模型架构进行了全方位创新。它提

关注公众号
标签: 理想