暴跌!英伟达市值一夜蒸发5890亿美元,创造历史,什么原因?DeepSeek“回应”

一场名为DeepSeek(深度求索)的回应风暴,正在席卷全球。暴跌

昨天,英伟亿美元创原因中美两国的达市苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的值夜蒸发造历AI应用,DeepSeek完成了对chatGPT的回应超越。


DeepSeek冲上苹果应用商店免费榜第一

在资本市场,这条鲸鱼也正在掀起滔天巨浪。英伟亿美元创原因

龙年最后一个交易日,达市A股AI算力指数大跌3.94%,值夜蒸发造历寒武纪股价跌幅一度超10%。回应

而美股方面,暴跌三大指数收盘涨跌不一,英伟亿美元创原因道指涨0.65%,达市标普500指数跌1.46%,值夜蒸发造历纳指跌3.07%。


美股三大指数收盘涨跌不一

大型科技股涨跌不一,英伟达下跌16.86%,创历史上最大单日个股蒸发规模,市值蒸发5888.62亿美元(约合人民币4.27万亿元);谷歌下跌4.03%;特斯拉下跌2.32%;微软下跌2,14%;亚马逊上涨0.30%;Meta上涨1.91%;苹果上涨3.25%,截至收盘市值为3.5万亿美元,再度成为全球市值最高上市公司


英伟达下跌16.86%,创历史上最大单日个股蒸发规模

美股半导体芯片板块全线暴跌,博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%。

消息面上,近期火遍全球的DeepSeek推出新模型,该模型以极低的成本实现了与OpenAI o1相当的性能,引发市场对科技AI巨头估值的担忧。简而言之,DeepSeek新模型性能与OpenAI o1旗鼓相当,但成本连后者的零头都不到。有分析人士认为,DeepSeek在有限的硬件资源下实现顶尖的模型性能,减少了对高端GPU的依赖,低廉的训练成本预示着AI大模型对算力投入的需求将大幅下降。正因为此,美股芯片股首当其冲。

不过DeepSeek自己对此却有不同看法,其表示英伟达股价暴跌与它无关


DeepSeek“回应”英伟达股价暴跌原因

自2023年底chatGPT横空出世,全球科技界的夜空被人工智能点亮以来,从未像现在这般聚集起一股“算力怀疑论”的厚重阴霾。

彻底释放它的,就是一个月来官宣两个开源大模型,被称为“来自东方神秘力量”的DeepSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。


梁文锋在总理座谈会上发言 新闻联播截图

中国的大模型已经追上美国了?

故事还得追溯到一个月前,1月23日,中国大模型创业团队DeepSeek官宣了新一代开源大模型DeepSeek-V3,部分性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近。

一个月后,DeepSeek-R1开源模型面世,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。


DeepSeek-R1开源模型面世,性能比肩OpenAI o1正式版

整件事最为传奇的地方在于,DeepSeek-V3的训练成本不到竞争对手的十分之一。Deepseek-R1的训练成本虽然没有公布,但它的收费却只有OpenAI o1的三十分之一。

简单说,现阶段DeepSeek就是全球大模型“性价比”的代名词。这就不难理解,全球的科技爱好者这两天都在下载体验DeepSeek。在国外,已经出现“使用DeepSeek构建一切”“Goodbye chatGPT”这样的话题。

昨天,同在杭州,《黑神话:悟空》出品人、游戏科学创始人冯骥总结了DeepSeek六大特点:强大、便宜、开源、免费、联网、本土。他还说:DeepSeek,可能是个国运级别的科技成果。

听上去有点夸张,但类似的讨论已经在美国持续了一周时间。在参与媒体访谈时,谷歌前CEO埃里克·施密特改变了美国在AI方面保持了两到三年领先优势的看法。他表示,过去6个月,中国以一种非同寻常的方式迎头赶上,其中一个项目就是DeepSeek。


昨天傍晚DeepSeek最新发布的乙巳新年春节AI贺词

他们不是在复制,是在创新

当然,更多的是来自同行满满的敬意。英伟达高级研究科学家Jim Fan评价R1:“我们生活在这样一个时间线上,一家非美国公司正在维持OpenAI的原始使命——真正开放、前沿的研究,赋予所有人力量。这看似不合逻辑,但最有趣的结果往往最容易发生。”

这个不合逻辑在哪?在美国AI初创公司Perplexity首席执行官Aravind Srinivas看来,DeepSeek的开发显然也受制于高端芯片等硬件,但“需求是发明之母”,DeepSeek用变通的方式构建了高效的解决方案。

他说自己非常惊讶,“通常的认知是中国人擅长复制。如果我们停止发表研究论文,停止描述我们的基础设施架构细节,停止开源,他们将无法赶上……这并不是说他们在复制,而是在创新。”


DeepSeek对话界面

那么,DeepSeek究竟用了什么魔法呢?

比如,他们对通用的模型推理步骤进行了调整。以往模型在提升推理能力时通常依赖于“监督微调”这个环节。这个环节可以简单类比为人类的填鸭式教育,就是让大模型反复做题,学习人类的推理方式。

而DeepSeek-R1在训练过程中直接跳过了这个环节,进入了“强化学习”阶段,探索大模型在没有任何监督数据的情况下,通过纯强化学习进行自我进化。他们要求大模型必须要把思考过程写出来,通过“奖励”引导这个“学生”找到最佳方案。

经历了无数次训练后,大模型这个学生迎来了“Aha moment”(顿悟时刻)。

这个“顿悟”外加其他工程上的优化,DeepSeek证明了疯狂堆积算力、数据的“大力出奇迹”不是通往AGI的唯一路径。

当优雅的算法能够降低对算力的依赖,目前全球的算力是否存在过剩,未来市场对算力的需求是否需要修正?这是近期动摇全球资本市场对科技企业的估值,出现动荡的根本。

最早的AI尝试用在了炒股上

在官方公众号上,DeepSeek对自己的介绍是,投身于探索AGI的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题。

在这次一鸣惊人前,很多人在国产的大模型江湖没听说过DeepSeek的名号。一定程度上缘于他们至今没有融过资,更别说接到任何一个巨头的“橄榄枝”。但这并不妨碍他们可能是“国内拥有最多高性能GPU的公司”。

这个底子,是他们做量化投资打下的。在轰炸AI圈之前,DeepSeek及背后的幻方量化是金融江湖成名已久的高手。

低调的创始人梁文锋是80后,出生在广东的一个五线城市,父亲是一名小学老师。他毕业于浙江大学,主修软件工程,人工智能方向。有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。

2016年,幻方量化首次上线运行AI策略。2018年,确立了要成为一家AI科技公司。2023年7月,梁文锋在杭州创立深度求索DeepSeek。

在团队配置上,DeepSeek只有139名研发人员,差不多是OpenAI的五分之一。其中,算法、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。

梁文锋曾透露,DeepSeek并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生,没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人”。

无论是在技术还是人才上,梁文锋似乎坚定地看好中国走出自己的模式,从而扮演科技变革引领者的角色。

今年1月20日,也就是DeepSeek-R1发布的当天,他参加了总理座谈会。会上李强总理强调,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点”。

橙柿互动·都市快报记者 梁英杰

编辑 高欣奕

审核 罗祎 陈欣文

责任编辑:荀建国_NN7379