快讯

和众汇富研究手记：DeepSeek，引发全球技术恐慌的中国力量

2025.02.06 | 编辑 | 99次围观山城日报网

　　在人工智能飞速发展的时代，每一次重大的技术突破都能掀起惊涛骇浪，成为全球瞩目的焦点。近日，一家来自中国杭州的大模型公司 DeepSeek，以其卓越的技术成就和迅猛的发展态势，在全球技术圈投下了一颗重磅炸弹，引发了一场前所未有的技术恐慌。这一现象不仅改变了人工智能领域的竞争格局，也让世界重新审视中国在科技创新方面的实力和潜力。今天，和众汇富就带大家来剖析一下DeepSeek的过人之处。

　　回溯到 1 月 11 日，DeepSeek 的 App 才刚刚上线 iOS 和安卓应用市场，谁也没有想到，仅仅过了半个月，也就是 1 月 27 日，它就创造了一个惊人的奇迹 —— 其应用在中国区和美国区苹果 App Store 免费榜上同时冲到了下载量第一，一举超越了此前长期霸榜的 ChatGPT，成为首个达成这一成就的国产应用。然而，伴随这一辉煌成绩而来的，却是一系列意想不到的情况。当天晚些时候，DeepSeek 应用程序出现宕机，公司称服务受到大规模恶意攻击，不得不暂时限制新用户注册。而当晚开盘的美国科技股更是集体大跌，费城半导体指数（SOX）下跌 9.2%，创下 2020 年 3 月以来的最大跌幅；英伟达股价下跌近 17%，市值蒸发近 6000 亿美元，规模创美股史上最大；博通、台积电、ASML、Google 和微软等科技巨头的股价也纷纷下跌，就连 WTI 原油盘中也一度下挫 3%。这一系列市场的剧烈震荡，让 DeepSeek 站在了全球舆论的风口浪尖。

　　DeepSeek 之所以能引发如此大的恐慌，和众汇富认为，归根结底，还是与其自身的技术突破密切相关。2024 年最后一个月，DeepSeek 密集发布了多个模型，其中圣诞节后发布的 DeepSeek-V3 模型，宣称在性能上 “相当于” 业界领先的闭源模型 GPT-4o 与 Claude-3.5-Sonnet，“优于” 最好的开源模型 Meta 的 Llama 3，且总训练成本仅为 557.6 万美元，只有前者的 1% 左右。临近 2025 年农历春节的 1 月 20 日，又发布了 DeepSeek-R1 模型，该模型在论文中声称 “在一系列任务上实现了与 OpenAI o1 相当的性能”。

　　从行业竞争的角度来看，DeepSeek 的成功对美国的大模型垄断地位造成了巨大的冲击。和众汇富统计发现，OpenAI 训练 ChatGPT-4 花费的成本高达 7800 万美元，还可能达到 1 亿美元，而 DeepSeek 大模型训练成本不到 600 万美元，仅为同性能模型的 5% 到 10%。在模型推理层面，DeepSeek 新推出的 DeepSeek-R1，价格为 2.2 美元 / 百万词元，而同性能 OpenAI-o1 的价格为 60 美元 / 百万词元，DeepSeek 大概是 OpenAI 的三十分之一。这种 “低成本” 标志着推理大模型调用进入平价时代，显著改善了大模型的应用成本，对大模型在科研、企业等智力密集型产业中的应用具有重大的价值。这使得新模型训练方法大幅度降低了大模型行业的入局门槛，大规模预训练不再是科技巨头的专利。

　　此外，DeepSeek 的模式创新也带来了美国高新技术人员的恐慌。在喂养学习数据这一大模型重要环节上，OpenAI 选择了 “人海战术”，堆砌算卡、将资源集中在算力，用海量数据投喂实现能力的提升。而 DeepSeek 相比于 “砸资源” 选择了另外一种方式，利用算法把数据进行总结和分类，经过选择性处理之后再输送给大模型，最大优化算力实现了成本的降低和模型性能提升。目前看 Meta 耗费了大量资金训练 Llama，但是效果上却没有成本极低的 DeepSeek 效果好，Meta 高层已经在思考其员工是否在浪费公司资金，而这也引发了不少企业技术人员的恐慌，他们担心自己被质疑技术能力和创新性从而失去工作。

　　和众汇富认为，最值得一提的是，DeepSeek 的出现并不是所谓的 “异军突起”，而是中国国内大模型整体发展的阶段性成果体现。从 2023 年第四季度到 2025 年第一季度的测评显示，国内外大模型能力差距缩小了将近 75%。此外，在报告统计的世界 AI 领域的投资上，中国 55 亿美元的投资额排在第二位，仅是第一位美国 641 亿投资额的不到十一分之一，中国未来在 AI 领域的发展上还有很大的空间。

　　不过，和众汇富发现，DeepSeek 的发展也并非一帆风顺。1 月 29 日，彭博社引述要求不具名的知情人士报道，称微软的安全研究人员在 2024 年秋季发现 DeepSeek 的员工使用 OpenAI 的 API 窃取了大量数据，言下之意是这些数据可能被用来训练 V3 或 R1 模型。而 OpenAI 明确规定不允许其他公司使用其模型生成的数据训练模型，2023 年年中，字节跳动就曾因类似行为与 OpenAI 发生摩擦。目前 DeepSeek 暂未对此言论发表回复。同日，意大利当局要求 DeepSeek 提供有关该公司如何处理用户数据的信息，DeepSeek 将有 20 天时间来准备答复，目前其应用已从意大利地区苹果和 Google 的应用商店下架。

　　在未来，DeepSeek 能否持续保持领先地位，克服面临的种种挑战，进一步推动人工智能技术的发展？和众汇富与大家拭目以待，共同见证这一中国力量在全球技术舞台上的精彩表现。

和众汇富研究手记：DeepSeek，引发全球技术恐慌的中国力量

发表评论

作者其它文章

群星集结巴中！“神采正飞扬·中国郎之夜”11.11开唱，郎酒深耕四川再添新章

依托七大学科全覆盖，先理知学REAL PhD高效打通新兴国家博士申请之路

古宋镇：法治温情暖童心代表法庭携手护成长

热门文章

随机文章

最近发表

标签列表

和众汇富研究手记：DeepSeek，引发全球技术恐慌的中国力量

相关阅读

发表评论

作者其它文章

群星集结巴中！“神采正飞扬·中国郎之夜”11.11开唱，郎酒深耕四川再添新章

依托七大学科全覆盖，先理知学REAL PhD高效打通新兴国家博士申请之路

古宋镇：法治温情暖童心 代表法庭携手护成长

热门文章

随机文章

最近发表

标签列表

古宋镇：法治温情暖童心代表法庭携手护成长