主题顶部自带醒目提醒,可以自由设置支持HTML!【本提示可以后台关闭】
    0

    和众汇富研究手记:DeepSeek,引发全球技术恐慌的中国力量

    2025.02.06 | 编辑 | 19次围观 山城日报网

      在人工智能飞速发展的时代,每一次重大的技术突破都能掀起惊涛骇浪,成为全球瞩目的焦点。近日,一家来自中国杭州的大模型公司 DeepSeek,以其卓越的技术成就和迅猛的发展态势,在全球技术圈投下了一颗重磅炸弹,引发了一场前所未有的技术恐慌。这一现象不仅改变了人工智能领域的竞争格局,也让世界重新审视中国在科技创新方面的实力和潜力。今天,和众汇富就带大家来剖析一下DeepSeek的过人之处。

      回溯到 1 月 11 日,DeepSeek 的 App 才刚刚上线 iOS 和安卓应用市场,谁也没有想到,仅仅过了半个月,也就是 1 月 27 日,它就创造了一个惊人的奇迹 —— 其应用在中国区和美国区苹果 App Store 免费榜上同时冲到了下载量第一,一举超越了此前长期霸榜的 ChatGPT,成为首个达成这一成就的国产应用。然而,伴随这一辉煌成绩而来的,却是一系列意想不到的情况。当天晚些时候,DeepSeek 应用程序出现宕机,公司称服务受到大规模恶意攻击,不得不暂时限制新用户注册。而当晚开盘的美国科技股更是集体大跌,费城半导体指数(SOX)下跌 9.2%,创下 2020 年 3 月以来的最大跌幅;英伟达股价下跌近 17%,市值蒸发近 6000 亿美元,规模创美股史上最大;博通、台积电、ASML、Google 和微软等科技巨头的股价也纷纷下跌,就连 WTI 原油盘中也一度下挫 3%。这一系列市场的剧烈震荡,让 DeepSeek 站在了全球舆论的风口浪尖。

      DeepSeek 之所以能引发如此大的恐慌,和众汇富认为,归根结底,还是与其自身的技术突破密切相关。2024 年最后一个月,DeepSeek 密集发布了多个模型,其中圣诞节后发布的 DeepSeek-V3 模型,宣称在性能上 “相当于” 业界领先的闭源模型 GPT-4o 与 Claude-3.5-Sonnet,“优于” 最好的开源模型 Meta 的 Llama 3,且总训练成本仅为 557.6 万美元,只有前者的 1% 左右。临近 2025 年农历春节的 1 月 20 日,又发布了 DeepSeek-R1 模型,该模型在论文中声称 “在一系列任务上实现了与 OpenAI o1 相当的性能”。

      从行业竞争的角度来看,DeepSeek 的成功对美国的大模型垄断地位造成了巨大的冲击。和众汇富统计发现,OpenAI 训练 ChatGPT-4 花费的成本高达 7800 万美元,还可能达到 1 亿美元,而 DeepSeek 大模型训练成本不到 600 万美元,仅为同性能模型的 5% 到 10%。在模型推理层面,DeepSeek 新推出的 DeepSeek-R1,价格为 2.2 美元 / 百万词元,而同性能 OpenAI-o1 的价格为 60 美元 / 百万词元,DeepSeek 大概是 OpenAI 的三十分之一。这种 “低成本” 标志着推理大模型调用进入平价时代,显著改善了大模型的应用成本,对大模型在科研、企业等智力密集型产业中的应用具有重大的价值。这使得新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。

      此外,DeepSeek 的模式创新也带来了美国高新技术人员的恐慌。在喂养学习数据这一大模型重要环节上,OpenAI 选择了 “人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。而 DeepSeek 相比于 “砸资源” 选择了另外一种方式,利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力实现了成本的降低和模型性能提升。目前看 Meta 耗费了大量资金训练 Llama,但是效果上却没有成本极低的 DeepSeek 效果好,Meta 高层已经在思考其员工是否在浪费公司资金,而这也引发了不少企业技术人员的恐慌,他们担心自己被质疑技术能力和创新性从而失去工作。

      和众汇富认为,最值得一提的是,DeepSeek 的出现并不是所谓的 “异军突起”,而是中国国内大模型整体发展的阶段性成果体现。从 2023 年第四季度到 2025 年第一季度的测评显示,国内外大模型能力差距缩小了将近 75%。此外,在报告统计的世界 AI 领域的投资上,中国 55 亿美元的投资额排在第二位,仅是第一位美国 641 亿投资额的不到十一分之一,中国未来在 AI 领域的发展上还有很大的空间。

      不过,和众汇富发现,DeepSeek 的发展也并非一帆风顺。1 月 29 日,彭博社引述要求不具名的知情人士报道,称微软的安全研究人员在 2024 年秋季发现 DeepSeek 的员工使用 OpenAI 的 API 窃取了大量数据,言下之意是这些数据可能被用来训练 V3 或 R1 模型。而 OpenAI 明确规定不允许其他公司使用其模型生成的数据训练模型,2023 年年中,字节跳动就曾因类似行为与 OpenAI 发生摩擦。目前 DeepSeek 暂未对此言论发表回复。同日,意大利当局要求 DeepSeek 提供有关该公司如何处理用户数据的信息,DeepSeek 将有 20 天时间来准备答复,目前其应用已从意大利地区苹果和 Google 的应用商店下架。

      在未来,DeepSeek 能否持续保持领先地位,克服面临的种种挑战,进一步推动人工智能技术的发展?和众汇富与大家拭目以待,共同见证这一中国力量在全球技术舞台上的精彩表现。


    发表评论
    标签列表