国产AI引发外网热议，DeepSeek下载热度仅次于ChatGPT

2025-01-26 18:45 九派新闻综合

　　近日，国产AI DeepSeek在中国、美国的科技圈受到广泛关注，甚至被认为是大模型行业的最大“黑马”，在外网，DeepSeek被不少人称为“神秘的东方力量”。

　　截至发稿，DeepSeek在美区苹果App Store的免费排行榜中飙升至第四，排行第一仍是ChatGPT。

　　DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

　　根据DeepSeek公布的DeepSeek-R1信息显示，其在后训练阶段（Post-Training）大规模使用了强化学习（Reinforcement learning）技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

DeepSeek-R1 API价格。图源：澎湃新闻

　　去年12月DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就发贴称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”

　　不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。

　　据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAIo1正式版。

　　这一模型发布后，引发了海外AI圈众多科技大佬的讨论。例如，英伟达高级研究科学家JimFan就在个人社交平台上公开发表推文表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

图源：证券时报

　　1月24号，一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称，现在Meta内部因为DeepSeek的模型，已经进入恐慌模式。

　　这位Meta员工写道：

　　“一切源于DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家‘仅用550万美元训练预算的中国公司’就做到了这一点。

　　工程师们正在争分夺秒地分析DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

　　管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本，而且这样的高管还有数十位，他们该如何向高层交代？

　　DeepSeek-R1的出现让情况更加严峻。具体细节属于机密，不便透露，不过很快就会公开了。”

　　26日，DeepSeek出现了短时闪崩现象。不少网友反映，使用时遇到 “服务器繁忙” 的提示。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。不过，官方状态页并未将这一事件标记为事故。

　　来源：九派新闻综合

责编：高雪婷

国产AI引发外网热议，DeepSeek下载热度仅次于ChatGPT

热点新闻

DeepSeek登顶苹果中国区免费榜第一，“黑神话悟空”创始人冯骥：震撼的突破

DeepSeek服务被挤“宕机”，雷军千万年薪挖角的“天才少女”曾是开发者之一