解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?

1月26日—27日,短短两天内,国内AI创业公司DeepSeek(深度求索)遭遇两次短暂宕机,DeepSeek将其归因为,新模型发布后导致访问量激增。

新模型指的是刚发布的推理大模型DeepSeek-R1,由此带来的访问量有多大?27日,DeepSeek在苹果美区应用商店下载量力压ChatGPT,登顶免费App下载排行榜

解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?
Dado Ruvic | Reuters

几乎名不见经传的创业公司,一年多时间内如何成为大模型行业的“黑马”,引发纳斯达克大抛售?

好用又便宜

2024年12月,DeepSeek发布了新一代大语言模型V3,已引起行业不少讨论,但1月20日发布的R1,将DeepSeek的热度推向了高潮。

大模型排名榜单Arena最新测评显示,R1基准测试在全类别大模型中排名第三,其中在风格控制分类中与OpenAI o1并列第一,其竞技场得分达到1357分,甚至略超OpenAI o1。这也意味着,DeepSeek-R1跻身全球最强大模型之列。

DeepSeek的官方测试也显示,R1在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1正式版。在各自小参数版本的模型比拼中,R1-32B与o1-mini的表现各有胜负,其中前者的数学推理明显优于后者。

DeepSeek的横空出世,让硅谷多位AI大佬刮目相看,无论是微软CEO还是OpenAI的投资人都公开表达,DeepSeek-R1作为开源模型在推理计算能力的出色表现,DeepSeek六大优势:强大、便宜、开源、免费、联网和本土。其中,便宜、免费、联网等优势全面超越了OpenAI、Meta、Google等AI巨头。

解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?
Picture Alliance | Getty Images

DeepSeek也被称为AI界的“拼多多”。

本土技术优势

便宜又好用的大模型,为何诞生在一家成立仅1年半的创业公司?

DeepSeek背后的实控人是梁文锋,他所创立的幻方量化是国内知名的量化私募基金,这也给DeepSeek打下了良好的算力基础。

解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?

不同于常规基金依赖基金经理,量化基金通过数量模型的计算寻找投资机会,因此对数据尤为敏感,其高频交易的特点更是离不开机器学习。为了从海量数据中挖掘投资机会,幻方量化早早开始囤积算力,先后斥资10亿元,在美国对芯片出口管制前购买了1万张英伟达A100型号GPU。机缘巧合下,幻方量化成为国内GPU算力最充足的企业之一。

根据DeepSeek公布的技术论文显示,R1在训练过程中实验了三种技术路径:直接强化学习、多阶段渐进训练和模型蒸馏,其中R1首次证明了直接强化学习的有效性。科技媒体在技术解读中打了个比方,面对同一道题目,大模型同时多次进行回答,系统将给每个答案打分,依照“高分奖励低分惩罚”的逻辑进行循环,最终得出更具优势的推理路径。

与此同时,Deepseek还采用了混合专家模型(MoE)创新架构,只需激活5%—10%的专家网络,大幅降低了大模型训练的算力要求,同时还采取了FP8混合精度训练,减少模型训练的显存占用量。

本着“该省省该花花”的训练思路,DeepSeek最新大语言模型V3的训练成本仅为558万美元,不足GPT-4o的二十分之一

所以,这家初创公司之所以在人工智能领域掀起了一场风暴至少有几个因素,首先,由于美国禁止先进芯片出口中国,DeepSeek居然能够使用不那么先进的芯片做成据指几乎可与美国对手媲美的产品,尤其1月20号发布的DeepSeek-R1正式版,被指性能堪比OpenAI 01正式版,用华尔街日报的一句话说:“这让硅谷惊叹不已。” 

其次,DeepSeek开发成本远远低于同类美国高科技公司。2024年12月底,这家小型初创公司 发布了一个模型,可与该行业中最好的模型相匹敌,然而成本极低。美国的OpenAI 在2024年花费了30亿美元来训练其各种模型,而 DeepSeek 声称自己只花了600万美元就开发出了自己的模型。就效率而言,这一壮举不禁让人质疑美国制裁的局限性,因为制裁本应阻止中国人获得最先进的人工智能芯片,以确保美国在人工智能领域的主导地位。然而,DeepSeek 声称只花了 560 万美元就开发出了自己的模型,与美国巨头数十亿美元的投资相比简直是小巫见大巫。

英伟达市值蒸发近6000亿美元

美国期货周日晚间大幅下跌,投资者周一早上醒来时看到一片红色。

英伟达(Nvidia)周一股价暴跌,市值蒸发近6000亿美元,创下美国历史上任何公司单日最大跌幅纪录。

在英伟达股价大幅上涨(2023年上涨239%,2024年上涨171%)之后,市场对任何可能的支出回落都感到紧张。另一家因AI而估值大幅上涨的美国芯片制造商博通(Broadcom)周一下跌17%,市值蒸发2000亿美元。

依赖英伟达GPU销售硬件的数据中心公司也遭遇了大规模抛售。戴尔(Dell)、慧与科技(Hewlett Packard Enterprise)和超微电脑(Super Micro Computer)跌幅均超过5.8%。特朗普最新AI计划的一部分——甲骨文(Oracle)下跌14%。

英伟达现在是市值第三大的上市公司,仅次于苹果和微软。

解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?
解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?

二手市场|房屋租赁|求职招聘|地产买卖

留学申请|生活问答|商务推广

添加费城LIVE小管家微信号phillyliveco

解码DeepSeek:私募基金下场做AI,中国AI黑马为何引发纳斯达克大抛售?

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
中国

中国19岁女孩马桶上产子后与闺蜜将其踩死

2024-5-8 12:25:20

限时活动

世界最大橡皮鸭本周登陆纽约

2024-8-1 21:34:02

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索