秋凤空间 | 阿里巨资投AI基础设施,谋求接谁的大生意?

发布日期:2025-02-28 16:06:41
图片

作者 | 王秋凤





阿里的2025年初过得跌宕起伏。坏消息:消费下行,CPI拉不上来;好消息,民企座谈会召开,杰克马应邀出席。坏消息:淘系、CBU(1688等2B内贸业务)、ICBU(外贸业务)、飞猪业务不是停步不前,就是萎缩;好消息:云、AI应用、大模型业务快速增长,通义千问一度在某非野鸡排名全球第二。坏消息:DeepSeek横空出世,让千问黯淡,让阿里尴尬;好消息,24日阿里CEO吴泳铭宣布3年内投资3800亿元人民币,建设云和AI基础设施。


阿里为什么疯狂投资AI基础设施


这笔投资虽然比微软的800亿美元AI投资少了些,但创了国内民企投资AI硬件的记录。也超越了阿里过去10年来投资的总和。


DeepSeek这类大模型,对于所有拥有大模型的公司来说,都相当于“技术起义”。在财力雄厚的大公司拼命堆算力卡的时候,DeepSeek告诉我们,不堆那么多……其实也可以。算力需求是绝对的,但与模型智力增长并不呈线性关系。它暗示,对外出租算力这门生意,可能未必有想象的那样赚钱,也就是投资效率变低。这其实给所有投资算力硬件的规划当头一棒。DeepSeek以10%的成本训练出的模型很好用,逼得通义千问降价97%。


图片


既然如此,阿里砸这么多资金投资AI基础设施,岂不要大赔特赔?


眼下是算力的时代,算力即国力。虽然DeepSeek对于“智算”这一块探索出更高效的路径,但我们刚才也说了,对算力的需求是绝对的。


算力不止有“智算”需求(自动驾驶、具身智能、医疗诊断),还有通算(电商、短视频、政务等非特定场景)和超算(天气预报、飞行器设计等一切复杂/混沌系统计算需求)。


阿里认识到算力的巨大潜在需求,“淘宝思维”立时上身。淘宝的内核就是数字房东,其本质在于搭建数字基础设施(通过服务器和软件),给经营和交易提供数字交易方式和数字空间。


如果AI的需求如此广泛,做算力出租者,应该大有前途。DeepSeek固然压低了智算需求门槛,但门槛更低反而意味着需求扩张。这种情况下,光囤算力卡太笨,有能力将算力送到用户手里才算做成了生意。再说,无论算力卡货源还是资金,阿里都比不过美股七姐妹。


打个比方,澳大利亚刚发现的全球最大铁矿哈默斯利矿床,虽然捡块石头就是铁,但总得引水拉电铺路修港口,才能将铁矿卖出去。


到阿里这里也是如此,计算、存储、网络三类硬件,是AI基础设施三件套。阿里的大额资金主要集中于这三个投向。


这也符合吴泳铭的表态“云计算网络就是未来的电网”、 “当国家将算力定义为第五生产要素,阿里要做的不是卖水人,而是成为‘国家算力池’的运营者”。


图片


坐庄思维一以贯之


至于算法,虽然阿里也声称在AI原生应用(自己做房东同时也卖货)、现有业务的AI转型、大模型训练加大投入。但这两年,阿里算法岗裁员力度,比其他任何岗位都要更血腥。从2022年到现在,阿里向社会输送6万多毕业人才,其中有多少是算法工程师,只有阿里知道,效果是把其他企业的算法岗薪酬都砸下来了。


几个大的公有云供应商,华为、阿里、腾讯、字节(火山引擎云)都发誓要做中国的算力底座。阿里的天量投资,显然奔着“算力送到家、便宜花样多”的原则,把客户拉过来,争取率先成为“最大的底座”。阿里对手,除了以上几位,还有三大运营商打造的算力设施。后者是国家队。而车企虽然自己也搭建算力设施,但阿里应将其视为客户,而非竞争者。


什么叫“花样多”?阿里拥有云服务的所有生态——IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务)。支持客户随时增容扩展和调用开源模型和数据集,这些思路,都能从淘式服务中看到影子。


吴泳铭说“我们要造的不是护城河,而是太平洋。”意思是不管谁输谁赢,阿里作为庄家照样抽成。


图片


如何在未来接住车企的生意


世界上没有无缘无故的爱。阿里宣布API费用降低97%,没有自建算力集群的车企,有机会以更低成本部署智驾算法和车路协同。2024年4月,长安汽车接入通义大模型。后者不仅提供算力,还提供语义语料(LLM训练库),前者用于座舱交互,搭载于长安启源E07。


请注意这个时间点,当时DeepSeek还未像今天这么火爆,而通义千问的API调用费用,也没有降到今天这个地步。


采取类似动作的还有零跑和智己(通过斑马智行的AliOS操作系统接入)。公开接入千问的就这3家,和1、2月份数十家车企争先恐后接入DeepSeek的热情,无法相提并论。


如果单纯比较大模型(不区分开源闭源),目前DeepSeek风头全球无两,就连老马用20万张算力卡堆出来的Grok也瞠乎其后。虽然后者烧钱更多、排名全球第一(在LMSYS大模型竞技场),但风评远不如DeepSeek。


这反而更坚定阿里做基础设施的信念。现在全球大模型都笼罩在DeepSeek的阴影下(很大一部分影响力来自于开源)。而在此之前,在阿里眼里,大模型不过是一堆算法工程师拿着高薪,调参发论文的摸鱼工具,否则就不会有那么多算法工程师毕业。


现在承认算法一时搞不过,转而追求算力和算力通道建设,是阿里理智的选择。因为就自然语言的语料库而言,阿里也做不过社媒属性比较强的腾讯、字节等对手。


DeepSeek现在报“服务器繁忙”情况略减少(也有人说没减少),一种可能是DeepSeek添置了算力卡,另一种可能是降低了2B权重,更多伺候C端用户。后者不大可能,2B还能有收入,2C就只能混个流量。当然,所有的社媒都挟持庞大的C端用户获得影响力,转而向B端贩卖流量。本质上是C2B,而非C2C。只不过DeepSeek的主业是量化,对卖流量暂时兴趣不大。


如果B端用户的算力需求上涨(这是必然的),自建算力集群就会遇到基础设施瓶颈,AI基础设施的生意就来了,前提是阿里有能力部署超大算力集群(比如100EFLOPS以上,现有车企算力普遍低于10EFLOPS)和高速通讯网络+边缘网。后者是华为的拿手好戏,阿里可以同时采购华为算力卡和华为的高速网方案。


而智驾模型依赖高质量标注数据,需高效的数据中心支持存储和预处理。车企正在卷大模型的迭代速度。对于分布式存储和训练平台(PAI)的需求,很快将触及自己硬件能力的上限。一种做法是自己加钱扩张云算力、存储中心和高速网络,另一种办法是租用包含以上能力的服务包。


就算车企掏得起这个钱,但和公共云服务商相比,车企自己的算力集群应用密度上不去,闲置就等于把矿泉水往海里倒。哪个划算,不言而喻。


车企的大模型训练需求再往前走一步,就大概率会寻求更大的算力底座。阿里就与华为、三大通讯运营商等算力基础设施服务商,形成竞争。DeepSeek如果不想掏钱升级自己的硬件,就不再是以上各位的同生态位对手。毕竟通义千问只是阿里AI庞大规划衍生的一个产品而已。


现在车企做智驾智舱大模型,还未触及自建和租用AI基础设施的能力上限,而云硬件短板将在2、3年内出现。至少阿里是这么想的,因此规划了一个3年部署计划,这样才能接得住B端即将诞生的大生意。


作者简介
王秋凤,先后就职于《经济观察报》、《第一财经日报》等主流平面媒体,搜狐汽车新闻中心、腾讯汽车等主流互联网平台,前北汽极狐汽车总裁,现任快手汽车负责人,中国汽车记协常务理事。




  E N D   -