该建筑属于从事出租数据中心空间业务的Equinix公司,里面的设备正被越来越多的公司客户用于AI系统。受到“生成式”模型(如爆款虚拟对话者ChatGPT等)以惊人速度成熟的激励,那些能够驾驭该科技潜能的公司有望攫取高额利润。然而,就像在掘金热潮初期发生的一样,销售所需凿子和铲子的公司已经赚得盘满钵满了。
5月24日,为许多AI服务器设计所需半导体的英伟达公司突破了分析师对其2-4月收入和利润的预期,宣布该季度预期销售额为110亿美元,比华尔街原来的预测值高50%。5月29日,英伟达老板黄仁勋宣布,世界正处于“新的计算时代的惊爆点”。第二天,该公司在此次盈利发布后的市值累计上涨了30%,触及了1万亿美元。
AI热潮席卷了芯片设计商AMD和生产商台积电等其他公司。此外,还有许多不同类别的计算基础设施提供商,包括那些彩色线缆、发出噪音的空调设备和数据中心租赁空间,还有运行AI模型和数据处理的软件。自从去年11月ChatGPT发布起,30家前述类别公司的平均权重指数涨幅已高达40%,而高科技板块NASDAQ指数涨幅仅为13%。说客集团AI Infrastructure Alliance的Daniel Jeffries总结道:“新的科技板块正在崛起”。
表面上看,这些AI设施看起来并不像ChatGPT和其他迅速追赶的竞争对手背后聪明的“大语言模型”那样令人兴奋。但随着模型建造者及附身其上的应用开发者争抢未来的AI蛋糕,它们需要很多很多算力,而且越快越好。
即便不考虑非AI应用,最新的(生成式)AI系统也要比旧版本对算力的要求高得多。据Google云平台的AI基础设施负责人Amin Vahdat观察,过去6年来,模型规模每年都增长了十倍。驱动ChatGPT的最新版本GPT-4用于分析数据的参数有1万亿个,是上一个版本的五倍。随着模型越来越复杂,训练它们所需要的算力也会随之增长。
在训练结束后,AI所需的数据计算量有所减少。但随着提供的应用的范围拓展,这种“推理”累积起来也会占用很多处理能力。微软的一项使用OpenAI公司(ChatGPT的创造者,微软持有其约半数股份)技术的服务覆盖了超过2500个客户,比前一个季度增长了10倍。Google母公司Alphabet在全球有6个产品用户数超过20亿,该公司计划用生成式AI给这些产品实现涡轮增压。
从算力需求增长中获益最明显的是芯片厂商。英伟达和AMD等公司设计芯片并在台积电等工厂投产,它们的产品在驱动大多数AI应用的云计算大型供应商处十分抢手。AI能够受益于更多、更强大(利润率一般也更高)的芯片,这对于芯片设计商们十分有利。据瑞银预计,在接下来的一两年内,AI将使对于GPU(图形处理器)这种专业芯片的需求增长100-150亿美元。英伟达的数据中心收入(已占其总销售额的56%)可能会翻番。AMD今年也将发布新的GPU。经纪商Bernstein的Stacy Rasgon指出,尽管AMD在GPU设计方面还远达不到英伟达的量级,但即便是仅是获取该市场的“边边角角”,该公司也将受益匪浅。专注于AI的芯片设计初创企业Cerebras和Graphcore等也努力在市场中开拓属于自己的一片天。据数据商PitchBook统计,类似这样的初创企业约有300家。
当然,制造商们也将获取其中一部分好处。4月,台积电老板魏哲家在谈到“AI相关的增量需求潜力”时很谨慎。投资者们与之相比则更加兴奋。在英伟达最新盈利发布后,台积电的股价上涨超过10%,市值增长了约200亿美元。还有一些间接受益者,包括那些能够将更多芯片打包进单一处理器的公司。荷兰公司Besi制造了把芯片封装在一起的工具。分析师公司New Street Research的Pierre Ferragu指出,这家荷兰公司控制了高精度封装市场四分之三的份额。其股价今年已上涨超过50%。
瑞银预计,GPU约占据了专用AI服务器成本的一半,而在一般服务器成本中仅占十分之一。但它们并非是唯一必要的工具。要想作为单一计算机工作,数据中心的GPU还需要能够彼此交谈,这就需要先进的交换机、路由器和专用芯片。据研究公司650 Group预测,在接下来的几年里,该网络设备市场的年增长率将为40%,2027年市场规模将达近90亿美元。英伟达也销售这样的设备,在全球销售额中占比为78%。但来自加州的Arista Networks等竞争对手也被投资者看好,其股价在过去一年中已上涨近70%。生产网络运营辅助芯片的Broadcom声称,2023年该公司相关设备的销售额将翻两番,达到8亿美元。
研究公司IDC的Peter Rutten认为,AI热潮对于进入数据中心的服务器安装商也是好消息。另一家分析公司Dell’Oro Group预测,五年内,全球数据中心专用于AI的服务器份额将从现在不到10%增长到20%,该类设备在数据中心的服务器资本支出中的份额将从20%提高到45%。
这将使Wistron和Inventec等服务器制造商获益,它们主要为亚马逊云服务和微软Azure等云供应商巨头生产定制的服务器。小型制造商也能过得不错。另一家服务器制造商Wiwynn的老板最近指出,AI相关项目在其近期订单中的比例已超过一半。美国的Super Micro公司宣布,在今年2-4月间,AI产品在其销售额中占比达29%,高于此前12个月里20%的平均水平。
所有这些AI硬件还需要专用软件来操作。其中一些程序来自于硬件公司,如英伟达的CUDA软件平台能帮助客户充分发挥其GPU功能。其他公司的应用还能够帮助AI公司管理数据(Datagen,Pinecone,Scale AI)或运行大语言模型(HuggingFace,Replicate)。据PitchBook统计,这样的初创企业约有80家,其中20家已在今年进行了新一轮融资。Pinecone的投资者包括Andreessen Horowitz和Tiger Global等风险资本。
与硬件类似,很多这类软件的客户也是云巨头。亚马逊、Alphabet和微软计划于今年投入合计约1200亿美元的资本,高于2022年的780亿美元。其中一大部分将用于拓展其云容量。即便如此,对于AI计算的需求如此之高,以至于云巨头们想要持续跟上都很艰难。
这为挑战者创造了空间。近年来,英伟达和Equinix已开始提供“接入GPU即服务”。专注于AI的云创业公司也如雨后春笋。其中,Lambda于3月完成4400万美元的筹资,引入的投资者包括Google的风险投资板块Gradient Ventures,以及OpenAI的联合创始人Greg Brockman。该笔交易意味着Lambda的估值达到约为2亿美元。另一家类似的公司CoreWeave也于4月从英伟达等处筹资2.21亿美元,整体估值已达20亿美元。CoreWeave联合创始人Brannin McBee认为,在围绕AI的客户服务和基础设施方面的专注,使得该公司能够与云巨头们开展竞争。
最后一类AI基础设施赢家是数据中心地主,它们最接近于扮演提供铲子的角色。随着对于云计算需求的上涨,它们的地产装得越来越满。在2022年下半年,数据中心的空置率为3%,为历史低点。Equinix及其对手Digital Realty等专业机构与大型资产管理者竞争,把数据中心加入其地产组合中。2021年,私募市场巨头Blackstone以100亿美元收购了美国最大的数据中心运营商之一QTS Realty Trust。Brookfield作为Blackstone在加拿大的竞争对手,此前已在数据中心上进行了大量投资,今年4月又收购了法国数据中心公司Data4。
AI基础设施的持续增长也许会受到一些限制而终结。一方面原因是能源。一家大量投资于数据中心机构认为,对于电力等需求巨大的能源的获取难度,预计将制约弗吉尼亚北部或硅谷等数据中心聚集地的进一步发展。从大型AI模型和基于云的推理转向小型系统将会降低需求,因为这些训练所需算力更少,并可以通过智能手机来推理。Google最近就发布了降级版PaLM模型。
最大的问号要打在AI繁荣自身的表现上。尽管ChatGPT等很受欢迎,真正能够使用该科技盈利的应用案例仍然很不清晰。在硅谷,热潮随时都可能转变为失望。随着人们发现GPU很适合挖掘比特币和其他加密货币,英伟达的市值曾在2021年暴涨,但又随着加密货币的覆灭而暴跌。如果该科技无法满足改革法案的要求,监管者可能会重拳出击。全球政策制定者担心生成式AI可能会打击就业或散布不实信息,已经在考虑加装护栏了。事实上,5月11日,欧盟立法者已经提出了一系列限制聊天机器人的规则建议。
所有这些限制因素都可能会减缓AI的部署,并由此使AI基础设施公司的前景蒙上阴影。但也许无需过分悲观。即便是生成式AI不像其鼓吹者们宣扬的那样有革命性,至少也会比加密货币有用得多。此外,还有很多其他非生成式AI也需要大量算力。除非是对生成式AI全球性封禁(现在看不到这种可能性),掘金热潮不太可能停下来。只要大家都处于热潮之中,凿子和铲子的商贩们就依然有钱赚。