界面新闻记者 | 李京亚
经历十月狂飙,国内科技圈顶尖人物对于大模型的部分思路开始趋同。
大模型创业者中最被看好的王小川上半年去美国考察之后,把做自家大模型的理念变更为“理想上慢一步,落地上快三步”,因为他发现即使“年底之前会有几家公司达到GPT3.5水平,但达到之后,可能很难去超越。”杭州云栖大会上,王小川的合作伙伴,阿里云首席技术官周靖人发出类似呼吁,人工智能浪潮刚刚开始,不用心急,“国内是三月起才陆续发布大模型,这方面海外至少有一年先发优势,国内短短半年变化喜人,而模型的生态发展还是需要时间。”
截至目前,国内数款头部主流大模型都已通过阿里云对外提供API服务,Baichuan系列之外,还有智谱AI ChatGLM系列、姜子牙通用大模型、零一万物、vivo和巨人网络等显赫的名字。除了通义大模型,国内有近乎一半的头部大模型公司跑在阿里云上。
周靖人还告诉界面新闻,今年的技术变革表面上是大模型所致,背后是云计算甚至计算机科学的全面升级。巧合的是,阿里云创始人王坚也持相似判断,他在31日上午主题演讲中坦言:很少人意识到人工智能和云计算不是科学研究工具的革命,而是会让科学发生一场革命的工具。
这些论调时值阿里云通义千问大模型完成一次重大升级之刻。
10月31日云栖大会上,阿里云正式发布了千亿级参数大模型通义千问2.0,这款模型的真实体感尚在迷雾之中,但从MMLU与GSM8K这类经典学术评测集的结果来看,其整体表现超越了Llama-2-70B,完胜OpenAI的Chat-3.5,与GPT-4的差距也进一步缩小。
阿里云的降价战略也在继续。今年4月,阿里云打响了国内云服务价格战的第一枪,在今天的云栖大会上,阿里云延续了价格下调,宣布Serverless产品全系降价,其中大数据、数据库、中间件等的Serverless版均降价30%-70%不等。
Serverless是一种基础架构方面的细颗粒度改良,指构建和运行不需要服务器管理的应用程序,其应用触手涵盖数据库资源、消息中间件资源、对象存储、日志服务等资源和产品。在做法上,Serverless将提供服务资源的基础设施抽象成各种服务,以API接口的方式供给用户按需调用,真正做到按使用收费,达到降低运营成本的目的。
阿里云内部在2022年达成了共识,认为Serverless将成为下一代云计算的主流形态,也基于此,阿里云当时实现了核心产品全面Serverless化。今年的大会此点是去年的延续,阿里云又有超40款云产品提供了Serverless的能力,并推出全球首款容器计算服务ACS。
有能力产生更优质的下游模型,是基础大模型最重要的核心能力。为证明自己具备这种“二次学习”能力,阿里云今天就组团上线了基于通义大模型训练的8大行业模型,面向当下很受欢迎的法律、健康、投研等垂直场景。此外,通义千问还正式发布了APP,在各大手机应用市场正式上线。
综合表面成绩看,阿里云在大模型基座、中间件、模型生态、开源社区方面都已经具备非常之影响,从评测结果看,阿里云基础大模型与国内大多数大模型也拉开了一定差距。
“今天有一个有趣的现象,既懂人工智能又懂云计算的公司,才能在现在的竞争里取得重要的战略性优势。”周靖人告诉界面新闻。
其实,头部云厂商“以价换量”小半年之后,算力需求与人工智能带来的利好已经传递到了云厂商的业绩之上,在8月阿里巴巴2024财年首季度财报中,阿里云同比增速重新回正为4%,达到251.23亿元,扭转了上一个财季的同比下滑,并有望实现年度营收破千亿人民币规模。