出品|虎嗅科技组
作者|齐健
编辑|陈伊凡
头图|谷歌
美国当地时间5月10日,一年一度的谷歌I/O开发者大会如期举行。一直以来,谷歌在I/O大会上都是以先行者的姿态展示最前沿的AI技术。但今年这位AI巨头的姿态却与往昔有些不同了。
虽然本次大会谷歌发布新技术的节奏没变,推出了PaLM 2大模型、Bard升级版,以及Gemini多模态模型。但在外人看来,这些技术似乎少了一些新奇的创意,多了几分追赶的焦虑。毕竟,在微软和OpenAI掀起来的这波AI大模型浪潮里,只要不是先行者,看起来都像是在追着微软的背影跑。
其实谷歌在AI赛道上跑的从来都不慢,近两年的谷歌I/O大会一直没有离开过AI,今年大会的AI味儿还更浓了些,不仅是Bard、Workspace这些微软已经布局的产品赛道,谷歌还将生成式AI融入了安卓。
一直以来,Bing一直被视为微软发力大模型的一个入口,是一个几乎完美的组合。但对谷歌来说,其杀手锏反而不是用户量更大的搜索,而是安卓系统。生态似乎给了谷歌一道牢固的护城河。不过在AI竞争中,这种逐鹿输赢如何,随着技术的迭代演变,还需要时间验证。
搜索并非大模型的唯一底牌,生态的优势又能让企业领先多久?
先发优势对谷歌搜索来说有多重要
微软把GPT能力赋予Bing的那一刻,就相当于是在对谷歌宣战。而谷歌推出Bard,自然也就是接下了这挑战书。
本次大会上,发布了PaLM 2大模型,这也被业界广泛认为是对标GPT-4的产物。
事实上,2022年I/O大会上展示过的PaLM模型参数量已经达到5400亿,单看参数量比当时OpenAI主打的GPT-3多2倍有余。而今年的进阶版——PaLM 2,更是在数学能力、代码编写、逻辑推理、以及多语言能力等方面都有大幅提升。
随着基础大模型的升级,谷歌搜索引擎里用到的大型语言模型(LLM)对话机器人Bard,也进行了一番升级,新增了引用功能,使内容更加准确。还有导出功能,可以将结果一键导出到Gmail或Docs中。
未来,Bard还将与谷歌的其他应用(Maps、Photos、Messages、Flights、YouTube等)集成,并开放第三方扩展,可以使用Adobe Firefly完成文生图功能。并结合谷歌最新宣布的Gemini多模态模型,提供和GPT-4的识图功能类似的,多模态能力。目前,开发者可以通过谷歌的PaLM API、Firebase以及Colab访问PaLM 2。
虽然有进步,但相对于竞品,Bard似乎还是慢了一小步。Bard的这些功能更新在不久前,微软的New Bing几乎都宣布了一遍。但是,在大模型的争夺中,先发优势能够决定多少?
从微软2023年一季度财报来看,市调公司Sensor Tower的数据显示,微软宣布将把ChatGPT纳入搜索6周后,必应的流量飙升了16%。在微软最新公布的2023年第一季度财报中,微软搜索和新闻广告营收同比增长10%,均超出分析师预期。
虽然Bing的流量大幅上涨,但谷歌同期的财报并未显示搜索业务有明显下滑。作为已经在搜索引擎市场上占据绝对优势的谷歌来说,“打江山易,守江山难”,谷歌搜索可能并不像Bing那样需要靠AI能力搏出位。对于搜索引擎市场的老大来说,需要的是保守和稳定,尽量少出现Bard首发时那样的“翻车”问题,可能才是现阶段保住市场地位的关键。
而在搜索引擎领域长久以后的AI之争,也并不急于一时的产品抢先,更多的还是要看AI大模型的底层能力,拼的就是PaLM和GPT谁进化得更快了。
从开发者的角度看,谷歌的大模型对于中小开发者,以及企业用户更为友好。PaLM 2包含了4个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。
其中的壁虎模型,甚至可以在手机上直接运行。不仅降低了开发成本,还拓展了应用开发的可能性。不需要绑定云服务的AI应用,不仅大幅降低了LLM的使用成本,也可以最大限度地本地数据的安全。
当然,对于企业用户来说,PaLM 2模型更易落地,其针对不同场景开发了不同的小模型。目前,谷歌内部已经有超过70个产品团队正在使用PaLM2构建产品。I/O大会上展示了其中的两款行业模型:安全领域的Sec-PaLM,聚焦于分析和解释潜在恶意脚本;医疗领域的Med-PaLM2,可以通过美国医学执照考试,甚至还可以从医学影像中合成患者信息。很快,这两种模型都将通过谷歌云提供给特定客户。
从搜索到企业应用,综合来看,在接下来的AI竞逐中。谷歌和微软,孰能争先,目前还难有定论。
安卓生态能成谷歌AI的壁垒吗?
本次大会的亮点之一是谷歌在安卓上融入了AI功能。
谷歌最新公布的Android 14中,也融入了两项AI功能:Magic Compose可以用生成式AI帮用户改写句子;安卓系统还将具备利用生成式AI制作具有3D效果的个性化壁纸的能力。
安卓短信功能
除应用功能以外,谷歌还推出了专为Android开发的AI编码机器人Studio Bot。不仅可以生成代码、修复BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持Kotlin和Java编程语言,并将直接嵌入到Android Studio开发工具的工具栏中。
这或许才是谷歌AI最重要的一步棋。
目前New Bing和Bard都围绕搜索引擎开放了插件体系,两家都提到了将和OpenTable预订餐厅,以及Instacart订货配送的功能相结合,为用户提供更多可延展的服务。
然而,无论开放多少插件,这种仅可用于搜索引擎的插件功能,存在着一些局限性。
对于用户和服务商来说,插件的模式能够实现的功能有限,跨平台整合能力不足,最后可能导致增加用户的操作复杂度,或者降低服务商的跨平台服务能力。就比如说你在携程可以完成一趟旅行的全部预订,但如果把订机票、订酒店、订餐厅都拆成3个插件,那么操作起来势必会繁琐一些。
此外,还可能会遇到插件的开发者生态问题。一方面搜索引擎作为基础平台的开放性是否能满足开发者需求,另一方面还要基于搜索引擎的AI平台定义应用场景,培养开发者。这就在无形中给AI生态创造了一个开发门槛。
而对于谷歌来说,在这方面虽然插件生态也是刚刚起步。但谷歌毕竟拥有安卓生态的庞大开发者社群,如果将AI能力加成到其中,则能够更快地建立起一套繁荣的AI生态。基于安卓系统的AI应用生态体系,可能会先微软一步为谷歌构筑起生成式AI的护城河。
不过也有人认为,AI大模型未必会形成操作系统级的生态。AI行业分析师仓剑告诉虎嗅,“AI大模型可能更像微信、支付宝这种超级APP,它是一个应用型平台。”
诚然,在操作系统层面,谷歌具备更强的生态体系,且已经聚拢了一大批优质开发者。但如微信小程序的轻量化应用的崛起,也说明以“超级App”为入口的插件型应用自有它们的优势。
首先,插件的开发成本更低。在微信推出一款小程序的成本肯定比在应用商店上架App要低得多,现在有的小程序开发价格甚至比一些H5(网页)更便宜。其次,小程序在实现单点功能方面更便捷,对于LLM来说,如果你不需要复杂的操作,只是用自然语言输入,即可获得结果的话,那么确实开发一款复杂应用可能没有什么必要。
而相较于App来说,搜索引擎作为入口的流量红利,或许也可以在一定程度上覆盖功能简单的不足。由此来看,虽然安卓生态可能为谷歌先一步聚拢AI开发者人气,但围绕搜索引擎的插件之争,应该也还会在两大巨头,甚至未来的更多入局者中持续发酵。