小程序
传感搜
传感圈

通义千问再开源超百亿级参数规模大模型

2023-10-04
关注

经济观察网  记者  钱玉娟

9月25日下午,阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,供全社会免费商用。阿里云透露,70亿参数的Qwen-7B等模型开源至今,短短一个半月时间里,下载量已突破百万量级。如今,用户既可以从中国大模型开源社区魔搭社区内直接下载14B模型,也可以通过阿里云的灵积平台访问和调用模型。

据了解,阿里云的灵积平台上,除了自研的通义千问大模型外,还托管着百川、姜子牙、Stable Diffusion、ChatGLM-v2等行业大模型。

“我们是一个开源的模型社区,希望给不同的开发者、企业更多的选择。”阿里云CTO周靖人接受经济观察网记者采访时称。周靖人说,“今天只做一个非常foundation(基础)的model(模型),跟我们实际的应用场景会有很多的距离。”他希望团队更为重要的一件事是:帮助开发者和企业用好模型。

基于此,通义千问选择对自研大模型开源,目的是为开发者、企业后续使用提供一个选项,周靖人表示,不同场景根据自身需求,选择不一样规模的模型来应用于自己的开发环境里。

伴随模型参数以及整体容量和能力的增加和提升,14B模型会比7B模型在某些长尾领域表现出更强的认知能力、推理能力等,周靖人指出“14B模型在模型微调和模型应用方面会更具性价比。”

不只是阿里云走上了大模型开源之路,全球以及中国市场上很多厂商都在做出这一选择,IDC中国高级分析师程荫称,“模型开源会让更多的人接触到大模型技术,从而降低技术学习和使用的门槛和成本,促进大模型在行业内的广泛应用。”

行业开源开放确实是趋势,但“让AI更普惠”这句话在周靖人看来,实现起来并不容易。

“只做开源也不行,不做开源更不行。”周靖人强调,当下大模型生态需要在技术创新的同时也要更及时地触达中小企业和个人开发者。

“未来可能会形成一种开源模型和商业模型并存的格局。”程荫分析,开源模型会促进更多生态的形成,降低训练模型的巨大成本,为创业型企业、开发者们带来更多机会。

 

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘