芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
一边手握OpenAI CEO的逾百万美元投资,一边被OpenAI四年前就预订了5100万美元(折合超3.6亿人民币)订单,还被美国政府以“国家安全”为由干涉融资交易,最近全球热度最高的AI芯片创企可能非Rain AI莫属了。
▲Rain AI办公室,一张海报上写着“从根本上降低AI成本”(图源:Rain AI)
这家距离OpenAI旧金山总部不到1英里的芯片创企,根据投资者文件,预计最快本月流片新测试芯片,最早或于明年10月向客户提供第一批硬件。
在联合创始人的描述中,Rain AI可能是“世界上最雄心勃勃的AI芯片公司”,其前沿技术非常“深奥优雅”,能真正在基础层面上解开人们对智能的理解。另据其官网介绍,Rain AI正在开发基于SRAM的数字存内计算芯片。
其投资阵容除了有热度空前的OpenAI CEO外,还有百度风投及多位声名赫赫的业界大牛。前联电董事长兼CEO胡国强、存内计算领域专家Arijit Raychowdhury博士、OpenAI AI硬件专家斯科特·格雷,都是Rain AI的顾问。
▲Rain AI的顾问(图源:Rain AI)
存算一体专家、千芯科技董事长陈巍博士告诉芯东西,Rain AI的芯片设计有3大亮点值得关注:1)数字存内逻辑架构,支持FP32精度;2)Block BF16格式,比标准BF16格式更高效、面积更小;3)(设计中)支持片上精调(Fine-tuning、LoRA),方便片上进行实时训练。
另据美国科技杂志《连线》报道,Rain AI的首款芯片基于RISC-V开源指令集架构,面向包括手机、无人机/机器人、汽车在内的边缘计算设备,既能训练算法,又能在部署时运行。
OpenAI计划如何采用其芯片尚未可知。支持AI模型按需实时定制或“微调”的能力,可能是OpenAI对这款芯片感兴趣的关键原因之一。The Information援引知情人士消息称,OpenAI 对于使用这些功能来降低数据中心成本并将其模型部署在手机和手表等设备中感到非常兴奋。
在自身尚需大量输血来维系模型训练和日常服务运营的情况下,OpenAI为何还愿意花费大量资金来支持创新AI芯片的供应?这家创企到底什么来头?它加紧研发的AI芯片又将凭借哪些核心技术来在日趋激烈的市场中竞逐一席之地?
一、OpenAI CEO、百度风投参投,要大降AI模型构建成本
Rain AI成立于2017年,AI芯片设计理念受大脑启发,其2022年11月发表在国际顶级学术期刊Nature子刊Nature Electronics的论文显示,与GPU上的反向传播相比,通过与忆阻器硬件结合的类脑新算法,其研究成果可将训练神经网络的能效提高至超过10000倍。
论文地址:https://www.nature.com/articles/s41928-022-00869-w
值得一提的是,这项研究成果是与斯坦利·威廉合作完成的,而世界上第一个忆阻器正是由威廉团队于2008年在惠普制造出。
早在2018年,OpenAI联合创始人兼CEO阿尔特曼就看好Rain走得模仿人脑研发芯片路线,以个人名义向Rain AI领投了一笔种子轮融资,注资超过100万美元。
第二年,OpenAI签署一项不具有约束力的协议,计划等Rain AI的芯片上市后斥资5100万美元采购这些芯片,不过至今尚未采取后续措施。
2021年,Rain AI推出可训练的端到端模拟AI芯片的工作原型芯片。阿尔特曼评价其神经拟态方法“可以大大降低构建强大AI模型的成本,并希望有一天能够帮助实现真正的通用人工智能”。当时Rain AI提出的长期使命是为AI提供真正的类脑芯片。
除了阿尔特曼外,Rain AI还获得了Facebook创始工程师杰夫·罗斯柴尔德、Cruise产品副总裁奥利弗·卡梅伦、Wayve AI创始人阿马尔·沙阿、OpenAI研究工程师斯科特·格雷、Pioneer基金创始人丹尼尔·格罗斯等业界大牛的投资。据《连线》报道,百度风投也参与其小额种子轮投资。
▲Rain AI的部分投资方(图源:Rain AI)
截至2022年2月,在获得由沙特阿美旗下风投基金Prosperity7 Ventures领投的2500万美元A轮融资后,Rain AI估值为9000万美元,融资总额达3300万美元。投资者透露说这足以维持其到2025年的运营。
不过在上周四,据外媒援引知情人士消息,美国海外投资委员会审查后,要求Prosperity7 Ventures出售Rain AI的股份,以避免中东悄悄获取关键技术的更多信息。此前阿尔特曼被曝出为一家新的AI芯片企业奔走中东,拟筹资数十亿美元,尚不清楚Rain AI是否参与其中。
二、两位90后创始人,前联电CEO当顾问
目前Rain AI拥有近40名员工,今年悄然更换了CEO,其网站已经将创始CEO戈登·威尔逊列为执行顾问,曾是前顶级律师事务所Freshfields Bruckhaus Deringer律师的威廉·帕索则从首席运营官晋升为首席执行官。
▲Rain AI的管理层(图源:Rain AI)
威尔逊上周四在领英发文证实了自己的退出。他分享了一些Rain AI创立的细节。
▲威尔逊在领英发文证实不再担任Rain AI的CEO(图源:领英网)
Rain AI始于佛罗里达大学,在那里,威尔逊遇到了另外两位联合创始人杰克·肯德尔(担任CTO)和身为佛罗里达大学材料科学与工程教授的胡安·克劳迪奥·尼诺(担任董事会成员)。
▲三位Rain AI联合创始人(图源:Rain AI)
当时肯德尔和威尔逊都只有25岁,没有创办公司的经验。在将新型芯片推向市场的路上,他们受到了来自行业人士的质疑,最终在重重困难中坚持下来。
其愿景是构建一个在结构和功能上都类似于大脑的芯片架构,为AI带来新的可能,使数据中心具有可持续性,并使所有机器能独立学习与适应。
根据威尔逊的描述,Rain AI的近期产品采用数字存内计算技术,将定义新的AI芯片市场,并拥有大规模颠覆现有市场的野心。
Rain AI的员工们纷纷在威尔逊这篇领英文章下留言,表达对威尔逊的欣赏和祝愿。
▲部分Rain AI员工在威尔逊宣布卸任CEO的文章下评论(图源:领英网)
威尔逊虽然退出了,但会继续以执行顾问的身份尽可能帮助Rain AI,同时也将开展自己的新项目和冒险。
三、即将推出AI硬件,四大技术亮点拆解
从官网最新介绍来看,Rain AI的AI芯片旨在重新定义AI计算极限,“在速度、功率、面积、精度和成本之间提供了创纪录的平衡”。
目前Rain AI可提供用于定制SoC的数字存储计算tile和软件栈的IP授权,即将推出硬件。
其芯片设计方法有4个技术亮点:
1、数字存内计算架构,支持FP32精度
与传统存内计算设计不同,Rain AI专有的D-IMC(数字存内计算)核心可扩展到大批量生产,并支持训练和推理。当与Rain AI的适当量化算法相结合时,其AI芯片可支持FP32精度。陈巍告诉芯东西,目前仅Rain AI、D-Matrix、千芯科技等少数存算一体芯片企业能做到这一点,多数存内计算架构仅能支持到INT8。
2、Block BF16格式,无精度损失
在硬件中获得高精度、以AI为中心的数据是AI训练和推理的核心挑战。Rain AI的block brain浮点方案确保与FP32相比没有精度损失,且比标准BF16格式更高效、面积更小。这在业界也很少见,千芯科技同样在研相关技术。
数字格式在电路级与其D-IMC核心共同设计,利用优化的4位和8位矩阵乘法的巨大性能增益。其灵活的方法可确保在不同网络上的广泛适用性,为AI效率设定了新的标准。
3、开发RISC-V与D-IMC间专有互连
由于缺乏硬件支持,AI芯片经常无法编译工作负载。Rain AI利用RISC-V指令集架构的功能,支持AI开发人员实现任何操作和编译任何模型的灵活性。Rain AI开发了RISC-V和D-IMC核心之间的专有互连,通过平衡的流水线提供出色性能。
4、设计微调算法,实现片上实时训练
由于训练环境和部署环境不可避免的不匹配,AI模型经常在部署时失败。微调解决了这个问题,但需要设备支持高性能训练。Rain AI正在与硬件共同设计微调算法(例如LORA),以促进在芯片上进行高效的实时训练。据陈巍解读,这一方法可能是Rain AI独有的。
四、去年还在主打类脑计算,今年已转向AI+存内计算
有意思的是,往前回溯到2022年2月,Rain AI的名字简称还是Rain Neuromorphics,旨在设计模仿大脑工作方式的芯片,并在其新闻稿中将神经拟态(Neuromorphics)作为传播重点。
早在2021年,Rain就在台积电180nm节点上流片了名为Cumulus的MN3测试芯片。该芯片采用CMOS架构,拥有10000个神经元,以ReRAM作为忆阻元件并结合借鉴NAND闪存工艺的3D制造技术,使ReRAM能扩展到多层存储器结构。
当时Rain计划其首批芯片将为视觉、语音、自然语言处理、推荐工作负载提供1.25亿个INT8参数,功耗低于50W,预计将于2024年提供样品,2025年将芯片投入商业发货。
▲Rain神经拟态芯片的上层,ReRAM器件位于列和随机连接的树突之间的界面处(图源:Rain AI)
在2022年A轮融资新闻稿中,Rain将其神经拟态处理单元(NPU)称作是世界上第一个端到端模拟、可训练的AI电路,是唯一结合了算法和硬件技术的根本性创新的AI模拟方法,在加快处理速度的同时能够降低功耗。
根据该新闻稿,模拟算法的实施使NPU的能效相较当时最好的处理器高1000倍。NPU硬件架构利用忆阻器将内存和计算结合起来作为人工突触,以稀疏模式覆盖在神经元电路的顶部,复制大脑的稀疏连接性,允许数千万个人工神经元在单个芯片上互连。
另据Y Combinator官网对投资创企的介绍,Rain研发了一种新型AI芯片忆阻纳米线神经网络(MN3,Memristive Nanowire Neural Network),该芯片每cm²可拥有超过1000万个脉冲神经元,功耗远低于传统GPU和CPU。
▲MN3技术将实现模拟计算硬件大规模扩展,在同一芯片区域包含更多的神经元(图源:Rain AI)
MN3是由Rain AI联合创始人尼诺于2014年在佛罗里达大学发明的,旨在实现模拟计算硬件的扩展。
不过,如今的Rain AI官网,已经是“All in AI”。从公司简称到产品、设计方法、团队的介绍,都只见“AI”、“存内计算”、“RISC-V”这些关键词,除了官网最底部的小字外几乎对“神经拟态”只字未提了。
▲官网招聘信息自称“Rain AI”(图源:Rain AI)
结语:业界等待“英伟达替代者”
随着生成式AI日趋火热,稀缺的算力使得几经热潮与降温的AI芯片赛道再度成为AI产业的焦点。而无论是科技大厂还是AI创业公司,虽然在训练模型上都暂时离不开英伟达的芯片,但都在寻求与期待实现AI芯片多元化。
除了向Rain AI砸钱外,OpenAI CEO阿尔特曼还参与投资了赫赫有名的晶圆级芯片创企Cerebras和去年10月刚成立的芯片公司Atomic Semi。而Atomic Semi的联合创始人之一正是叱咤半导体界的硅谷风云人物“金坷垃”Jim Keller。
阿尔特曼参投的AI芯片创企Rain提供了一个有趣的案例,宣传重心从基于ReRAM的类脑芯片悄然转向基于SRAM的数字存内计算芯片,原CEO变顾问、律师成芯片企业掌门人,产品尚未问世却因为“国家安全”的原因被美国政府要求让中东股东撤资……一系列波折既给这家成立6年的AI芯片公司带来了大量的关注度,也再度力证存算一体AI芯片的落地前景正被看好。
从图形芯片演化而出的GPGPU,是当前AI训练芯片市场的宠儿,但并非唯一解。在降低模型训练与推理成本的道路上,业界还在持续探索实现高能效和高性能的芯片架构的更多可能。
参考信源:Rain AI官网、《连线》、EE Times