ChatGPT爆火以来,引发了全球新一轮生成式人工智能的浪潮,全球科技巨头先后展开人工智能大模型的军备竞赛。可以预见,多模态大模型时代,AI开始像人类一样思考和工作,传统的交互方式、内容生成方式彻底颠覆,新的业态和商业模式将出现,诸多产业乃至人类生活也将被重构。
大模型竞争的白热化,引发了对算力基础设施的需求飙升,而作为算力基础的高性能芯片,其设计日益复杂且充满挑战,相应地对设计芯片所用的EDA工具也提出了全新的要求。在GPT引领的新一代生成式AI浪潮下,芯片设计行业将如何利用AI+EDA工具来应对这些变革?
大模型时代,算力成制约AI发展最大障碍
作为人工智能时代的基础设施,大模型所需的巨额算力就如同工业生产中的所需的电力,并且,随着ChatGPT迅速演进至GPT-4以上版本,对图片、语音、视频等多模态的支持使得训练任务中使用的算力呈指数级增长,催生了对算力更大的需求。
“随着AI算法和模型的规模和复杂度不断增加,AI运行所需的能耗和算力都呈指数级增长,包括训练成本和后续运营成本,尤其是目前的运营成本与使用者数量紧密相关的现状下,需要的算力相当于超1.5万颗当下最先进的GPU芯片。”新思科技资深产品经理庄定铮判断,“在AIGC时代,未来对算力的需求将每6-7个月翻倍,AI芯片成为驱动人工智能发展的核心动力。”
“更大、更复杂的AI模型和算法仍在日新月异地进化中,带来庞大的高性能AI芯片需求。预计到2030年,AI市场规模有望达到15970亿美元,相比2021年的870亿美元,复合年均增长率高达38.1%。”随着需求飙升,在庄定铮看来,算力俨然已成为当前限制AI发展的最大障碍。例如,随着模型参数越来越大,当前应用最广泛的GPU在提供算力支持上也存在瓶颈。在GPT-2之前,GPU内存还能满足AI大模型的需求,Transformer模型大小每两年平均增长240倍,实际上GPT-3等大模型的参数增长已经超过了GPU内存的增长。
“传统的设计趋势已经不能适应当前的需求,芯片内部、芯片之间或AI加速器之间的通信成了AI计算的瓶颈。”他指出,包括GPU、NPU、HPC等在内的高性能AI算力芯片性能提升,主要依靠芯片架构优化、制造工艺进步、算法优化等方面提升来实现。与此同时,在算力提升的过程中也面临着一些挑战,包括能耗优化、设计复杂度不断增加,以及日益激烈的市场竞争压力等等。
然而,摩尔定律逼近极限,传统芯片的性能提升幅度已远远跟不上AI所需的性能增长速度。传统的芯片设计过程是一项高度复杂且挑战艰巨的工作,通常需要经过数月的反复探索和调试,在此过程中不仅需要用到物理实现、仿真、验证、测试等多种EDA工具和软件,而且要求芯片设计工程师具备熟练的技能和经验。不仅如此,设计一颗芯片需要花费大量的时间和人力成本,设计过程中的任何一个错误都可能导致大量时间和资源的浪费,甚至可能导致整个项目的失败。
幸运的是,尽管摩尔定律逐步放缓,但市场需求的爆发正在激发芯片设计领域的持续创新。“在AI技术的发展对芯片设计带来巨大挑战的同时,我们也可以将AI应用于芯片设计过程中,正所谓‘用AI帮助AI’。”庄定铮强调,“AI与EDA的双向奔赴,将开启芯片设计的下一场革命。”
AI引领芯片设计的下一场革命
随着芯片设计和制造的复杂度与日俱增,AI正在给半导体行业各领域都带来新的变革,AI在设计工具的应用也在呈指数级增长。
工欲善其事,必先利其器。AI与EDA的双向奔赴,使得众多芯片开发团队能够深入和广泛地利用AI工具的优势,开发者因此能够创造出更加复杂的芯片,成为大算力时代的必然之“器”。
庄定铮告诉集微网,实际上新思科技从几年前就开始大力投入对AI工具的研究。一方面将AI技术持续引入到当前的各种EDA工具中,以提高生产力;另一方面,通过AI来帮助人类提高决策效率。将AI技术与EDA工具结合带来两个核心价值,首先是使EDA更加智能,减少芯片设计流程中一部分重复且繁杂的工作,让开发者可以在相同甚至更短时间内设计出功耗、性能和面积(PPA)更好的芯片;其次是大幅降低使用门槛,解决人才短缺的挑战。
目前,新思科技已经构建了三大王牌“利器”,帮助芯片开发者应对严峻的设计挑战:Fusion Compiler, DSO.ai和DesignDash,庄定铮将其描述为“数智时代护航芯片设计生产力最大化的‘三驾马车’”。利用这三大王牌工具,开发者无论是在RTL早期开发、中期迭代,还是后期PPA冲刺阶段,都可以最大化提升效率,结合人类智慧和机器智能以释放设计潜力,开拓开发者的设计思维,实现更好的芯片设计、更快的上市周期。
其中,DSO.ai新思科技于2020年推出的行业内第一个用自主AI系统帮助客户进行芯片设计的解决方案。藉由融合设计+DSO.ai,让开发者用AI系统做芯片开发设计,达成最佳效果,并缩短芯片设计流程和推向市场的时间。DSO.ai面市短短一年内,由AI设计的商业芯片在数量上至少增加了一个数量级,新思科技预测其客户利用AI帮助流片的设计将从今年的数百个增加到2023年的数千个。DSO.ai的第一批用户对这一工具的实际使用效果纷纷点赞。在今年3月份召开的新思科技全球用户大会(SNUG)上,英特尔就重点介绍了 DSO.ai 如何成功协助其最新至强XEON微处理器芯片将总功耗降低6%, 微软也分享了将DSO.ai 应用到从早期设计探索到最终优化的整个设计流程中之后,总功耗比最佳专家流程还低了3%。在DSO.ai的协助下,意法半导体在其首个Cortex-A510 的早期设计探索期间实现 3 倍的生产力提升,有效地覆盖了1025种不同组合的搜索空间。
随着DSO.ai在越来越多的AI芯片设计开发中得到实践,新思科技在今年四月进一步推出了全球首个全栈式AI驱动型EDA解决方案Synopsys.ai,让开发者第一次从系统架构到设计和制造、在芯片开发的每一个阶段都可以采用AI技术,并从云端访问这些解决方案,最终达到降本增效,并缩短产品开发周期的优异成果。
据庄定铮介绍,完整的Synopsys.ai解决方案将覆盖先进数字与模拟芯片的设计、验证、测试和制造环节,现已搭载物理实现解决方案(DSO.ai)、功能验证解决方案(VSO.ai)和芯片测试解决方案(TSO.ai),未来还将推出更多功能,并针对模拟电路设计进行优化,目标到2024年覆盖全流程,最终“让IC设计每阶段都能用上AI不是梦”。
目前,全球十大半导体企业中已有9家公司采用了Synopsys.ai解决方案,持续夯实新思科技在AI驱动芯片设计的全球领导者地位。在每个芯片开发项目中,该解决方案的AI引擎持续在不同的数据集上进行训练,随着时间推移,其优化结果的能力将持续提升。
据瑞萨电子、联发科、台积电等首批客户反馈,Synopsys.ai成功帮助其提高芯片性能并降低成本,并将产品开发周期缩短了数周;在协助客户执行定制级模拟模块的工艺制程设计迁移时,提高生产效率并加快设计收敛;帮助客户在减少功能覆盖盲区方面实现了高达10倍的优化,并将IP验证效率提高了30%等。
AI成为耗电大户,如何实现双碳目标?
随着“百模大战”开打,也有一些声音在探讨AI大模型的所需的能源消耗,已经堪比加密货币挖矿。数据显示,过去十年,我国数据中心整体用电量以每年超过10%的速度递增。而IDC预计,到2024年数据中心耗电量将占到全社会耗电量的5%以上;到2025年,全球数据中心占整个全球用电量将要提升到全球的20%。
随着AI领域实现突破性进展的深度学习模型,其规模越大,能耗水平也迅速攀升。华为AI首席科学家田奇在近日一场AI大模型技术论坛上强调,大模型训练成本中60%是电费。根据斯坦福人工智能研究所(HAI)发布的《2023年人工智能指数报告》,训练像OpenAI的GPT-3这样规模的人工智能模型所需消耗的电力,足可以让一个普通美国家庭用上数百年了。GPT-3是目前大模型中有据可查的第一大“电老虎”,耗电量高达1287兆瓦时。
如何解决发展AI与双碳目标之间的矛盾?庄定铮看来,AI既是一个问题,也是一个解决方案。AI设计工具可以更好地优化AI处理器芯片来提高能效,从而直接帮助全球为实现净零排放而努力。
“如今新建的超大规模数据中心所使用的服务器相比以往越来越省电,《Nature》上发表的一份报告显示,传统数据中心的电源使用效率(PUE)(即所需的总能量除以用于计算的能量)约为2.0,而超大规模数据中心则约为1.2。在此趋势下,我们还可以通过在能源输送、电子系统设计、芯片技术、供应链运营几个关键领域采用更可持续的做法,来实现更好的节能成果。”
即通过更节能的方式,更低碳的过程,来设计、制造更低能耗的芯片及系统,以实现整个半导体生命周期的双碳目标。
庄定铮提出,首先,AI专用芯片相比CPU、GPU等芯片在处理AI运算的功耗表现上远胜于后者,因此,AI专用芯片的大规模使用,将有助于降低数据中心的能耗水平。诸如新思科技的AI设计工具有助于帮助这样的AI专用芯片提升PPA(性能、功耗和面积)表现;其次,EDA工具在AI技术的加持下,大幅缩短了芯片开发流程、周期和人员投入,也就意味着整体消耗能源的降低。
对此,新思科技最近开展的一项非正式研究表明,利用AI设计工具优化AI芯片,整体上平均可以节省约8%的能源。例如,DSO.ai自主AI芯片设计应用等技术使用强化学习来从功耗、性能和面积方面改善芯片;结合使用低功耗IP解决方案组合还可以帮助降低芯片功耗,同时加快产品上市;芯片生命周期管理(SLM)提供用于监控和分析的片上传感器,可以在功耗方面生成切实可行的见解。
具体到细节,新思科技的数据显示,通过利用新思科技从架构到签核的整体性软件驱动方法,芯片开发者们能够实现超过50%的能效提升。其中,通过动态电压频率调整(DVFS)、电源域和电压岛等电源管理策略选择可以带来显著的节能效果。除了这些策略外,功耗与性能的宏架构权衡,以及IP选择和权衡,可以节省30%至50%的电能;通过时钟、数据、内存和毛刺功耗的微架构权衡有助于实现节能,查找和修复RTL电源块以及使用工具引导的时钟门控、数据门控和内存大小调整也是如此,可实现15%至30%的节能效果;通过在动态和泄漏功耗、电源完整性与PPA的权衡,以及功耗感知测试码生成等领域采用自动优化技术,可实现10%至15%的节能效果;通过采用以签核为中心的方法实现功耗和电源完整性目标,再加上动态和泄露功耗回收以及非常精确的工程变更命令(ECO)更改,可实现5%至10%的节能效果等等。
在以底层技术推动芯片行业的“低碳化”的同时,另一方面,新思科技也正直接参与到能源行业的数字化转型中,把芯片设计中的“降低能耗”的技术和思路迁移到传统能源领域,直接投入到低碳化事业当中。
人类如何与AI一起拥抱未来?
AI正在给半导体行业带来新的变革机遇,助力开发者创造出更加复杂芯片——这在没有AI辅助的情况下是无法实现的。AI将开辟超乎想象的未来,让我们能够比现在走得更快,做得更多。当然,也带来不同的声音和质疑:AI是否将取代人类?
“就当前而言,AI不会取代人类,但是可以成为人类工作、生活的‘助手’,因而特别适用于那些需要大量重复、耗时的任务,具体到芯片设计流程中,就是数字实现、验证和测试环节。”庄定铮指出,“至于最前端的系统架构创新,以及后端的签核、检查工作,前者需要更多的创意,也有更大的研发潜力,后者需要确保错误和bug能够及时发现甚至零错误,这些流程仍将需要极大的人力工作,并不能走捷径。”
由于芯片设计客户对于数据隐私性与安全性考虑,新思科技提供的AI解决方案并非经过预训练的模型,需要客户使用自己的设计数据从0开始训练。“基于新思科技的强化学习(Reinforcement Learning, RL)引擎,客户只需执行一次完整流程就可得到一个基本可用的模型;执行第二次时就可沿用第一次执行时所产生的数据,并且算力相比第一次执行就能减少3~4倍。” 他解释,“第二次运行后所需的算力就能降到一个平稳的水平,第三次就已经处于一个很低的水平,所以这个AI工具会越用越‘聪明’,越用越有效率。”
值得注意的是,驱动Synopsys.ai解决方案所需的算力本身并不高,但是在这个工具运行过程中会调用众多的EDA产品,所以对于整体EDA软件所需的算力在短期内是成倍增加的。“比如,客户所需的EDA算力可能从以往需要三台计算机运行半年,变为一次性需要30台运行两个星期,”庄定铮解释,“虽然看起来提高了客户前期的算力投入成本,但如果拉长到整个项目周期来看,客户所获得的收益远远大于投入。”
这样的算力成本架构变化,使得新思科技正积极探索通过结合云服务的方式,让全球广大的中小芯片设计客户也能享受到Synopsys.ai这一强大的工具带来的生产力提升。
辩证来看,AI在替代掉一些重复性的工作的同时,也催生了新的工作岗位;在芯片领域,尽管它固然有能源与成本增加的问题,但我们也看到了在芯片设计和验证流程中扩大AI使用可以为芯片成果和生产力带来的显著优势,并最终能够带来极大的能耗和成本降低。
“当今充满挑战的宏观经济形势下,人们对使用AI处理重复性更高的芯片设计任务的兴趣不断被激发,以便开发者可以专注于他们最擅长的事情——创新,包括应对不断提高的PPA需求,控制芯片设计成本和供应链漏洞,推动芯片设计的持续创新等。”庄定铮强调,“变革总会以不同形式带着创新的技术来改变当下的生活方式。我们可能会看到许多传统行业被颠覆,但同时也会涌现出许多新的机会和行业。因此,企业和个人都需要具备适应力和创新力来应对、拥抱这种变革。”
未来,新思科技将继续投资人工智能,助力芯片开发者提高生产力,并利用现有资源加快设计和验证周期。新思科技将不断开拓AI赋能EDA工具之路,加快芯片创新和AI技术的不断进化,为人类带来更智能的产品和生活,也让世界更“绿色”,更美好。(校对/萨米)