之前回答一个问题,做了一点计算和分析,所得到的结果颇为出人意料:当进行SHA-256哈希运算(比特币矿机所擅长的计算)时,一台普通的神马M20矿机就能比“天河二号”还快了,更不用说更先进的矿机,如蚂蚁S19/S19 Pro。
一台矿机竟然比超算还快?或者说,一台超算(当前世界排名第四)在进行某些运算时还不如一台普通的矿机?
是这样的。
矿机比超算还快
首先要说,这二者其实没有多少可比性。一个专用、一个通用;一个微小、一个庞大。
“天河二号”造价超过一亿美元,占地720平方米,使用超过8万颗Intel Xeon CPU,包含三百多万个计算核心。可用于完成各种计算。
蚂蚁S19比特币矿机:小小的个头,售价一万多元。具备强大的SHA-256哈希算力,只能用于比特币及相关币挖矿。
所以,只能对比这两者的SHA-256哈希运算速度了:
蚂蚁S19矿机:其SHA-256运算速度可达95TH/s,也就是每秒可完成九千五百万亿次哈希运算
天河二号:每颗12核Intel至强CPU可提供约400MH/s算力,八万颗Intel至强CPU(12核及57核两种CPU)共能提供最大52TH/s,也就是每秒可完成五千二百万亿次哈希运算,实际上由于多核调度关系,还未必能达到这一峰值速度
所以,是的,一台一万多元的矿机,在进行特定哈希运算时,速度比一台数亿元的超级计算机还快!
那么,矿机为什么能这么快呢?
为什么能这么快
矿机的结构并不复杂,能算这么快,靠的是大量的专用芯片。
比如蚂蚁S19 Pro使用了大量的自研芯片 BM1398运算芯片。一台矿机有三块算法板,每块算法板上安装了114颗运算芯片。一台矿机就有342颗芯片并行提供算力。
BM1398芯片是采用台积电7纳米工艺生产的,由于该芯片的架构和数据保密,我们只好用一些开源信息来进行估算。
github上有一个开源的SHA-256哈希运算模块,提供Verilog源代码,当使用40纳米工艺实现时,此模块可以达到250MH/s(和一颗8核的至强芯片差的不多了),而所占用的面积只有0.0142平方毫米。如果在一颗芯片中排布100个SHA-256运算模块,面积还不到2平方毫米,而性能已经达到了25GH/s(没有计算连接、总线等面积开销)。而这仅仅是40纳米工艺而已。
举这个例子是想说明:芯片中真正用于计算的部分很少,绝大多数资源都消耗到了调度、管理等辅助功能上。
当我们所用的功能清晰、明确时,就可以使用专用芯片极大的提高运算速度。比如各种数字币挖矿(大量的哈希运算),比如4G和5G通信(大量的卷积运算),比如人工智能(大量的卷积运算)
专用芯片的性能往往超过我们的想象,而我们芯片的发展,也完全可以利用这一点。如果能降低芯片的流片成本,也未必不能复制PCB(印刷电路板)的发展历程。要知道,现在全球的PCB设计和生产,中国都占了一大半的份额,又有谁有本事卡脖子呢?