一早晨陈洋就在办公室里清洗数据,为深度学习程序的模型训练做准备。
清洗数据可不是用水洗,而是通过纠正和删除数据集中的错误、重复部分,以提高数据质量、去除冗余数据的过程。
主要对王奇裳提供的芯片设计方案进行分类和整备。
陈洋的芯片设计软件毕竟是初代品,对逻辑图和版图分辨能力差,陈洋要把版图数据剥离出去,只留下逻辑图。
芯片逻辑图是通过符号和线条等抽象的图形方式来描述电路的逻辑关系,类似于电路原理图。而版图则是利用实际元器件的大小和位置来展示电路的物理布局。
整个工艺流程陈洋是这样设计的:借助深度学习的方式,训练出会绘制芯片逻辑图的人工智能。
先有逻辑图后有版图,逻辑图抽象于概念,版图屈从于现实,把版图映射到物理描述层面,在芯片生产工厂将设计好的电路映射到晶圆上生产,经过封装测试,造出来实实在在的GPU,再焊接到PCB版子上,安装上mos管,显存,电容电阻,再装上换热结构,最后外壳一套,贴上信仰标,这就是一块显卡。
维尼也在同一间办公室工作着,他正在搭建的就是王奇裳提供的算力服务器。算力服务器就是专注于提供算力服务的高性能计算机,安装的是计算卡,算是显卡的一种,但是没有显示输出,也不会出现买显卡买到计算卡的问题,因为一般计算卡比同性能的消费级显卡贵很多。
王奇裳不仅为NOX小队提供了大量的图形芯片逻辑图和版图,然后还向临近的超威半导体研究所借来了算力服务器,早晨看着服务器运抵以后,这才匆忙飞回圣克拉拉硅谷。
维尼目前在把核心部件VegaFE计算卡一片片安装进服务器,再把服务器与服务器使用专用数据线连接,以实现数据共享和任务协同,他戴着防静电手环,小心精密地进行动作。
王奇裳的面子大得惊人,VegaFE配备了4096个流处理器,有16G的HBM2大显存,峰值单精度性能足足13.1 TFLOPS,17年6月27日发布,是2018年最快的HPC加速卡之一,通过桥接器可以将四块卡绑定在一起,搭配双路霄龙,实现八卡并行。
目前一共有8台服务器,陈洋敲了敲计算器,算力集群一共100TFLOPS。(秒万亿次浮点)
维尼把每一台服务器都连接到位,满头大汗地宣告算力集群搭建成功,陈洋的深度学习软件终于可以开始运转,他甚至有点迫不及待。
随着接电完成,程序进行算力调用,服务器里的双滚珠轴承工业风扇开始狂躁地轰鸣,声浪一浪接着一浪,办公室就像开了二十个电吹风,陈洋和维尼面面相觑。
“要不咱把它们推到隔壁吧,要不咱去隔壁工作——反正人和设备不能放在一起,噪音太大受不了。”维尼向陈洋建议着,陈洋立马从谏如流,放下手里的活站起身来活动两下,就和维尼一起搬服务器。
安顿利索,陈洋把数据陆续导入深度学习软件开始训练,这个过程被坊间称为炼丹,时间有长有短,几小时到几天不等,全看服务器算力大小,还有数据拟合收敛情况。
完成至关重要的一步后,陈洋终于长长地松了一口气,彻底放松下来。
他的全套生成式设计软件胜利在望!
人事已尽,余下的看天命!