近年来,随着晶体管数量的显著增多、RC寄生参数指数级的增长,IC设计的复杂度越来越高,与此同时还要应对Time to Market的效率压力。而IC设计中,65%以上的时间都用于仿真,亟需高性能仿真平台应对以上挑战,存储作为EDA仿真平台的重要环节,在容量、性能需求上也紧跟摩尔定律,面临着容量及性能的爆发式增长挑战。
EDA仿真主要分前端业务和后端业务。不同的设计企业划分上略有不同,但是业务特点总体一致。前端业务,主要以RTL编码仿真为主,数据特点基本都是KB级别的小文件,并且主要是8KB左右的文件为主,超过60%以上都是元数据读写,这类场景针对存储的要求就是更高的OPS性能诉求。后端业务,主要以综合优化仿真、编译网表及网表测试为主,主要是GB级别的大文件写场景,这类场景对存储性能要求带宽更高。
目前IC设计企业在存储选型和使用上,主要存在以下几个问题:

● 采用服务器本地盘的方案,这种方案常常因为不同的项目组之间资源无法调度、无法共享,造成资源利用率低,投资浪费的情况。并且EDA多为temp临时文件,这些临时文件增长非常迅速,服务器本地盘无法扩容,容量受限爆盘导致仿真任务失败。另外由于没有专业存储提供相关的数据保护特性,比如快照、配额流控等,易用性差,数据安全也无法保障。
● 采用一台存储搞定前后端的方案,这种方案形成混合型业务场景,既要高OPS性能又要大带宽,在EDA仿真平台内,存储常常会成为主要瓶颈。
● 专业存储如何规划使用存疑,比如存储层面如何确保仿真业务不中断,关键仿真任务如何高效的执行,数据的安全、容量规划等等。
高性能存储方案助力IC设计企业缩短EDA仿真周期
华为数据存储联合IC设计企业在EDA设计仿真过程中的业务诉求,通过系列化的优化,大幅缩短EDA仿真周期。
从存储层面针对EDA场景8项优化提升仿真性能30%+
● 针对海量小文件场景,通过小IO聚合满条带ROW连续写来优化IO性能,同时也提升了SSD寿命。
● 针对大量的元数据操作,通过多项核心算法,比如元数据的压紧算法,元数据的预取与淘汰算法等,提升元数据操作性能。
● 元数据和数据独立分区,有利于提升垃圾回收效率,消除性能瓶颈。
● 在硬件方面,华为数据存储专门用了DTOE的智能网卡,把协议从CPU卸载到网卡上,节约网卡缓存到缓存的拷贝时间。
● CPU需要处理读写IO、GC、快照等其他特性,把读写IO优先级排最高,这样可以保障读写IO的时延最低。
● 华为数据存储采用全局共享的分布式文件系统,基于目录均衡打散,消除控制器的瓶颈,支持自动迁移热点目录到空闲控制器上,实现自动负载均衡。
● 华为数据存储使用多核鲲鹏920 CPU,通过CPU智能分区,绑核处理,避免跨CPU核跨控开销,提升CPU的处理效率、降低时延。
● EDA场景会有大量删除Temp文件的操作,华为数据存储专门针对删除操作做了CPU绑核处理,专核专用,确保高负载情况下Delete操作不卡顿。
全闪存介质升级,能效优化降低整体TCO
存储介质主要分HDD机械硬盘以及SSD全闪存硬盘。以前大多数IC设计企业,会选择采用1.2TB左右的HDD机械硬盘,通过好几个硬盘柜来堆存储性能,但是这样会导致机房空间、功耗大幅增高。目前越来越多的IC设计企业,尤其是一些先进制程的设计企业,为了性能需求会选择SSD全闪存存储。
从投入产出比看,SSD应用可以大大降低企业的运维成本,相比于传统存储需要配置几十个磁盘机柜、上万块HDD磁盘,SSD只需要几个机柜即可;SSD不仅在空间需求上优势明显,在能耗、运维成本上也非常突出:相对于HDD,在相同的容量下,SSD的电力能耗降低70%,空间占用节省50%。在存储系统中每更换1块SSD,带来的节能减排效果,相当于种了150棵树,以及3360个普通家庭熄灯一小时。
存储层丰富的企业软件特性,帮助IC设计企业更好的管理数据提升效率
华为数据存储提供了很多丰富的软件特性,帮助IC设计企业更好的管理数据,提升工作效率。有些IC设计企业会有多个项目,但是只买了一套存储,项目组之间的数据为了信息安全又不想被看到,那么我们用多租户的特性,来确保数据安全隔离。
EDA仿真临时文件较多,如果不做及时删除,存储空间就会被快速消耗掉,影响到其他用户,这个问题可以通过设置配额的方式来解决,确保存储空间的有效利用。有些关键仿真为了不被其他任务挤占掉存储性能资源,会特别设置一个关键VIP任务的最低性能要求,来确保仿真任务高效完成。
海量小文件一直都是EDA仿真场景的最大难题,华为数据存储不是通过备份软件对应用层扫描的方式来备份,而是通过底层的快照技术和异步复制技术,来做到Disk to Disk的快速备份,可以有效提升几倍甚至十倍的性能提升。
存储层四级可靠为EDA仿真平台平稳运行保驾护航
● 永远在线的方案:通过业界唯一的NAS Active-Active双活解决方案,确保单套存储故障时不会影响生产。
● 永远在线的系统:通过RAID TP可以容忍3块硬盘同时失效,另外全闪存储重构1TB时间只需要15分钟,解决块硬盘不影响生产的问题。
● 永远在线的架构:通过Smart Matrix全互联架构和独有的SMB Failover功能,可以容忍单套存储系统内单个引擎故障或者7个控制器故障,业务不中断。
● 永远在线的SSD:通过全局磨损与反磨损,来提升SSD的使用寿命,降低IT运维人员压力。
结语
IMEC(微电子研究中心)在未来峰会上发布的最新报告显示,2036年左右将实现0.2nm的工艺,摩尔定律仍将持续,半导体企业将会面临更复杂的设计及更长的仿真验证时长。从模块设计开始,回归验证、综合、后端布局布线、物理验证、功耗分析等等,每一步都是要靠EDA仿真平台,不断的验证求解、Debug最终才能很好地开发出来。
作为EDA仿真平台重要的一环,华为OceanStor存储,基于深厚的行业Knowhow,融合多家头部半导体企业的实际使用诉求,帮助企业缩短EDA仿真周期,做最好的EDA仿真数据底座,实现半导体产品更快的TTM(Time to market)。