加速创新成果转化,XSKY星辰天合存储平台“护航”芯片设计

2022年01月 · XSKY

天津市滨海新区信息技术创新中心(以下简称“创新中心”)顺应国家集成电路产业发展推进纲要而组建,依托于国家项目、政府基金和社会资本,以应用为先导,产学研结合,在引领信息安全和通信产业科技创新的基础上,开展高端技术研发和科技成果转化,研发世界领先的新型通信和信息安全芯片及产品。

该创新中心专注于科技成果转化,并在信息通信基础设施的“芯”变革中,聚焦芯片方面自主创新,实现“芯”突破打造“芯”高地开辟“芯”蓝海


微信图片_20220113103826.jpg


以创新中心主攻方向之一的交换芯片市场来看,其市场潜力巨大,自主可控替代空间广阔。其中,电子设计自动化(Electronic Design Automation)工具贯穿和衔接从设计、制造到封装的各个流程,某种程度上,可谓定义行业生产效率和产品技术水平的“命脉”。“用好EDA”尤其重要,更与产品上市时间、研发路线图计划等息息相关。因此,与EDA应用和流程相匹配,一套适用、好用、易用的IT基础架构至关重要。


IT基础:传统架构难以为继


芯片设计过程中,工程师需要不断地测试、验证和迭代方案,进行多频度、大规模的仿真测试。涉及编码前端设计后端设计流片等不同阶段,其数据存储模型各有特点,读写类型不一,对系统IOPS带宽等要求侧重点也不尽相同。

尚不论上述细分场景下的适配和调优,大部分EDA流程仍在采用单机本地存储架构,创新中心也不例外。这种方案在容量和性能扩展方面均受限制,并无法满足当前和未来业务发展所需。


微信图片_20220113103741.jpg


如上图所示,客户采用多台独立的x86服务器运行计算,每台计算节点将EDA处理的数据暂存到本地硬盘,最后由主节点对所有数据进行回收,再实施后续处理。计算任务在计算集群中被分割为若干个子任务,有些计算节点输入的数据可能存放在其他节点上,各节点的数据会多次读写本地硬盘。同时,各节点间的数据传输也会造成多余的网络风暴,严重拖累芯片设计效率,拉长产品交付周期。

单台EDA设计服务器计算资源有限,运行仿真分析任务时,经常会遭遇CPU性能瓶颈,执行效率低下,甚至可能因内存瓶颈导致进程崩溃。

大型的IC设计项目有多个子任务,任务之间需要共享数据,需要在不同节点之间多次拷贝数据,效率极低。

需要手动拆分任务,人工成本高、误差概率大且进展缓慢。

在使用容量已经不足的情况下,无法灵活扩展。


存算分离:面向未来


数据显示,即便在三年前,平均每设计一款芯片生成的数据量已经超过100TB。随着设计复杂度与日俱增,传统存储架构无法满足多任务、高并发协作的性能要求,且运维成本居高不下,管理工作耗时费力。

本质上,EDA设计应用对数据存储提出了包括多协议支持(标准文件协议+HDFS+S3等协议应对企业未来发展)、灵活扩展高性能强安全等在内的一系列要求。XSKY星辰天合帮助客户有针对性地革新,兼顾利旧并充分结合先进、适用的技术,打造一套适应当下且迎合未来发展需求的数据基础架构。


微信图片_20220113103748.jpg


星辰天合为EDA设计量身定制的高性能分布式文件存储方案采用存算分离架构,提供计算、调度、存储端到端整体方案,完美遵循适度超前、高可用和安全合规三大基本原则。

采用高性能节点组成计算集群,EDA设计软件在计算节点上运行。

在计算节点部署SGE调度平台(支持Vivado调度),进行多任务并行计算,任务按照芯片的功能模块粒度进行拆分,分发到所有计算节点运行,调度平台合理分配计算资源给客户端用户。

研发设计人员通过VNC等远程工具访问调度平台,进行作业任务提交、管理及波形状态查看等。

后端存储使用星辰天合高性能分布式文件存储系统XGFS,每个计算节点通过NFS协议挂载相同的存储空间。同时,研发人员也可以根据自身实际需要,挂载新的存储空间。

对于本地存储中的历史数据,通过X3DS无缝平滑迁移至星辰天合分布式文件系统。

微信图片_20220113103752.jpg


以高性能分布式文件存储系统XGFS为底座,创新中心成功搭建起强大、可靠的全分布式业务架构,覆盖临时数据(代码&执行脚本、fsdb文件、门级网表)和持久化数据(制造厂商Lib库、仿真用例集、IC版图)等各类数据模式和应用场景,无缝衔接EDA流程的各个环节。


八大收益,降本增效


星辰天合为创新中心设计的高性能存储方案采用存算分离架构,平台可以根据EDA不同阶段流程的具体应用场景,有针对性地匹配计算和存储资源。新平台支持计算和存储单独横向扩展灵活性佳,可满足中大规模EDA集群并行访问数据的需求。在保证高性能EDA数据访问的前提下,可将单个文件系统容量从TB级扩展到PB级。系统支持HDFS大数据接口,无需任何数据导出和迁移,即可帮助客户使用原有数据集,快速高效地开展Hadoop大数据分析。同时支持高性能EC(纠删码技术)、WORM(不可变存储)、快照配额整池扩容等企业级高级数据服务特性,满足芯片设计行业快速发展的需要。

项目实施后,高效满足创新中心EDA多任务并发协作等应用场景,大大提升了整体设计效率,同时实现了数据的统一存储,管理更加便捷,真正帮助客户降本增效

1)弹性扩展:软件定义架构,存算分离,支持容量和性能分别按需横向扩展。

2)支持高并发:告别性能瓶颈,解决过往仿真任务处理慢、进程崩溃重启等问题。

3)跨节点数据拷贝:统一命名空间,数据共享,提升数据副本流转使用效率。

4)端到端解决方案:分布式计算、调度和存储,将整体EDA研发效率提升50%

以上。

5)高性能EC存储:存储空间利用率提高100%

6)软硬件解耦:灵活选择,避免被硬件厂商锁定。

7)多协议融合互通:NFSCIFSFTPHDFSS3全部支持,无缝响应快

速创新。

     8)统一数据管理:将多工作区数据集中汇聚,提升系统运行效率并简化平台运维。

小小芯片,牵动全球数字经济的“神经”,更是数字新基建离不开的“国之重器”。在芯片研发设计的EDA主战场上,任何一点细微的创新或不足,其展现在市场竞争中的效果都可能呈无数倍放大。

时间就是一切,效率就是生命,一套适用好用前瞻的IT基础设施能帮助企业“事半功倍”,以更快、更强的姿态投入市场竞争,用强大的产品力说话。通过星辰天合量身定制的高性能分布式存储平台,创新中心团队得以更专注、高效地投入研发设计等核心业务之中,面向未来,加速创新成果转化