Speedster®7t FPGA是Achronix公司2019年推出的创新性FPGA系列产品,旨在满足人工智能/机器学习(AI/ML)和高带宽数据加速应用日益增长的需求。Speedster7t FPGA采用台积电(TSMC)的7nm FinFET工艺制造,它基于一种高度优化的全新架构,具有一个革命性的二维片上网络(2D NoC)和一个高密度机器学习处理器(MLP)模块阵列。通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA +”技术。
本文详细介绍了Speedster7t FPGA的特性和功能,欢迎您阅读,以进一步了解该产品。您也可以在Achronix微信公众号的“产品介绍”栏目中随时阅读本文。
针对高带宽工作负载进行优化的一类全新FPGA
基于台积电(TSMC)的7纳米工艺技术
800K至5.7M的等效逻辑单元(LE)
嵌入式存储器容量高达385Mb
多达16个GDDR6通道,可提供高达4 Tbps的存储器带宽
多达72个SerDes端口,支持1-112Gbps的数据速率
多达4个400G以太网端口(4× 400G或16× 100G)
多达4个PCIeGen5端口,支持16通道(×16)和8通道(×8)配置
革命性的全新二维片上网络(2D NoC)布线结构从根本上改变了FPGA的设计方法
全新的、灵活的机器学习处理器(MLP),针对人工智能/机器学习(AI / ML)功能进行了优化:
- 在Int8整数格式下,可提供多达41K的乘累加单元(MAC)和高达134TOPS的运算能力
Achronix的Speedster®7t系列是一种革命性的FPGA架构,它经过了高度优化以满足人工智能/机器学习和高带宽数据加速应用日益增长的需求。Speedster7t FPGA系列产品专为这些高带宽工作负载而设计,具有一个革命性的全新二维片上网络(2D NoC)和一个针对人工智能/机器学习进行优化的、高密度的机器学习处理器(MLP)阵列。通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA+”技术。对于高性能计算、机器学习和硬件加速而言,至关重要的是在片内和片外传输数据的能力,无论是支持输入和输出的数据流,还是存储/缓冲这些数据。Speedster7tFPGA的架构可支持前所未有的带宽。112 GbpsSerDes
Speedster7t器件拥有多达72个业界最高性能的SerDes接口,可在1-112 Gbps的速率上运行。
PCI Express Gen5
Speedster7t FPGA配备了多个PCIeGen5接口,同时支持16通道(×16)和8 通道(×8)配置。PCIe控制器接口支持双重操作,既可以作为端点(endpoint),也可以作为根复合体(rootcomplex)。
以太网
每个Speedster7tFPGA都包括多个由8个SerDes通道和以太网MAC组成的以太网子系统,以支持广泛的应用。每个以太网MAC都具有很强的灵活性,可以支持总带宽高达400G的多个端口,同时每个SerDes通道都可以实现10G到100G之间的线路速率。高性能的以太网接口通过NoC连接到FPGA内部。
GDDR6
Speedster7t器件是唯一支持GDDR6存储器的FPGA,GDDR6存储器是目前可用的带宽最高的外部存储器件。Speedster7t FPGA具有多个GDDR6 SDRAM控制器端口,能够以可获取的最低DRAM成本(每存储位)提供最快的SDRAM访问速度。
每个GDDR6存储控制器都能够支持512 Gbps的带宽。因此,Speedster7t器件中多达8个的GDDR6控制器可以支持4Tbps的GDDR6累加带宽,并且以很小的成本就可提供与基于HBM的FPGA等效的存储器带宽。
DDR5
Speedster7t FPGA包括了DDR5存储器接口支持,以满足更深入的缓冲需求。PHY和控制器支持多种配置,例如印制电路板(PCB)上的各种焊接组件,UDIMM、SODIMM、RDIMM和LRDIMM模块,以及从4位到72位的位宽。PHY和控制器支持JEDEC规范定义的所有标准特性,并且与所有主要供应商的存储器均可兼容。PHY到硬件控制器的接口符合DFI 4.0规范,这使得设计人员可以用其软件控制器来替换硬件控制器。Speedster7t FPGA具有革命性的全新二维片上网络(2D NoC),旨在支持业界最高性能的接口协议。NoC还支持各种高速接口和存储器接口之间的直接连接。通过简单地针对任务配置NoC,一个主处理器可以直接从任意一个PCIe Gen5接口将数据传输至任意一个GDDR6或DDR5存储控制器。在这个应用案例中,没有用到FPGA的可编程逻辑,因为NoC可以管理所有事情——这次数据传输不需要FPGA阵列内的可编程互连。NoC使用一系列高速的行和列网络通路在整个FPGA内部分发数据,从而在整个FPGA结构中以水平和垂直方式分布数据流量。NoC中的每一行或每一列都有两个256位的、单向的、行业标准的AXI通道,可以在每个方向上以512 Gbps的传输速率运行。每个Speedster7t器件都具有大量的可编程数学计算单元,这些单元被集成至全新的机器学习处理器(MLP)模块中。每个MLP都是一个高度可配置的计算密集型单元模块,具有多达32个乘法器/累加器(MAC),支持4位到24位的整数格式和各种浮点模式,包括对Tensorflow的Bfloat16格式以及可显著提高性能的高效块浮点格式的原生支持。MLP模块包括紧密集成的嵌入式存储器模块,以确保机器学习算法将以750 MHz的最高性能运行。这种高密度计算和高性能数据传输的结合造就了一种处理器结构,该结构可提供基于FPGA的最高可用的TOPS级别运算能力(TOPS即Tera-OperationsPer Second,每秒万亿次运算)。
为了应对第三方攻击的威胁,Speedster7t FPGA配备了最先进的比特流安全保护功能,它们具有的多层防御能力可保护比特流的保密性和完整性。密钥是基于防篡改物理不可克隆技术(PUF)进行加密的,比特流由256位的AES-GCM加密算法进行加密和认证。为了防止边信道攻击,比特流被分段,每个数据段使用单独导出的密钥,且解密硬件采用差分功率分析(DPA)应对措施。此外,2048位RSA公钥认证协议被用来激活解密和认证硬件。用户可以确信的是当他们加载其安全比特流时,它是预期的配置,这是因为它已通过RSA公钥、AES-GCM私钥和CRC校验进行了身份验证。从设计验证到比特流生成和系统调试,Achronix的ACE设计工具现在可以为Speedster7t FPGA提供全面的支持。设计人员可以使用功能强大的布局规划工具(floorplanner)进行设计优化,并且在进入时序驱动的布局布线之前为所有设计模块实例分配区域或位置。ACE还包括一个关键的路径分析工具,可以分析时序以确保设计符合其性能要求。设计人员还可以使用ACE强大的Snapshot嵌入式逻辑分析器来创建复杂的触发条件,并显示在Speedster7t器件中运行的信号。
经验证的、可向低成本ASIC转换的途径,用以满足大批量需求Achronix是唯一一家既提供独立FPGA芯片又提供嵌入式FPGA(eFPGA)知识产权(IP)的公司。Achronix在Speedcore™ eFPGA IP中采用的技术与其在Speedster7t FPGA中所使用的一样,可支持从Speedster7t FPGA到ASIC的无缝转换。FPGA应用通常具有一些必须保持可编程性的功能,而其他功能则是专用于特定系统应用的固定功能。对于转换为ASIC而言,固定功能可以被固化进ASIC结构中,从而减小芯片面积、降低成本和功耗。当客户使用Speedcore eFPGA IP将Speedster7t FPGA转换为ASIC时,有望节省高达50%的功耗并降低90%的成本。Speedster7t FPGA器件可提供从800K至5.7M的等效逻辑单元(LE)。支持包括Speedcore eFPGA和Speedster7t FPGA在内的所有Achronix产品的ACE设计工具现已可提供,Speedster7t FPGA芯片和基于PCIe的加速卡目前可以订货。
* AC7t1500 支持DDR4,其他器件支持DDR5
Achronix半导体公司是一家私有的、采用无晶圆厂模式的半导体公司,总部位于美国加利福尼亚州圣克拉拉市,同时提供高性能FPGA和嵌入式FPGA(eFPGA)解决方案。Achronix历来都是高性能FPGA市场向前发展的推动者之一。Achronix提供的产品包括可编程的FPGA结构,具有硬连线系统级模块的高性能、高密度独立FPGA,数据中心和高性能计算(HPC)硬件加速器板,以及支持所有Achronix产品的一流EDA软件。公司在美国、欧洲和中国都设有销售办公室和代表处,在印度班加罗尔设有一间研发和设计办公室。说明:Achronix、Speedcore和Speedster是Achronix半导体公司的商标。所有其他商标均为其潜在所有者的财产。所有规格如有变更,恕不另行通知。
联系方式:
邮箱:dawson.guo@achronix.com欢迎您扫码关注Achronix微信公众号,了解更多FPGA和eFPGA产品及应用信息: