AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​

当前,AI已经成为推动企业创新和发展的核心技术。企业在积极探索AI应用的同时,不断增长的庞大数据量也给IT基础架构提出了更高的算力要求,解决算力难题成为企业优先考虑的问题。

近期,AMD正式推出了一款AMD Alveo™ V80 计算加速卡,此卡着重为计算密集型工作负载解决内存与带宽挑战。AMD自适应和嵌入式计算事业部( AECG )高级产品线经理Shyam Chander在接受记者采访时表示,AMD Alveo™ V80计算加速卡所具有的硬件灵活应变能力更加适用于内存密集型工作负载,为大数据集提供FPGA灵活性与HBM,基于AMD Vivado的工具设计框架能够很好地应用于V80计算加速卡,帮助用户更好地部署到生产系统中。

一款专为内存密集型工作负载提供灵活应变的加速卡

AMD Alveo™ V80 计算加速卡的设计初衷即是解决计算密集型工作负载时内存与带宽所带来的挑战。

据Shyam Chander介绍,在传统的计算密集型架构中,存储器和网络访问都非常容易形成瓶颈,其根本原因在于PCIe连接带宽有限,不能够满足海量数据的读写带宽要求。采用HBM的方式则能够很好地解决这一问题。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图1

从技术上来看,作为Versal HBM系列家族最大的一个器件,AMD Alveo™ V80 计算加速卡采用了7nm AMD Versal HBM自适应SoC,具备32GB HBMe、800GB/的带宽,能够提供260万个LUT的可编程逻辑,能够应对大规划数据的工作量要求。此外,该产品还拥有800G的网络带宽(4*200G或4*10/25/40/50G),采用QSFP56光纤模块,具备58GB/s的收发器。由于采用了集成型高带宽网络核心与加密引擎,产品还具备10890个DSP计算逻辑片,提供较之前代产品至高2-3倍的DSP 性能。而硬化与计算基础设施的连接能够实现轻松集成。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图3

在MCIO扩展端口上,AMD Alveo™ V80 计算加速卡采用PCle Gen5的接口,低时延具备32GB/s串行解串器。在存储器扩展方面,产品采用了32GB DDR4 DIMM扩展插槽,具备更强的内存扩展能力。

Shyam Chander表示,与上一代AMD Alveo™ U55C产品相比,AMD Alveo™ V80 计算加速卡在存储器带宽方面至高提高1.8倍,逻辑密度至高提高2倍,网络带宽从200GB每秒升至800GB每秒,至高提高4倍,在PCle带宽方面至高提高2倍。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图5

与传统架构的固定的缓存层次结构用于数据读取/写入和不规则访问模式的潜在低效率相比,AMD Alveo™ V80 计算加速卡所采用的自适应计算架构具备在计算附近分配内存,能够降低延迟和低功耗,同时还能够更加灵活地适应自定义数据类型和数据迁移。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图7

除此之外,AMD Alveo™ V80 计算加速卡还具备更高的安全能力。Shyam Chander表示,目前越来越多的企业重视网络安全方面的问题,都希望构建坚固的网络安全保障,以此来保护数据的安全,防止网络安全事件的发生。AMD Alveo™ V80 计算加速卡所采用的HBM可以用于缓冲和流量表的存储,能够与数据有更好地连接,更好地实现流量管理。另外,Versal芯片能够提供硬化的IP加密引擎,实现至高800G的内嵌 IPSec,因此具备更高的网络安全性能。

满足不同场景下的大规模加速内存密集型工作负载

作为一款高性能的计算加速卡,AMD Alveo™ V80适用于高性能计算、数据分析、金融科技、网络安全、AI计算、存储压缩等应用,能够满足不同场景下的大规模加速内存密集型工作负载需求。

Shyam Chander表示,无论是高性能计算场景下的基因组学、分子动力学,还是数据分析场景下的欺诈检测、医疗分析,亦或是AI计算场景下的推荐引擎、大语言模型等,所有这些工作都有一个相似的共性,他们都是计算和存储器密集型的工作负载。因此,借助AMD Alveo™ V80计算加速卡可以非常高效地实施这些工作负载。

在采访过程中,Shyam Chander还通过几个典型的案例应用,详细介绍了AMD Alveo™ V80计算加速卡在不同企业的应用情况。

例如在射电天文天线阵列的传感器处理场景下,需要15TB/s的持续传感器数据(131000个天线),利用420块AMD Alveo U55C卡工作负载进行传感器的实时数据传输与波束成型和连接器,该场景应用使用了DSP的工作负载。面对越来越复杂的工作负载,在有限的机架空间内需要迅速扩展计算资源。利用AMD Alveo™ V80计算加速卡,不但实现了3倍的算力提升,而且还降低的机架的使用空间。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图9

根据AMD的估算,在为传感器处理扩展算力的应用场景下,以往采用420块AMD Alveo™ U55C卡工作负载,21台服务器才能完成的计算任务,在采用最新的AMD Alveo™ V80之后,仅需要140张加速卡、14台服务器即可,至高可以降低21%的总体拥有成本(3年以上),至高能够减少66%的加速卡,至高可以减少33%的服务器数量,以及至高可以降低55%的功耗。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图11

在数据压缩场景应用中,10Pb数据存储,在没有进行压缩时需要55台服务器,1303个SSD驱动器,每年约427千瓦时的功耗。同样的数据规模,在采用AMD Alveo™ V80计算加速卡进行压缩后,只需要21台服务器,504个SSD驱动器,每年约233千瓦时的功耗,三年以上的总体拥有成本至高可以降低56%。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图13

在网络安全的应用场景中,新一代的安全解决方案需要在传统防火墙的基础上具备更好的功能。AMD Alveo™ V80计算加速卡能够提供硬化的IP包括加密引擎,可以实现至高800G的内嵌 IPSec,而HBM也用于缓冲和流量表存储来加强安全性能。

AMD推出AMD Alveo™ V80 计算加速卡:专为内存密集型工作负载设计,满足各种场景应用下的计算加速需求​插图15

“AMD Alveo™ V80计算加速卡由于面向传统的FPGA开发人员,因此除了拥有更高的计算加速性能之外,还为开发人员提供了Vivado设计套件,并支持定制和优化支持。”采用最后,Shyam Chander表示,AMD提供了用于快速启动项目的示例设计,可以简化Alveo硬件设计框架硬件的开发,强大的灵活性简化了系统集成难度,降低了产品开发周期,加速了产品的开发与部署。

本文来源于互联网,如若侵权,请联系管理员删除,本文链接:https://www.9969.net/25987.html

沫沫沫沫
上一篇 2024年7月23日 01:56
下一篇 2024年7月23日 01:56

相关推荐