Astera Labs一直是多空双方激烈博弈的一只票:空头看衰其PCIe retimers在英伟达GB200中的用量减少(vs. DGX);多头则看好其最新推出的PCIe switch将帮助公司大幅提升content dollar。今天笔者就为读者朋友们来详细拆解一下Astera Labs在英伟达AI server中的content opportunity。
首先,笔者来讲解一下英伟达目前的DGX server中到底用了多少颗PCIe retimers和switches:我们知道,一个DGX server里有一张UBB(universal base board)板,上面放了8颗GPGPU,另外还有一个CPU board (被称为head node),上面放了2颗CPU。笔者根据供应链调研得知,一个标准的DGX server里会在UBB板上配置8颗PCIe Gen5 retimers (对应8颗GPGPU),以及在head node上配置8颗PCIe Gen5 retimers,对应UBB上的8颗retimers(有些MGX客户也会通过改动板子的layout来缩短数据传输距离,从而实现在head node上只放置4颗retimers,但标准版的DGX里是8+8 retimers的设计)。此外,一个DGX server里还配有2颗144 lane的PCIe Gen5 switch,用于连接CPU,GPU,以及CX7网卡。具体来说,每颗PCIe switch要连接1颗Intel或AMD的CPU,占用16 x 2 = 32 lanes;2张CX7网卡,占用16 x 2 = 32 lanes;以及4张GPGPU卡,占用16 x 4 = 64 lanes,总共占用了128 lanes,剩下的144 – 128 = 16 lanes英伟达没有规定配置,留给客户和整机厂家自由发挥(见下图,以AMD CPU DGX为例):
这其中,PCIe Gen5 retimers英伟达采用的是Astera Labs,一颗的量产价格在$30~35(取决于客户要的量多少);PCIe Gen5 switch则采用的是博通的PEX89144,一颗的量产价格在$400~450。
讲完了DGX server, 下面让我们来看一下英伟达GB200 compute tray的PCIe拓扑结构图:
这里大家可能有一个理解的误区:自从Astera Labs在OCP大会宣布其Scorpio PCIe Gen6 switch产品会用在GB200之后,有一些投资人误以为上图中蓝色的PCIe fanout switch即是这颗用在GB200里的PCIe switch。其实这只是一个PCIe Gen3 switch(16个uplink接Grace CPU + 18个downlink接USB/BMC/Boot/Debug network),用于管理compute tray里面的一些miscellaneous/peripherals设备,由美国analog芯片公司Diodes供应。英伟达标准版的GB200 reference design里面是没有PCIe Gen6 switch的,而只有采用非英伟达CX8网卡和/或采用非英伟达Grace CPU的hyperscalers客户才需要在GB200 compute tray里加装PCIe Gen6 switch。
我们知道,Astera Labs今年首先推出的是一款64 lane的PCIe Gen6 switch,用于连接compute tray里面的CPU/GPU/NIC/NVMe。笔者根据供应链调研得知,一张GB200卡需要对应使用2颗Astera Labs的64 lane PCIe switch,其中每颗PCIe switch要连接1颗CPU,占用17 lanes;1张NIC网卡,占用16 lanes;1张GPGPU卡,占用16 lanes;以及2个SSD(即NVMe),占用2 x 4 = 8 lanes,总共占用了57 lanes,剩下的64 – 57 = 7 lanes暂时闲置,不同客户可以根据自己需要自行配置(见下图):
一个GB200的compute tray有两张GB200卡,因此需要配置2 x 2 = 4颗这样的64 lane PCIe switch。此外,虽然标准版的GB200 compute tray因为CPU和GPU距离很近且是通过NVLink C2C连接,因此不需要再使用PCIe retimer,但如果hyperscalers客户采用based on FPGA的自研的NIC网卡,且NIC和NVMe是放在另外一块主板之外的extended board上的话,那就仍然会需要采用4颗PCIe retimers(对应4张NIC网卡)。
以上我们讲完了英伟达DGX和GB200的PCIe拓扑结构。在下文中,笔者将会介绍Astera Labs目前已经拿到的GB200 projects,以及测算其在GB200 中的content opportunity。
Keep reading with a 7-day free trial
Subscribe to 海外科技股研究 to keep reading this post and get 7 days of free access to the full post archives.