继上一篇文章讲解了GB200 的PCIe 拓扑结构之后(Astera Labs (ALAB US) – How Large is the GB200 Content Opportunity?),今天笔者继续为大家来讲解GB200的power modules,以及最近投资人关心比较多的美股power management IC公司Monolithic Power System。
首先,我们要知道GB200的power modules分为AC-DC, 48V-12V DC-DC,以及12V-1V DC-DC三部分。
第一步,数据中心的交流电(电压通常在180V-305V之间,不同国家的AC电压有所不同)通过GB200 racks上的PSU(power supply unit)先转换为了48V的直流电。一个标准的GB200 NVL72 rack会有6排power shelf,其中机顶放3排,机底放3排,每排power shelf高度为1U(见下图)。每排power shelf包含6个PSU,所以一个rack总共有6 x 6 = 36个PSUs。每个PSU提供5.5kw电力,所以总共提供5.5 x 36 = 198kw的电力。PSU的供应商主要为Delta Electronics(主供)和Lite-On。中国的麦格米特也有在验证中。
看到这里也许有些读者会有疑惑:我们知道一个GB200 NVL72 总耗电量为120kw,那为什么一个rack要配备5.5 x 36 = 198kw的PSU呢?原因在于这里每个PSU的5.5kw其实指的是单个unit的最大负荷值,在实际使用过程中,出于冗余设计的考量,一般按最大负荷值的50~60%来配备,因此耗电120kw的GB200 NVL72就需要配备198kw的PSU了。
第二步,48V的直流电进到每一个compute tray之后,要先通过一个power module把电压下降到12V。这里有两种模块可以选择:在DGX server上英伟达使用的是IBC (intermediate bus converter)模块;而在最新的GB200 server上则使用的是PDB(power distribution board)模块。Delta Electronics在其最近一次的法说会上表示,公司在GB200的power module上lost content,其实指的就是这个IBC模块到PDB模块的转变。
简单来说,IBC (intermediate bus converter)就是一组DC-DC converter,传统的DGX server每个compute tray配8个IBC模块,一个IBC模块(~1kw)对应一个SXM module(即一张GPGPU),单价在~$60。B200的DGX server仍然会采用IBC模块,但单价会稍微贵一些(ASP~$70),因为要对应1.2kw的B200 GPU(vs. H100/H200只有0.7w)。台达电,艾默生,和伟创力是这个IBC模块的主要供应商。
到了GB200英伟达则采用了全新设计的PDB(power distribution board)。其中每个compute tray里面有一个8kw的PDB模块,每个PDB模块里面又由两个4kw的DC-DC converters组成(见下图)。一个PDB模块单价为~$250,由Renesas独供。Monolithic Power System一直想做进去PDB,但始终没有成功,原因后文会再详细解释。
讲完了PSU,IBC,和PDB,最后我们到了第三步,即Bianca board上面负责12V转1V的VRM(voltage regulator module)。这里的主供便是Monolithic Power System(MPS)。笔者会在下文中详细介绍MPS用在GB200 Bianca board上面的产品,content dollar,market share以及接下来所面临的竞争情况。
Keep reading with a 7-day free trial
Subscribe to 海外科技股研究 to keep reading this post and get 7 days of free access to the full post archives.