NVIDIA (NVDA US) GB300 Power System – An Overview of new PSU, BBU, and Super Capacitor Design
继上一篇文章讲解了英伟达GB200 的power system design之后(Is Monolithic Power System (MPWR US) a Short? – The GB200 Power Module War),今天笔者继续为大家来讲解下一代GB300的power system,以及最近投资人比较关注的BBU和超级电容。
首先我们要知道,Battery Backup Unit (即BBU)和超级电容共同组成了GB200/300 rack中的Energy Storage Tray, 并与power shelf vendor为同一供应商(即Delta, Lite-on以及麦格米特)。BBU可以简单理解为之前数据中心用UPS(uninterruptible power supply)的进阶版,但与使用铅酸电池的UPS相比,使用锂离子电池的BBU有着以下的优势:1)预期使用寿命为5~10年,是铅酸电池的2~3x;2)体积能做的更小更紧凑,一颗BBU占用的空间比UPS少50~70%,重量则轻50~60%,因此更适合用于in-rack solution,或即便放置在机柜旁的side car上也为寸土寸金的AI data center节省出了更大的使用空间;3)能更快速充电,充电速度可以达到UPS的5x,因此英伟达自然选择了BBU作为其新的备用电源系统。而超级电容的出现则是因为CSP客户在测试GB200系统时发现power shelf在实际使用过程中有时会出现电压不稳定的情形,为了在电源突然加减负载的时候对power shelf的电压波动进行稳压,英伟达新引入了超级电容进Energy Storage Tray。目前BBU和超级电容在GB200 rack都是选配部件,但到了GB300 rack则会正式成为标配。
笔者在上一篇介绍GB200电源系统的文章中讲过,一个标准的GB200 NVL72 rack配有6排power shelf(其中机顶放3排,机底放3排),每排power shelf包含6个PSU,总共6 x 6 = 36个PSUs。而英伟达目前的reference design中则推荐每排power shelf搭配一个BBU shelf,平时power shelf给其所对应的BBU shelf充电,在突发停电时BBU则可以快速响应,代替power shelf输出48V的直流电(见下图),为服务器备份数据提供宝贵的时间窗口(通常BBU可提供备电5~7分钟):
BBU模组本身则有3kw, 5.5kw, 12kw等几种不同的规格,通常以6个BBU模组组成一个BBU shelf (见下图一)。微软在其最近的announcement中(New Microsoft Azure NVIDIA GB200 Systems Shown)就展示了其搭载了5颗BBU模组的NVL36 GB200 rack(见下图二):其中左侧为NVL36 GB200 rack,右侧为搭配的side car,右下图红圈处即为BBU shelf。其中BBU模组微软应该采用了目前市面上高阶的12kw BBU(见下图三),因此一台NVL36 rack只需要配备60kw / 12kw = 5颗BBU模组即可。上文提到,BBU shelf统一由power shelf供应商供应,但其中的锂电池模组实际上是由power shelf供应商外包给台湾的顺达和AES生产,其中顺达为主供。
在接下来的文章中,笔者将会介绍明年下半年计划推出的GB300中的power system design的变化,以及相对应的BBU和超级电容的价值量测算。
Keep reading with a 7-day free trial
Subscribe to 海外科技股研究 to keep reading this post and get 7 days of free access to the full post archives.