一、发生了什么?——交换芯片正从“连接器”到“算力调度中心”
在传统的半导体投资框架中,交换芯片常被视为网络设备中具备“防御性”但缺乏“弹性”的配角。然而,随着AI算力集群从万卡级向十万卡级演进,经典的“木桶效应”开始显现:单卡算力不再是唯一的瓶颈,芯片间的数据搬运效率已成为决定集群有效算力输出的关键短板。
交换芯片,这一负责数据报文高速转发与调度的核心元器件,正处于这场算力瓶颈突围战的最前线。它以占交换机BOM成本超过30%的价值量,决定了整个集群的带宽上限与时延下限。
在传统云计算时代,交换芯片主要承担“连接”功能,保证数据包在服务器间的尽力而为传输。然而,在AI时代,其角色发生了本质性跃迁。
解决“通信墙”困境:AI大模型的训练涉及海量的参数交换与梯度同步,具有典型的“低熵+突发”特征。网络通信一旦出现拥塞或延迟,昂贵的GPU计算单元将被迫闲置等待。交换芯片通过其内置的大容量缓存、无阻塞交换架构及先进的拥塞控制算法(如RoCEv2、自适应路由),直接决定了计算与通信的重叠效率。在这个层面上,交换芯片已不再是外围器件,而是与GPU并列的算力核心底座。
异构互联的“胶水”:英伟达对Marvell的20亿美元战略投资揭示了行业趋势——未来的AI算力集群将是GPU、XPU、DPU共存的异构生态。交换芯片凭借其标准化的以太网协议或开放的专用互联协议(如NVLink Fusion),成为连接不同算力单元、实现内存语义直接访问的调度枢纽。
(以上图片表明英伟达在大模型时代统治算力市场的核心底牌是通过 NVLink(高速互联技术)与 NVSwitch(物理交换芯片),在服务器/机架内部实现“把多张 GPU 变成一张超级巨型 GPU”的 Scale-Up方案。)
二、 为什么重要?——产业逻辑的重构:Scale-up与Scale-out的双击效应
如果说过去十年交换芯片的增长是线性的,那么AI驱动的增长将是指数级的。其核心逻辑变更为“横向扩张(Scale-out)”与“纵向聚合(Scale-up)”的双轮驱动。
……