找回密码
 注册
搜索
查看: 12|回复: 0

Astera Labs 两天 +33%—,铜进光未必退。彻底搞懂下一个千亿级别 GPU 互联推理布局

[复制链接]
发表于 2 小时前 | 显示全部楼层 |阅读模式
Astera Labs 两天 +33%——耗时一周万字深度解析,铜进光未必退。彻底搞懂下一个千亿级别 GPU 互联推理布局










我们是来自美国硅谷的投研团队,成员来自于斯坦福、UCLA、沃顿商学院的科技和金融背景。


























美研芒格君





@Kay2289123


·
6月24日










跟大家介绍一下。我在湾区一线科技大厂做 AI inference、training 和 tech lead,26 年创立投研团队管理成员毕业于斯坦福、UCLA、沃顿等顶尖学府  我的研究范围从硅谷中心出发,从算力、互联、存储三大板块为大家带来一手解读,拆解其中的相互依存关系。透过事情看本质,拆解被多数人忽略的机会
显示更多


































ALAB 代表的是推理时代的下个千亿市场的瑞士军刀,这篇文章耗时一周调研,帮你梳理清楚 ALAB 代表的机会和上下游产业,帮助你领先 99% 的人。

一、推理时代,正式来了



过去十年 AI 圈最重要的指标是「训练一个更大的模型」。但从 2025 下半年开始,一个临界点被跨过去了。

5.18 JPM 大会上,主持人 Harlan Sur 直接抛出这个判断:「2025 下半年发生了一个大拐点——推理工作量已经超过训练工作量。从那以后,推理还在以指数级速度增长。这创造了新的硅片机会、新的存储和内存层级、新的高性能 CPU 需求。」

这个转变对 ALAB 来说意义重大,它本身就是为这个时代被定位的公司。CEO 在大会上把推理时代的红利总结成三件具体的事——这三件事,正好对应 ALAB 三条核心产品线。

读完后你会理解:为什么 ALAB 每颗 AI 芯片旁边能卖出去的产品价值,从上市时不到 $100 涨到现在超过 $1,000,而且接下来还会继续涨。

二、CEO 在大会上讲的「推理三剑客」



ALAB CEO 原话:「我们的解决方案对训练和推理都适用。机柜级别已经成为训练和推理的统一计算单元。但推理工作量的变化,确实让我们看到了三个新的具体机会。」

机会 1:长上下文推理——KV Cache 内存瓶颈。场景:你给豆包上传一份 500 页的财报让它总结,或者跟它聊一整天的代码。这种「百万 token 长上下文」,GPU 要持续保存的注意力缓存(KV Cache)有几十甚至几百 GB。GPU 自带的 HBM 又贵又小,装不下。

随着上下文窗口变大,瓶颈从计算转移到内存。
这正是 Leo(ALAB 内存控制器)的长处——它是 GPU 和「远处大仓库」之间的门卫。Leo 已经从「通用内存扩展件」升级成「长上下文推理的专用件」,占据了推理市场的新机会。

机会 2:MoE 模型推理——全员对话,Scorpio X 的硬功夫。场景:今天最先进的大模型,几乎都是 MoE(专家混合)架构,比如 GPT-4、Claude、DeepSeek、Mistral。模型内部分成几十到几百个「专家网络」,每次推理只激活其中几个。但麻烦在于:你事先不知道哪个专家在哪颗 GPU 上。

MoE 推理工作负载有一个特殊的流量模式——它喜欢所有 GPU 跟所有其他 GPU 说话,因为你不知道下一个专家在哪颗 GPU 上。这就要求交换机能提供全双工对等带宽(意思是任何两颗 GPU 之间都能双向同时讲话)。Scorpio 家族就是从底层就为这种带宽设计的。
更关键的是 CEO 接着讲的两个特性——这两个是 Scorpio X 的真正杀手锔。

「超级广播」:本来 GPU No.1 要把消息发给另外 4 颗 GPU,得发 4 次。开了超级广播后,GPU #1 只发一次给交换机,交换机自己把消息转发给那 4 颗 GPU。GPU 省下来的 I/O 带宽可以拿去做更多计算。

「交换机帮你算」:N 颗 GPU 训练时各自算出梯度,然后要合并起来再继续。本来 GPU 要互相对发数据然后自己合并;现在各 GPU 把数据丢给交换机,交换机自己合并,再发回所有 GPU。把杂活从 GPU 上「卸」到交换机里,GPU 算力被释放。

这两件事在 MoE 推理这种「全员对话 + 频繁聚合」的场景下,带来的不是 10% 提升,是整柜 GPU 利用率的结构性跳变——同样一柜子 72 颗 GPU,跑同样的 MoE 模型,效率可以差好几倍。

机会 3:Agentic 推理——异构配置,PCIe 是「服务器的神经系统」。场景:Agentic AI,一个 AI 助手可能同时调用大模型、搜索向量数据库、执行代码、读写文件、调用 API。每种工作有最适合的硬件,大模型推理用 GPU、向量检索用 CPU + 高速存储,代码执行用通用计算。

Agentic 工作量带来很多不同的硬件配置组合。客户想把各种 SSD、GPU 等等混在一起。而 PCIe 真的是服务器的神经系统,我们在 PCIe 产品线处于领先位置。
这正是 Aries(接力员)+ Scorpio P(服务器内部调度员)的长处。每一台「混搭推理服务器」,都需要 ALAB 的产品来传话和调度。

三、CEO 亲口说的曲线——从 $100 到 $1,000+



我们上市时,每颗 AI 加速芯片旁边能卖出去的 ALAB 产品价值还不到 $100。今天在一些应用里已经超过 $1,000。再加上未来的光学产品,这个数字会大幅超过 $1,000。
这条曲线是这家公司商业模式最重要的一句话——NVIDIA、AMD、AWS 每出一颗新的 AI 芯片,ALAB 跟着卖出去的产品价值,是上市时的 10 倍以上。

但这条曲线要诚实拆一下:光学增量来源容易被误读。NVIDIA 自家的 NVL576 跨柜光化用的是自家 CPO + LITE / COHR 激光器(NVIDIA 上个月各砸 $20 亿股权投资这两家锁死供应)。这条线 ALAB 一点都赚不到。

ALAB 光学增量真正打的是非 NVIDIA 的多柜 scale-up:亚马逊 Trainium 多柜化、AMD MI500、UALink 阵营。

但值得注意的是:光引擎里 ALAB 真正赚到差价的只有自家硅 + 集成那部分(约 $100-200),激光器和光芯片代工基本是「过手收入」——这就是为什么 CFO 把长期毛利目标从 76% 降到 70%。

四、把六条产品线放进「推理时代」重新看



① Aries——每台推理服务器内部的「信号接力员」。现在的 AI 推理服务器里,GPU、SSD、网卡、CPU 七零八落塞在一起,各自之间要传数据。任何一段距离一长,信号就糊。Aries 就是夹在中间把信号「重新喊清楚」的人。

收入占比:公司最大产品线,粗算占 2025 全年收入 50% 以上。主要客户:亚马逊 Trainium、英伟达 Blackwell。主要对手:博通、Marvell。

② Scorpio P——服务器内部的「调度总管」。一台推理服务器内部塞了 8 颗 GPU、1 颗 CPU、好几块 SSD、几张网卡,大家同时要传数据。谁先发?走哪条道?谁等谁?Scorpio P 就是站在中间发令的调度总管。服务器内部硬件越花样,它越值钱。

收入占比:2025 全年约 15%(约 $1.28 亿美元)。主要客户:亚马逊(主)+ 英伟达(已确认)+ 2 家未公开大云。主要对手:博通(老一代占优,新一代被 ALAB 抢先)。

③ Scorpio X——千卡集群的「群聊总指挥」(增长发动机)。上面「机会 2」对应的产品。MoE 推理要让一柜子 GPU 互相问「专家在你这儿吗」——这种「全员同时找人」非常烧带宽。Scorpio X 的硬功夫,是让 72 颗 GPU 同时讲话不卡顿,而且能替 GPU 干杂活(超级广播 + 交换机帮你算)。

2026 一季度刚开始量产,二季度起出货 320 通道旗舰版。增长动能:到 2026 年末,Scorpio(P + X)成为公司最大产品线,X 超过 P。新市场规模约 $100 亿。主要客户:亚马逊 Trainium 4(主)、AMD MI500(2027);10+ 客户合作中。

④ Taurus——多机柜联动的「加压智能网线」。有些推理任务大到一柜子 GPU 不够用,要几柜子联手。机柜跟机柜之间 1-2 米,普通铜线传不过去,普通光纤又贵又费电。Taurus 就是「带加压器的智能铜线」——便宜、稳定、刚好够用。

收入占比:2025 全年估约 20%,全年增长 4 倍以上。低毛利(硬件模块)。主要客户:400G 这一代几乎只有亚马逊;800G「许多客户」未点名。主要对手:Credo(CRDO)——直接正面对刚。竞争压力:高。

⑤ Leo——长上下文推理的「内存仓库门卫」。你让豆包读完一本 1000 页的书然后回答问题,GPU 需要保存的「对话记忆」(KV Cache)有几十 GB,GPU 自己旁边的高速内存装不下。需要在远处租一个「便宜大仓库」,Leo 就是那个仓库的门卫。

收入占比:2025 全年估约 5%(最小一条线但加速)。毛利贡献:高毛利。主要客户:微软 Azure(ALAB 唯一一条主要客户不是亚马逊的产品线)+ 定制版 Leo 客户。

⑥ COSMOS——推理服务不能中断的「全栈监工」。推理时代有个特点是不能中断。你在跟 ChatGPT 对话,中间网线挂了重启 30 秒,体验就毁了。COSMOS 干三件事:提前几小时报警「这根线快挂了」;统一上报几百万条线的健康状况;真挂了自动把数据流绕开让推理服务不中断。

换掉 ALAB 的芯片 = 整套监控系统要重新搭——这才是 ALAB 真正的更换成本。这是 ALAB 76% 毛利能稳住的真正原因。博通、Marvell 在 PCIe 这条线上现在都还没有同样成熟的产品(领先约 18 个月)。

五、ALAB 跟光模块是替代还是合作?



读到这里你可能会有一个疑问:「我一直关注光模块板块(LITE、COHR、中际旭创、新易盛),那 ALAB 这堆 Scorpio、Aries、Taurus,是不是要替代光模块?」

答案:不替代,大部分是合作关系,只在一个未来的小区域里有交叉。

GPU 想给另一颗 GPU 发数据,可能走三种路径。路径 1:同一台服务器内部(几十厘米),走铜线,中间需要 Aries + Scorpio P。路径 2:同一个机柜里几台服务器之间(1-2 米),走 Taurus 智能铜线。路径 3:不同机柜、不同房间之间(几米到几十公里),必须用光纤。

光模块公司的主业是路径 3——长距离传话。ALAB 的主业是路径 1 和路径 2——短距离调度 + 信号清理。两者在大部分时候是「高速公路 + 城市街道」的关系。一条完整的数据传输路径,需要光模块 + ALAB 配合,少一个都不行。

未来 NPO / CPO 时代是唯一会重叠的地方。ALAB 通过 aiXscale 收购拿到了玻璃光纤耦合器这一小段。也就是说,ALAB 进入光引擎赛道,反而是 LITE / COHR 的好消息——它们的激光器卖得更多了。

六、那「路径 1-2」的铜线,会不会被光取代?



这是一个自然延伸出来的反问——既然大家都在猛推光学方案,那 ALAB 现在引以为豪的路径 1(服务器内部铜线)+ 路径 2(机柜内铜线),会不会被光一锅端?

答案:不会被一锅端。三件事让短距离用光「不划算」:钱(1 个光引擎成本是同距铜线的 3-10 倍);电(短距离内铜几乎不耗能,光要烧几瓦);耐用度(光器件比铜线脆弱)。

行业共识:30 厘米内永远是铜,1-2 米看速度档,5 米以上必须光。这不是公司选择,是物理。

今天全世界所有的 scale-up 都跑在铜上。我们认为铜和光会长期共存。机柜级别的连接会继续是铜的。但当集群从 1 个机柜扩展到 3、4、5、6 个机柜时,铜就跑不动了——这是物理规律。这时候光才进来。
验证:英伟达 GB300 NVL72 一个机柜 72 颗 Blackwell 跑的是铜背板(全世界最先进 AI 机柜架构)。下一代 Rubin / Rubin Ultra(2026-2027)机柜内仍然铜,光只在 NVL576 跨机柜超大集群上引入。博通 Tomahawk 6-Davisson CPO 猛推光,但战场是跨机柜以太网(路径 3),在路径 1-2 没有产品。

把 ALAB 六条产品线按「光替代暴露度」重新分类:Aries、Scorpio P、Scorpio X、Leo、COSMOS(约 80% 收入)对「光替代」几乎免疫——它们是「先于光引擎」或「与光无关」的产品。

真正暴露的只有 Taurus 那 20%(400G/lane 切换 2027-2028),给了 ALAB 3 年缓冲时间。但光替代不是 ALAB 真正的中期风险——AVGO 和 Marvell 在同一个铜战场上夹击,才是真正的麻烦。

七、AVGO 全栈反扑——这才是真正的中期威胁



上一节说 ALAB 80% 收入「对光替代免疫」这话没错。但份额不是这样丢的。真正威胁 ALAB 份额的,是 AVGO 和 Marvell 在同样的铜战场上端出对应产品,而且 AVGO 比 ALAB 早做了 20 年这些事。

AVGO 在 OFC 2026(2026-03)直接亮出全栈 AI 网络组合——这是行业内唯一一家能在每个层级都端出量产产品的玩家:Tomahawk Ultra,Jericho 4 等等。

关键的战略意图是 SUE(Scale-Up Ethernet)——AVGO 不打算用 UALink 这个 ALAB 主导的开放标准,而是另开一条「用以太网做 scale-up」的战线。如果亚马逊、微软、Meta 里有人被 SUE 吸引(尤其 Meta 本来就是以太网重度用户),UALink 的市场就被切走一半。

AVGO 全栈反扑的真正威力是捆绑销售。客户买 AVGO 一家可以解决 8 个问题(scale-out + SUE + CPO + AEC DSP + 光 DSP + 自定义 ASIC + 网络安全 + 软件栈),买 ALAB 只能解决 4 个。

当客户是亚马逊这种「想要少几个供应商」的大云,AVGO 的体量优势会发挥出来。

再看 Marvell——它不是全面对手,但在 ALAB 最赚钱的两条线(Aries + Scorpio P)上是直接对手,而且 Marvell 与亚马逊有更深的自定义 ASIC 合作关系(Trainium 的设计就有 Marvell 参与)。亚马逊「单一供应商不超过 70%」的采购铁律,意味着 Marvell 拿到 Aries 上 20-30% 二供份额几乎是 2026 下半年到 2027 必定发生的事。

未来 3 年我们团队推演的份额演变:Aries 从 80% 压到 50-60%(Marvell Alaska P);Scorpio P 从 95% 压到 60-70%(AVGO PCIe Gen7);Scorpio X 从早期压到 25-40%(AVGO SUE);Taurus 从 30% 压到 20-25%(Credo + Marvell LPO);光引擎从 0 压到 15-25%(LITE / COHR + AVGO 自家)。

每一条都在压缩。但同时 AI 加速器年出货量 2025-2028 翻 3-4 倍,ALAB 单芯片含金量 $1,000 → $1,500 → $2,000。综合下来,绝对收入 2025 → 2028 仍能 2-3 倍增长。

这家公司面临的真实情况是:份额一定会从「龙头垄断」压到「正常寡头」——但绝对收入还能涨 2-3 倍。这是被 AI 加速器市场本身指数级增长拉动的。

八、客户名单——过于集中的风险



ALAB 一直把自己定位成「连接界的瑞士」(技术中立,谁的协议都做)。真的中立吗?

三个来自 SEC 文件的硬事实:第一,2025 年报:一个最终客户占了全年收入 70% 以上,前三大客户合计 86%;第二,亚马逊 2026 年初签的 65 亿美元采购权证(SEC 8-K 文件)明确覆盖智能交换芯片 + 信号调理产品 + 光引擎产品;第三,公司自己在年报风险提示里写:这种集中度是重大风险。

那「一个客户 70%」是谁?公司从来没有在公开披露里直接点名。但叠加 65 亿美元采购权证 + 亚马逊 Trainium 公告 + 长期合作历史,卖方共识和产业观察基本指向亚马逊。这是产业拼图,不是公司逐项确认。

六条产品线主要客户指向:Aries、Scorpio P、Scorpio X、Taurus、UALink 都指向亚马逊;Leo 指向微软(唯一例外)。六条里五条都是亚马逊。技术上是「瑞士」,客户结构上不是。

更要命的是 Google 永远拿不到——Google TPU 体系结构性使用博通。即便 ALAB 把「分散化」故事讲到极致,客户名单上限就是亚马逊 + 微软 + Meta + AMD + 英伟达这一圈,Google 那块永远没份。

多头视角:一家公司能在亚马逊的每条产品线里都做到 #1,意味着它在客户钱包里份额极高。Google 自研能力最强,但即便在 TPU 上自研,它还是大量用博通这种第三方供应商——「大云全自研」的剧本,历史上从未发生过。

三个结构性天花板:第一,NVLink 永远进不去。英伟达占了全球 AI 加速器市场 85% 份额,其中只有 PCIe 那一小段属于 ALAB;第二,AVGO 的全栈反扑。OFC 2026 之后 AVGO 已经端出业界唯一完整的 AI 以太网组合;第三,CPO 时代上下游通吃。真正赢的是 LITE / COHR(激光器上游)+ AVGO / 英伟达(系统下游),ALAB 夹在中间,毛利会被两头挤。

当前股价 $287 对应 81 倍 forward P/E,意味着即便在中性情景里(2030 收入翻 3-4 倍),股价已经把这个增长基本兑现。这才是 $287 真正不舒服的地方。

另有一个细节:CEO 在过去两个月卖了过亿美元股票,卖出价位呈递增(4 月中 $149、4 月底 $172、5 月中 $200——每次都精准卖在阶段高点前后)。这些都是事先制定的程序化卖出,法律上「不能解读为老板看空」。但这种节奏让人不太舒服。

九、最后



推理时代真正的赢家,不是只造 GPU 的公司,而是让 GPU 之间能高效喊话的公司。ALAB 是这个时代的真管道工——每多一颗 AI 芯片上线,它就卖出去一整套连接基础设施。

但这只票现在的争议不是「多 vs 空」,是「你愿不愿意为一家会从 80% 龙头降级到 50% 寡头的公司,付 81 倍 forward P/E」。AVGO 全栈反扑、Marvell 二供铁律、英伟达自家光学生态——三股力量同时挤压,会让 ALAB 在未来 3 年从「垄断」沉淀到「寡头之一」。








您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2026-6-30 13:58 , Processed in 0.030721 second(s), 18 queries .

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表