Astera Labs 两天 +33%—，铜进光未必退。彻底搞懂下一个千亿级别 GPU 互联推理布局

network · 发表于 2 小时前

Astera Labs 两天 +33%——耗时一周万字深度解析，铜进光未必退。彻底搞懂下一个千亿级别 GPU 互联推理布局

我们是来自美国硅谷的投研团队，成员来自于斯坦福、UCLA、沃顿商学院的科技和金融背景。

美研芒格君

@Kay2289123

·
6月24日

跟大家介绍一下。我在湾区一线科技大厂做 AI inference、training 和 tech lead，26 年创立投研团队管理成员毕业于斯坦福、UCLA、沃顿等顶尖学府我的研究范围从硅谷中心出发，从算力、互联、存储三大板块为大家带来一手解读，拆解其中的相互依存关系。透过事情看本质，拆解被多数人忽略的机会
显示更多

ALAB 代表的是推理时代的下个千亿市场的瑞士军刀，这篇文章耗时一周调研，帮你梳理清楚 ALAB 代表的机会和上下游产业，帮助你领先 99% 的人。

一、推理时代，正式来了

过去十年 AI 圈最重要的指标是「训练一个更大的模型」。但从 2025 下半年开始，一个临界点被跨过去了。

5.18 JPM 大会上，主持人 Harlan Sur 直接抛出这个判断：「2025 下半年发生了一个大拐点——推理工作量已经超过训练工作量。从那以后，推理还在以指数级速度增长。这创造了新的硅片机会、新的存储和内存层级、新的高性能 CPU 需求。」

这个转变对 ALAB 来说意义重大，它本身就是为这个时代被定位的公司。CEO 在大会上把推理时代的红利总结成三件具体的事——这三件事，正好对应 ALAB 三条核心产品线。

读完后你会理解：为什么 ALAB 每颗 AI 芯片旁边能卖出去的产品价值，从上市时不到 $100 涨到现在超过 $1,000，而且接下来还会继续涨。

二、CEO 在大会上讲的「推理三剑客」

ALAB CEO 原话：「我们的解决方案对训练和推理都适用。机柜级别已经成为训练和推理的统一计算单元。但推理工作量的变化，确实让我们看到了三个新的具体机会。」

机会 1：长上下文推理——KV Cache 内存瓶颈。场景：你给豆包上传一份 500 页的财报让它总结，或者跟它聊一整天的代码。这种「百万 token 长上下文」，GPU 要持续保存的注意力缓存（KV Cache）有几十甚至几百 GB。GPU 自带的 HBM 又贵又小，装不下。

随着上下文窗口变大，瓶颈从计算转移到内存。

这正是 Leo（ALAB 内存控制器）的长处——它是 GPU 和「远处大仓库」之间的门卫。Leo 已经从「通用内存扩展件」升级成「长上下文推理的专用件」，占据了推理市场的新机会。

机会 2：MoE 模型推理——全员对话，Scorpio X 的硬功夫。场景：今天最先进的大模型，几乎都是 MoE（专家混合）架构，比如 GPT-4、Claude、DeepSeek、Mistral。模型内部分成几十到几百个「专家网络」，每次推理只激活其中几个。但麻烦在于：你事先不知道哪个专家在哪颗 GPU 上。

MoE 推理工作负载有一个特殊的流量模式——它喜欢所有 GPU 跟所有其他 GPU 说话，因为你不知道下一个专家在哪颗 GPU 上。这就要求交换机能提供全双工对等带宽（意思是任何两颗 GPU 之间都能双向同时讲话）。Scorpio 家族就是从底层就为这种带宽设计的。

更关键的是 CEO 接着讲的两个特性——这两个是 Scorpio X 的真正杀手锔。

「超级广播」：本来 GPU No.1 要把消息发给另外 4 颗 GPU，得发 4 次。开了超级广播后，GPU #1 只发一次给交换机，交换机自己把消息转发给那 4 颗 GPU。GPU 省下来的 I/O 带宽可以拿去做更多计算。

「交换机帮你算」：N 颗 GPU 训练时各自算出梯度，然后要合并起来再继续。本来 GPU 要互相对发数据然后自己合并；现在各 GPU 把数据丢给交换机，交换机自己合并，再发回所有 GPU。把杂活从 GPU 上「卸」到交换机里，GPU 算力被释放。

这两件事在 MoE 推理这种「全员对话 + 频繁聚合」的场景下，带来的不是 10% 提升，是整柜 GPU 利用率的结构性跳变——同样一柜子 72 颗 GPU，跑同样的 MoE 模型，效率可以差好几倍。

机会 3：Agentic 推理——异构配置，PCIe 是「服务器的神经系统」。场景：Agentic AI，一个 AI 助手可能同时调用大模型、搜索向量数据库、执行代码、读写文件、调用 API。每种工作有最适合的硬件，大模型推理用 GPU、向量检索用 CPU + 高速存储，代码执行用通用计算。

Agentic 工作量带来很多不同的硬件配置组合。客户想把各种 SSD、GPU 等等混在一起。而 PCIe 真的是服务器的神经系统，我们在 PCIe 产品线处于领先位置。

这正是 Aries（接力员）+ Scorpio P（服务器内部调度员）的长处。每一台「混搭推理服务器」，都需要 ALAB 的产品来传话和调度。

三、CEO 亲口说的曲线——从 $100 到 $1,000+

我们上市时，每颗 AI 加速芯片旁边能卖出去的 ALAB 产品价值还不到 $100。今天在一些应用里已经超过 $1,000。再加上未来的光学产品，这个数字会大幅超过 $1,000。

这条曲线是这家公司商业模式最重要的一句话——NVIDIA、AMD、AWS 每出一颗新的 AI 芯片，ALAB 跟着卖出去的产品价值，是上市时的 10 倍以上。

但这条曲线要诚实拆一下：光学增量来源容易被误读。NVIDIA 自家的 NVL576 跨柜光化用的是自家 CPO + LITE / COHR 激光器（NVIDIA 上个月各砸 $20 亿股权投资这两家锁死供应）。这条线 ALAB 一点都赚不到。

ALAB 光学增量真正打的是非 NVIDIA 的多柜 scale-up：亚马逊 Trainium 多柜化、AMD MI500、UALink 阵营。

但值得注意的是：光引擎里 ALAB 真正赚到差价的只有自家硅 + 集成那部分（约 $100-200），激光器和光芯片代工基本是「过手收入」——这就是为什么 CFO 把长期毛利目标从 76% 降到 70%。

四、把六条产品线放进「推理时代」重新看

① Aries——每台推理服务器内部的「信号接力员」。现在的 AI 推理服务器里，GPU、SSD、网卡、CPU 七零八落塞在一起，各自之间要传数据。任何一段距离一长，信号就糊。Aries 就是夹在中间把信号「重新喊清楚」的人。

收入占比：公司最大产品线，粗算占 2025 全年收入 50% 以上。主要客户：亚马逊 Trainium、英伟达 Blackwell。主要对手：博通、Marvell。

② Scorpio P——服务器内部的「调度总管」。一台推理服务器内部塞了 8 颗 GPU、1 颗 CPU、好几块 SSD、几张网卡，大家同时要传数据。谁先发？走哪条道？谁等谁？Scorpio P 就是站在中间发令的调度总管。服务器内部硬件越花样，它越值钱。

收入占比：2025 全年约 15%（约 $1.28 亿美元）。主要客户：亚马逊（主）+ 英伟达（已确认）+ 2 家未公开大云。主要对手：博通（老一代占优，新一代被 ALAB 抢先）。

③ Scorpio X——千卡集群的「群聊总指挥」（增长发动机）。上面「机会 2」对应的产品。MoE 推理要让一柜子 GPU 互相问「专家在你这儿吗」——这种「全员同时找人」非常烧带宽。Scorpio X 的硬功夫，是让 72 颗 GPU 同时讲话不卡顿，而且能替 GPU 干杂活（超级广播 + 交换机帮你算）。

2026 一季度刚开始量产，二季度起出货 320 通道旗舰版。增长动能：到 2026 年末，Scorpio（P + X）成为公司最大产品线，X 超过 P。新市场规模约 $100 亿。主要客户：亚马逊 Trainium 4（主）、AMD MI500（2027）；10+ 客户合作中。

④ Taurus——多机柜联动的「加压智能网线」。有些推理任务大到一柜子 GPU 不够用，要几柜子联手。机柜跟机柜之间 1-2 米，普通铜线传不过去，普通光纤又贵又费电。Taurus 就是「带加压器的智能铜线」——便宜、稳定、刚好够用。

收入占比：2025 全年估约 20%，全年增长 4 倍以上。低毛利（硬件模块）。主要客户：400G 这一代几乎只有亚马逊；800G「许多客户」未点名。主要对手：Credo（CRDO）——直接正面对刚。竞争压力：高。

⑤ Leo——长上下文推理的「内存仓库门卫」。你让豆包读完一本 1000 页的书然后回答问题，GPU 需要保存的「对话记忆」（KV Cache）有几十 GB，GPU 自己旁边的高速内存装不下。需要在远处租一个「便宜大仓库」，Leo 就是那个仓库的门卫。

收入占比：2025 全年估约 5%（最小一条线但加速）。毛利贡献：高毛利。主要客户：微软 Azure（ALAB 唯一一条主要客户不是亚马逊的产品线）+ 定制版 Leo 客户。

⑥ COSMOS——推理服务不能中断的「全栈监工」。推理时代有个特点是不能中断。你在跟 ChatGPT 对话，中间网线挂了重启 30 秒，体验就毁了。COSMOS 干三件事：提前几小时报警「这根线快挂了」；统一上报几百万条线的健康状况；真挂了自动把数据流绕开让推理服务不中断。

换掉 ALAB 的芯片 = 整套监控系统要重新搭——这才是 ALAB 真正的更换成本。这是 ALAB 76% 毛利能稳住的真正原因。博通、Marvell 在 PCIe 这条线上现在都还没有同样成熟的产品（领先约 18 个月）。

五、ALAB 跟光模块是替代还是合作？

读到这里你可能会有一个疑问：「我一直关注光模块板块（LITE、COHR、中际旭创、新易盛），那 ALAB 这堆 Scorpio、Aries、Taurus，是不是要替代光模块？」

答案：不替代，大部分是合作关系，只在一个未来的小区域里有交叉。

GPU 想给另一颗 GPU 发数据，可能走三种路径。路径 1：同一台服务器内部（几十厘米），走铜线，中间需要 Aries + Scorpio P。路径 2：同一个机柜里几台服务器之间（1-2 米），走 Taurus 智能铜线。路径 3：不同机柜、不同房间之间（几米到几十公里），必须用光纤。

光模块公司的主业是路径 3——长距离传话。ALAB 的主业是路径 1 和路径 2——短距离调度 + 信号清理。两者在大部分时候是「高速公路 + 城市街道」的关系。一条完整的数据传输路径，需要光模块 + ALAB 配合，少一个都不行。

未来 NPO / CPO 时代是唯一会重叠的地方。ALAB 通过 aiXscale 收购拿到了玻璃光纤耦合器这一小段。也就是说，ALAB 进入光引擎赛道，反而是 LITE / COHR 的好消息——它们的激光器卖得更多了。

六、那「路径 1-2」的铜线，会不会被光取代？

这是一个自然延伸出来的反问——既然大家都在猛推光学方案，那 ALAB 现在引以为豪的路径 1（服务器内部铜线）+ 路径 2（机柜内铜线），会不会被光一锅端？

答案：不会被一锅端。三件事让短距离用光「不划算」：钱（1 个光引擎成本是同距铜线的 3-10 倍）；电（短距离内铜几乎不耗能，光要烧几瓦）；耐用度（光器件比铜线脆弱）。

行业共识：30 厘米内永远是铜，1-2 米看速度档，5 米以上必须光。这不是公司选择，是物理。

今天全世界所有的 scale-up 都跑在铜上。我们认为铜和光会长期共存。机柜级别的连接会继续是铜的。但当集群从 1 个机柜扩展到 3、4、5、6 个机柜时，铜就跑不动了——这是物理规律。这时候光才进来。

验证：英伟达 GB300 NVL72 一个机柜 72 颗 Blackwell 跑的是铜背板（全世界最先进 AI 机柜架构）。下一代 Rubin / Rubin Ultra（2026-2027）机柜内仍然铜，光只在 NVL576 跨机柜超大集群上引入。博通 Tomahawk 6-Davisson CPO 猛推光，但战场是跨机柜以太网（路径 3），在路径 1-2 没有产品。

把 ALAB 六条产品线按「光替代暴露度」重新分类：Aries、Scorpio P、Scorpio X、Leo、COSMOS（约 80% 收入）对「光替代」几乎免疫——它们是「先于光引擎」或「与光无关」的产品。

真正暴露的只有 Taurus 那 20%（400G/lane 切换 2027-2028），给了 ALAB 3 年缓冲时间。但光替代不是 ALAB 真正的中期风险——AVGO 和 Marvell 在同一个铜战场上夹击，才是真正的麻烦。

七、AVGO 全栈反扑——这才是真正的中期威胁

上一节说 ALAB 80% 收入「对光替代免疫」这话没错。但份额不是这样丢的。真正威胁 ALAB 份额的，是 AVGO 和 Marvell 在同样的铜战场上端出对应产品，而且 AVGO 比 ALAB 早做了 20 年这些事。

AVGO 在 OFC 2026（2026-03）直接亮出全栈 AI 网络组合——这是行业内唯一一家能在每个层级都端出量产产品的玩家：Tomahawk Ultra，Jericho 4 等等。

关键的战略意图是 SUE（Scale-Up Ethernet）——AVGO 不打算用 UALink 这个 ALAB 主导的开放标准，而是另开一条「用以太网做 scale-up」的战线。如果亚马逊、微软、Meta 里有人被 SUE 吸引（尤其 Meta 本来就是以太网重度用户），UALink 的市场就被切走一半。

AVGO 全栈反扑的真正威力是捆绑销售。客户买 AVGO 一家可以解决 8 个问题（scale-out + SUE + CPO + AEC DSP + 光 DSP + 自定义 ASIC + 网络安全 + 软件栈），买 ALAB 只能解决 4 个。

当客户是亚马逊这种「想要少几个供应商」的大云，AVGO 的体量优势会发挥出来。

再看 Marvell——它不是全面对手，但在 ALAB 最赚钱的两条线（Aries + Scorpio P）上是直接对手，而且 Marvell 与亚马逊有更深的自定义 ASIC 合作关系（Trainium 的设计就有 Marvell 参与）。亚马逊「单一供应商不超过 70%」的采购铁律，意味着 Marvell 拿到 Aries 上 20-30% 二供份额几乎是 2026 下半年到 2027 必定发生的事。

未来 3 年我们团队推演的份额演变：Aries 从 80% 压到 50-60%（Marvell Alaska P）；Scorpio P 从 95% 压到 60-70%（AVGO PCIe Gen7）；Scorpio X 从早期压到 25-40%（AVGO SUE）；Taurus 从 30% 压到 20-25%（Credo + Marvell LPO）；光引擎从 0 压到 15-25%（LITE / COHR + AVGO 自家）。

每一条都在压缩。但同时 AI 加速器年出货量 2025-2028 翻 3-4 倍，ALAB 单芯片含金量 $1,000 → $1,500 → $2,000。综合下来，绝对收入 2025 → 2028 仍能 2-3 倍增长。

这家公司面临的真实情况是：份额一定会从「龙头垄断」压到「正常寡头」——但绝对收入还能涨 2-3 倍。这是被 AI 加速器市场本身指数级增长拉动的。

八、客户名单——过于集中的风险

ALAB 一直把自己定位成「连接界的瑞士」（技术中立，谁的协议都做）。真的中立吗？

三个来自 SEC 文件的硬事实：第一，2025 年报：一个最终客户占了全年收入 70% 以上，前三大客户合计 86%；第二，亚马逊 2026 年初签的 65 亿美元采购权证（SEC 8-K 文件）明确覆盖智能交换芯片 + 信号调理产品 + 光引擎产品；第三，公司自己在年报风险提示里写：这种集中度是重大风险。

那「一个客户 70%」是谁？公司从来没有在公开披露里直接点名。但叠加 65 亿美元采购权证 + 亚马逊 Trainium 公告 + 长期合作历史，卖方共识和产业观察基本指向亚马逊。这是产业拼图，不是公司逐项确认。

六条产品线主要客户指向：Aries、Scorpio P、Scorpio X、Taurus、UALink 都指向亚马逊；Leo 指向微软（唯一例外）。六条里五条都是亚马逊。技术上是「瑞士」，客户结构上不是。

更要命的是 Google 永远拿不到——Google TPU 体系结构性使用博通。即便 ALAB 把「分散化」故事讲到极致，客户名单上限就是亚马逊 + 微软 + Meta + AMD + 英伟达这一圈，Google 那块永远没份。

多头视角：一家公司能在亚马逊的每条产品线里都做到 #1，意味着它在客户钱包里份额极高。Google 自研能力最强，但即便在 TPU 上自研，它还是大量用博通这种第三方供应商——「大云全自研」的剧本，历史上从未发生过。

三个结构性天花板：第一，NVLink 永远进不去。英伟达占了全球 AI 加速器市场 85% 份额，其中只有 PCIe 那一小段属于 ALAB；第二，AVGO 的全栈反扑。OFC 2026 之后 AVGO 已经端出业界唯一完整的 AI 以太网组合；第三，CPO 时代上下游通吃。真正赢的是 LITE / COHR（激光器上游）+ AVGO / 英伟达（系统下游），ALAB 夹在中间，毛利会被两头挤。

当前股价 $287 对应 81 倍 forward P/E，意味着即便在中性情景里（2030 收入翻 3-4 倍），股价已经把这个增长基本兑现。这才是 $287 真正不舒服的地方。

另有一个细节：CEO 在过去两个月卖了过亿美元股票，卖出价位呈递增（4 月中 $149、4 月底 $172、5 月中 $200——每次都精准卖在阶段高点前后）。这些都是事先制定的程序化卖出，法律上「不能解读为老板看空」。但这种节奏让人不太舒服。

九、最后

推理时代真正的赢家，不是只造 GPU 的公司，而是让 GPU 之间能高效喊话的公司。ALAB 是这个时代的真管道工——每多一颗 AI 芯片上线，它就卖出去一整套连接基础设施。

但这只票现在的争议不是「多 vs 空」，是「你愿不愿意为一家会从 80% 龙头降级到 50% 寡头的公司，付 81 倍 forward P/E」。AVGO 全栈反扑、Marvell 二供铁律、英伟达自家光学生态——三股力量同时挤压，会让 ALAB 在未来 3 年从「垄断」沉淀到「寡头之一」。

账号		自动登录	找回密码
密码			注册