博威---云架构决胜云计算

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 502|回复: 1

CPU(通用处理器),GPU(通用图形处理器),ASIC(应用专用集成电路),量子计算...

[复制链接]
发表于 2024-12-19 17:16:15 | 显示全部楼层 |阅读模式
我之前写过很多文章介绍CPU(通用处理器),GPU(通用图形处理器),ASIC(应用专用集成电路),量子计算机的背景,诸位可以去我的主页找来看看。


诸位可以回顾一下,在比特币(BTC)的挖矿发展过程中,从CPU到GPU再到ASIC走的出奇地顺畅:


1,比特币于2009年诞生,其挖矿算法采用的是SHA-256哈希函数,设计之初的目标是让普通人利用家用电脑的CPU挖矿,CPU本身以其灵活的通用计算能力为最大优点。早期区块难度很低,单个CPU能够完成大量挖矿任务。但随着比特币网络的哈希难度(Difficulty)不断增加,单台CPU无法满足需求,挖矿速度大幅下降。


2,2010年开始,矿工们发现,GPU(尤其是AMD/ATI显卡)的并行处理架构对于计算SHA-256哈希值更高效,使得GPU逐步取代CPU成为主流挖矿工具。开发者也开始利用CUDA和OpenCL编写高性能挖矿程序,加速了GPU矿池形成。当然,与CPU相比,功耗上升明显,但性价比大幅提高。当然,随着参与者增多,比特币挖矿难度继续快速提高。


3,从2013年开始,专门用于比特币挖矿的ASIC开始逐渐取代GPU,标志着挖矿进入一个高效、集约的时代。这些ASIC专为SHA-256算法优化,能够以极高效率完成哈希运算。因为专款专用的缘故,ASIC上没有过多的冗余电路,所以单个ASIC矿机的算力显著高于顶级GPU,同时单位功耗更低。从此,矿机制造商(如比特大陆,嘉楠耘智,比特微,亿邦国际,现在还有比特小鹿)开始引领硬件和芯片开发,将挖矿产业集中化了。


同样的事情到深度学习和AI训练的领域会不会复现呢?我们今天来简单地看一看。随着生成式AI应用的迅猛发展,GPU飞速发展迅猛,NVidia作为最大的赢家,2024年的前三个季度的收如达到了惊人的911.6亿美金,纯利润约507.8亿美金。其中第三季度,NVidia在数据中心这块的业务收入达到了308亿美金。毫不夸张地说,这业务相当于开足马力的一个印钞机。


那么,按照现在的剧本,AI ASIC能否成为英伟达GPU可⾏的替代品?


我们首先看看,ASIC相对于GPU,能够提供什么独特的优势。* ASIC为特定任务(如 AI 推理)高度优化,规模化下成本有显著优势。同时能够在固定计算需求下实现超高性能和极低延迟。* 功耗显著低于 GPU,单位计算能效比(Performance-per-Watt)高。* 效率更高:例如,Google TPU 在执行大规模矩阵运算和模型推理时的效率远高于GPU。


和比特币的ASIC类似,AI ASIC专款专用,不包含多余的硬件功能,减少了晶体管数量,降低了功耗和芯片生产成本。在部署量足够大时,规模效应带来的成本优势显著。在这里,我多提一嘴,GPU翻倍增加的功耗(H100 700瓦到GB200 1100瓦的热设计)给设计实现和配套的设施带来了极大的挑战,甚至因为GPU过热,客户甚至需要大幅度采用非技术手段缩减其他部件的热设计功耗,比如说大规模使用SSD替换传统的硬盘。


当然,AI ASIC的缺点在于,开发生态通常为闭源设计(如 Google TPU),针对性强,但灵活性差,较难达到 GPU那样的广泛适配性。GPU 可以在模型训练、推理和通用计算任务之间灵活切换,支持各种 AI 框架(如 TensorFlow、PyTorch),而GPU的开发生态(如 CUDA、TensorRT)高度成熟,开发者非常多。


目前的情况是,推理和边缘场景下,ASIC已经具备替代 GPU的很多优势,具有非常大的前景。对照北美四大云计算厂商(CSP:Cloud Service Providor)的自研产品路线:Google的TPU出货目前以v5产品为主,2025年将量产TPU v6;亚马逊的ASIC产品包括Trainium和Inferentia,分别用于训练和推理环节;微软和Meta也推出了各自的ASIC产品Maia100和MTIA。由于大型云计算厂商的业务模型、应用场景等多通过自身云来承载,相关软件绝大部分自行研发,所以,自研ASIC在这一块基本不存在瓶颈,完全可适应自家的不同业务场景需求。

而在训练场景下,因为任务本身具有复杂性和多样性,所以对硬件的灵活性需求更高,GPU 的通用性在这里会更具优势。
但是,我们也要看到技术的变化是动态的,正如前OpenAI联合创始人Ilya Sutskever在2024年NeurIPS大会上表示:预训练时代即将终结(Pre-training as we know it will end)。“将数据比作AI发展的燃料,由于我们只有一个互联网,数据增长已经触顶,AI即将进入‘后石油时代’,而这,意味着依赖于海量数据的预训练模型将难以为继,AI发展将有新的突破。”Ilya认为,未来AI发展将聚焦于智能体、合成数据和推理时计算(Agents、Synthetic data和Inference-time compute)。这些确定性较高的任务可能也会适合ASIC的方式。

而摩根士丹利于2024年12月15日发布研报《AI ASIC 2.0:潜在赢家》。在研究报告里面得出类似的结论。大摩报告预计,基本情境下,到2027年,云端AI半导体市场规模将达到2380亿美元,而在乐观情境下甚至可能达到4050亿美元。在这一领域,预计ASIC凭借针对性优化和成本优势,有望逐步从英伟达GPU手中争取更多机会。
摩根士丹利明确预计,AI ASIC市场规模将从2024年的120亿美元增长至2027年的300亿美元,年复合增长率达到34%。尽管英伟达的AI GPU性能卓越,但摩根士丹利认为,云服务提供商(CSP)如谷歌、亚马逊和微软,仍在积极推动ASIC设计。这背后的驱动力主要有两个。

1,是优化内部工作负载。通过开发自定义芯片,云服务提供商(CSP)可以更高效地满足其内部AI推理和训练需求。

2,是更好的性价比。报告指出,虽然英伟达的GPU具备强大的计算性能,但其硬件价格高昂,特别是在AI训练过程中。相比之下,ASIC的单位成本更低,尤其是在大规模使用后。例如,亚马逊的Trainium芯片在推理任务中比英伟达的H100 GPU便宜约30%至40%。谷歌也在不断优化其TPU系列,最新的TPU v6在能效上比上一代提升67%。

要做AI ASIC的生意,需要比较深的技术积累,尤其是在半导体IP方面的积累,包括但不限于网络,存储和其他各种类型的控制器IP,以及对先进工艺设计的知识。这里有两个核心公司值得关注,最近股市最火的两个Ticker,

1,博通,之前合并了安华高(Avago),Avago在2014年收购ASIC大厂的LSI Logic,一举奠定了ASIC领域的基础;

2,Marvell,Marvell之前在网络和存储市场有大量积累,同样以并购拓展ASIC研发,在2019年收购格芯(GlobalFoundries)旗下负责ASIC业务的Avera Semi,当时客户就包含目前的ASIC大客户亚马逊和微软。

谷歌自2013年开始自研芯片起,就和博通开始了深度合作,截至目前,两家共同设计了迄今为止已公布的所有TPU芯片,同时博通已经获得了谷歌下一代AI芯片TPU v7的设计合同,这一长期合作关系使博通能够显著受益于谷歌在AI技术方面的持续投资。
Meta最新的自研AI芯片都将选择博通作为自研芯片技术的核心合作伙伴,Meta此前与博通共同设计了Meta的第一代和第二代AI训练加速处理器,预计博通将在2025年加快研发Meta下一代AI芯片MTIA 3。

OpenAI给了博通两代ASIC项目,将在2026年启动,会采用3nm和2nm工艺,以及3D封装。苹果现在使用的是谷歌TPU,但是也在积极定制自己的算力芯片。

Marvell这边,微软下一代项目给了Marvell,且承诺给的量相当大,且在12月份Marvell宣布与Amazon Web Services(AWS)扩展战略合作关系,达成了一项为期五年的多代协议。

其他的大客户比较敏感,不多谈了。至少目前在AI ASIC领域,这两家走得最早最远。

博通最新的业绩报告显示,博通的AI相关营收(数据中心以太网芯片+AI ASIC)全财年累计达到122亿美元。更重磅的是,博通首席执行官陈福阳(Hock Tan)在业绩电话会议上表示,人工智能产品营收将在2025财年第一季度同比增长65%,远快于该公司约10%的整体半导体业务增速,并且预计到2027财年,其为全球数据中心运营商们所打造的AI组件(以太网芯片+AI ASIC)潜在市场规模将高达900亿美元。陈福阳在电话会议上强调“未来三年,AI芯片的相关机遇无比广阔大。”

另外,根据Marvell在AI Day上的预测,AI ASIC的业务规模将在2027年达到400亿美元规模。 Marvell设定的目标是占据该400亿美元市场的20%份额,即80亿美元。

所有这些都显示,AI ASIC正是朝阳时代。当然,据传,英伟达和AMD也不想落下,均设立了定制芯片业务部门,专注为云计算公司设计定制芯片(ASIC)。

所以,AI ASIC的竞争还将会更激烈。将来是不是也会演变成比特币矿机那样的百花齐放呢?


























下午10:02 · 2024年12月18日
·
2.6万
查看







 楼主| 发表于 2024-12-20 13:04:40 | 显示全部楼层
现在对芯片市场一个刚起来的叙事是,博通Broadcom的定制AI芯片会成为英伟达真正的竞争威胁。因此英伟达股价在跌。
定制AI芯片对英伟达的威胁有多严重?事实上应该不严重。
1,博通对未来定制化芯片市场的预测,并不等于说马上就会赢得相当大的市场份额。所谓定制AI芯片的竞争本身也不是什么新鲜事,说好久了。
2,大科技公司自己早就在开发,但还是让英伟达拿了绝大部分业务。这是由于英伟达在硬件、软件和网络解决方案经历了十多年的磨合优化,是目前最好的产品。转移到竞争对手的系统上,说说容易,实际操作有各种问题,企业不值得做这样的冒险。特别是英伟达不断在发布功能强大得多的GPU。
3,如果企业选择在亚马逊或谷歌的产品基础上构建AI,将被锁定在一个云计算供应商上,面临未来芯片可能被淘汰的风险。英伟达在向后兼容性方面拥有最好的记录,说明英伟达推出更快的产品时,对软件的大量投资不会白费。
这就是为什么亚马逊AWS的高管接受采访时表示,英伟达的市场份额可能会达到95%,也就是更高,而不是更低。
摩根士丹利的分析师则平和一些,认为定制AI芯片的市场份额将从今年的11%上升到2030年的15%,其余将流向AI GPU,也就是英伟达的地盘。
英伟达将继续主导蓬勃发展的AI芯片市场,至少目前还没有确凿的数据表明英伟达会有闪失。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2025-1-10 21:44 , Processed in 0.094588 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表