博威---云架构决胜云计算

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 208|回复: 3

https://boist.org/2025年2月5日:贸易战推迟,国债收益率跌出警戒线;特降达升,C...

[复制链接]
发表于 2025-2-9 07:47:17 | 显示全部楼层 |阅读模式
https://boist.org/



2025年2月5日:贸易战推迟,国债收益率跌出警戒线;特降达升,CSP继续加码大基建;我的本周市场看法和交易总结
Published by
Bo Zeng


on
[color=var(--wp--preset--color--foreground)][color=var(--wp--preset--color--foreground)]2月 6, 2025




大家好,今天是2025年2月5日星期三。随着美加、美墨纷纷宣布关税延期30天,特朗普“贸易战”给市场造成的冲击逐渐缓解。周一跳水之后,三大股指均于周二开始反弹。但正如周末日报所说,贸易战的风险并未消除。本周,多家科技公司继续公布第四季度财报,其中周二AMD、谷歌;周三ARM,QCOM财报已发布完毕;周四将迎来Mag 7除英伟达之外的最后一家大科技——亚马逊。亚马逊的财报细节可能将对半导体板块产生重要影响,具体我们会在下文分析。
贸易战闹剧
周二上午,墨西哥率先和白宫达成协议:增派1万人军队加强管理边境管理,并确保控制毒品流入问题。随后,特朗普宣布两国之间25%的关税延期30天执行,这无疑给紧张的市场情绪带来一定宽慰。
但令人意料的突破还是来自加拿大。上午,白宫和特鲁多的谈话并没有实质性结果,我本以为这是由于自由党态度坚决——和之前预期的那样,至少要等到3月底换人之后才会有进展,因此,我对下午3点所谓的第二次会谈并不报任何希望。毕竟这可是特鲁多在民意上一统保守派,成为民族英雄的最后机会。
没想到特鲁多周六那振聋发聩的国民演讲不过再次证明了他只是一位能说会道的表演艺术家。周二下午,特鲁多态度迅速软化,180度大转弯。甚至他最终给出的发言稿也和墨西哥如出一辙:派兵巡逻边境,并许诺控制那或许本就不存在的芬太尼问题。
我也能够理解特鲁多最后时刻做出的选择。虽然从单方面来看,他光脚不怕穿鞋的,完全没有给特朗普台阶下的理由。但既然墨西哥方面靠打嘴炮就能换来30天的宽限期,加拿大又何乐而不为呢?这也是一种“榜样效应”吧。至于30天后两国边境治理效果是否能令特朗普满意,就是另外一回事了。那时候特鲁多都辞职了,“管他洪水滔天”?
加拿大首先单方面宣布暂停报复性关税30天;周二晚间特朗普也作出回应,表示美国方面的25%关税延期30天。二月初突然爆发的美加、美墨贸易战“闹剧”就此告一段落。根据上周五彭博社、华盛顿邮报等媒体报道,特朗普团队原本就打算将关税推迟到3月,市场还庆祝特意这一消息,并在日内反弹。现在看来,三国元首这么折腾,实际上还是让一切都回到了原点。Fake News被骂的真冤。从另一方面说,这也意味着股指可能会因此直接反弹回1月31日,也就是SPY 500 6120,纳斯达克2000点左右。
不过我个人认为,贸易战的问题并未完全解决。这主要是如下三个理由:
  • 在惩罚性关税取消之后,特朗普依然可能对北美贸易伙伴施加10%的统一关税——正如他对欧盟做的那样
  • 中国的关税贸易战才刚开始,而且中方并无让步迹象:比如最近宣布对谷歌、苹果进行的反垄断调查,至少表明中方正在为谈判增加筹码。原定于周二的两国元首的关税会谈也取消了。
  • 特朗普最终(Eventually)会对半导体增加关税,这当然也会冲击市场,对上涨构成阻力。
这波上涨我依然当做横盘中的震荡看待。
半导体复苏?
周三,在经历了拜登出口禁令、DeepSeek市场冲击和特朗普关税的三重打击后,NVDA终于迎来久违的反弹。日内NVDA涨超5%,再次回到3万亿市值。实际上,这波反弹严格意义来说是从AVGO开始:
  • 上周,Meta披露了其强劲的AI投资预算,2025年将继续投资600-650亿,华尔街预期为550亿。
  • 周二,Goog财报释放的相同的信号。公司25年数据中心投资为750亿美金,远超华尔街预期的580亿。
因受益于云服务厂商可能在AI ASIC方面的投资,AVGO周二以来已累计反弹近7%,几乎已完全回补了DeepSeek Shock以来的缺口。AVGO是谷歌自研硬件的密切合作伙伴。
CSP们在25年继续加码AI基础设施,不但和美国Stargate加大投资的基本国策一致,而且至少也应让DeepSeek GPU无用论偃旗息鼓了。当然,NVDA股价的反弹也和上述贸易战放缓和美国银行“恰逢时宜”的看好公司财报有关。
周三,美国银行发布研报指出,他们看好本月底即将发布的英伟达第四季度财报,指出营收虽然大概率再次超预期,但因H系列滞销和中国地缘政治因素,公司利润率可能下降。美国银行给出的目标价是190,前提是黄仁勋能就Blackwell的执行情况提供保证,并对2026财年及2025年自然年的业务前景表达信心。
根据我们之前几个季度的财报经验,双beat其实并不重要而且一定会发生,这原本就是NVDA财务部门的精心设计。财报后下跌的主要原因是买方的目标肯定比卖方研报给的更高。如果股价在财报之前就涨到位,我会倾向于看空,并考虑卖Call。3月17日的GTC技术大会可能是下一个反弹机会,预计在该会议上,英伟达会展示下一代的AI芯片技术——正如Blackwell问世那样。关于NVDA的具体讨论见文末我的操作。
10年期国债异动
除财报外,周三还发生了一件极不寻常的事:作为美股牛市重要指标的美国10年期国债收益率自12月FOMC后,首次跌破4.5%。之前说过,只要收益率维持在4.5%上方,我绝不会加仓。4.5%是10年期国债收益率的一个关键心里位置,他对SPY的估值水平是否被抑制有重要作用。一般来说,国债收益率越高,股价承压越大。
10年期收益率的下降主要得益于美国财政部长Bressent今天的发言。他说,“特朗普总统想要的并非是降低利率,而首先是降低国债收益率”。特朗普的这一要求无疑是正确的。
  • 在经济强劲、就业健康的今天,美联储完全没有降息的理由。而较高的利率实际上能为衰退时紧急降息预留空间。
  • 美国政府完全可以通过控制政府债务、减少债务发行来压低长端利率,从而释放风险。这也正是DOGE正在做的事。
  • DOGE的目标是2025年减少美国政府预算1万亿,而且也已经在USAID、媒体经费等方面取得重大进展,这将大幅降低财政部今年的发债量。
国债收益率如果能继续降低,这将利于美股的估值反弹。如果该趋势得以持续,我可能会略微调整2月份的对冲策略,比如减少卖Call仓位,更多卖Put,并开始在强势个股上加仓。
我的操作
以下内容为会员可见,对会员项目感兴趣的读者,欢迎阅读[color=var(--wp--preset--color--foreground)]本文了解详情。会员可以加入会员群,并阅读全站会员可见内容。
下面总结本周二和周三我在ARM,AMD,GOOG财报前的期权操作,以及明天AMZN的分析。此外也会讨论我对近期NVDA/TSLA的看法与操作计划。部分和操作有关的市场讨论也已移至下方:



 楼主| 发表于 2025-2-9 07:48:43 | 显示全部楼层
特斯拉和英伟达本周五到期期权墙:TSLA: 370 下跌阻力,380 上升阻力
NVDA:130 上升阻力
什么是Gex 中的 Call Wall/Put Wall
之前日报有分析



























下午1:03 · 2025年2月7日
·
1万
查看






 楼主| 发表于 2025-2-10 12:43:15 | 显示全部楼层
2025年1月26日周末特别篇:DeepSeek颠覆AI,芯片产业链逻辑重写;OpenAI如临大敌?盘前蒸发一万亿,NVDA领跌11%;本周总结和下周计划
Published by
Bo Zeng


on
[color=var(--wp--preset--color--foreground)][color=var(--wp--preset--color--foreground)]1月 27, 2025




紧急更新:周一盘前,纳指现已跳水约4%,英伟达暴跌10%。几乎达到了8/5日因日报Carry Trade Unwind导致的黑色星期一水平。当时市场抛售的原因是日元加息。
大家好,今天是2025年1月26日星期日。除了上周五NVDA盘尾跳水外,周末半导体板块又出大事了。一个由中国量化基金公司(幻方)研发的大语言模型DeepSeek-R1引爆全网;该模型号称使用不到600万美金——也即不到OpenAI训练成本的3%,实现在多个推理任务上与OpenAI-o1不相上下的评测效果,推理价格更是不到o1的4%。令人震撼的是,这一切都是在中国受出口禁令影响,无法获取NVDA最新Hopper算力的基础上做到的;DeepSeek甚至一度作为幻方的一个业余项目出现,公司早期对其并不抱太大期望。
虽然从严格意义上说,DeepSeek-R1的文章早在5天前就已公开;但随着试用人数逐渐增多,又恰逢Scale AI CEO接受CNBC采访,舆论恰好在这个周末正式引爆。一时间,英文社区风声鹤唳,“美国即将被赶超、中国威胁论”等言论甚嚣尘上。甚至有人呼吁开始OpenAI、Meta、微软和谷歌等CSP放弃继续烧钱,回归模型效能。另一方面,投资人也(合理地)担忧起芯片厂商英伟达来。DeepSeek的成功证明,只要用2000多台落后GB200一代有余,算力仅为其20%的H800,即可训练出世界最先进的大语言基础模型。实现AGI之路真的需要这么多GPU吗?CSP在数据中心成百上千亿的投资还有意义吗?加速计算的总市场规模还有之前估算的那么多吗?NVDA乃至整个半导体产业链的估值逻辑,似乎正在我们面前摇摇欲坠。
这种担心是否有依据呢?我们今天的周末日报特别篇就来详细探讨这个问题。
不止一个模型
首先要明确,当我们谈论令世人震惊的DeepSeek-R1模型时,实际上往往同时指代了三个部分:
  • 一,是参数大小为670B的大语言基础模型DeepSeek V3;
  • 二,是使用无监督数据,借助增强学习方式在数学和代码专业问题上微调得到的推理模型DeepSeek-R1-Zero;
  • 三,是在DeepSeek-R1-Zero基础上,混入更多带有标签的监督数据,提高模型其他方面综合能力而得到的DeepSeek-R1。
DeepSeek-R1,才是那个打败一众开闭源模型,在竞技场上和OpenAI o1难分伯仲的超新星。
这个周末,我花了大概10小时研究了DeepSeek发布的两篇论文,其中详细介绍了基础模型DeepSeek V3和推理模型DeepSeek R1/Zero的训练过程。我认为,这两篇工作的侧重点不同,相应的贡献也并不一致。对讨论感兴趣的读者,可以去推特回顾我的这三篇推文[[color=var(--wp--preset--color--foreground)]1][[color=var(--wp--preset--color--foreground)]2][[color=var(--wp--preset--color--foreground)]3]。
为方便参考,现将我的观点大致总结如下:
  • 对DeepSeek V3而言,我更愿意称之为一次工程学上的奇迹。幻方团队的主要工作是降本增效,解决了如何在成本有限、算力有限的条件下,训练出世界领先的大语言基础模型的问题。注意到DeepSeek V3已经是该模型序列的第三代。从2023年成立DeepSeek公司,第一代模仿ChatGPT开始,他们在这方面的工作已经至少有2年时间。
  • 相比之下,DeepSeek R1/Zero的学术价值更大。它是完全原创的工作,甚至具有开创意义。DeepSeek R1向全球科研工作者乃至硅谷创业公司高管们揭露了这么一个残酷的事实:通过一种叫做GRPO的方法,你不需要海量标注数据,不需要人工设计思维链,只需回归最简单的RL(增强学习),模型自然就会涌现出和当下最先进模型相媲美的推理能力!不过,这种推理能力也存在一些局限,我们下面会具体说。
颠覆硅谷?
真正令市场恐惧的,既不是DeepSeek V3不到OpenAI 3%的训练成本,也不是DeepSeek R1 能和o1 媲美的推理能力,而是他们两者出人意外的结合。这不禁让人疑问:DeepSeek廉价又强悍,Open AI这几年花掉的几十亿美元莫非全都打了水漂,硅谷AGI的研发方向难道完全错了?
这其实是将DeepSeek V3和R1的两种特性“混合”而产生的效果:
  • 我们应该将DeepSeek R1单独拿出来分析,它的价值并不局限于DeepSeek。已花巨资研发的Llama、Claude甚至国内同行如QWEN等模型都在受益者其列。
  • R1的训练方法可以应用在任何一个已知的大语言模型上,并极大的提高他们的推理能力。
  • 可以说,DeepSeek R1的成功实际上是开源社区的胜利他打破的是OpenAI o1推理上的垄断地位,而不能单纯看成来自敌对国家的威胁。
相较而言,极端条件下训练出来的V3反而不一定那么有用。
  • DeepSeek V3基本达到了开源大语言模型的平均水平。既然已经拥有Llama,那么大部分公司都没有重头开始训练V3的需要;
  • 在算力和资金充足的情况下,V3特有的一些训练技巧价值其实并不算大。依然有一些细节值得关注,我们下文会具体讨论。
正如Perplexity CEO 在CNBC的采访中所说,DeepSeek-V3的成功其实是“必要致创新”(Necessity led innovation);比如,当一个国家缺少石油时,他说不定就会把煤炭的燃烧效率玩出花来。DeepSeek面临的就是这么一种情况。
对技术不大感兴趣的读者,可以直接跳到下面的“市场反应”小节,继续阅读我们对市场方面的相关分析。如果看到这里,这篇文章还没能让您犯困,我们就继续来看DeepSeek的技术细节。
DeepSeek V3
虽然网传DeepSeek实际上囤积了上万张A100乃至H100显卡,我们这里姑且相信文章中他们只用了2048张H800的说法。注意,H800是H100的中国特供版,其通信带宽是H100的一半,其他性能不变。也正因如此,H800很难像H100一样,有效组建大规模计算集群。这可能也是V3只用到了2048张卡训练的原因。
为了在捉襟见肘的算力下训练模型,DeepSeek V3采用了多种极端方法优化,我将对训练效能最大的贡献依次列举如下:
  • 世界范围内首次采用fp88位浮点数,一般电脑中全精度浮点为32位,8位浮点可以节省75%的空间混合精度训练100B以上规模的大语言模型。在此过程中, DeepSeek解决了大量计算(比如哪些用fp8,哪些要用精度更高的fb32)问题,并优化了不少矩阵计算中必要的Tensor Core CUDA算子。
  • 采用自研的DualPipe训练框架,通过调度通信和计算顺序,减少每一个节点的空闲时间,将GPU的并行算力压榨到极致。一般而言,在各大公司的大语言模型技术报告中,因为训练系统内在的不稳定性,往往需要从上一个储存点(Checkpoint)重启多次才能完成一个Epoch的训练,但DeepSeek并没有。根据团队自己的说法,在2个月的训练过程中没有一次因遇到损失异常而重启。该框架的优化水平令人咂舌。
  • 在模型设计上,DeepSeek采用改进后的MoE(Mixture of Experts),大幅降低了训练的资源需求。具体来说,通过MoE,每个Token训练所激活的神经元从670B降低到不足37B,仅占权重的不到5%。这大幅加快了Token的训练速度,减少训练时间。DeepSeek训练1T Token所需时间约为3天,因此全部14.8T数据训练完毕,最终花费约2个月。
从这篇V3的技术报告看,除fp8外,该模型在训练方面的其他贡献主要是基于前人工作的改良,而非革命性的
  • 比如在MoE的路由函数上加入一个非零的极小偏置,以避免某些权重归零,坍缩MoE;
  • 又或者是将移动平均值出存在CPU缓存中,减少通信开销;
  • 模型增加推理上下文长度(Context Extension)的技巧,其实也来自2023年一篇名为YaRN的华人文章。这一点相信业内同行均有使用;
  • DualPipe设计非常精妙,但具备LLM训练能力的各家大厂应该都有类似并行框架,比如ZeRO。只不过在Bubble Time 和 Expert Parallelism上没有做的像DeepSeek一样这么精湛。
此外,模型还采用了一种叫做MLA(Multi-head Latent Attention,多头隐空间注意力机制)的技术。这个技术名字听起来玄乎其玄,其原理非常简单。他是利用线性代数中的基本的投影计算,将注意力头中原本高维度的Q, K, V三大矩阵投影到更低维的“隐空间”里,压缩他们的大小,以便在训练结束后储存在节点缓存中。这样的好处是在推理时不必重新计算输入单词的KQV,大大加快了推理速度。这也是DeekSeek推理成本低,Token生成速度极快的原因。
最后,V3还使用了MTP(Multi-Token Prediction,多词预测)技术。不过在实际训练中MTP的长度仅为1。也就是和GPT相比,V3只多预测了一个单词。这主要是为了提高文本数据利用率,增强模型的预测能力,和训练效率无关。
我认为MLA和MTP均非革命性,类似的技术OpenAI和其他公司应该也有所采用。特别是MoE,早在GPT-4时期就有传闻。
总的来说:
  • DeepSeek V3利用 fp8 量化精度和 MoE 混合专家技术做到了模型大小和训练成本的极致优化,让670B的基础模型在较小集群中也能充分训练;
  • 同时,他采用MLA多头隐空间注意力让推理成本进一步下降,在个人电脑上也能实现不错的效果。
上述两点,让DeepSeek V3成为了开源大语言模型里兼顾成本和速度的佼佼者。
DeepSeek R1/Zero
和DeepSeek V3相比,R1的贡献则比较“简单”。他创造性地使用了一种叫做GRPO(Group Relative Polixy Optimization)的增强学习(Reinforcement Learning)策略。团队在不需要人工标注思维连的前提下,直接用问题答案作为参考,对模型输出自动评分。令人惊奇的是,模型在数学和代码问题上“自然涌现”出了推理能力。这一发现就是R1文章对LLM-AI领域最大的贡献。
和传统的PPO相比,GRPO的优势主要体现在下面几个方面:
  • 他不需要人工标注每个备选答案的分数,也就是做到真正的无监督训练
  • 他减少了PPO的复杂度,省略了需要训练的价值模型(Value Model)
鉴于Reinforcement Learning本身是一个非常复杂的话题,具体细节超出了本文范畴。这里我们只需要知道,DeepSeek尝试了一条其实一直摆在大家面前,但却被社区长期忽略的道路:直接将答案作为判别式进行训练。这么一来,GRPO的Reward Model甚至都简单到只是一组规则(Rule-based),设置起来非常方便,训练成本非常低,可解释性非常强。当然其缺陷就是:它只对数学、代码这种有明确答案的场景进行推理。
至于说为什么之前所有人类似GRPO的尝试都失败了,而在DeepSeek上却大获成功,这一点想必是圈内的热议话题。有一种理论认为,是其他LLM的思维链数据意外”泄露”到了DeepSeek V3训练数据中造成污染,才让此技术成功。是否果真如此,还需要等待业内人士确认。
为了弥补GRPO在其他场景下能力的缺陷,DeepSeek还做了以下骚操作
  • 这个以DeepSeek V3为基础无监督RL训练出来的模型,被称为DeepSeek R1-Zero。
    • 由上述GROP的评分机制决定,这一模型回答数学和代码以外问题存在缺陷,比如输出语言混合,格式混乱等。
  • 加入了大量“人工标注”的训练数据,对DeepSeek R1-Zero进行监督微调(SFT)。这些数据对应文学、语言、对话和其他数学和代码之外的推理场景。
    • 数据源宣称来自DeepSeek-V3 和 DeepSeek R1-Zero的原始输出,外加一些必要的人工迭代。
    • 在这个阶段是否有混入ChatGPT的思维链,我们并不清楚。
  • 这个微调的过程一共重复了2次,也就是业内常见的RL-SFT-RL-SFT Pipeline。最终,DeepSeek得到了一个令他们满意的新的模型。经过“微调”后的模型,才是今天的主角:DeepSeek R1
这些细节表明:
  • DeepSeek R1是完全的无监督训练,这一说法并不准确。要想让模型在各方面都达到OpenAI o1的水平,依然需要大量的标注数据
  • 即便如此,GRPO表现出来的无监督推理能力仍然令人震惊。它才是DeepSeek R1横空出世对学界最大的贡献,也是业界未来将要大力研究的方向。
  • DeepSeek进行了更多实验,比如将R1推理能力蒸馏到了更小的QWEN和Llama模型上,这些模型的推理能力也获得了较大提升。当然,这些模型的综合实力还是无法和参数规模达670B的原装R1相比,蒸馏模型更多的意义可能在仅限终端。
在DeepSeek R1问世后不到3天,就已经有人在Llama-1b上复现了GRPO的效果。显然,经过GRPO训练后,Llama-1b在数学和代码上的能力远超同级别模型。这说明GRPO是有效的。更多公司如Meta,Anthropic甚至OpenAI可能会很快跟进。
市场反应
伴随着CNBC采访Alexandew Wong和推特上中英文社区热火朝天的讨论,DeepSeek的影响力在这个周末迅速发酵。周日下午,DeepSeek App一度超越ChatGPT,成为苹果App Store美区免费软件生产力榜单下载量第一。
此消息一出,我就预感到大事不妙。随后美股期货开盘,NQ径直跌下1%;Robinhood 24小时交易夜盘开盘,NVDA首当其冲大跌5%;整个AI半导体板块从设计,制造到周边,均出现大幅下跌(更新:跌幅在盘前进一步扩大,NQ跌4%,NVDA最大跌11%最终NVDA跌幅达到了惊人的18%)。具体来说,盘前:
  • ARM,英伟达和AVGO均下跌5%。他们都和高算力芯片的设计有关,其中ARM是英伟达GB系列产品的CPU方案,AVGO是AI定制芯片ASIC的设计商
  • MU跌4%,他和高算力芯片所需的大容量高速内存HBM有关
  • 台积电跌4.5%,他是这些芯片的制造商
  • Intel跌2%,AMD跌2.5%。他们本来就没有在算力市场上分到多少羹,算是被带崩。
  • 高通也下跌2.8%,属于算力芯片的外围供应,如芯片通信方案。
半导体板块总计在盘前抹去了接近1万亿市值,相当于孙正义5000亿Stargate投资方案的两倍。这何尝不令人哑然失笑。
作为美国的竞争对手,甚至是某些方面的敌对国,中国在芯片禁运的条件下,用更差的显卡,更低的成本,更快的速度,实现了可以比肩OpenAI的开源模型,这对市场的投资逻辑而言无疑是颠覆性的
不论如何,市场总是选择先跌为敬,开盘后再让华尔街的交易员们消化。乍看之下,NVDA最先进的GPU或许将不再重要;云服务商26年之后的Capex可能会迅速减少;在最糟的情况下,美国丧失科技领先地位,Stargate出师未捷身先死,泡沫迅速破裂,AI上下游市场价值被重写。
不确定带来恐慌,恐慌带来抛售,这无可厚非。况且,周一盘前的下跌还有可能是伴随日元加息和FOMC避险的因素,也并非完全是DeepSeek一家公司的原因。除了半导体板块外,美股几乎所有板块都在下跌,加密货币也难逃一劫。这一切,都让我想到去年7月底机构去杠杆,疯狂Degrossing的场景。
但在市场情绪彻底消散之前,我们依然要问自己两个问题:
  • 英伟达GPU是否不再必要?
  • 真正受DeepSeek冲击的行业是谁?
对这两个问题的回答,将决定我们今天是彻底清仓,还是继续抄底;如果抄底,应该抄谁。下面,我将回答这两个灵魂之问,并附上本周我的操作总结和下周计划。以下内容代表个人意见,仅供参考。
不再必要?
  • 从DeepSeek自己给出的技术报告来看,DeepSeek V3成功的关键在fp8量化,而fp8 计算的关键又在于NVDA Tensor Core的对低精度矩阵乘法的支持。实际上,虽然V3完成了世界首次大规模的fp8混合精度训练,他们依然对Tensor Core现有的设计颇有微词,甚至对此提出了多个建议,希望NVDA能在GB和下一代计算卡中改进。比如在3.5.2节中,他们建议NVDA能提高fb8矩阵乘法后结果累加的精度。
  • DeepSeek V3训练成果的另一个关键,是自研DualPipe对显卡训练性能的极致榨取。这实际上也依赖NVDA的NVLink在all-to-all这一瓶颈操作上的优异表现。
以下内容为会




 楼主| 发表于 2025-2-10 12:44:38 | 显示全部楼层
2025年1月28日:DeepSeek光速反转,训练秘方硅谷早已掌握?降本增效不影响支出,AGI才是最终目标;准备周三FOMC和特斯拉财报
Published by
Bo Zeng


on
[color=var(--wp--preset--color--foreground)][color=var(--wp--preset--color--foreground)]1月 29, 2025




大家好,今天是2025年1月28日星期二,恰逢国内大年初一,这里祝大家新春快乐,给大家拜年了。承蒙厚爱,周末所写的DeepSeek技术分析报告在网络上广为流传,也称为本站阅读量最大的一期日报。希望以后有机会能给大家带来更多结合科技和投资方面的深度分析。再次谢谢大家的点赞、转发和支持。
虽然关于DeepSeek训练速度、推理效果等基本问题应该被我们差不多搞清楚,但是纵观全网依然还是有一些误会。有机会的话,我会在接下来几天找时间录一期Youtube视频,对上期日报内容进行更加精炼的小结,供不方便阅读文字的朋友们了解。我也会在视频中加入最近关于此事的最新进展,特别是马斯克、OpenAI、Lecun Yann和微软均已就DeepSeek事件做出相应回复。
光速反转?
今天半导体走出了一回令所有人意外的反转。在周一早盘英伟达大跌11%时,我就已加仓买入NVDL和一些NVDA2月底Call,为抄底做准备。不过当时因为周末日报刚写完,实在太困就睡了过去。等下午醒来一看,不得了,NVDA竟然最大下探到18%,跌幅较上午接近翻倍。该股也打破了自去年9月以来由自己创造的纳斯达克个股最大单日跌幅记录,抹去市值近6000亿——这甚至超过了Stargate投资额的总和。
市场的反应显然过度了。根据我们的理解,DeepSeek依然选择和NVDA深度合作;从所谓Jevons悖论来看,效能的提高反而会导致更广泛的消耗,而不是相反——打印机就是一个很好的例子。因此不论从什么方面去理解,NVDA都不应该无缘由拿下18%的跌幅。从周一的收盘价计算,NVDA甚至已经跌回2024年6月,等于公司半年白忙了。
这并不合理。我们认为,周一NVDA大跌,主要是多个因素共同促进导致:
  • DeepSeek改变了模型训练的范式,大幅降低训练成本。这不可避免地改变了估值逻辑,让本就过热的AI赛道风声鹤唳。与此同时,Meta在没有显著利好新闻的情况下逆势上涨,这可能是Meta拥有Llama一系列开源模型。Meta和NVDA之间的的一涨一跌,很可能是华尔街选择“空半导体,多开源模型”,下意识扎堆避险导致。但我认为这种情况在市场充分消化该消息后会逆转。
  • 然而,仅凭DeepSeek一个模型又如何能撬动万亿市场?更何况它本身开源,美国各大AI公司很快就能复现。另一个利空消息可能才是本次暴跌的幕后黑手。周一,特朗普宣布要对美国之外的半导体产品加征关税,关税幅度从25%到100%不等。政策虽尚在讨论之中,但显然对台湾半导体产业链构成重大打击。这可能也是TSM在周一被一同抛售的原因。NVDA虽然是一家美国公司,且可以通过涨价将成本转移到一众CSP身上,但作为半导体龙头,被ETF和算法连带抛售也属情理之中。
  • 本周,恰逢大批CSP公布财报。周三,微软、Meta都不得不在电话会议中回答是否继续加大投资,以及AI算力的回报合理性问题。如果CSP们暗示将减少26年以后高端GPU预算,那么NVDA将继续承压。这种不确定性很可能加剧了抛售力度。
  • 周三的FOMC也市场从上周起就处于被动状态。在失去买盘的情况下,市场容易因风吹草动造成大幅下跌:这也就是所谓的“进入亚稳态后,因偶发扰动突然坍缩,选择方向”。
  • 关于NVDA的出口禁止令继续发酵。根据估计,如果完全禁止向新加坡出口,英伟达最大可能损失高达22%,由于该公司股价长期被实际营收所支撑,EPS暴跌显然是致命打击。
神奇的是,极端负面的市场情绪在周二来了一次惊天逆转。在开盘后半小时的多空博弈犹豫不决之后,NVDA大福反弹,最终日内涨超9%,每股涨约10美金。两倍做多ETF NVDL大涨18%;NVDL是NVDA最好的抄底工具,也是周一,周二我盘前的购买的标的。
从技术面看,这或许可以解释成NVDA触及100日均线后正常反弹。不过我个人认为,更可能是交易员们在消化了一天的动荡之后,终于回过神来。DeepSeek带来的行业冲击可能并没有之前想的那么糟糕:
  • 首先,DeepSeek很可能拥有远超2048颗H800芯片的算力,业内普遍认为他们可能有5万张H100显卡,而且近年来购买显卡的花费已超数亿美元。并且,V3和R1训练过程应远超600万美金。按行业内常见的10次以上实验以优化参数计算,本次研发最低也消耗上千万美金,绝非一般团队能支撑。
  • 周二,OpenAI团队终于对DeepSeek做出正面回应,称该公司独立发现了一些OpenAI早在使用的“秘密”,暗示RL推理训练已被美国AI公司广泛采用。并在回复中继续称,“现阶段提高模型智能比降本增效更重要”,AGI才是最终目标,未来会继续加大算力投资。此消息来自OpenAI的核心研究员,想必是极大的安抚了市场情绪。
  • 一些研究人员指出,DeepSeek之所以能用简单的RL算法获得比肩o1的推理能力,数据泄露可能是一个主要因素。近年来,随着大批成熟LLM模型问世,在工程师的精心调教下(如Prompt Engineering),模型输出已包含大量思维链信息。这些数据不可避免的流入互联网,成为新模型训练语料的一部分。DeepSeek新模型天然和思维链对齐,训练起来自然更有优势。这可能是虽早有其他团队尝试pure RL,但却均告失败的原因。
  • 周二,DeepSeek服务器突遭DDoS攻击,出现限制新用户注册、回答速度大幅下降等一系列产品问题。这可能也让市场意识到:没有足够的算力,模型再小显卡也不够用的现实。正如我们上期日报所说,FLOPS永远是王道。模型再快,还是要有足够的算力来同时服务全球60亿人。没有人会嫌弃更大的算力,这也和微软、OpenAI CEO以及Lecun Yann的看法类似。
  • 更新:据金融时报报道,OpenAI指控DeepSeek在去年秋季透过API大幅盗取GPT数据,这将为市场在DeepSeek上的反应带来更多不确定因素。此外,阿里巴巴宣布研发出一款表现超越DeepSeek的大语言模型,若属实,这将让市场重新审核这一系列事件对AI的意义。后市如何可能需要更多耐心。对此我有自己的看法,也欢迎[color=var(--wp--preset--color--foreground)]入群共同讨论。
总而言之,周二的反弹是欢迎的。这一反弹是否能够持续,需要等待周三FOMC和CSP财报才能确认。我昨天的抄底仓位已经减仓,具体操作见文末。
FOMC
考虑到篇幅,我就大致分享一下对明天FOMC的看法:
  • 据FedWatch数据,25年1月美联储降息25个基点的概率不足0.5%,有高达99.5%的概率不会降息。基本上可以确认本月不会降息,这也我们之前日报的预期一致。
  • 从全年来看,有98%的概率会在25年12月底之前累计降息两次。在月初好于预期的CPI数据出炉之后,市场维持每年降息2次的预期不变。该预期最糟时曾一度跌至1次。
  • 我维持之前对25年美联储宏观政策的基本判断:就业数据比CPI更重要
    • 即使CPI放缓,美联储也不会加快降息步伐;
    • 如果劳动力市场持续火热,美联储可能会暂停降息,但并不会加息。
    • 虽然CPI对降息没有决定性作用,但过高的CPI可能会促使美联储加息。所谓“物极必反”,大概就是这个道理吧。
总而言之,
  • 如鲍威尔能给特朗普上任第一周面子,在周三的发布会上重申稳健的降息步骤,并对通胀达标持续乐观,市场会继续反弹;
  • 如鲍威尔和12月一样强势,反复强调“降息进入第二阶段”,甚至给市场为全年不再降息打预防针,那周二短暂的反弹可能提前终止。
如上所述,其实投资是个概率问题,没有人可以预测未来。控制仓位,不论是博反弹抄底或是做空保护,都是散户手中最好的武器。
最近一个月,10年期国债收益率虽从高点有所回路,但依然在4.5%警戒线之上。因此我延续了12月圣诞节以来“不加仓,逢高减仓”的策略,周一这种短期博弈反弹的机会除外。
特斯拉财报
周三,对我而言还有一件大事,就是特斯拉的第四季度财报。自特朗普就职以来,TSLA股价已经连续7天下跌,财报将是股价接下来选择方向的关键。同样因为篇幅,我简单总结自己的看法如下。感兴趣的读者,可以[color=var(--wp--preset--color--foreground)]入群深入讨论。
  • TSLA Q4 汽车业务营收不容乐观。1月初的交付数据已透端倪,欧洲和美国的电车销量大幅不及预期。Model Y改款可能会提振销量,而且已经在中国市场得到体现,但特斯拉依然面临美国电车补助取消的威胁。
  • 除AI外,财报最大的看点就是能源业务。能源业务在近期面临有两个互相抵消的重要变革,可能左右市场情绪:
    • 一个是特朗普正式退出巴黎协定,全球变暖议题被搁置,这会大幅降低碳积分的必要性,减少特斯拉这方面的收入;
    • 另一方面,随着数据中心耗能增加,电网负载呈压,为削峰填谷降低综合用电成本,特斯拉储能业务可能会收获更大需求,意外成为继核能和芯片股之外,全球AI算力增长的受益方。
    • 相比而言,我认为后者的影响比前者要大,因为后者代表产业变革。因此,我对储能业务年化增长的预期依然乐观。
  • AI方面,市场关心的当然就是FSD的最新进展,以及Robotaxi的量产时间。数据显示,FSD 13的高速公路里程平均接管数相较FSD 12下降近百倍,令人惊艳。根据我个人的测试,FSD 13的驾驶表现已非常接近人类,当然在导航数据等方面和谷歌相比还有改进空间,尚不能完全脱离监督。但就在周二,马斯克转发了一条特斯拉工厂中,汽车自动从生产线开出开往码头指定地点载货的视频,宣称“无监督的无人驾驶已经到来”。如果马斯可能在财报会议上对FSD给出乐观指引,股价可能会迅速上涨
  • 机器人方面,特斯拉方面似乎一直释放着“大超预期“的信号,比如在25年底,特斯拉预计将能生产数千台Optimus人形机器人,并在2026年增加到最多10万台;大家很快将会见到“非常多”的机器人等等。不清楚这些言论是“自夸”还是公司对自己的真实预期,需要在财报的电话会议中才能得到确认。
我对特斯拉财报之后走势的看法是:
  • 如果AI进展(包括FSD,Robotaxi和机器人)超预期,上看$420,如突破$420可能最高涨到$450的前高。
  • 如果AI进展不及预期,或者马斯克发言令华尔街失望,那么下看$350。



您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|boway Inc. ( 冀ICP备10011147号 )

GMT+8, 2025-3-12 12:37 , Processed in 0.112412 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表