|
|

楼主 |
发表于 2025-2-26 11:05:29
|
显示全部楼层
Introducing DeepSeek-R1 optimizations for Blackwell, delivering 25x more revenue at 20x lower cost per token, compared with NVIDIA H100 just four weeks ago.Fueled by TensorRT DeepSeek optimizations for our Blackwell architecture, including FP4 performance with state-of-the-art production accuracy, it scored 99.8% of FP8 on MMLU general intelligence benchmark.FP4-optimized DeepSeek checkpoint now available on @huggingface
: [size=0.001px]https://huggingface.co/nvidia/DeepSee[size=0.001px]k-R1-FP4…
为 Blackwell 引入 DeepSeek-R1 优化,与四周前的 NVIDIA H100 相比,收入增加了 25 倍,而每个代币的成本降低了 20 倍。
得益于 TensorRT DeepSeek 对我们的 Blackwell 架构的优化,包括具有最先进生产精度的 FP4 性能,它在 MMLU 通用智能基准测试中获得了 FP8 的 99.8%。FP4 优化的 DeepSeek 检查点现已在[url=https://x.com/huggingface]@huggingface
上可用:
翻译得准确吗?请提供反馈,以便我们加以改进:

上午7:49 · 2025年2月25日
·
36.7万
查看
100
482
2,696
593
|
|