DeepSeek V4 源码剖析

DeepSeek V4 源码剖析

第一本面向 1.6T 稀疏 MoE 模型源码的深度专著。

本书基于 DeepSeek-V4-Pro Preview(2026-04-24 在 Hugging Face 开源,MIT 许可)的官方推理实现 inference/model.pyconfig.json、官方 DeepSeek_V4.pdf 技术报告,以及与之配套发布的三个工程仓库——FlashMLA(稀疏注意力 CUDA 内核)、DeepGEMM(FP4/FP8 GEMM 内核)、DeepEP(MoE all-to-all 通信库),系统拆解 V4 在架构、精度、训练、部署四个维度上的全部设计决策。

这本书会回答你什么

目录

开篇

第一篇:全景

第二篇:注意力革命

第三篇:MoE 引擎

第四篇:超连接与 MTP

第五篇:FP4 / FP8 训练栈

第六篇:分布式与通信

第七篇:训练与对齐

第八篇:生态与部署

适合谁读

学习建议

V4 的源码看似只有 800 行 inference/model.py,但每一行背后都压着一篇论文级的设计决策。建议按"第一篇 → 第二篇 → 第四篇 → 第三篇 → 第五篇 → 其他"的顺序读:

相关丛书

版权声明

本书采用 CC BY-NC 4.0 许可协议。转载或引用请署名 杨艺韬 并附原文链接,禁止商业用途。

本书所引用的 DeepSeek-V4 源码遵循 MIT 许可,分析的版本为 Preview Release(HF 仓库 deepseek-ai/DeepSeek-V4-Pro,2026-04-24 首次提交)。后续随官方代码更新,相关章节会标注适用版本范围。