DeepSeek R1 是怎么训练出来的?

发表于2025-02-06|更新于2025-09-16|免费AI工具AI知识

|浏览量:

这几天发了不少DeepSeek的视频，看到有不少同学对V3和R1的关系不是很清楚，这里简单说下我自己的理解。首先，我们要知道大语言模型的训练最开始是用各种网络数据训练出能对语言有基本理解的模型，这通常叫做预训练过程，得出来的模型通常叫做Base Model，比如这里的DeepSeek-v3就是个base model，这个base model就像一个打破任督二脉的武林高手，一身知识和内功，但是不懂怎么运用…

请我喝杯咖啡

微信赞赏

相关推荐

DeepSeek R1：怎么实现国产免费加强版Perplexity

国产加强版Perplexity啊！我们知道Perplexity可谓是大语言模型应用落地最成功的产品，他可以将网络搜索的内容帮我们整理好再给我们答案，不需要我们点开各个搜索结果网页查看，但它做的更多还是将拿回来的网站内容文本做总结，并不确保结果一定合理。如果我们将它这个网络搜索总结能力结合推理大模型的能力，那我们将会得到加强版的Perplexity了。而这，就是今天我要跟大家分享的最强免费推理大语言模型deepseek r1了，通过它的深度思考和网络搜索能力… 访问入口

Grok3推理模型测评：打败DeepSeek r1？

Grok3 reasoning model推理模型测试报告啊。今天终于发现可以在官网上免费用上Grok3了，鉴于上次在lmarena上测试的是early-grok-3，这次准备在官网上正式测试下，我们这次先测试的是推理模型。去到官网，看到这里已经是grok 3了，选择Think，打开推理模式… 访问入口

DeepSeek Prover：最新炸裂模型发布！

号外号外！DeepSeek推出最新炸裂模型！数学证明的终极革命来了！DeepSeek一小时前刚推出DeepSeek-Prover-V2-671B，这将用AI重新定义数学推理的边界！这款由 DeepSeek打造的超级数学大脑，拥有 6710亿参数的惊人规模… HuggingFace访问入口

谁是下一个deepseek？

顶级域名 AI.com 突然解绑中国AI新秀DeepSeek，跳转至一个神秘感十足的页面。这一变动不仅让行业猜测四起，更暗示着一场颠覆性AI变革即将到来访问入口

DeepSeek Engineer！免费创意变App！

兄弟们，还记得之前跟大家介绍过的超简洁AI编程工具DeepSeek Engineer V1吗? 这几天他们更新了！新版 V2 超好用，是个轻量级 AI 编码助手，本地就能玩。 Github项目访问入口

AskManyAI：DeepSeek r1满血版免费用.

.DeepSeek R1满血版免费用啊！我们知道国产之光DeepSeek r1火遍全球，奈何官方托管访问量过大及其他原因导致老是出现服务繁忙，自家部署的话有只能部署个蒸馏小参数版本。今天跟大家介绍一个可以免费用DeepSeek r1满血版的方式… 访问入口

数据加载中