AI产品狙击手

专注于大语言模型LLM,文生图模型Stable Diffusion, 视频生成模型等免费AI工具的分享和应用,助你掌握最前沿的AI技术

0%

DeepSeek R1 是怎么训练出来的?

这几天发了不少DeepSeek的视频,看到有不少同学对V3和R1的关系不是很清楚,这里简单说下我自己的理解。首先,我们要知道大语言模型的训练最开始是用各种网络数据训练出能对语言有基本理解的模型,这通常叫做预训练过程,得出来的模型通常叫做Base Model,比如这里的DeepSeek-v3就是个base model,这个base model就像一个打破任督二脉的武林高手,一身知识和内功,但是不懂怎么运用…