通俗解释：大模型的参数究竟是啥？

大模型的参数究竟是什么东西啊？前几天我老婆这么问我。我说参数参数，就是参天大树……（哔——）参数参数，它就是个数嘛！比如其中一个参数可能是3.1415926，另一个参数可能是-0.0009527。像DeepSeek R1 最大的版本是671B，这个B是十亿的意思，也就是它有6710亿个，类似这样的数。你可以想象一张巨大的表格，每一个格子里都有一个类似这样的数，一共有几千亿个数，这些参数通常占了一大

大靠山

962人浏览 · 2025-04-10 10:32:55

大靠山 · 2025-04-10 10:32:55 发布

大模型的参数究竟是什么东西啊？前几天我老婆这么问我。

我说参数参数，就是参天大树……

（哔——）

参数参数，它就是个数嘛！

比如其中一个参数可能是3.1415926，另一个参数可能是-0.0009527。

像DeepSeek R1 最大的版本是671B，这个B是十亿的意思，也就是它有6710亿个，类似这样的数。

你可以想象一张巨大的表格，每一个格子里都有一个类似这样的数，一共有几千亿个数，这些参数通常占了一大模型90%以上的体积。

她听完好像更疑惑了：为什么大模型掌握的各种知识、规律，为什么可以「储存」到这么一堆数字里呢？

于是我决定换一种方式，利用初中知识来让她理解大模型里的参数究竟是干什么的？

但凡，你不是九年义务教育的漏网之鱼。

就肯定知道，这个东西可以来拟合一条直线。

只要你找到了这条直线对应的a和b的值，你就是这条线的世界里的神。

因为你掌握了这条线上的所有点的分布规律——给你任何一个点的x坐标，你都能很快推导出它的y。

换句话说：

只要找到合适的拟合方法，这条线上无数多个点的分布规律都被压缩到a和b这两个小小的参数里。

规律就这么被「压缩」到参数里。

而大模型做的事情，就是把这个世界的文字或者图像或者声音的分布规律，压缩到一堆参数里。

人工智能圈里流行一句话叫：「压缩」即「智能」。

只不过，一条直线上的所有点，分布规律比较简单，所以拟合它需要用到的公式（y=ax+b）就非常简单，参数也非常少（只有a、b两个)。

而文字、图像和声音的规律比一条直线的规律显然要复杂得多，所以拟合的方法也更复杂。

需要用像自注意力机制、反向传播算法、Transformer 架构、词嵌入等复杂方法。

需要用的参数量也更多，得要百亿、千亿甚至更多，才能更准确地捕捉复杂的分布规律。

但本质上，它跟人们用一个简单的公式，去拟合一条直线，背后的思想是一样的。

训练一个大语言模型的过程，是通过大量已有的文字，推导出最合适的模型参数。

就像是根据已知的两个点的坐标，去计算推导出a和b的值。

而「使用」大语言模型的过程，是输入一些新的文字，通过模型参数和拟合方法的计算，得到新的文字。

这就好比是，在已知参数a和b的值，以及直线方程表达式，给你一个点的x坐标，让你来求它的y坐标。

总之，大模型的核心，就是这两样东西（参数和拟合方法），只要能有了合适的参数和拟合方法，哪怕是用Excel表格也可以制作出一个大模型。

这个就是网友用Excel做的GPT-2，里头每一个各自里的那个数字，就是一个「参数」：

有了这些合适的参数，再配上合适的计算方法，它就可以成为一个所谓的大模型。

顺便说一嘴，这个Excel文档大概有整整1.34GB大小，用起来特别卡，来自开源项目：

我给大家演示一下效果啊。

我在左边输入几个单词，Dogs are man’s ，它就可以计算出下一个词最有可能是best。

我再把best填到左边，它又可以预测出下一个词是friend

我再重复一边，它会预测出一个下一个token（词元）是句号。

其实从理论上来说，只要你有了合适的参数和计算方法，你用纸和笔，也是能手搓出一个“大模型”的（只不过计算起来非常慢）。

所以回到最开始的问题：大模型的参数究竟是什么东西啊？

参数，真的就是一个数，参与计算的数。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述