DeepSeek打造您人生中的第一个一百万

最近DeepSeek可以说的超级火，不仅仅是IT圈，在教育圈，医疗圈，甚至是娱乐圈都是火爆了。趁着这波热度很多人默默的卖课，卖教程甚至于骗点击流量，大大的挣了一波。这个时候试问屏幕前的您，眼红了没有。不要急，今天小编便教教大家如何通过DeepSeek打造人生中的第一个一百万

Cosmos_Zhang

1807人浏览 · 2025-02-08 21:03:20

Cosmos_Zhang · 2025-02-08 21:03:20 发布

简介

最近DeepSeek可以说的超级火，不仅仅是IT圈，在教育圈，医疗圈，甚至是娱乐圈都是火爆了。趁着这波热度很多人默默的卖课，卖教程甚至于骗点击流量，大大的挣了一波。这个时候试问屏幕前的您，眼红了没有。不要急，今天小编便教教大家如何通过DeepSeek打造人生中的第一个一百万(百试百灵，包教包会)。

工欲善其事，必先利其器

你说你都要赚一百万的人了，那搞个好点的设备不过分吧。实测挣的多少与设备的性能成正比哈。不开玩笑了，本文就是教您打造DeepSeek R1的本地部署。具体的配置推荐如下：

DeepSeek版本	笔记本内存	CPU	GPU情况
1.5B	16G	i5 CPU	无GPU 2-3并发可流畅运行
7B	32G	推荐i7 CPU	无GPU 2-3并发可流畅运行
8B	32G	推荐Ultra 7 CPU	无GPU 2-3并发可流畅运行

条条大路通罗马 Ollama（模型管理） + AnythingLLM/Dify/Open-WebUI/ChatBox（前端功能扩展）

准备好机器之后剩下的就是抵达罗马的大道，本文会介绍并带着大家安装以Ollama为基准的各种DeepSeek环境。对于想要在本地或自托管环境中运行 LLM 的用户而言，Ollama 提供了一个无需 GPU、在 CPU 环境也可高效完成推理的轻量化 “本地推理” 方案。而要让 Ollama 真正 “接地气”，往往需要与其他开源项目进行配合 ——例如将文档、数据源或应用前端与 Ollama 打通，这便衍生出许多解决方案。

Ollama 简介

在进入对比之前，先简单回顾一下 Ollama 的定位和特性：

本地推理： CPU 即可运行：适合 Mac 或 Linux 环境。若无 GPU 的情况下，也能让开源模型（如 Deepseek、LLaMA、GPT-Neo、Mistral 等）跑起来。
轻量易用：安装方式简洁，一键下载二进制文件或通过 Homebrew、pkg 安装。只需一个命令行工具就能加载模型并进行对话、推理。
量化优化：支持对常见大语言模型做 4-bit 或 8-bit 等量化，进一步降低资源占用。
发展活跃：在 GitHub 上有不错的社区支持和更新节奏，适合初中级开发者快速上手

那如何安装Ollama呢？

很简单，首先进入Ollama的官网点击此链接 Ollama 如下图

点击Download就能进入如下页面

注意C盘的磁盘使用率最好大于12GB，下载完毕直接点击安装即可。

下面是一些ollama参数和配置标识，不感兴趣的童靴直接跳过即可。

参数	标识与配置
OLLAMA_MODELS	表示模型文件的存放目录，默认目录为当前用户目录即 C:\Users%username%.ollama/models Windows系统建议不要放在C盘，可放在其他盘（D:\ollama\models)
OLLAMA_HOST	表示ollama服务监听的网络地址，默认为127.0.0.1 如果想要允许其他电脑访问Ollama（如局域网中的其他电脑），建议设置成0.0.0.0
OLLAMA_POST	标识ollama服务监听的默认端口，默认为11434 如果端口有冲突，可以修改设置成其他端口(如8080等)
OLLAMA_ORIGINS	标识HTTP客户端请求来源，使用半角逗号分割列表如果本地使用不受限制，可以设置成星号*
OLLAMA_KEEP_ALIVE	标识大模型加载到内存中后的存活时间，默认为5m即5分钟（如纯数字300代表300秒，0代表处理请求响应后立即卸载模型，任何负数则表示一直存活）建议设置成24h,即模型在内存中保持24小时，提高访问速度
OLLAMA_NUM_PARALLEL	表示请求处理的并发数量，默认为1(即单并发串行处理请求)
OLLAMA_MAX_QUEUE	表示请求队列长度，默认值为512 建议按照实际需求进行调整，超过队列长度的请求会被抛弃
OLLAMA_DEBUG	表示输出Debug日志，应用压法阶段可以设置成1（即输出详细日志信息，便于排查问题）
OLLAMA_MAX_LOADED_MODELS	表示最多同时加载到内存中模型的数量，默认为1(即只能由1个模型在内存中)