香橙派（Orange Pi AI Pro，昇腾NPU）本地跑DeepSeek等LLM

全栈O-Jay

221人浏览 · 2025-12-30 16:15:16

全栈O-Jay · 2025-12-30 16:15:16 发布

从零于香橙派快速部署DeepSeek1.5B、QWen0.5B、TinyLLama三个轻量LLM。8T和20T算力的都行，内存最好16GB或以上。

0、SD卡导入镜像

用balenaEtcher将官网的镜像拷进SD卡（最好Ubuntu 22.04）
在这里插入图片描述

1、连接板子

在这里插入图片描述
开发板开机成功后登录帐号HwHiAiUser，密码Mind@123
单击下方菜单栏的终端图标，或使用Ctrl+Alt+T快捷键，打开终端窗口，执行Linux命令

2、环境配置

检查CANN版本

cat /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/ascend_toolkit_install.info

输出如下信息OK，
在这里插入图片描述
否则参考CANN升级指南进行CANN升级或者降级

安装MindSpore

pip uninstall mindspore -y 
pip install https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.5.0/MindSpore/unified/aarch64/mindspore-2.5.0-cp39-cp39-linux_aarch64.whl--trusted-host ms-release.obs.cn-north-4.myhuaweicloud.com -i https://pypi.tuna.tsinghua.edu.cn/simple

Swap检查

free -m

在这里插入图片描述

若swap没有配置，需要执行下面命令，配置swap 16G

sudo fallocate -l 16G /swapfile 
sudo chmod 600 /swapfile
sudo mkswap /swapfile 
sudo swapon /swapfile 
echo '/swapfile none swap sw 0 0' | sudo tee -a /etc/fstab

安装gradio

pip uninstall gradio -y 
pip install gradio==4.44.0

安装mindnlp （0.4版本）

pip install git+https://github.com/mindspore-lab/mindnlp.git@0.4

环境变量配置

echo 'export TE_PARALLEL_COMPILER=1' >>~/.bashrc 
echo 'export MAX_COMPILE_CORE_NUMBER=1' >>~/.bashrc
source ~/.bashrc

安装cgroup

sudo apt-get update
sudo apt-get install cgroup-tools
# 检查是否安装成功
cgcreate --help

3.1、部署Deepseek1.5B

新建Deepseek-Qwen文件夹

mkdir Deepseek-Qwen

下载代码文件
到代码仓库下载源码，放到Deepseek-Qwen文件夹下
传输文件可以用微信传输助手网页版，比较方便
在这里插入图片描述

打开终端，进入Deepseek-Qwen文件夹，运行以下命令测试推理代码

cd Deepseek-Qwen
python deepseek-r1-distill-qwen-1.5b.py

运行过程中，会从modelers等国内镜像平台下载模型文件，一定要确保开发板联网以及mindnlp是0.4版本。

在这里插入图片描述
复制http链接：http://127.0.0.1:7860/到浏览器并打开

在输入框，输入问题，等待反馈结果。

在这里插入图片描述
你会发现，推理得很慢很慢。昇腾对于LLM的推理引擎目前做得不好，应该很多计算没有offload到NPU，硬件加速没有充分利用，对比RK3588的rkllm模型推理速度差很多。

3.2、部署Qwen0.5B

如法炮制
在这里插入图片描述
下载并终端运行上面的代码
还是推理得挺慢

3.3、部署TinyLLama

在这里插入图片描述
下载并终端运行上面的代码

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

大模型选型指南：结合具体行业场景，谈谈 Claude 4.8 的长程上下文与逻辑推理优势

DeepSeek技术社区

我花了一周时间部署odysseus，对比ChatGPT/Claude的结果如下

odysseus 26天78K星，自托管AI工作空间最火项目。我花一周实际部署，对比ChatGPT/Claude/Copilot的结果：部署耗时约3小时，混合模式月费$8-12（原SaaS订阅$70+）。功能覆盖度方面，聊天和Agent功能基本覆盖SaaS方案，额外提供邮件/笔记/日历集成、本地全文搜索、多模型切换、自定义Agent定时任务。差距在于聊天流畅度、移动端缺失、文档协作功能有限。适合有