
低成本2*2080Ti KTrans部署满血DeepSeek-R1模型
技术栈: KTransformers + DeepSeek(gguf版) + OpenWebUI版
低成本2*2080Ti部署满血DeepSeek-R1模型
低成本2*2080Ti部署满血DeepSeek-R1模型 : 技术栈: KTransformers + DeepSeek(gguf版) + OpenWebUI版
技术栈: KTransformers + DeepSeek(gguf版) + OpenWebUI版
环境: 2*2080Ti
通过在服务器上部署KTransformers后 加载DeepSeek的参数文件
- 发现2080无法使用KTrans自带的Marlin算子
- 当部署KTrans自带的UI后出现 Request Error问题后,选择用OpenWebUI实现
部署KTransformer
Installation Guide - Ktransformers
按照官方部署 完成Preparation、Installation以及测试的 Local Chat
下载 DeekSeek-R1参数
注意: 下载DeepSeek-R1时 不能使用原版的.safetensors文件,而是他们提供的.gguf格式文件
部署问题:
1.如果使用.git下载时
git clone https://github.com/kvcache-ai/ktransformers.git
cd ktransformers
git submodule init
git submodule update
不会出现任何问题
但是如果部署的是 zip下载的方法,会出现版本不一致的情况
fatal error:l.h: No such file or directory25|
#include "llama.cpp/ggml-impl.h"
llama.cpp/ggml-imp
compilation terminated.
导致 第三方插件 llama.cpp
和 pybind11
无法正确识别
解决办法:
尝试用gitee下载KTrans模块
git clone https://gitee.com/nemo1982/ktransformers.git
两个第三方软件也都更换成gitee的同源软件 in ktransformers/.gitmodules
2. CUDA_LAUNCH_BLOCKING=1
正常做Local_Chat
python -m ktransformers.local_chat --model_path ./DeepSeek-R1 --gguf_path ./deepseek_ggufs
RuntimeError: CUDA error: invalid device function
CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
原因:Marlins算子对GPU有要求
再次提一下,能否支持2080ti · Issue #150 · kvcache-ai/ktransformers
解决方法:
注:找到自己配置的.yaml文件进行更新
generate_op: "KLinearMarlin"
3.KTrans前端UI: Request Error
参考链接:
WebUI API请求URL问题 · Issue #515 · kvcache-ai/ktransformers
输入网址:KTransformers本地LocalHost可正常运行
但KTransformers使用ip会显示UI界面,但运行时出现 Request Error
原因:走了localhost
的地址,这个地方应该换成/
而非localhost:port/
解决办法1:增加SSH端口 ssh 映射到本地,通过 localhost 访问
但是该方法治标不治本,所以团队通过使用OpenAI WebUI绕过KTrans的UI
解决方法2:Open-WebUI 使用 KTransformer
通过 Open-WebUI 使用 KTransformer · Issue #578 · kvcache-ai/ktransformers
open-webui serve
在ktransformers/ktransformers/website/public/index.html
修改<script src="./config_remote.js">
成你自己的config文件
window.configWeb = {
apiUrl: '/v1',
port: 8080,
};
后只需要配置编辑链接
可关注:https://github.com/HanShu0425/KTransformers_WebUI/tree/main
URL: http://ip:10002/v1 密钥与ID随便设置即可!
有问题私信+V: Shu19857404990
更多推荐
所有评论(0)