遇到知识库上传文档失败,各种报错,然后网络搜索,好多解决方案都是收费的,也看不到也不知道行不行。

最终找到2个靠谱的,试着修复了下,居然成功了。

特此留档记录,防止忘记。

1. 使用ollama下载安装向量化工具

        nomic-embed-text

Ubuntu环境下,命令行输入

ollama pull nomic-embed-text

open-webui管理员面板,进入“设置”栏找到“模型”选项,并点击右上角的设置图标进行模型设置,

把deepseek和刚下载的nomicembed-text排序在前,

并选择默认模型为deepseek:
embed-text,点击保存:

管理员面板找到“文档”选项,将“语义向量模型引擎”设置为Ollama,并且在“语义向量模型”手动输入“Nomic-Embed-Text”,设置完点击保存,

这里有个错误,应该是输入模型里的全称例如 XXX:latest

确保open-webui识别到Ollama,进一步找到“外部连接”选项,只勾选Ollama API而不勾选OpenAI API

 bga-m3向量模型

方法和nomic-embed-text类似

ollama pull nomic-embed-text

管理员面板找到“文档”选项,将“语义向量模型引擎”设置为Ollama,并且在“语义向量模型”手动输入“bga-ma:latest”,设置完点击保存,

2.PDF文件无法处理问题修复

管理员面板->设置->文档

内容提前引擎,选择默认,pdf图像处理开发打来

源码部署还需要安装一些库文件

在backend目录下执行

pip install rapidocr-onnxruntime

apt-get install mesa-utils

安装上这俩,基本上没有问题了

3. Dimensionality of (1024) does not match index dimensionality (384)

这个问题,搜索好久都没有好的解决办法,要么就是说的高深莫测给的专业术语看的迷迷糊糊的。自己无意中弄好了,大家可以尝试下。

重置数据库,不过有风险,就是之前存储的都会丢失。

我重置后,不再出现错误提示,能正常上传文档,解决问题。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐