最终效果展示

MinerU安装成功

上回说道,MinerU可以将pdf转化为Markdown,这对于大语言模型的知识库构建来说,十分重要。
由于我是windows电脑,使用的安装步骤是,直接从github下载MinerU的项目文件夹,在该文件夹启动终端。
并使用:

docker build -t mineru:latest .

构建镜像。

这个过程,在我这儿竟花费了足足一个半小时。害我几部短剧都看完了,也没等到最终的结果。
在这里插入图片描述
下一步:

docker run --rm -it --gpus=all mineru:latest /bin/bash

在这里插入图片描述
按照官方的教程,到这里就已经是成功了。

我们要上传个pdf到这个container里。
在docker desktop的界面上,找到这个container,可以拷贝它的ID。
在这里插入图片描述
使用docker cp命令向其中添加pdf。(注意docker cp命令是在container之外打的。)
在这里插入图片描述

先测试一下是否有什么异常(又回到了docker里面):

magic-pdf --help

在这里插入图片描述
执行转换命令:

magic-pdf -p test.pdf -o testdir -m auto

开始干活儿了。

在这里插入图片描述

6G现存也可以支持,开心啊!

在这里插入图片描述
最终结果在这儿可以看。
在这里插入图片描述
效果还可以啊!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐