VMware虚拟机中部署千问3.5-2B:隔离的AI实验环境搭建

1. 为什么选择虚拟机部署AI模型

在本地机器上直接部署AI模型可能会面临环境冲突、依赖混乱等问题。使用VMware虚拟机可以创建一个完全隔离的Ubuntu环境,既能保证宿主机系统的干净整洁,又能自由地进行各种AI实验而不用担心搞乱系统配置。

这种方法特别适合:

  • 需要测试不同版本CUDA和驱动的情况
  • 想尝试各种AI模型但担心依赖冲突
  • 企业环境中需要隔离开发和生产环境
  • 学习AI部署但不想影响日常使用的主系统

2. 环境准备与VMware安装

2.1 硬件要求

在开始之前,请确保你的电脑满足以下最低配置:

  • 至少16GB内存(推荐32GB)
  • 100GB可用磁盘空间
  • 支持虚拟化的CPU(Intel VT-x或AMD-V)
  • 独立NVIDIA显卡(CUDA支持)

2.2 安装VMware Workstation

  1. 从VMware官网下载最新版Workstation Player(免费版)或Workstation Pro
  2. 运行安装程序,按照向导完成安装
  3. 安装完成后重启电脑

2.3 创建Ubuntu虚拟机

  1. 打开VMware,点击"创建新虚拟机"
  2. 选择"自定义(高级)"安装
  3. 选择稍后安装操作系统
  4. 选择Linux > Ubuntu 64位
  5. 设置虚拟机名称和存储位置
  6. 分配至少4个CPU核心和16GB内存
  7. 创建新虚拟磁盘,大小至少80GB
  8. 完成虚拟机创建

3. 安装Ubuntu系统

3.1 下载Ubuntu镜像

从Ubuntu官网下载最新的LTS版本(如22.04 LTS)ISO镜像文件。

3.2 配置虚拟机并安装Ubuntu

  1. 右键新建的虚拟机,选择"设置"
  2. 在CD/DVD选项中选择"使用ISO镜像文件",浏览选择下载的Ubuntu ISO
  3. 启动虚拟机,开始Ubuntu安装
  4. 选择语言后点击"安装Ubuntu"
  5. 选择"最小安装"和"安装第三方软件"选项
  6. 分区选择"清除整个磁盘并安装Ubuntu"
  7. 设置时区、键盘布局和用户账户
  8. 等待安装完成,重启虚拟机

3.3 安装VMware Tools(增强功能)

  1. 在VMware菜单选择"虚拟机" > "安装VMware Tools"
  2. 在Ubuntu中会自动挂载VMware Tools ISO
  3. 打开终端,执行以下命令:
    tar -xzf /media/$USER/VMware\ Tools/VMwareTools-*.tar.gz -C /tmp/
    cd /tmp/vmware-tools-distrib/
    sudo ./vmware-install.pl
    
  4. 按照提示完成安装,重启虚拟机

4. 配置AI开发环境

4.1 安装NVIDIA驱动和CUDA

  1. 首先更新系统:
    sudo apt update && sudo apt upgrade -y
    
  2. 安装NVIDIA驱动:
    sudo ubuntu-drivers autoinstall
    
  3. 重启后验证驱动安装:
    nvidia-smi
    
  4. 安装CUDA Toolkit(以11.7为例):
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
    sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
    sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/3bf863cc.pub
    sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ /"
    sudo apt-get update
    sudo apt-get -y install cuda-11-7
    

4.2 安装Python和必要工具

  1. 安装Python和pip:
    sudo apt install python3 python3-pip python3-venv -y
    
  2. 创建虚拟环境:
    python3 -m venv qwen-env
    source qwen-env/bin/activate
    
  3. 安装PyTorch(与CUDA版本匹配):
    pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
    

5. 部署千问3.5-2B模型

5.1 下载模型权重

  1. 从官方渠道获取千问3.5-2B模型权重
  2. 创建模型目录:
    mkdir -p ~/models/Qwen-3.5-2B
    
  3. 将下载的模型文件放入该目录

5.2 安装依赖库

在虚拟环境中安装必要的Python包:

pip install transformers sentencepiece accelerate

5.3 编写简单的推理脚本

创建一个inference.py文件:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "~/models/Qwen-3.5-2B"  # 修改为你的模型路径
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    device_map="auto",
    trust_remote_code=True
).eval()

while True:
    prompt = input("请输入问题(输入quit退出): ")
    if prompt.lower() == "quit":
        break
    response, _ = model.chat(tokenizer, prompt, history=None)
    print("回答:", response)

5.4 运行模型测试

执行脚本进行测试:

python inference.py

6. 常见问题解决

6.1 CUDA内存不足

如果遇到CUDA内存不足错误,可以尝试:

  1. 减少batch size
  2. 使用更低精度的模型(如fp16)
  3. 增加虚拟机分配的显存(在VMware设置中)

6.2 模型加载缓慢

首次加载模型可能需要较长时间,因为需要下载和缓存一些文件。后续运行会快很多。

6.3 性能优化建议

  1. 确保VMware Tools已正确安装
  2. 在VMware设置中启用3D加速
  3. 为虚拟机分配更多CPU和内存资源
  4. 考虑使用更轻量级的模型变体

7. 总结与下一步建议

经过这一系列步骤,你应该已经在VMware虚拟机中成功搭建了一个隔离的AI实验环境,并部署了千问3.5-2B模型进行测试。这种隔离环境的好处是显而易见的 - 你可以自由地尝试各种配置和模型,而不用担心影响主系统。

实际使用下来,虚拟机的性能虽然比不上物理机直接运行,但对于学习和中小规模实验已经足够。如果遇到性能瓶颈,可以考虑增加虚拟机资源分配,或者直接在物理机上部署。

下一步,你可以尝试:

  • 部署其他AI模型进行比较
  • 开发基于千问的应用程序
  • 学习模型微调技术
  • 探索模型量化等优化技术

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐