本地部署DeepSeek模型及Web访问指南

admin

2025 年 03 月 01 日

167 次浏览

暂无评论

2174字数

系统软件藏经阁

以下是本地部署DeepSeek模型并通过Web页面访问的详细指南，综合了多个来源的最佳实践和注意事项：

一、本地部署工具及方法

1. 基础部署工具选择

LM Studio（新手推荐）
适合无编程基础的用户，提供图形化界面，支持一键下载和加载模型。
步骤：
1. 下载安装LM Studio，切换语言为中文。
2. 搜索并下载模型（如deepseek-r1:7b），点击加载即可使用。
  优点：操作简单，无需代码。
  缺点：大型模型对硬件要求较高（如70B参数需RTX 5090D显卡）。
Ollama（进阶用户推荐）
需命令行操作，适合需要灵活配置的用户。
步骤：
1. 安装Ollama，通过命令ollama run deepseek-r1:7b下载模型。
2. 结合第三方客户端（如Cherry Studio、Chatbox）或Web UI工具提升交互体验。
  优点：支持多版本模型（1.5B~70B），资源占用较低。

2. 配置Web交互界面

Open WebUI（推荐方案）
通过Docker部署，提供浏览器访问的友好界面。
步骤：

安装Docker，确保系统支持容器化部署。

执行命令拉取Open WebUI镜像（分CPU/GPU版本）：

# CPU版本
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
# NVIDIA GPU版本
docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

访问http://localhost:3000，配置Ollama API地址（如http://localhost:11434）。

其他Web工具
- PageAssist（Chrome插件）：通过浏览器插件直接调用本地模型。
- Cherry Studio：支持多模型管理，内置提示词库。

二、硬件要求与模型选择

硬件配置建议
- 入门级：1.5B~7B参数模型，需至少4GB显存GPU + 16GB内存（如RTX 3060）。
- 高性能需求：32B~70B模型需RTX 4090或H100显卡，显存≥24GB。
- 无显卡设备：可使用CPU推理，但速度显著下降（如7B模型生成约1字/秒）。
模型版本选择
- 轻量版：deepseek-r1:1.5b或7b，适合日常问答和文本生成。
- 专业版：deepseek-r1:32b或70b，适用于复杂推理和学术研究。