post on 08 May 2025 about 2668words require 9min
CC BY 4.0 (除特别声明或转载文章外)
如果这篇博客帮助到你,可以请我喝一杯咖啡~
[实验目的]:理解系统架构与原理,掌握 DeepSeek 的基本工作原理、内部架构和检索机制,了解其在大规模语义检索中的优势。学习如何在本地环境中部署和调试 DeepSeek 系统,包括环境配置、依赖安装、参数调优等关键步骤。
访问官网:https://ollama.com/ 下载
双击 OllamaSetup.exe 进行安装:
这里我选择是的 1.5b,整个模型大小 1.1 GB。
更多版本可以在这里查看:https://ollama.com/library/deepseek-r1
1
ollama run deepseek-r1:1.5b
注意:
- 系统需要安装 conda 进行虚拟环境的配置,并且 webui 需要 python 版本在 3.11 才能安装
- Open WebUI 的核心包大小相对较小,但它会拉取一些额外的依赖包(如用于 RAG 功能的嵌入模型或前端支持的库),这些依赖可能会增加总体安装体积。例如,首次运行时,它可能会下载约 900MB 的嵌入模型(如 all-MiniLM-L6-v2)用于本地功能。
GitHub - open-webui/open-webui: User-friendly AI Interface (Supports Ollama, OpenAI API, …)
1
2
3
4
5
6
7
conda create -n webui python=3.11
conda activate webui
pip install open-webui
open-webui serve
浏览器访问本地 8080 端口 http://localhost:8080
可以发现 openui 的页面非常类似 chatgpt 的页面,功能也非常丰富
注意执行命令之前打开 docker desktop
1
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
OLLAMA_BASE_URL
更改为服务器的 URL:1
docker run -d -p 3000:8080 -e OLLAMA_BASE_URL=https://example.com -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
1
docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda
可以发现本地端口映射为 3000,浏览器输入对应网址 http://localhost:3000/即可进入对应的界面
实测初始加载和响应速度比似乎用 pip 安装慢了不少,但是后面问题回答速度还是非常快的
Page Assit
浏览器插件回答
- 使用 nomic-embed-text 文本嵌入模型
https://ollama.com/library/nomic-embed-text
1
ollama pull nomic-embed-text
1
2
3
curl -fsSL https://ollama.com/install.sh | sh
#也许需要相应的权限才能安装,可以使用命令
sudo curl -fsSL https://ollama.com/install.sh | sh
上面的命令老是网络连接出现问题,因为我使用的是 ubuntu 系统的服务器,也可以使用下面的命令安装,速度快很多
1
sudo snap install ollama
后面的步骤和在 windows11 本地部署的流程相类似,都是拉取和运行模型,再使用 docker 部署 open-webui 再访问对应的端口使用,所以对应命令我直接粘贴不再详细解释
1
ollama run deepseek-r1:1.5b
注意后面的命令最好都添加上 sudo,以防不必要的权限报错
1
sudo systemctl start docker
1
sudo systemctl status docker
1
sudo docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
本地端口映射为 8080,浏览器输入对应网址 http://<ip>
:8080/即可进入对应的界面
1
sudo systemctl stop docker
虽然 1.5B 和 7B 级别的小参数模型在资源占用和响应延迟方面具有明显优势,但其生成效果和理解能力相对有限,仅适用于边缘计算中的基础性任务。不过,在特定场景下仍具备一定的应用价值。对于日常生产中的高质量生成需求,仍推荐使用部署在云端服务器的大参数模型,以确保效果和稳定性。
Related posts