DeepSeek-V4 预览版｜Pro / Flash 选型 + 本地部署最低配置清单

一、版本选型对比（快速选）

表格

维度	DeepSeek-V4-Pro	DeepSeek-V4-Flash
激活参数	49B	13B
核心优势	超强数学推理、复杂代码、长文档精读、Agent 复杂任务、专业创作	低显存、高速度、日常对话、轻量代码、批量文案、低成本 API
适用场景	科研、复杂开发、法律合同 / 整书解析、深度逻辑推理、企业级 Agent	个人日常使用、轻量化本地部署、小设备离线运行、高频低成本调用
推理速度	中等	极快
显存需求	高	低

选型建议

做代码开发、数理竞赛、百万字长文档分析、复杂逻辑 → 选 V4-Pro
日常聊天、写文案、简单脚本、本地离线自用、低配显卡 → 选 V4-Flash

二、本地部署最低硬件配置（量化版，实用落地）

全部基于主流 GGUF / AWQ 量化，纯本地可跑，无需联网

1. DeepSeek-V4-Flash（13B 级）

4bit 量化最低：
- 显存：8GB 独立显存
- 内存：16GB
- 硬盘：20GB 空闲
6bit 量化（平衡画质 / 性能）：
- 显存：10GB
适合显卡：RTX3060、4060、5060、AMD 7600M 等中端卡

2. DeepSeek-V4-Pro（49B 级）

4bit 量化最低：
- 显存：18GB 独立显存
- 内存：32GB
- 硬盘：50GB+ 空闲
6bit 量化：
- 显存：24GB+
适合显卡：RTX4090、5090、A10、3090、专业计算卡

三、部署简易方案（小白直接用）

一键部署使用 Ollama / LlamaFactory / Text-generation-webui，一键导入 V4 量化权重，自动配置推理参数。
接口兼容本地部署后可开启 OpenAI 兼容接口，可对接 Wordpress、AI 工具、本地知识库等第三方应用。
长上下文开关默认开启 128K 上下文，手动可调至 100 万 Token，显存占用会小幅上升。

四、补充关键提醒

官方旧模型 deepseek-chat、deepseek-reasoner 将于2026-07-24下线，需提前替换为 v4 模型名。
百万上下文模式下，Flash 版本性价比远高于 Pro，日常长文本优先用 Flash。
国产 N 卡 / 国产算力主机可通过框架适配，正常运行 V4 全系模型。

DeepSeek-V4 预览版 Ollama 一键部署命令（直接复制即用）

一、前置准备

先安装 Ollama：官网下载：https://ollama.com/
安装完成后，打开终端 / CMD，直接输下面命令即可自动下载 + 运行

二、一键安装命令

1. DeepSeek-V4-Flash（13B 轻量版，8G 显存可跑）

bash

运行

ollama run deepseek-v4-flash

2. DeepSeek-V4-Pro（49B 旗舰，强推理 / 代码 / 长文本）

bash

运行

ollama run deepseek-v4-pro

三、常用管控命令

后台运行 / 开机自启：

bash

运行

ollama start

停止模型：

bash

运行

ollama stop deepseek-v4-flash
ollama stop deepseek-v4-pro

查看已装模型：

bash

运行

ollama list

卸载模型（清理空间）：

bash

运行

ollama rm deepseek-v4-pro

四、开启 100 万超长上下文（关键配置）

创建自定义模型文件，解锁 1M 上下文：

新建文本，写入：

plaintext

FROM deepseek-v4-flash
PARAMETER num_ctx 1048576
PARAMETER num_batch 4096

保存为 v4-longctx.modelfile
执行打包生效：

bash

运行

ollama create deepseek-v4-flash-1m -f v4-longctx.modelfile
ollama run deepseek-v4-flash-1m

五、本地 OpenAI 兼容接口（可对接任意软件）

部署完成后，直接调用本地接口：

接口地址：http://127.0.0.1:11434/v1/chat/completions
模型名：deepseek-v4-flash / deepseek-v4-pro
无需密钥，直接填进 AI 软件、编辑器、知识库、WordPress 即可接入

一键搭建｜DeepSeek‑V4 可视化 WebUI 部署方案

搭配 Ollama + Open WebUI，自带网页面板、参数调节、量化切换、100 万长上下文，全程复制即用。

一、环境前提

已安装并正常运行 Ollama
已拉取模型

bash

运行

ollama pull deepseek-v4-flash
ollama pull deepseek-v4-pro

二、一键安装 Open WebUI（网页控制台）

Windows /macOS/ Linux 通用，终端执行：

bash

运行

ollama run webui

等待自动下载镜像，完成后自动启动。

三、访问后台

浏览器直接打开：

plaintext

http://localhost:3000

无需配置，自动识别本地 Ollama 所有模型，直接切换 V4‑Flash / V4‑Pro。

四、核心实用设置（直接优化体验）

超长上下文设置 → 参数 → 上下文长度填入：1048576保存即解锁百万 Token。
性能优化

开启 GPU 硬件加速
关闭不必要插件，降低显存占用
低配显卡优先选 V4-Flash

五、功能亮点

可视化切换模型、调节温度 / 最大生成长度 /topP
对话存档、文件夹分类、知识库上传
兼容剪贴板长文档、整本书 / 代码库直接投喂
自带暗色模式、移动端适配
全局 OpenAI 接口，可给其他软件调用

六、停止 & 重启命令

bash

运行

# 关闭网页端
ollama stop webui

# 重新打开
ollama run webui

👁 阅读量：144 次

deepseekV4-Pro 与 V4-Flash 的选型建议 + 本地部署

DeepSeek-V4 预览版｜Pro / Flash 选型 + 本地部署最低配置清单

一、版本选型对比（快速选）

选型建议

二、本地部署最低硬件配置（量化版，实用落地）

1. DeepSeek-V4-Flash（13B 级）

2. DeepSeek-V4-Pro（49B 级）

三、部署简易方案（小白直接用）

四、补充关键提醒

DeepSeek-V4 预览版 Ollama 一键部署命令（直接复制即用）

一、前置准备

二、一键安装命令

1. DeepSeek-V4-Flash（13B 轻量版，8G 显存可跑）

2. DeepSeek-V4-Pro（49B 旗舰，强推理 / 代码 / 长文本）

三、常用管控命令

四、开启 100 万超长上下文（关键配置）

五、本地 OpenAI 兼容接口（可对接任意软件）

一键搭建｜DeepSeek‑V4 可视化 WebUI 部署方案

一、环境前提

二、一键安装 Open WebUI（网页控制台）

三、访问后台

四、核心实用设置（直接优化体验）

五、功能亮点

六、停止 & 重启命令

发表回复取消回复

2026 年 4 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

deepseekV4-Pro 与 V4-Flash 的选型建议 + 本地部署

DeepSeek-V4 预览版｜Pro / Flash 选型 + 本地部署最低配置清单

一、版本选型对比（快速选）

选型建议

二、本地部署最低硬件配置（量化版，实用落地）

1. DeepSeek-V4-Flash（13B 级）

2. DeepSeek-V4-Pro（49B 级）

三、部署简易方案（小白直接用）

四、补充关键提醒

DeepSeek-V4 预览版 Ollama 一键部署命令（直接复制即用）

一、前置准备

二、一键安装命令

1. DeepSeek-V4-Flash（13B 轻量版，8G 显存可跑）

2. DeepSeek-V4-Pro（49B 旗舰，强推理 / 代码 / 长文本）

三、常用管控命令

四、开启 100 万超长上下文（关键配置）

五、本地 OpenAI 兼容接口（可对接任意软件）

一键搭建｜DeepSeek‑V4 可视化 WebUI 部署方案

一、环境前提

二、一键安装 Open WebUI（网页控制台）

三、访问后台

四、核心实用设置（直接优化体验）

五、功能亮点

六、停止 & 重启命令

发表回复 取消回复

发表回复取消回复