返回首页门户

Phase 07 / Shipping & Release

打包与发布

模型分发策略、显存分级预算与全平台部署规程

Physical Atlas / 交付路径拓扑

01 / 模型分发两条路径

路径 A：内挂模式 (Not Recommended)

将模型放入 Content/ 并随 Pak 打包。

会导致单次 Patch 更新体积巨大。
某些虚拟化文件系统可能干扰 mmap 物理映射效率。

路径 B：外挂模式 (Recommended)

将模型放在 Saved/Models/ 或自定义外部路径。

支持独立下载器更新，主程序轻量化。
物理优势： 100% 兼容 OS 原生 mmap，读取延迟最低。

02 / 物理显存分级预算

为了在不同机器上稳定运行，业务层应预设显存预算水位：

硬件档位	推荐模型	显存锁定预算
基础档 (RTX 3060)	Gemma-2B (4-bit)	1.8 GB
标准档 (RTX 4060)	Gemma-4-E2B (4-bit)	2.5 GB
极致档 (RTX 4080+)	Llama-3-8B (8-bit)	6.5 GB