04 场景演算
场景 S2 · 500 GPU 中型混合卡池
场景 S2 · 500 GPU 中型混合卡池
假设:500 张卡(H800 × 200、A800 × 100、L40S × 100、4090 × 100),单机房,2 年目标。
一、硬件盘点
| 卡型 | 数量 | 单机布局 | 用途 |
|---|---|---|---|
| H800 80G | 200 | 25 台 8 卡 | 大模型推理 + 长租 |
| A800 80G | 100 | 12-13 台 8 卡 | 训练客户 |
| L40S 48G | 100 | 12-13 台 8 卡 | 视觉 / 中等模型 |
| 4090 24G | 100 | 25 台 4 卡 | 中小客户 / 抢占实例 |
网络:H800/A800 走 IB 400G;L40S/4090 走 100G RoCE
二、月成本估算
| 项 | 月成本 |
|---|---|
| 硬件折旧 | ~180 万 |
| 电费(含 PUE 1.4) | ~14 万 |
| 机柜(60 柜) | ~18 万 |
| 带宽 + IDC 服务 | ~15 万 |
| 团队(20 人 × 3 万) | ~60 万 |
| 合计 | ~287 万/月 |
三、目标收入结构(Plan C 混合,12 个月后)
| 产品线 | 卡型 | 月营收目标 | 毛利率 |
|---|---|---|---|
| IaaS 长租大 B | 100 H800 + 60 A800 | 200 万 | 45% |
| IaaS 抢占竞价 | 60 4090 + 40 H800 | 60 万 | 30% |
| MaaS 保障 API | 60 H800 + 40 L40S | 240 万 | 55% |
| MaaS 抢占 API | 60 L40S + 40 4090 | 60 万 | 40% |
| 合计 | 500 | 560 万 | ~49% |
保本判断:月成本 287 万 < 月营收 560 万,年利润 ≈ 3280 万
四、卡型分配决策逻辑
- H800:满足高毛利订单 → MaaS + 高端长租
- A800:训练客户主力 → 长租
- L40S:视觉 + 中型 LLM → MaaS 常驻
- 4090:抢占实例 / 小客户 → 弹性池
五、12 个月路线图
| 季度 | 里程碑 |
|---|---|
| Q1 | Plan A v1 + Plan B v1 上线;100 卡试运营 |
| Q2 | 300 卡满载;Plan A v2 K8s 化 |
| Q3 | 500 卡满载;Plan B v2 多引擎 |
| Q4 | Plan C 完整调度上线,毛利拉到 45%+ |
六、团队 20 人配比
- CEO / COO / CTO:3
- 商务 / 运营:3
- SRE:4
- 后端 / 计费 / 平台:4
- 推理工程 / 训练调优:3
- 前端 / UX:2
- 客服 / 技术支持:1
七、关键风险
| 风险 | 应对 |
|---|---|
| 大 B 客户拖延付款 | 强预付 + 合规审查 |
| 大厂降价 30% | 差异化服务 + 深度定制 |
| 卡型价格倒挂(H800 二手价格跌) | 3 年内不动 H800,只跑满 |
| 团队被挖角 | 期权 + 阶段奖金 |
| 电价上涨 | 与 IDC 锁 3 年协议 |
| GPU 断供 | 与供应链建立备胎 |
八、竞争定位
在国内二线阵营(非 BAT)里差异化:
- 场景聚焦:不做全能,只吃"大模型推理 + 训练咨询"两块
- 国产替代:A800/H800 供应有限时,主推华为昇腾 / 寒武纪备用
- 陪跑服务:白手套帮客户调 vLLM / DeepSpeed,附加咨询
- 合规牌:数据不出机房,医疗 / 金融 / 政务客户友好
- 社区:主办北京 AI 开发者 meetup、赞助开源模型(DeepSeek/Qwen 生态位)