04 场景演算
场景 S1 · 100 GPU 初创起步
场景 S1 · 100 GPU 初创起步
假设:某创业公司拿到一批 100 张 H800(12-13 台 8 卡机),电价 0.35 元,团队 8 人。
一、硬件盘点
- 12 台 8×H800:96 卡
- 1 台 4×H800 + 4×L40S:混合小机器
- 网络:ConnectX-7 400G IB
- 机房:北京 T3+ IDC,独立 20 个机柜
- 电费:0.35 元/度(含制冷 PUE 1.35)
二、月度成本(单机 8×H800 基准)
| 项 | 单机月成本 | 12 台合计 |
|---|---|---|
| 硬件折旧(240 万/5 年) | 40,000 | 480,000 |
| 电费(6kW × 24h × 30d × 0.35 × 1.35) | 2,041 | 24,494 |
| 机柜托管(3000 元/柜) | 3,000 | 36,000 |
| 带宽(100Mbps + 溢价) | 3,000 | 36,000 |
| IDC 服务费 | 500 | 6,000 |
| 团队人力分摊(8 人 × 3 万) | 20,000 | 240,000 |
| 月总成本 | ~68,541 | ~822,494 |
保本线:全部 12 台机器月收入 ≥ 82.2 万,即单机月收入 ≥ 6.9 万。
三、三条路线对比
Plan A 独占卖算力
- 单机满租 ≈ 20 万/月(35 元/卡时 × 8 卡 × 24h × 30d)
- 空置率 40%(新平台常态)→ 单机月收入 ≈ 12 万
- 12 台合计:144 万/月,毛利 ≈ 43%
- 风险:出租率不稳,新客户拓展慢
Plan B 全跑 MaaS
- 单机有效吞吐 ≈ 4,800 tok/s(7B/14B 小模型 + 高 batch 混合负载)
- 单机月营收 6-15 万(v1 到 v2,看模型 + KV cache 命中)
- 12 台合计:72-180 万/月,v2 状态下毛利约 15-35%
- 风险:token 定价战、需要工程团队
Plan C 混合模式(推荐)
- 4 台跑保障 MaaS(Plan B P1)
- 5 台 Plan A 长租(P0,60% 出租率)
- 3 台抢占实例池(P2,双向流转)
- 12 台合计预估:
- Plan A 长租:5 台 × 12 万 = 60 万
- MaaS 保障:4 台 × 6 万 = 24 万
- 抢占池:3 台 × 4 万 = 12 万
- 合计 96.0 万/月,当前成本下毛利 ≈ 17%
四、8 周落地计划
| 周 | Plan A | Plan B |
|---|---|---|
| W1-2 | 机房验收、组网、装机 | 选 3 个模型(DeepSeek-V3、Qwen3、GLM) |
| W3-4 | MAAS 装机 + 监控 | vLLM 部署 + OpenAI 兼容 API |
| W5-6 | 计费 + 门户 v1 | Token 计费 + 限流 + 5 内测客户 |
| W7-8 | 接 3 个白名单客户 | 正式上线,全网可注册 |
五、团队分工(8 人配比建议)
- 1 CEO / 商务:拉客户、融资
- 2 SRE / 运维:机房、K8s、监控
- 2 后端:门户、计费、API
- 1 推理工程:vLLM 调优、量化、Cache
- 1 前端:控制台
- 1 客服 + 内容:技术文档、开发者关系
六、6 个月目标
- IaaS 侧:8 个长租客户,出租率 ≥ 60%
- MaaS 侧:200 个付费开发者,月度活跃 API 客户 ≥ 50
- 月收入:≥ 160 万
- 毛利:≥ 40%
- 客户 NPS:≥ 30
七、关键假设与敏感度
乐观假设:
- 60 天内拿到 3 个长租大客户 → 单机收入拉到 15 万+/月
- MaaS 侧发展 500 付费开发者 → 单机 MaaS 拉到 1.5 万/月
悲观假设:
- 长租客户拉不到(大厂价格战)→ 全跑 MaaS,收入拦腰
- 团队推理调优跟不上 → MaaS 毛利仅 30%
敏感度:
- 电价每升 0.05 元 → 单机成本 +292,全月 -0.35 万
- 卡型换成国产(华为昇腾) → 折旧降 30%,但客户面窄
- 出租率提升 10 pct → 全月收入 +12 万
八、退出选项
如果 6 个月后:
- 长租客户 < 3 家、MaaS 付费 < 100 个 → 转售算力给大厂 / 云厂商
- MaaS 亏损 → 专注 IaaS 长租,砍 MaaS 团队
- 卡贬值加速 → 考虑租赁给同行、卖二手回款
九、给创始人的具体建议
- 别买第二批卡,把这 100 张先跑出正现金流
- 先做 Plan B:3 个模型 + OpenAI 兼容 API,6 周上线
- Plan A 主动找 3 个种子长租客户:签 6-12 个月合同,先锁基础盘
- 不要打价格战:Plan B 官方价 -20%、Plan A 白名单陪跑,用服务差异化
- 社区先建起来:早期用 100 万 token 免费额度换开发者
- 每周对齐单机经济:不看总收入,只看"单机日营收/成本比"
- 6 个月里保留 30% 弹药:卡断供、价格战、客户跑路都是常态