GPU Compute Plans
02 路线B 卖Token

Plan B · 场景演算

Plan B · 场景演算

单跑 Plan B(不做 IaaS)时的三个规模场景,供管理层判断纯 MaaS 独立路线可行性。

S-B-1:50 卡 MaaS 起步

假设

  • 6-7 台 8×H800
  • 团队 6 人(重推理工程)
  • 目标:100-300 付费开发者

月度

金额
成本60 万
Plan B v1 营收(吞吐满载 50%)40 万
Plan B v2 营收(多引擎 + prefix cache)75 万

关键判断

  • v1 阶段可能亏损(客户还在拉新)
  • 6 个月内必须冲到 v2 状态,否则失败
  • 差异化点:模型时效性 + 免费额度大方

适合谁:懂开发者社区、能造轮子的团队

S-B-2:500 卡 MaaS 中型

假设

  • 60 台
  • 团队 20 人
  • 目标:5000+ 开发者 + 100+ 企业客户

月度

金额
成本500 万
Plan B v2 营收750-900 万
Plan B v3 生态+200 万

关键挑战

  • 客户增长速度决定生死(每月新增开发者 300+)
  • 需要开发者关系团队 + 内容营销
  • 免费额度会消耗大量算力

适合谁:有 SaaS 增长经验的团队

S-B-3:2000 卡 MaaS 大型

假设

  • 250 台
  • 团队 100 人
  • 目标:区域 API 平台头部

月度

金额
成本2000 万
成熟 MaaS 营收3500 万
模型市场 + 应用 GMV+500 万

关键判断

  • 到这个规模拼的是"哪个模型独家上架"
  • 需要与开源大模型团队深度合作
  • 毛利率能拉到 55-65%

适合谁:有开发者品牌 + 融资能力 + 生态思维

单跑 Plan B 的天花板

通常止步 5000 卡左右,原因:

  1. 大厂官方 API 更便宜(DeepSeek 直接卖)
  2. 长尾模型需求分散,规模不经济
  3. 客户对"一站式"要求高(不只是 API)

破局路径

  • 走向 Plan C(混合)
  • 转向"AI 中间层"(应用 + Agent + 数据)
  • 出海抢欧美市场(Together / Fireworks 定位)

Plan B 的三大风险

  1. 模型价格战:DeepSeek 官方 API 降到 0.1×,你没利润
  2. 模型迭代:客户要求 24 小时上新模型,慢半天客户就走
  3. 合规:AI 内容生成被监管,直接被下线

核心判断

单跑 Plan B 需要三个条件

  • 有强推理工程团队
  • 有开发者社区运营能力
  • 早期能补贴烧钱(12-18 月 runway 至少)

三者少一个:转 Plan C,别单跑 B。

On this page