GPU Compute Plans
05 成本模型

单机经济模型

单机经济模型

用来对齐单卡 / 单机的成本和收益,跑数字用的。

一、单机成本拆解模型

标准假设:单机 8×H800 80G,Ubuntu 22.04,2×Xeon 8480+ CPU + 2TB DDR5 + NVMe 存储 + ConnectX-7 网卡。

硬件成本

  • 整机采购价:240 万人民币(含 GPU × 8 + 服务器 + 网卡 + 税费 + 供应链溢价)
  • 注意:此处的「整机采购价」是全包落地价,高于裸卡批量采购价;若与外部裸卡报价对比,需加 30–80% 平台/服务/税费溢价。
  • 折旧年限:5 年(每年 48 万,每月 4 万)
  • 参数化:monthly_hw = purchase_price / 60

电费

  • 满载功耗:6 kW
  • PUE:1.35(好机房)~1.6(一般机房)
  • 电价:p_kwh(元/度)
  • 参数化:monthly_elec = 6 * 24 * 30 * p_kwh * PUE
  • 示例:
    • 张家口(0.35, PUE 1.3):6 × 720 × 0.35 × 1.3 = 1,966 → 1.97 万/月
    • 北京(0.4, PUE 1.35):6 × 720 × 0.4 × 1.35 = 2,333 → 2.33 万/月
    • 上海(0.55, PUE 1.5):6 × 720 × 0.55 × 1.5 = 3,564 → 3.56 万/月
    • 新加坡(1.2, PUE 1.5):6 × 720 × 1.2 × 1.5 = 7,776 → 7.78 万/月

机柜租金

  • 单柜月租:2000-5000 元(含 IDC 服务)
  • 8 卡机占 6-8U → 通常单柜可放 3-5 台
  • 分摊:500-1500 元/机

带宽

  • 100 Mbps 独享:2000-3000 元/月
  • 1 Gbps 独享:8000-15000 元/月
  • 参数化:monthly_bw

人力分摊

  • 团队 10 人 × 3 万 / 100 台机器 = 3000 元/机
  • 参数化:team_size * salary / total_machines

汇总(不同机房)

月成本 = 采购价/60 + 电费 + 机柜 + 带宽 + 运维分摊 计算:

机房电价月成本
张家口0.35≈ 6.6 万
内蒙古0.30≈ 6.4 万
北京0.40≈ 6.9 万
上海0.55≈ 8.2 万
深圳0.50≈ 7.5 万
新加坡1.2≈ 12.7 万

二、单机营收模型

Plan A 长租

  • 单价:30-40 元/卡时(H800,2026 市场价)
  • 满租月收入:8 卡 × 24 × 30 × 35 = 20.16 万/月
  • 出租率 60%:12.1 万/月
  • 出租率 80%:16.1 万/月

Plan A 抢占实例

  • 单价:10-15 元/卡时(3-4 折)
  • 满载:8 × 24 × 30 × 12 = 6.9 万/月

Plan B token 计费(vLLM,混合模型负载)

  • 235B 大模型保守吞吐:≈ 每卡 60 tok/s,8 卡合计 480 tok/s
  • 生产环境 7B/14B 小模型 + 高 batch 混合负载有效吞吐:≈ 每卡 600 tok/s,8 卡合计 4,800 tok/s
  • 月生成 tokens:4,800 × 86400 × 30 ≈ 124 亿
  • 均价(input + output 加权)≈ ¥5 / M tokens
  • 月理论满载:124 亿 × 5 ÷ 100 = 6.2 万/月
  • KV Cache 命中提升 40% 后8.7 万/月
  • 多客户共享 system prompt11 万/月
  • v2 混合策略极限15-19 万/月

Plan B 抢占(异步批处理)

  • 单价:0.3-0.5 × 保障价
  • 月理论:0.3-0.5 万/月

三、单机毛利表(三种模式)

假设北京机房(月成本 6.9 万):

模式满载月营收实际(80%)毛利率
Plan A 独占20.2 万16.1 万66%
Plan A 独占(60% 出租)12.1 万9.7 万43%
Plan B v219 万15 万118%
Plan C 混合(P0 4/8卡 + MaaS 4/8卡)11 万8.8 万37%

四、单卡月毛利汇总

卡型单卡月成本单卡目标营收目标毛利率
H800 80G6,400 元15,000-25,00055-70%
A800 80G5,100 元12,000-18,00055-70%
L40S 48G3,150 元6,000-10,00045-65%
4090 24G3,550 元3,500-5,5000-35%
H100 80G9,000 元25,000-35,00060-75%

五、Break-Even 分析

多久能回本?

假设整机 240 万,月毛利:

情境月毛利回本月数
Plan A 满租13.3 万18.0 月
Plan A 60% 出租5.2 万46.2 月
Plan B v2-5.0 万无法回本
Plan C 混合4.1 万58.5 月

关键结论:按北京机房单机约 6.9 万/月成本,Plan A 满租约 18 个月回本;在 ¥5/M 且 480 tok/s 条件下纯 Plan B 无法覆盖单机成本,必须依赖更高溢价、更大吞吐或 Plan C 混合摊薄成本。

六、敏感度分析

电价每上涨 0.05 元 → 单机月成本 +0.03 万,Plan A 满租回本延迟约 0.04 个月

出租率每提高 10% → 单机月收入 +2.0 万,年利润 +24 万

KV Cache 命中率每提高 10% → Plan B 有效吞吐 +15%

卡型从 H800 换成 4090 → 单卡成本降 65%,但客户面窄,只能做小模型 MaaS

七、决策建议(针对不同月成本容忍度)

  • 成本敏感(月成本 < 6 万/机) → 内蒙古、张家口机房,先做 Plan A 长租
  • 平衡型(6-8 万/机) → Plan C 混合,追求 60% 综合毛利
  • 高端型(>8 万/机) → 只做 Plan B 高毛利模型,不碰长租低毛利业务
  • 海外(>10 万/机) → 卖溢价服务(合规、SLA、白手套),毛利率必须 ≥ 55%

On this page