GPU Compute Plans
16 风险管理

16 · 极端场景推演

16 · 极端场景推演

不做最坏打算的人,活不过第三年。

场景一:大厂降价 50%

触发:DeepSeek / 阿里 / 字节某天宣布 API 全线降价 50%。

影响链

  • 我方的保障级 API 价格竞争力消失
  • 客户开始比较"官方 vs 我方"
  • Spot API 价格被迫降到 1 折
  • 月营收预期 -40%

应对剧本

  1. T+0(当天):不跟降。发客户邮件说明差异化价值(服务 + 安全 + 中立)
  2. T+7:推"企业合约锁价"活动,签 12 个月送 2 个月
  3. T+30:加速微调服务 + 私有部署产品线(不受 token 价格战影响)
  4. T+90:如果仍流失严重,切到"只做私有部署 + 微调"模式
  5. 底线:Plan A 长租客户不受 token 价格战影响,IaaS 基本盘保命

场景二:GPU 断供

触发:美国出口管制升级,H200/H100 全面禁运中国。

影响链

  • 无法扩卡
  • 现有卡二手价暴涨 2-3 倍
  • 万卡计划搁置

应对剧本

  1. T+0:立即启动备胎供应链(华为昇腾 910C / 寒武纪)
  2. T+30:已有卡锁死不卖,只做推理
  3. T+90:昇腾生态迁移(6 个月爬坡期)
  4. T+180:昇腾 + 4090 混合集群上线
  5. 底线:已有 40 卡 5090 + 未来采购国产卡,维持 MaaS 不中断

场景三:AI 监管一刀切

触发:国务院发布《AI 生成内容管理办法》要求所有 MaaS 平台备案 + 内容审核 + 模型审查。

影响链

  • MaaS 业务暂停 1-3 个月(备案期)
  • 模型市场关闭
  • 客户流失

应对剧本

  1. 预防:Year 1 就做 AI 备案 + 等保三级
  2. T+0:立即下线未备案模型
  3. T+30:接通内容审核(阿里云内容安全 API)
  4. T+90:备案完成,恢复服务
  5. 底线:Plan A IaaS 不受影响,长租客户保命

场景四:团队集体离职

触发:CTO + 2 个核心工程师被大厂挖走。

影响链

  • 技术停滞
  • 客户信心动摇
  • 融资暂停

应对剧本

  1. 预防:期权 vesting 4 年 + cliff 1 年(走的人拿不到)
  2. T+0:CEO 亲自顶技术 + 外包应急
  3. T+7:启动紧急招聘(猎头 + 推荐)
  4. T+30:新 CTO 到位
  5. 底线:保留 3 个月 Runway 给重建

场景五:机房断电 72h

触发:IDC 电力故障 + 备用发电机故障。

影响链

  • 全线服务中断
  • 客户数据可能丢失
  • SLA 违约赔偿

应对剧本

  1. 预防:双路市电 + 柴油发电机 + UPS
  2. T+0:通知客户 + 启动灾备(如有跨 Region)
  3. T+24:如果无跨 Region,租临时云 GPU 恢复核心模型
  4. T+72:机房恢复 + 数据完整性检查
  5. T+96:事后 postmortem + 客户赔偿
  6. 底线:保险赔付 + 客户合同不可抗力条款

场景六:融资失败 + 现金流告急

触发:市场寒冬,投资人全部观望。

影响链

  • Runway < 6 个月
  • 无法扩卡
  • 团队缩编

应对剧本

  1. 预防:始终保留 12 个月 Runway
  2. T+0:冻结招聘 + 砍非核心支出
  3. T+30:找过桥贷款 / 股东借款
  4. T+90:转型"小而美"——砍到 20 卡,只做高毛利 MaaS + 微调
  5. T+180:如果有正现金流,等待市场回暖再融资
  6. 底线:卖卡回款(即使二手价跌 40% 仍能收回 60%)

场景七:客户数据泄露事件

触发:被黑客入侵,客户 prompt 数据泄露。

影响链

  • 客户信任崩塌
  • 媒体曝光
  • 监管处罚
  • 集体诉讼

应对剧本

  1. T+0:立即断网 + 保留证据
  2. T+1h:通知法务 + 评估范围
  3. T+24h:通知受影响客户
  4. T+72h:GDPR/网信办通报
  5. T+7d:公开声明 + 修复方案
  6. T+30d:事后报告 + 改进措施
  7. 底线:网络安全责任险 + 合同赔偿上限条款

场景八:核心模型被官方收回

触发:Qwen / DeepSeek 团队宣布不再开源,或要求商业授权。

影响链

  • 模型清单被迫缩减
  • 客户流失到官方平台

应对剧本

  1. 预防:不依赖单一模型,保持 5+ 模型清单
  2. T+0:保留已有权重(开源协议允许继续使用)
  3. T+30:寻找替代模型(GLM / Llama / 自研微调)
  4. T+90:微调自己的模型形成壁垒
  5. 底线:已有权重可继续用,只是没有更新

On this page