16 风险管理
16 · 极端场景推演
16 · 极端场景推演
不做最坏打算的人,活不过第三年。
场景一:大厂降价 50%
触发:DeepSeek / 阿里 / 字节某天宣布 API 全线降价 50%。
影响链:
- 我方的保障级 API 价格竞争力消失
- 客户开始比较"官方 vs 我方"
- Spot API 价格被迫降到 1 折
- 月营收预期 -40%
应对剧本:
- T+0(当天):不跟降。发客户邮件说明差异化价值(服务 + 安全 + 中立)
- T+7:推"企业合约锁价"活动,签 12 个月送 2 个月
- T+30:加速微调服务 + 私有部署产品线(不受 token 价格战影响)
- T+90:如果仍流失严重,切到"只做私有部署 + 微调"模式
- 底线:Plan A 长租客户不受 token 价格战影响,IaaS 基本盘保命
场景二:GPU 断供
触发:美国出口管制升级,H200/H100 全面禁运中国。
影响链:
- 无法扩卡
- 现有卡二手价暴涨 2-3 倍
- 万卡计划搁置
应对剧本:
- T+0:立即启动备胎供应链(华为昇腾 910C / 寒武纪)
- T+30:已有卡锁死不卖,只做推理
- T+90:昇腾生态迁移(6 个月爬坡期)
- T+180:昇腾 + 4090 混合集群上线
- 底线:已有 40 卡 5090 + 未来采购国产卡,维持 MaaS 不中断
场景三:AI 监管一刀切
触发:国务院发布《AI 生成内容管理办法》要求所有 MaaS 平台备案 + 内容审核 + 模型审查。
影响链:
- MaaS 业务暂停 1-3 个月(备案期)
- 模型市场关闭
- 客户流失
应对剧本:
- 预防:Year 1 就做 AI 备案 + 等保三级
- T+0:立即下线未备案模型
- T+30:接通内容审核(阿里云内容安全 API)
- T+90:备案完成,恢复服务
- 底线:Plan A IaaS 不受影响,长租客户保命
场景四:团队集体离职
触发:CTO + 2 个核心工程师被大厂挖走。
影响链:
- 技术停滞
- 客户信心动摇
- 融资暂停
应对剧本:
- 预防:期权 vesting 4 年 + cliff 1 年(走的人拿不到)
- T+0:CEO 亲自顶技术 + 外包应急
- T+7:启动紧急招聘(猎头 + 推荐)
- T+30:新 CTO 到位
- 底线:保留 3 个月 Runway 给重建
场景五:机房断电 72h
触发:IDC 电力故障 + 备用发电机故障。
影响链:
- 全线服务中断
- 客户数据可能丢失
- SLA 违约赔偿
应对剧本:
- 预防:双路市电 + 柴油发电机 + UPS
- T+0:通知客户 + 启动灾备(如有跨 Region)
- T+24:如果无跨 Region,租临时云 GPU 恢复核心模型
- T+72:机房恢复 + 数据完整性检查
- T+96:事后 postmortem + 客户赔偿
- 底线:保险赔付 + 客户合同不可抗力条款
场景六:融资失败 + 现金流告急
触发:市场寒冬,投资人全部观望。
影响链:
- Runway < 6 个月
- 无法扩卡
- 团队缩编
应对剧本:
- 预防:始终保留 12 个月 Runway
- T+0:冻结招聘 + 砍非核心支出
- T+30:找过桥贷款 / 股东借款
- T+90:转型"小而美"——砍到 20 卡,只做高毛利 MaaS + 微调
- T+180:如果有正现金流,等待市场回暖再融资
- 底线:卖卡回款(即使二手价跌 40% 仍能收回 60%)
场景七:客户数据泄露事件
触发:被黑客入侵,客户 prompt 数据泄露。
影响链:
- 客户信任崩塌
- 媒体曝光
- 监管处罚
- 集体诉讼
应对剧本:
- T+0:立即断网 + 保留证据
- T+1h:通知法务 + 评估范围
- T+24h:通知受影响客户
- T+72h:GDPR/网信办通报
- T+7d:公开声明 + 修复方案
- T+30d:事后报告 + 改进措施
- 底线:网络安全责任险 + 合同赔偿上限条款
场景八:核心模型被官方收回
触发:Qwen / DeepSeek 团队宣布不再开源,或要求商业授权。
影响链:
- 模型清单被迫缩减
- 客户流失到官方平台
应对剧本:
- 预防:不依赖单一模型,保持 5+ 模型清单
- T+0:保留已有权重(开源协议允许继续使用)
- T+30:寻找替代模型(GLM / Llama / 自研微调)
- T+90:微调自己的模型形成壁垒
- 底线:已有权重可继续用,只是没有更新