02 路线B 卖Token
Plan B · v3 · Marketplace 版本
Plan B · v3 · Marketplace 版本
目标:从"卖 token"进化为"AI 平台生态"。
时间:v2 稳定后 6-12 个月。
1. 相比 v2 的关键升级
| 维度 | v2 | v3 |
|---|---|---|
| 模型来源 | 平台上架 | 客户上架 + 分成 |
| 应用形态 | 纯 API | + 托管应用 / Agent / RAG |
| 定价 | 平台定价 | 平台 + 客户自定价 |
| 生态 | 开发者 | 开发者 + ISV + 终端用户 |
| 微调 | 单模型 LoRA | 全流程微调市场 |
| 数据 | 无 | 数据集市场 |
| 多模态 | 无 | 文/图/音/视频 |
2. 生态定位
从"云厂商"转向"AI 中间层平台":
应用层 ←── 终端用户
│
产品层 ←── ISV / AI 创业公司(在平台上发布应用)
│
模型层 ←── 平台自营 + 社区上传(分成)
│
基础设施 ←── 平台自持算力3. 核心新功能
3.1 模型市场
- 任何开发者可上传自己的模型(LoRA / 全量 / 蒸馏版)
- 平台自动审核 + 部署
- 定价:作者定 base + 平台加成 20%
- 分成:作者 60% / 平台 40%
- 榜单:每周 Top 10、按类型分类
3.2 微调工作室
- 无代码微调 UI
- 支持 LoRA、QLoRA、DPO、RLHF
- 训练数据集上传(客户私有 or 从数据市场买)
- 训完自动上架成客户私有模型
- 训练成本按 GPU 时长扣(可用抢占实例省钱)
3.3 数据市场
- 平台预置:CommonCrawl、Wikipedia、代码数据集
- 客户可上传自己的数据集卖给别人(分成)
- 平台负责合规审核 + 去 PII
3.4 Agent / RAG 托管
- 一键部署 LangGraph / AutoGen / Dify
- 内置工具库:搜索、代码执行、SQL、爬虫
- 客户只交 prompt + 工具选择,平台负责调度
3.5 应用商店(App Store 模式)
- 开发者可在平台上发布 AI 应用
- 用户扫码 / 一键使用
- 应用收入平台分 30%
4. 架构演进
终端用户
│
┌─────▼──────┐
│ 应用层 │ ← 客户开发的 AI 应用
│ (Web/App) │
└─────┬──────┘
│
┌─────▼──────┐
│ Agent 引擎 │ ← 平台托管
│ RAG 服务 │
└─────┬──────┘
│
┌─────▼──────┐
│ 模型市场 │ ← 平台 + 社区模型
│ (10000+) │
└─────┬──────┘
│
┌─────▼──────┐
│ 推理平台 │ ← v1/v2 演进而来
│ (v2 内容) │
└─────┬──────┘
│
┌─────▼──────┐
│ 自持算力 │
└────────────┘5. 关键难点
| 难点 | 应对 |
|---|---|
| 社区模型安全 | 每个模型跑沙箱 + 自动扫描后门 |
| 分成结算 | 按 token 精细计费 → 每月自动打款 |
| 合规 | 上架模型需实名 + 内容审核 |
| 模型爆炸式增长 | 冷模型下架、按 QPS 分级 |
| 训练资源紧张 | 微调任务默认走抢占实例 |
| Agent 安全 | 工具调用沙箱、外网访问白名单 |
6. 里程碑
| 季度 | 交付 |
|---|---|
| Q1 | 模型市场(自营 + 首批签约作者) |
| Q2 | 无代码微调工作室 |
| Q3 | Agent / RAG 托管 |
| Q4 | 应用商店 + 分成结算 + 多模态扩展 |
7. 商业指标(v3 时应有)
- 平台入驻模型数:1000+
- 月活开发者:5000+
- 生态 GMV:占平台总收入 30% 以上
- 平台自营 vs 分销:50/50 目标
- 模型分类:文本 / 代码 / 视觉 / 音频 / 多模态 齐全
8. 竞品对标
| 玩家 | 定位 | 我方差异化 |
|---|---|---|
| Hugging Face | 全球最大模型社区 | 只推不训,我方训 + 推 + 分成 |
| Together.ai | 高性能推理 | 类似定位 |
| Replicate | 应用友好 | UI 更好 |
| SiliconFlow | 国内头部 | 追赶 + 生态差异 |
| 阿里百炼 | 大厂 | 中立第三方 |
关键判断:v3 是否真的能做出生态取决于 v1/v2 阶段的开发者社区体量,如果开发者不到 1 万,v3 不要做,专注 v2。
9. 风险清单
- 合规红线:AI 生成内容管理办法收紧,可能整个模型市场被砍
- 恶意模型:后门、Prompt 越狱、数据窃取
- 收入结构失衡:如果生态跑不起来,白投入大量运营成本
- 抄袭 / 侵权:客户上传模型是否有版权
- 平台责任:客户模型作恶,平台可能连带
10. 核心判断
v3 不建议早做。
原因:
- 模型市场本质是"用户量游戏",没到 5 万开发者规模的时候,社区活不起来
- 分成模式对小平台不利,作者会跑去 HF
- v2 阶段的推理优化、抢占实例、批量 API 已经能做出 60% 毛利
- v3 应该是"营收到 5000 万/年 + 开发者过万"再启动的方向
v2 阶段就应该做的 v3 铺垫:
- API 里预留模型市场字段(作者、版本、许可证)
- 计费系统预留分成账目
- 开发者社区先运营起来(论坛、meetup、大 V 合作)