AI应用种子期的“PMF证据”到底是什么:一张清单帮你自检
种子期AI项目最常见的误判,是把“Demo很聪明”当成“PMF快到了”:现场惊艳、客户说好用,但两周后没人再打开;团队以为模型不够强,其实是没把AI变成工作流里的“交付能力”。
OXYZ资本更愿意把种子期PMF证据定义为三件事(而且必须能被交叉验证):
- 替代了真实工作的一段,并且替代率在上升;
- 用户会重复把同一类任务交给它;
- 随着单量增长,单位交付成本不会线性爆炸。
下面用“工作流替代率”做主线,把证据拆成可操作的检查项。
一、第一性指标:工作流替代率(别从模型开始)
先回答“你替代谁的哪段流程”。画一张工作流拆解图:目标岗位 × 场景 × 交付物,从触发到交付拆 8–15 步,并给每步标:频次、耗时、输出标准、风险点、AI介入方式(替代/辅助/不碰)。
替代率(早期粗算够用):
替代率 ≈ Σ(频次 × 被替代耗时 × 质量系数) / Σ(频次 × 总耗时)
质量系数 0~1:能否直接用、返工比例、风险可控性。很多“功能很全”的产品替代率只有 5%~10%;真正有势能的窄场景,替代率做到 30%~50% 往往会迅速变成刚需。
二、种子期最硬的四类 PMF 证据
1)首次价值:从激活到“可交付结果”
TTFV(Time To First Value)要短,并且必须基于“可用标准”统计(字段齐全/格式可导入/合规通过/评分达标)。关注两项就够:
- TTFV 中位数(别拿最好那条当结论)
- 任务成功率(一次通过率/返工率)
没有“可用标准”,所有指标都只是叙事。
2)复用:不是惊艳一次,而是每周离不开
看两条信号:
- 复用频率:每用户每周核心任务次数
- Cohort 复用趋势:按首用周/注册周看后续周是否更稳、更高
高频任务不复用,通常意味着你还没融进工作流。
3)单位经济:边际成本是否可控
把成本拆开算清楚:推理成本 + 人工介入(审核/改写/兜底分钟数)+ 交付支持(是否定制)。关键看两条趋势:
- 每单人工介入比例是否下降
- 每成功交付的总成本是否随规模下行
AI应用最怕“规模化 = 人肉爆炸”,种子期就要提前把这颗雷拆掉。
4)数据飞轮:例外在变少,自动化在变多
你是否把“失败原因”结构化?是否沉淀模板/规则/字段?质量波动是否在收敛?
没有闭环,你永远在用通用模型能力做产品,天花板很快出现。
三、三种“看起来很接近 PMF”的陷阱
- Demo好看但融不进工作流:复制粘贴、格式不对、字段缺失,让用户多做一步。
- 没有闭环:靠换模型/调 prompt 救火,无法解释、无法复现。
- 替代率上不去:每单都要大量人工兜底,收入涨、毛利不涨,越增长越危险。
四、一张清单:AI应用种子期 PMF 证据自检
A. 工作流与标准
☐ 目标岗位+场景一句话(谁在什么情境下交付什么)
☐ 工作流拆解图(8–15步,标频次/耗时/风险/AI介入点)
☐ “可用输出标准”(可检测、不靠主观)
B. 使用与复用
☐ TTFV(中位数)与任务成功率/返工率
☐ 复用频率(每用户每周核心任务次数)
☐ Cohort 复用曲线(迭代后是否变好)
C. 替代与节省
☐ 工作流替代率(当前值 + 4–8周趋势)
☐ 前后对比样本(10–30单:耗时/成本/错误率)
☐ 人工角色迁移证据(执行→审核的比例在提升)
D. 规模化与单位经济
☐ 每成功交付的推理成本(按任务口径)
☐ 每成功交付的人工介入分钟数(趋势下降)
☐ 集成进度与计划(CRM/工单/表格/文档等至少一条落地路径)
E. 数据飞轮与可控性
☐ 失败原因标签体系(可统计、可复盘)
☐ 模板/规则/字段沉淀在增长(可复用资产)
☐ 输出可追溯、可回滚、可控(尤其B2B)
种子期 PMF 的本质,是“把聪明变成交付”
如果你能拿出清单里大部分证据,哪怕收入还早,方向通常就很清晰:你不是在做一个会说话的模型包装,而是在把一段真实工作流变成可规模化的交付系统。
OXYZ资本欢迎AI应用领域的创业者们投递“工作流拆解图 + 指标口径”
发两样:1)工作流拆解图;2)TTFV/复用/替代率/边际成本的口径与样本。
我可以按清单帮你做一次“PMF证据体检”:哪一段替代率被卡住、哪些证据还不够硬、下一轮实验该怎么跑。

