AI应用种子期的“PMF证据”到底是什么：一张清单帮你自检

2026-02-04 11:09:03

种子期AI项目最常见的误判，是把“Demo很聪明”当成“PMF快到了”：现场惊艳、客户说好用，但两周后没人再打开；团队以为模型不够强，其实是没把AI变成工作流里的“交付能力”。

OXYZ资本更愿意把种子期PMF证据定义为三件事（而且必须能被交叉验证）：

下面用“工作流替代率”做主线，把证据拆成可操作的检查项。

一、第一性指标：工作流替代率（别从模型开始）

先回答“你替代谁的哪段流程”。画一张工作流拆解图：目标岗位 × 场景 × 交付物，从触发到交付拆 8–15 步，并给每步标：频次、耗时、输出标准、风险点、AI介入方式（替代/辅助/不碰）。

替代率（早期粗算够用）：

替代率 ≈ Σ（频次 × 被替代耗时 × 质量系数） / Σ（频次 × 总耗时）

质量系数 0~1：能否直接用、返工比例、风险可控性。很多“功能很全”的产品替代率只有 5%~10%；真正有势能的窄场景，替代率做到 30%~50% 往往会迅速变成刚需。

二、种子期最硬的四类 PMF 证据

1）首次价值：从激活到“可交付结果”

TTFV（Time To First Value）要短，并且必须基于“可用标准”统计（字段齐全/格式可导入/合规通过/评分达标）。关注两项就够：

没有“可用标准”，所有指标都只是叙事。

2）复用：不是惊艳一次，而是每周离不开

看两条信号：

高频任务不复用，通常意味着你还没融进工作流。

3）单位经济：边际成本是否可控

把成本拆开算清楚：推理成本 + 人工介入（审核/改写/兜底分钟数）+ 交付支持（是否定制）。关键看两条趋势：

AI应用最怕“规模化 = 人肉爆炸”，种子期就要提前把这颗雷拆掉。

4）数据飞轮：例外在变少，自动化在变多

你是否把“失败原因”结构化？是否沉淀模板/规则/字段？质量波动是否在收敛？
没有闭环，你永远在用通用模型能力做产品，天花板很快出现。

三、三种“看起来很接近 PMF”的陷阱

四、一张清单：AI应用种子期 PMF 证据自检

A. 工作流与标准

☐ 目标岗位+场景一句话（谁在什么情境下交付什么）
☐ 工作流拆解图（8–15步，标频次/耗时/风险/AI介入点）
☐ “可用输出标准”（可检测、不靠主观）

B. 使用与复用

☐ TTFV（中位数）与任务成功率/返工率
☐ 复用频率（每用户每周核心任务次数）
☐ Cohort 复用曲线（迭代后是否变好）

C. 替代与节省

☐ 工作流替代率（当前值 + 4–8周趋势）
☐ 前后对比样本（10–30单：耗时/成本/错误率）
☐ 人工角色迁移证据（执行→审核的比例在提升）

D. 规模化与单位经济

☐ 每成功交付的推理成本（按任务口径）
☐ 每成功交付的人工介入分钟数（趋势下降）
☐ 集成进度与计划（CRM/工单/表格/文档等至少一条落地路径）

E. 数据飞轮与可控性

☐ 失败原因标签体系（可统计、可复盘）
☐ 模板/规则/字段沉淀在增长（可复用资产）
☐ 输出可追溯、可回滚、可控（尤其B2B）

种子期 PMF 的本质，是“把聪明变成交付”

如果你能拿出清单里大部分证据，哪怕收入还早，方向通常就很清晰：你不是在做一个会说话的模型包装，而是在把一段真实工作流变成可规模化的交付系统。

OXYZ资本欢迎AI应用领域的创业者们投递“工作流拆解图 + 指标口径”
发两样：1）工作流拆解图；2）TTFV/复用/替代率/边际成本的口径与样本。
我可以按清单帮你做一次“PMF证据体检”：哪一段替代率被卡住、哪些证据还不够硬、下一轮实验该怎么跑。