不是所有 Agent 都值得做:龙虾之后,创业者该如何筛选场景
最近 AI 圈所谓的“龙虾”,本质上已经成了 OpenClaw 及其带动的 Agent 热潮的代称。OpenClaw 在 2026 年 1 月 29 日的更名公告里提到,项目在两个月内拿下了超过 10 万 GitHub stars、单周 200 万访问;它还明确保留了“lobster heritage”和龙虾 mascot。官网给出的价值主张也很直白:不是陪你聊天,而是“真正去做事”——清收件箱、发邮件、管日历、办值机,都可以从聊天入口直接完成。AWS 随后甚至给出了一套部署指南,但同时提醒,直接安装并不容易,而且有不少安全考量;OpenClaw 官方也承认,提示注入仍是整个行业尚未解决的问题。
这正是“龙虾之后”最让创业者上头的地方:大家第一次强烈地感受到,大模型不只是一个会回答问题的接口,而是开始接管动作、接管流程、接管软件入口。可问题也恰恰出在这里。McKinsey 2025 年全球调查显示,88% 的受访组织已经在至少一个业务职能中常态化使用 AI,23% 开始在某些业务里规模化 agentic AI,另有 39% 还停留在实验阶段;但真正报告企业层面 EBIT 影响的只有 39%,大多数公司依旧卡在从试点到规模化的路上。换句话说,Agent 的热是真的,Agent 的价值也是真的,但“值得创业者做的 Agent 场景”远比热闹本身少得多。
更值得创业者警惕的是,OpenClaw 官方文档把自己的核心用户明确写成了 developers 和 power users,也就是愿意自建、自配、自担风险的一群人。很多团队看到这种产品爆红,就会天然误判:既然极客世界跑通了,企业世界也会跟着跑通。但这两件事之间,隔着权限、审计、责任归属、异常处理和采购流程。消费级爆红,不等于企业级可部署;技术上能动起来,也不等于商业上值得做。
所以,龙虾之后,创业者最需要的不是再多长一只“爪子”,而是重新学会判断:什么样的场景,配得上一个 Agent;什么样的场景,看上去性感,做出来却只是一个更贵的实习生。
一、不是所有“能自动化”的任务,都适合做成 Agent
很多创始人筛场景时,第一反应是看“这个任务能不能自动完成”。但这其实问错了问题。真正该问的是:这个任务值不值得被一个 Agent 接管。
OXYZ资本观点是,Agent 场景筛选最容易犯的错误,是“按能力找场景”,而不是“按摩擦找场景”。一旦按能力找,你会忍不住追着模型边界跑:能不能写方案、能不能谈客户、能不能做运营、能不能管项目。结果是产品看起来越来越全能,商业上却越来越虚。因为能力是连续的,场景是离散的;模型可以越来越聪明,但企业预算只会为明确问题买单。
创业者需要理解一个残酷事实:企业不是为了“AI 很厉害”付钱,而是为了“某段流程终于不再卡人、卡时间、卡错误”付钱。一个 Agent 值不值得做,不取决于它能做多少步,而取决于它能不能稳定吞掉一段重复、昂贵、可审计的劳动。
所以,不要先问“这个职业能不能被 Agent 替代”,要先问“这个工作单元能不能被 Agent 接管”。职业是模糊的,任务才是原子的。销售不会被一个 Agent 一次性替代,但线索分拣、首轮触达、会前准备、CRM 回填,也许可以被分段接管;财务不会被一个 Agent 一次性替代,但票据归档、报销初审、异常比对、对账提醒,也许完全可以切出来做。
OXYZ资本内部认为,真正值得做的,不是“替代一个人”,而是“吃掉一个动作链”。
二、为什么代码 Agent 先跑出来了
如果创业者想知道什么样的场景最容易率先成立,最好的样本其实不是客服,也不是销售,而是代码。
Anthropic 的研究给了一个非常重要的信号:在整体使用中,AI 仍更偏向“增强”而不是“自动化”,增强占 57%,自动化占 43%;但到了 Claude Code 这种 coding agent 场景,79% 的交互已经属于自动化,而且“AI 执行—人类校验—再反馈”的 feedback loop 也明显更高。Anthropic 在 2026 年 1 月的新报告里还把“AI 自主度”和“任务成功率”列为影响经济价值的关键变量。
这背后的启发非常大。为什么代码 Agent 跑得快?不是因为程序员更爱新技术,而是因为代码世界天然具备四个条件:输入相对结构化,环境机器可读,反馈几乎即时,成败有客观标准。代码写错了可以编译、可以测试、可以回滚、可以 diff。也就是说,它是一个高频、半封闭、可验证的工作环境。
这其实就是所有 Agent 场景筛选的底层答案:先去找那些像“代码世界”一样,边界清楚、环境可控、结果可验、异常可收束的流程。
很多创业者做反了。他们第一站就想做“老板 Agent”“全自动销售 Agent”“全能运营 Agent”。这些场景的问题不是不大,而是太大;不是价值不高,而是决策密度太高、责任链太长、异常太多。模型可能能完成其中 60% 的工作,但剩下那 40% 恰恰是最贵、最难、最需要人承担后果的部分。创业公司最容易死在这 40% 里。
三、创业者筛场景,先过六把尺子
我更建议把 Agent 场景筛选,压缩成六个问题。
第一,任务边界清不清楚。起点是什么,终点是什么,验收标准是什么?如果一个任务的成功只能靠“老板觉得不错”“客户好像满意”,那它很难成为早期 Agent 产品。反过来,像“把工单正确分流”“把报销初审完成”“把指定数据填进系统”“把初版报告按模板生成”,都更适合。
第二,环境是否机器友好。Agent 不是魔法,它需要能看见环境、理解环境、操作环境。最好有 API、有后台、有标准文档、有固定表单、有明确权限。越依赖线下沟通、口头默契、灰色经验,越不适合一开始做全自动。
第三,异常是不是少数。很多团队 demo 能跑,是因为只跑了主干流程;真正上线后死掉,是因为长尾异常太多。一个好场景不是“主流程很顺”,而是“异常情况也有办法收束”:要么自动回退给人工,要么触发复核,要么有 kill switch。没有异常治理的 Agent,不是产品,是事故。
第四,频次够不够高。低频任务即使价值大,也未必适合创业公司优先做。因为你需要靠高频去积累数据、打磨异常、建立信任、摊薄集成成本。OXYZ资本在看一些相关项目时,最常追问的一句就是:这个动作一周发生几次?如果答案是“偶尔”,那它多半只是一个酷功能,不是一个好生意。
第五,责任链能不能承受自动化。有些任务虽然繁琐,但一旦出错,责任成本极高,而且组织内部没人愿意承担“让机器直接做”的责任。这种场景并非不能做,但更适合先从“建议型”或“审阅型”切入,而不是直接做自治 Agent。创业者要明白,很多流程慢,不是因为没人想到自动化,而是因为责任没人愿意先背。
第六,预算锚点明不明确。一个场景是否值得做,最终要落回商业化:它替代的是外包预算、编制预算、合规成本,还是机会成本?如果你说不清客户今天在哪个科目上为这个问题流血,你就很难把 Agent 卖进去。OXYZ资本认为,好的 Agent 场景,一定对应着一笔今天已经存在、只是被低效消耗掉的钱。
四、别一上来做“全自动”,先判断你到底在做哪一类 Agent
OXYZ资本内部讨论时,通常会把 Agent 场景分成三类。
第一类是助手型。它负责理解、整理、建议,但不直接下场执行。比如会议纪要整理、政策解读、素材归档、售前方案初稿。这类场景最容易起量,但也最容易陷入“大家都能做”的同质化。
第二类是半闭环型。它可以执行大部分动作,但关键节点要人复核。比如合同初审、发票校验、客服分单、线索评分、投后数据汇总。这类场景往往最适合创业公司切入,因为既能给客户带来真实效率提升,又不至于把责任一次性全甩给模型。
第三类是强闭环型。它可以在明确权限和审计机制下自动完成完整动作链,比如固定规则下的工单流转、标准流程下的订单处理、代码环境中的自动修复与提交。这类场景利润最好,但门槛也最高,往往建立在前两类跑通之后。
很多团队把顺序做反了,一上来就想做第三类,最后被异常、权限、安全、审计拖死。真正成熟的路径,往往是先用第一类拿到入口,用第二类建立信任,再用第三类吃到自动化红利。
五、给每个候选场景打一张“12分卡”
如果你现在手里已经有三个候选方向,不妨直接打分:任务边界、环境可控、异常可收束、反馈可验证、频次够高、预算明确,每项 0 到 2 分,总分 12 分。
8 分以下,不建议做。因为这说明它要么边界太虚,要么环境太脏,要么责任太重。
8 到 10 分,可以做,但更适合从 Copilot 或半闭环切入。
10 分以上,才值得认真投入资源,把它往自治 Agent 推。
这个方法看起来很土,但它很有效。因为创业早期最怕的不是方向不性感,而是方向太性感,以至于团队不愿意承认它其实不成立。OXYZ资本内部认为,早期创业最重要的能力之一,就是在热潮里保持“减法判断”——知道哪些机会该追,也知道哪些机会该忍住。
六、最后,别做一个更贵的实习生
龙虾之后,市场真正需要的,不是再多一个会调工具、会写提示词、会在演示里跑通 20 步流程的 Agent。市场需要的是:它上线以后,企业某一段本来靠人硬扛的流程,真的开始更快、更便宜、更稳定、更可审计。
很多创业者最终不是输给模型能力,而是输给了场景贪心。总想一步到位,总想“端到端替代”,总想把最复杂、最体面、最像未来的那部分先做出来。可创业不是拍科幻片。真正能跑出来的公司,往往都从一个并不性感、但异常清楚、成本清楚、责任清楚的动作切进去。
所以,回到这篇文章的标题:不是所有 Agent 都值得做。
龙虾之后,真正决定胜负的,不是谁先喊出“万物皆可 Agent”,而是谁先搞清楚:哪一段流程,值得被 Agent 吞掉;哪一段流程,只适合继续由人承担。
创业者最该练的,不是想象力,而是筛选力。因为热潮会过去,演示会过时,模型会迭代,只有那些真正扎进业务骨头里的 Agent,才会留下来,长成公司。

