不是所有 Agent 都值得做:龙虾之后,创业者该如何筛选场景

最近 AI 圈所谓的龙虾,本质上已经成了 OpenClaw 及其带动的 Agent 热潮的代称。OpenClaw  2026  29 日的更名公告里提到,项目在两个月内拿下了超过 10  GitHub stars、单周 200 万访问;它还明确保留了“lobster heritage”和龙虾 mascot。官网给出的价值主张也很直白:不是陪你聊天,而是真正去做事”——清收件箱、发邮件、管日历、办值机,都可以从聊天入口直接完成。AWS 随后甚至给出了一套部署指南,但同时提醒,直接安装并不容易,而且有不少安全考量;OpenClaw 官方也承认,提示注入仍是整个行业尚未解决的问题。

 

这正是龙虾之后最让创业者上头的地方:大家第一次强烈地感受到,大模型不只是一个会回答问题的接口,而是开始接管动作、接管流程、接管软件入口。可问题也恰恰出在这里。McKinsey 2025 年全球调查显示,88% 的受访组织已经在至少一个业务职能中常态化使用 AI23% 开始在某些业务里规模化 agentic AI,另有 39% 还停留在实验阶段;但真正报告企业层面 EBIT 影响的只有 39%,大多数公司依旧卡在从试点到规模化的路上。换句话说,Agent 的热是真的,Agent 的价值也是真的,但值得创业者做的 Agent 场景远比热闹本身少得多。

 

更值得创业者警惕的是,OpenClaw 官方文档把自己的核心用户明确写成了 developers  power users,也就是愿意自建、自配、自担风险的一群人。很多团队看到这种产品爆红,就会天然误判:既然极客世界跑通了,企业世界也会跟着跑通。但这两件事之间,隔着权限、审计、责任归属、异常处理和采购流程。消费级爆红,不等于企业级可部署;技术上能动起来,也不等于商业上值得做。

 

所以,龙虾之后,创业者最需要的不是再多长一只爪子,而是重新学会判断:什么样的场景,配得上一个 Agent;什么样的场景,看上去性感,做出来却只是一个更贵的实习生。

 

一、不是所有能自动化的任务,都适合做成 Agent

很多创始人筛场景时,第一反应是看这个任务能不能自动完成。但这其实问错了问题。真正该问的是:这个任务值不值得被一个 Agent 接管。

 

OXYZ资本观点是,Agent 场景筛选最容易犯的错误,是按能力找场景,而不是按摩擦找场景。一旦按能力找,你会忍不住追着模型边界跑:能不能写方案、能不能谈客户、能不能做运营、能不能管项目。结果是产品看起来越来越全能,商业上却越来越虚。因为能力是连续的,场景是离散的;模型可以越来越聪明,但企业预算只会为明确问题买单。

 

创业者需要理解一个残酷事实:企业不是为了“AI 很厉害付钱,而是为了某段流程终于不再卡人、卡时间、卡错误付钱。一个 Agent 值不值得做,不取决于它能做多少步,而取决于它能不能稳定吞掉一段重复、昂贵、可审计的劳动。

 

所以,不要先问这个职业能不能被 Agent 替代,要先问这个工作单元能不能被 Agent 接管。职业是模糊的,任务才是原子的。销售不会被一个 Agent 一次性替代,但线索分拣、首轮触达、会前准备、CRM 回填,也许可以被分段接管;财务不会被一个 Agent 一次性替代,但票据归档、报销初审、异常比对、对账提醒,也许完全可以切出来做。

 

OXYZ资本内部认为,真正值得做的,不是替代一个人,而是吃掉一个动作链

 

二、为什么代码 Agent 先跑出来了

如果创业者想知道什么样的场景最容易率先成立,最好的样本其实不是客服,也不是销售,而是代码。

 

Anthropic 的研究给了一个非常重要的信号:在整体使用中,AI 仍更偏向增强而不是自动化,增强占 57%,自动化占 43%;但到了 Claude Code 这种 coding agent 场景,79% 的交互已经属于自动化,而且“AI 执行人类校验再反馈 feedback loop 也明显更高。Anthropic  2026  1 月的新报告里还把“AI 自主度任务成功率列为影响经济价值的关键变量。

 

这背后的启发非常大。为什么代码 Agent 跑得快?不是因为程序员更爱新技术,而是因为代码世界天然具备四个条件:输入相对结构化,环境机器可读,反馈几乎即时,成败有客观标准。代码写错了可以编译、可以测试、可以回滚、可以 diff。也就是说,它是一个高频、半封闭、可验证的工作环境。

 

这其实就是所有 Agent 场景筛选的底层答案:先去找那些像代码世界一样,边界清楚、环境可控、结果可验、异常可收束的流程。

 

很多创业者做反了。他们第一站就想做老板 Agent”“全自动销售 Agent”“全能运营 Agent”。这些场景的问题不是不大,而是太大;不是价值不高,而是决策密度太高、责任链太长、异常太多。模型可能能完成其中 60% 的工作,但剩下那 40% 恰恰是最贵、最难、最需要人承担后果的部分。创业公司最容易死在这 40% 里。

 

三、创业者筛场景,先过六把尺子

我更建议把 Agent 场景筛选,压缩成六个问题。

 

第一,任务边界清不清楚。起点是什么,终点是什么,验收标准是什么?如果一个任务的成功只能靠老板觉得不错”“客户好像满意,那它很难成为早期 Agent 产品。反过来,像把工单正确分流”“把报销初审完成”“把指定数据填进系统”“把初版报告按模板生成,都更适合。

 

第二,环境是否机器友好Agent 不是魔法,它需要能看见环境、理解环境、操作环境。最好有 API、有后台、有标准文档、有固定表单、有明确权限。越依赖线下沟通、口头默契、灰色经验,越不适合一开始做全自动。

 

第三,异常是不是少数。很多团队 demo 能跑,是因为只跑了主干流程;真正上线后死掉,是因为长尾异常太多。一个好场景不是主流程很顺,而是异常情况也有办法收束:要么自动回退给人工,要么触发复核,要么有 kill switch。没有异常治理的 Agent,不是产品,是事故。

 

第四,频次够不够高。低频任务即使价值大,也未必适合创业公司优先做。因为你需要靠高频去积累数据、打磨异常、建立信任、摊薄集成成本。OXYZ资本在看一些相关项目时,最常追问的一句就是:这个动作一周发生几次?如果答案是偶尔,那它多半只是一个酷功能,不是一个好生意。

 

第五,责任链能不能承受自动化。有些任务虽然繁琐,但一旦出错,责任成本极高,而且组织内部没人愿意承担让机器直接做的责任。这种场景并非不能做,但更适合先从建议型审阅型切入,而不是直接做自治 Agent。创业者要明白,很多流程慢,不是因为没人想到自动化,而是因为责任没人愿意先背。

 

第六,预算锚点明不明确。一个场景是否值得做,最终要落回商业化:它替代的是外包预算、编制预算、合规成本,还是机会成本?如果你说不清客户今天在哪个科目上为这个问题流血,你就很难把 Agent 卖进去。OXYZ资本认为,好的 Agent 场景,一定对应着一笔今天已经存在、只是被低效消耗掉的钱。

 

四、别一上来做全自动,先判断你到底在做哪一类 Agent

OXYZ资本内部讨论时,通常会把 Agent 场景分成三类。

 

第一类是助手型。它负责理解、整理、建议,但不直接下场执行。比如会议纪要整理、政策解读、素材归档、售前方案初稿。这类场景最容易起量,但也最容易陷入大家都能做的同质化。

 

第二类是半闭环型。它可以执行大部分动作,但关键节点要人复核。比如合同初审、发票校验、客服分单、线索评分、投后数据汇总。这类场景往往最适合创业公司切入,因为既能给客户带来真实效率提升,又不至于把责任一次性全甩给模型。

 

第三类是强闭环型。它可以在明确权限和审计机制下自动完成完整动作链,比如固定规则下的工单流转、标准流程下的订单处理、代码环境中的自动修复与提交。这类场景利润最好,但门槛也最高,往往建立在前两类跑通之后。

 

很多团队把顺序做反了,一上来就想做第三类,最后被异常、权限、安全、审计拖死。真正成熟的路径,往往是先用第一类拿到入口,用第二类建立信任,再用第三类吃到自动化红利。

 

五、给每个候选场景打一张“12分卡

如果你现在手里已经有三个候选方向,不妨直接打分:任务边界、环境可控、异常可收束、反馈可验证、频次够高、预算明确,每项分,总分 12 分。

 

分以下,不建议做。因为这说明它要么边界太虚,要么环境太脏,要么责任太重。
10 分,可以做,但更适合从 Copilot 或半闭环切入。
10 分以上,才值得认真投入资源,把它往自治 Agent 推。

 

这个方法看起来很土,但它很有效。因为创业早期最怕的不是方向不性感,而是方向太性感,以至于团队不愿意承认它其实不成立。OXYZ资本内部认为,早期创业最重要的能力之一,就是在热潮里保持减法判断”——知道哪些机会该追,也知道哪些机会该忍住。

 

六、最后,别做一个更贵的实习生

龙虾之后,市场真正需要的,不是再多一个会调工具、会写提示词、会在演示里跑通 20 步流程的 Agent。市场需要的是:它上线以后,企业某一段本来靠人硬扛的流程,真的开始更快、更便宜、更稳定、更可审计。

 

很多创业者最终不是输给模型能力,而是输给了场景贪心。总想一步到位,总想端到端替代,总想把最复杂、最体面、最像未来的那部分先做出来。可创业不是拍科幻片。真正能跑出来的公司,往往都从一个并不性感、但异常清楚、成本清楚、责任清楚的动作切进去。

所以,回到这篇文章的标题:不是所有 Agent 都值得做。


龙虾之后,真正决定胜负的,不是谁先喊出万物皆可 Agent”,而是谁先搞清楚:哪一段流程,值得被 Agent 吞掉;哪一段流程,只适合继续由人承担。

 

创业者最该练的,不是想象力,而是筛选力。因为热潮会过去,演示会过时,模型会迭代,只有那些真正扎进业务骨头里的 Agent,才会留下来,长成公司。