不是所有 Agent 都值得做：龙虾之后，创业者该如何筛选场景

2026-03-06 15:41:09

最近 AI 圈所谓的“龙虾”，本质上已经成了 OpenClaw 及其带动的 Agent 热潮的代称。OpenClaw 在 2026 年 1 月 29 日的更名公告里提到，项目在两个月内拿下了超过 10 万 GitHub stars、单周 200 万访问；它还明确保留了“lobster heritage”和龙虾 mascot。官网给出的价值主张也很直白：不是陪你聊天，而是“真正去做事”——清收件箱、发邮件、管日历、办值机，都可以从聊天入口直接完成。AWS 随后甚至给出了一套部署指南，但同时提醒，直接安装并不容易，而且有不少安全考量；OpenClaw 官方也承认，提示注入仍是整个行业尚未解决的问题。

这正是“龙虾之后”最让创业者上头的地方：大家第一次强烈地感受到，大模型不只是一个会回答问题的接口，而是开始接管动作、接管流程、接管软件入口。可问题也恰恰出在这里。McKinsey 2025 年全球调查显示，88% 的受访组织已经在至少一个业务职能中常态化使用 AI，23% 开始在某些业务里规模化 agentic AI，另有 39% 还停留在实验阶段；但真正报告企业层面 EBIT 影响的只有 39%，大多数公司依旧卡在从试点到规模化的路上。换句话说，Agent 的热是真的，Agent 的价值也是真的，但“值得创业者做的 Agent 场景”远比热闹本身少得多。

更值得创业者警惕的是，OpenClaw 官方文档把自己的核心用户明确写成了 developers 和 power users，也就是愿意自建、自配、自担风险的一群人。很多团队看到这种产品爆红，就会天然误判：既然极客世界跑通了，企业世界也会跟着跑通。但这两件事之间，隔着权限、审计、责任归属、异常处理和采购流程。消费级爆红，不等于企业级可部署；技术上能动起来，也不等于商业上值得做。

所以，龙虾之后，创业者最需要的不是再多长一只“爪子”，而是重新学会判断：什么样的场景，配得上一个 Agent；什么样的场景，看上去性感，做出来却只是一个更贵的实习生。

一、不是所有“能自动化”的任务，都适合做成 Agent

很多创始人筛场景时，第一反应是看“这个任务能不能自动完成”。但这其实问错了问题。真正该问的是：这个任务值不值得被一个 Agent 接管。

OXYZ资本观点是，Agent 场景筛选最容易犯的错误，是“按能力找场景”，而不是“按摩擦找场景”。一旦按能力找，你会忍不住追着模型边界跑：能不能写方案、能不能谈客户、能不能做运营、能不能管项目。结果是产品看起来越来越全能，商业上却越来越虚。因为能力是连续的，场景是离散的；模型可以越来越聪明，但企业预算只会为明确问题买单。

创业者需要理解一个残酷事实：企业不是为了“AI 很厉害”付钱，而是为了“某段流程终于不再卡人、卡时间、卡错误”付钱。一个 Agent 值不值得做，不取决于它能做多少步，而取决于它能不能稳定吞掉一段重复、昂贵、可审计的劳动。

所以，不要先问“这个职业能不能被 Agent 替代”，要先问“这个工作单元能不能被 Agent 接管”。职业是模糊的，任务才是原子的。销售不会被一个 Agent 一次性替代，但线索分拣、首轮触达、会前准备、CRM 回填，也许可以被分段接管；财务不会被一个 Agent 一次性替代，但票据归档、报销初审、异常比对、对账提醒，也许完全可以切出来做。

OXYZ资本内部认为，真正值得做的，不是“替代一个人”，而是“吃掉一个动作链”。

二、为什么代码 Agent 先跑出来了

如果创业者想知道什么样的场景最容易率先成立，最好的样本其实不是客服，也不是销售，而是代码。

Anthropic 的研究给了一个非常重要的信号：在整体使用中，AI 仍更偏向“增强”而不是“自动化”，增强占 57%，自动化占 43%；但到了 Claude Code 这种 coding agent 场景，79% 的交互已经属于自动化，而且“AI 执行—人类校验—再反馈”的 feedback loop 也明显更高。Anthropic 在 2026 年 1 月的新报告里还把“AI 自主度”和“任务成功率”列为影响经济价值的关键变量。

这背后的启发非常大。为什么代码 Agent 跑得快？不是因为程序员更爱新技术，而是因为代码世界天然具备四个条件：输入相对结构化，环境机器可读，反馈几乎即时，成败有客观标准。代码写错了可以编译、可以测试、可以回滚、可以 diff。也就是说，它是一个高频、半封闭、可验证的工作环境。

这其实就是所有 Agent 场景筛选的底层答案：先去找那些像“代码世界”一样，边界清楚、环境可控、结果可验、异常可收束的流程。

很多创业者做反了。他们第一站就想做“老板 Agent”“全自动销售 Agent”“全能运营 Agent”。这些场景的问题不是不大，而是太大；不是价值不高，而是决策密度太高、责任链太长、异常太多。模型可能能完成其中 60% 的工作，但剩下那 40% 恰恰是最贵、最难、最需要人承担后果的部分。创业公司最容易死在这 40% 里。

三、创业者筛场景，先过六把尺子

我更建议把 Agent 场景筛选，压缩成六个问题。

第一，任务边界清不清楚。起点是什么，终点是什么，验收标准是什么？如果一个任务的成功只能靠“老板觉得不错”“客户好像满意”，那它很难成为早期 Agent 产品。反过来，像“把工单正确分流”“把报销初审完成”“把指定数据填进系统”“把初版报告按模板生成”，都更适合。

第二，环境是否机器友好。Agent 不是魔法，它需要能看见环境、理解环境、操作环境。最好有 API、有后台、有标准文档、有固定表单、有明确权限。越依赖线下沟通、口头默契、灰色经验，越不适合一开始做全自动。

第三，异常是不是少数。很多团队 demo 能跑，是因为只跑了主干流程；真正上线后死掉，是因为长尾异常太多。一个好场景不是“主流程很顺”，而是“异常情况也有办法收束”：要么自动回退给人工，要么触发复核，要么有 kill switch。没有异常治理的 Agent，不是产品，是事故。

第四，频次够不够高。低频任务即使价值大，也未必适合创业公司优先做。因为你需要靠高频去积累数据、打磨异常、建立信任、摊薄集成成本。OXYZ资本在看一些相关项目时，最常追问的一句就是：这个动作一周发生几次？如果答案是“偶尔”，那它多半只是一个酷功能，不是一个好生意。

第五，责任链能不能承受自动化。有些任务虽然繁琐，但一旦出错，责任成本极高，而且组织内部没人愿意承担“让机器直接做”的责任。这种场景并非不能做，但更适合先从“建议型”或“审阅型”切入，而不是直接做自治 Agent。创业者要明白，很多流程慢，不是因为没人想到自动化，而是因为责任没人愿意先背。

第六，预算锚点明不明确。一个场景是否值得做，最终要落回商业化：它替代的是外包预算、编制预算、合规成本，还是机会成本？如果你说不清客户今天在哪个科目上为这个问题流血，你就很难把 Agent 卖进去。OXYZ资本认为，好的 Agent 场景，一定对应着一笔今天已经存在、只是被低效消耗掉的钱。

四、别一上来做“全自动”，先判断你到底在做哪一类 Agent

OXYZ资本内部讨论时，通常会把 Agent 场景分成三类。

第一类是助手型。它负责理解、整理、建议，但不直接下场执行。比如会议纪要整理、政策解读、素材归档、售前方案初稿。这类场景最容易起量，但也最容易陷入“大家都能做”的同质化。

第二类是半闭环型。它可以执行大部分动作，但关键节点要人复核。比如合同初审、发票校验、客服分单、线索评分、投后数据汇总。这类场景往往最适合创业公司切入，因为既能给客户带来真实效率提升，又不至于把责任一次性全甩给模型。

第三类是强闭环型。它可以在明确权限和审计机制下自动完成完整动作链，比如固定规则下的工单流转、标准流程下的订单处理、代码环境中的自动修复与提交。这类场景利润最好，但门槛也最高，往往建立在前两类跑通之后。

很多团队把顺序做反了，一上来就想做第三类，最后被异常、权限、安全、审计拖死。真正成熟的路径，往往是先用第一类拿到入口，用第二类建立信任，再用第三类吃到自动化红利。

五、给每个候选场景打一张“12分卡”

如果你现在手里已经有三个候选方向，不妨直接打分：任务边界、环境可控、异常可收束、反馈可验证、频次够高、预算明确，每项 0 到 2 分，总分 12 分。

8 分以下，不建议做。因为这说明它要么边界太虚，要么环境太脏，要么责任太重。
8 到 10 分，可以做，但更适合从 Copilot 或半闭环切入。
10 分以上，才值得认真投入资源，把它往自治 Agent 推。

这个方法看起来很土，但它很有效。因为创业早期最怕的不是方向不性感，而是方向太性感，以至于团队不愿意承认它其实不成立。OXYZ资本内部认为，早期创业最重要的能力之一，就是在热潮里保持“减法判断”——知道哪些机会该追，也知道哪些机会该忍住。

六、最后，别做一个更贵的实习生

龙虾之后，市场真正需要的，不是再多一个会调工具、会写提示词、会在演示里跑通 20 步流程的 Agent。市场需要的是：它上线以后，企业某一段本来靠人硬扛的流程，真的开始更快、更便宜、更稳定、更可审计。

很多创业者最终不是输给模型能力，而是输给了场景贪心。总想一步到位，总想“端到端替代”，总想把最复杂、最体面、最像未来的那部分先做出来。可创业不是拍科幻片。真正能跑出来的公司，往往都从一个并不性感、但异常清楚、成本清楚、责任清楚的动作切进去。

所以，回到这篇文章的标题：不是所有 Agent 都值得做。

龙虾之后，真正决定胜负的，不是谁先喊出“万物皆可 Agent”，而是谁先搞清楚：哪一段流程，值得被 Agent 吞掉；哪一段流程，只适合继续由人承担。

创业者最该练的，不是想象力，而是筛选力。因为热潮会过去，演示会过时，模型会迭代，只有那些真正扎进业务骨头里的 Agent，才会留下来，长成公司。