AI应用单位经济模型最简版:数据不完备也能先跑起来!

很多订阅/按量计费的 AI 应用团队,会在一个看似增长正常的阶段突然被现实打断:
新增在涨、功能在上、demo很能打,但现金流越来越紧。原因往往不是你不会增长,而是你在用看不见的成本给增长买单——推理、带宽、内容安全、人工审核、客服、重试、失败兜底……都不是零边际成本。你以为自己在扩张,其实是在把亏损放大。

OXYZ资本认为AI 应用早期最该先跑起来的不是更精细的增长模型,而是一个足够粗、但能指导决策的单位经济模型(Unit Economics。它不需要数据完美,但必须能回答三个致命问题:
1)我每多一个付费用户/每多一次关键使用,是否更赚钱?
2)我应该限制什么、放开什么、优先优化哪里?
3)我现在的定价与套餐,是否在卖得越好亏得越多

下面给你一个最简版单位经济模型,专门面向订阅/按量计费产品:你只要有最基础的用量记录(哪怕抽样),就能在一周内跑出第一版,并在 30 天内迭代到可用。

 

一、先把单位选对:别用注册用户,用会产生成本与收入的最小闭环

单位经济最常见的死法,是单位选错:
你用注册用户算成本,永远看不清楚钱花在谁身上;你用“PV/访问算收入,更是自欺欺人。

OXYZ资本观点:对 AI 应用,单位建议从下列三种里选一个(只选一个作为主单位):

1)订阅型(Seat/账号)优先用:活跃付费席位(Paid Active Seat

定义:当月付费在核心场景完成至少一次可交付动作的席位。
可交付动作例子:导出/发布/写回系统/批量处理完成。

好处:直接对齐订阅收入;避免把买了但不用的席位当成功。

2)按量计费优先用:计费事件(Billable Event

定义:你收费口径对应的最小事件,比如:

  • 1k tokens / 每次模型调用
  • 每份报告/每个任务/每条工单自动处理
  • 每次写回成功(更贴近交付)

好处:你卖什么就算什么,最容易对齐利润。

3)两者混合(订阅超额)优先用:关键闭环任务(Closed-loop Task

定义:一次用户从触发到交付完成的任务(例如生成人审写回发送)。

好处:把体验拉回交付,更能暴露真正成本。

选择规则一句话:你怎么收费,就尽量怎么定单位;如果收费口径还在摇摆,就先用闭环任务当过渡单位。

 

二、最简模型只需要个格子:一张表跑出第一版

你不需要复杂财务模型。最简版先把贡献毛利算出来就够了。

7个核心变量(订阅/按量都适用)

  1. 收入(Revenue
  • 订阅:ARPA(月均每付费账号收入)或每席位MRR
  • 按量:单价 × 用量(或每事件收入)
  1. 推理成本(Inference COGS
    模型调用成本:tokens × 单价(或请求 × 单价)
  2. 非推理变动成本(Non-inference Variable COGS
    向量检索、存储、带宽、第三方API、内容安全审核、短信/邮件等
  3. 失败与重试成本(Failure/Retry Tax
    超时重试、用户反复点、模型翻车导致二次生成
  4. 人工成本摊销(Human-in-the-loop / Support
    人工审核、客服工单、交付支持(按每单位平均分钟数×人力单价)
  5. 支付与渠道费用(Payment/Platform Fees
    支付通道费、应用商店抽成等(按收入比例)
  6. 单位贡献毛利(Contribution Margin, CM
    CM = 收入 -2+3+4+5+6

你先别急着把研发、行政等固定成本摊进去。早期最关键的是:单位贡献毛利是否为正,以及哪一项在吞噬你。

 

三、数据不完备怎么办:用可控误差先跑起来

很多团队卡在没有准确数据所以算不了。这恰恰是早期最危险的借口。

OXYZ资本内部认为:单位经济模型不是审计,它是决策仪表盘。早期你追求的不是精确到小数点,而是把误差控制在可用区间,并能指导动作。

1)推理成本:用抽样中位数就够

做法(1小时可完成):

  • 抽样最近 200 次关键任务(或 50 个付费用户的一天)
  • 记录每次:输入tokens、输出tokens、调用次数、是否重试
  • 取中位数(median)作为典型成本,再取P90作为高成本尾部

然后用模型供应商单价估算:
推理成本/任务(输入tokens+输出tokens× 单价 × 调用次数

关键:把重试算进去。很多产品真正亏在失败税,不是正常调用。

2)非推理成本:先用比例法估算

早期你不可能把每个基础设施成本都按任务归因。可以先用比例近似:
非推理变动成本 ≈ 推理成本 ×20%~60%
比例取决于:你是否重度RAG、是否大量图片/文件、是否强合规审核。

先用区间跑三种情景:保守/基准/乐观,后面再逐项拆开。

3)人工成本:用工单分钟数粗算

你不需要精确统计每个客服动作,只需要回答:
100个闭环任务,会产生多少分钟人工介入?
例如:每100单里有10单需要人工,每单平均8分钟,那么人工成本/任务就能估。

 

四、两类产品的最小可用单位经济长什么样

A)订阅型(含席位)最简看三行

  • 每付费席位收入(MRR/Seat
  • 每付费席位变动成本(COGS/Seat:推理+非推理+失败税+人工摊销
  • 席位贡献毛利(CM/Seat = MRR/Seat - COGS/Seat

你只要能回答:

我每新增一个真实活跃付费席位,贡献毛利是正还是负?
如果是负的,先别扩张,先修产品与套餐。

B)按量计费最简看四行

  • 每事件收入(Price/Event
  • 每事件推理成本(Inference/Event
  • 每事件总变动成本(Total COGS/Event
  • 每事件贡献毛利(CM/Event

按量产品最怕的不是低价,而是成本与用量同向爆炸。你必须明确:

  • 哪些用量是高价值高付费
  • 哪些用量是高成本低付费(需要限制/提价/改产品路径)

 

五、把模型用起来:三条红线规则,直接指导迭代与定价

单位经济模型不该只是表格,它要能立刻变成行动。

OXYZ资本认为,早期至少设置三条红线:

红线1:免费用户的单位成本上限

给免费层设成本预算(例如:每免费用户每月成本≤X元)。
超过就必须触发限制:

  • 降级模型/减少上下文
  • 限制批量与高频
  • 必须先预览再精修(把高成本动作变成用户确认触发

红线2P90成本必须被套餐/定价覆盖

如果P90任务成本远高于平均,你会被少数重度用户拖死。
解决不是劝用户少用,而是:

  • 用套餐覆盖尾部(超额计费、企业版、加购包)
  • 或把高成本路径改成可控(分段生成、缓存、异步队列)

红线3:失败税(重试/翻车)必须单独立项优化

很多团队只盯模型效果,却忽视重试次数
优化失败税往往比提升一点点质量更直接赚钱:

  • 加缓存与去重(同输入不重复算)
  • 失败兜底(不给用户反复点的理由)
  • 提前校验(输入不合法直接提示,不进模型)
  • 路由策略(先小模型草稿,大模型精修)

 

六、四个最有效的单位经济杠杆:产品、工程、定价、增长

当你算出 CM 为负或太薄,别急着涨价砍功能,先按杠杆优先级排。

1)产品杠杆:把高成本动作变成高意图动作

典型做法:

  • 先给可用草稿,用户点精修/生成最终版才走大模型
  • 批量/长文档/自动写回放到明确付费阶段
  • 用模板与结构化输入减少token浪费

2)工程杠杆:把钱从重复计算里抠出来

最常见的直接收益点:

  • 缓存(prompt+上下文哈希)
  • 分段/摘要(长上下文先压缩再推理)
  • 模型路由(不同任务用不同模型)
  • 异步化(减少峰值算力与超时重试)

3)定价杠杆:把成本曲线映射到价格曲线

订阅产品建议:

  • 明确包含量Included Usage),超额收费
  • 可交付能力分层(导出/写回/团队库/审计日志)

按量产品建议:

  • 让定价口径更贴近价值(按报告/按工单解决/按写回成功)
  • 尾部高成本做加价或加购包

4)增长杠杆:先筛对的人,再谈规模

单位经济差时最怕投放。你要先用产品与渠道把高意图用户筛出来:

  • 证据页/用例页承接决策
  • 模板分享带来同类任务用户
  • 集成/目录带来明确场景用户
    这会直接改善用量结构与付费意愿。

 

七、30天落地节奏:把最简版迭代成可决策版

给你一套可照抄的 30 天节奏,适合订阅/按量计费产品:

1周:选单位做抽样账本

  • 定义主单位(付费活跃席位计费事件闭环任务)
  • 抽样 200 次关键任务,算 median  P90 成本
  • 失败税单独列出来

2周:跑出 CM 区间(乐观/基准/保守)

  • 非推理成本用比例法先估
  • 人工用100单分钟数
  • 得到 CM 的上下限,确定红线

3周:用两次实验修正模型

  • 实验A:限制免费层高成本动作,观察成本下降与留存变化
  • 实验B:推出超额/加购包或分层权益,看 ARPA 与用量结构变化

4周:把模型接进产品决策

  • 每周看一次单位贡献毛利失败税
  • 迭代优先级按:失败税路由/缓存套餐映射增长扩张

 

结语:别等数据完美,先让模型能救命

单位经济模型的意义,不是让你在表格里获得安全感,而是让你在最关键的时刻做对三件事:
敢于限制、敢于定价、敢于放大。

OXYZ资本观点AI 应用早期的胜负,往往不是谁模型更强,而是谁更早把成本曲线驯服到收入曲线之下。你不需要一开始就把每一分钱算清楚,但你必须尽早知道:
你是在做一门会越做越赚钱的生意,还是一个越火越亏的算力慈善