AI应用单位经济模型最简版:数据不完备也能先跑起来!
很多订阅/按量计费的 AI 应用团队,会在一个看似“增长正常”的阶段突然被现实打断:
新增在涨、功能在上、demo很能打,但现金流越来越紧。原因往往不是你不会增长,而是你在用“看不见的成本”给增长买单——推理、带宽、内容安全、人工审核、客服、重试、失败兜底……都不是零边际成本。你以为自己在扩张,其实是在把亏损放大。
OXYZ资本认为:AI 应用早期最该先跑起来的不是“更精细的增长模型”,而是一个足够粗、但能指导决策的单位经济模型(Unit Economics)。它不需要数据完美,但必须能回答三个致命问题:
1)我每多一个付费用户/每多一次关键使用,是否更赚钱?
2)我应该限制什么、放开什么、优先优化哪里?
3)我现在的定价与套餐,是否在“卖得越好亏得越多”?
下面给你一个“最简版单位经济模型”,专门面向订阅/按量计费产品:你只要有最基础的用量记录(哪怕抽样),就能在一周内跑出第一版,并在 30 天内迭代到可用。
一、先把“单位”选对:别用“注册用户”,用“会产生成本与收入的最小闭环”
单位经济最常见的死法,是单位选错:
你用“注册用户”算成本,永远看不清楚钱花在谁身上;你用“PV/访问”算收入,更是自欺欺人。
OXYZ资本观点:对 AI 应用,单位建议从下列三种里选一个(只选一个作为主单位):
1)订阅型(Seat/账号)优先用:活跃付费席位(Paid Active Seat)
定义:当月付费 + 在核心场景完成至少一次“可交付动作”的席位。
可交付动作例子:导出/发布/写回系统/批量处理完成。
好处:直接对齐订阅收入;避免把“买了但不用”的席位当成功。
2)按量计费优先用:计费事件(Billable Event)
定义:你收费口径对应的最小事件,比如:
- 每 1k tokens / 每次模型调用
- 每份报告/每个任务/每条工单自动处理
- 每次写回成功(更贴近交付)
好处:你卖什么就算什么,最容易对齐利润。
3)两者混合(订阅 + 超额)优先用:关键闭环任务(Closed-loop Task)
定义:一次用户从触发到交付完成的任务(例如“生成→人审→写回→发送”)。
好处:把“体验”拉回“交付”,更能暴露真正成本。
选择规则一句话:你怎么收费,就尽量怎么定“单位”;如果收费口径还在摇摆,就先用“闭环任务”当过渡单位。
二、最简模型只需要 7 个格子:一张表跑出第一版
你不需要复杂财务模型。最简版先把“贡献毛利”算出来就够了。
7个核心变量(订阅/按量都适用)
- 收入(Revenue)
- 订阅:ARPA(月均每付费账号收入)或每席位MRR
- 按量:单价 × 用量(或每事件收入)
- 推理成本(Inference COGS)
模型调用成本:tokens × 单价(或请求 × 单价) - 非推理变动成本(Non-inference Variable COGS)
向量检索、存储、带宽、第三方API、内容安全审核、短信/邮件等 - 失败与重试成本(Failure/Retry Tax)
超时重试、用户反复点、模型翻车导致二次生成 - 人工成本摊销(Human-in-the-loop / Support)
人工审核、客服工单、交付支持(按每单位平均分钟数×人力单价) - 支付与渠道费用(Payment/Platform Fees)
支付通道费、应用商店抽成等(按收入比例) - 单位贡献毛利(Contribution Margin, CM)
CM = 收入 -(2+3+4+5+6)
你先别急着把研发、行政等固定成本摊进去。早期最关键的是:单位贡献毛利是否为正,以及哪一项在吞噬你。
三、数据不完备怎么办:用“可控误差”先跑起来
很多团队卡在“没有准确数据所以算不了”。这恰恰是早期最危险的借口。
OXYZ资本内部认为:单位经济模型不是审计,它是“决策仪表盘”。早期你追求的不是精确到小数点,而是把误差控制在可用区间,并能指导动作。
1)推理成本:用“抽样 + 中位数”就够
做法(1小时可完成):
- 抽样最近 200 次关键任务(或 50 个付费用户的一天)
- 记录每次:输入tokens、输出tokens、调用次数、是否重试
- 取中位数(median)作为“典型成本”,再取P90作为“高成本尾部”
然后用模型供应商单价估算:
推理成本/任务 ≈(输入tokens+输出tokens)× 单价 × 调用次数
关键:把重试算进去。很多产品真正亏在“失败税”,不是正常调用。
2)非推理成本:先用“比例法”估算
早期你不可能把每个基础设施成本都按任务归因。可以先用比例近似:
非推理变动成本 ≈ 推理成本 ×(20%~60%)
比例取决于:你是否重度RAG、是否大量图片/文件、是否强合规审核。
先用区间跑三种情景:保守/基准/乐观,后面再逐项拆开。
3)人工成本:用“工单分钟数”粗算
你不需要精确统计每个客服动作,只需要回答:
“每100个闭环任务,会产生多少分钟人工介入?”
例如:每100单里有10单需要人工,每单平均8分钟,那么人工成本/任务就能估。
四、两类产品的“最小可用单位经济”长什么样
A)订阅型(含席位)最简看三行
- 每付费席位收入(MRR/Seat)
- 每付费席位变动成本(COGS/Seat):推理+非推理+失败税+人工摊销
- 席位贡献毛利(CM/Seat) = MRR/Seat - COGS/Seat
你只要能回答:
我每新增一个“真实活跃付费席位”,贡献毛利是正还是负?
如果是负的,先别扩张,先修产品与套餐。
B)按量计费最简看四行
- 每事件收入(Price/Event)
- 每事件推理成本(Inference/Event)
- 每事件总变动成本(Total COGS/Event)
- 每事件贡献毛利(CM/Event)
按量产品最怕的不是“低价”,而是成本与用量同向爆炸。你必须明确:
- 哪些用量是“高价值高付费”
- 哪些用量是“高成本低付费”(需要限制/提价/改产品路径)
五、把模型用起来:三条“红线规则”,直接指导迭代与定价
单位经济模型不该只是表格,它要能立刻变成行动。
OXYZ资本认为,早期至少设置三条红线:
红线1:免费用户的“单位成本上限”
给免费层设成本预算(例如:每免费用户每月成本≤X元)。
超过就必须触发限制:
- 降级模型/减少上下文
- 限制批量与高频
- 必须先预览再精修(把高成本动作变成“用户确认触发”)
红线2:P90成本必须被“套餐/定价”覆盖
如果P90任务成本远高于平均,你会被少数重度用户拖死。
解决不是“劝用户少用”,而是:
- 用套餐覆盖尾部(超额计费、企业版、加购包)
- 或把高成本路径改成可控(分段生成、缓存、异步队列)
红线3:失败税(重试/翻车)必须单独立项优化
很多团队只盯模型效果,却忽视“重试次数”。
优化失败税往往比提升一点点质量更直接赚钱:
- 加缓存与去重(同输入不重复算)
- 失败兜底(不给用户反复点的理由)
- 提前校验(输入不合法直接提示,不进模型)
- 路由策略(先小模型草稿,大模型精修)
六、四个最有效的“单位经济杠杆”:产品、工程、定价、增长
当你算出 CM 为负或太薄,别急着“涨价”或“砍功能”,先按杠杆优先级排。
1)产品杠杆:把“高成本动作”变成“高意图动作”
典型做法:
- 先给可用草稿,用户点“精修/生成最终版”才走大模型
- 把“批量/长文档/自动写回”放到明确付费阶段
- 用模板与结构化输入减少token浪费
2)工程杠杆:把钱从“重复计算”里抠出来
最常见的直接收益点:
- 缓存(prompt+上下文哈希)
- 分段/摘要(长上下文先压缩再推理)
- 模型路由(不同任务用不同模型)
- 异步化(减少峰值算力与超时重试)
3)定价杠杆:把“成本曲线”映射到“价格曲线”
订阅产品建议:
- 明确“包含量”(Included Usage),超额收费
- 以“可交付能力”分层(导出/写回/团队库/审计日志)
按量产品建议:
- 让定价口径更贴近价值(按报告/按工单解决/按写回成功)
- 对“尾部高成本”做加价或加购包
4)增长杠杆:先筛“对的人”,再谈规模
单位经济差时最怕投放。你要先用产品与渠道把“高意图用户”筛出来:
- 证据页/用例页承接决策
- 模板分享带来同类任务用户
- 集成/目录带来明确场景用户
这会直接改善用量结构与付费意愿。
七、30天落地节奏:把“最简版”迭代成“可决策版”
给你一套可照抄的 30 天节奏,适合订阅/按量计费产品:
第1周:选单位 + 做抽样账本
- 定义主单位(付费活跃席位 / 计费事件 / 闭环任务)
- 抽样 200 次关键任务,算 median 与 P90 成本
- 把“失败税”单独列出来
第2周:跑出 CM 区间(乐观/基准/保守)
- 非推理成本用比例法先估
- 人工用“每100单分钟数”估
- 得到 CM 的上下限,确定红线
第3周:用两次实验修正模型
- 实验A:限制免费层高成本动作,观察成本下降与留存变化
- 实验B:推出超额/加购包或分层权益,看 ARPA 与用量结构变化
第4周:把模型接进产品决策
- 每周看一次“单位贡献毛利”与“失败税”
- 迭代优先级按:失败税→路由/缓存→套餐映射→增长扩张
结语:别等数据完美,先让模型能救命
单位经济模型的意义,不是让你在表格里获得安全感,而是让你在最关键的时刻做对三件事:
敢于限制、敢于定价、敢于放大。
OXYZ资本观点:AI 应用早期的胜负,往往不是谁模型更强,而是谁更早把“成本曲线”驯服到“收入曲线”之下。你不需要一开始就把每一分钱算清楚,但你必须尽早知道:
你是在做一门会越做越赚钱的生意,还是一个越火越亏的“算力慈善”。

