高时长不等于好生意:AI陪伴赛道最危险的幻觉,是把亏损当增长
如果今天还用“时长高、用户黏、需求真”来判断 AI Native Social × 超写实数字人 × 多模态互动娱乐 值不值得投,那大概率只看对了一半。OXYZ资本的核心判断是:这条赛道当然能做出真钱生意,但好生意和热产品之间,隔着一整条单位经济鸿沟。 问题从来不是有没有需求,而是谁在为那些最昂贵的分钟买单。
需求已经被验证。2025 年上半年,AI companion apps 在移动端收入约 8200 万美元;截至 2025 年 7 月,累计消费者支出约 2.21 亿美元。但同一组数据也给了市场另一记冷水:前 10% 产品拿走了 89% 的收入。这说明什么?说明它不是“没有商业化”的赛道,而是极强 power law、极强分化的赛道。能赚钱的会赚得很集中,跑不顺单位经济的,会在高时长里越跑越亏。
所以,OXYZ资本并不把“高时长”自动等同于“高价值”。在这个赛道里,真正的商业分水岭只有一句话:高频主循环必须足够便宜,昂贵模态必须被有效分层定价。 如果一个团队还在相信“便宜月费 + 无限语音/视频/超长记忆”能跑出健康生意,那它大概率是在用资本补贴用户,而不是在做商业模式。
这也是为什么,我们更认可的结构,不是把所有能力打包进一个低价订阅,而是:低成本文本/2D/动作主循环 + 订阅做底 + 虚拟币/credits + 语音/视频/长记忆/图像单独收费 + 尽量提高 web支付占比。 原因很简单:订阅可以做收入底盘,但订阅不是慈善,它本质上建立在“平均使用量假设”之上。一旦用户真的把高成本权益用满,平费订阅就会迅速变成负毛利。
这里最值得警惕的,不是“收费太贵”,而是“收费太懒”。很多团队会把 IAP、虚拟币、credits 当成订阅之外的补充收入,但 OXYZ资本的观点恰恰相反:IAP 不是补充,它是这条赛道最核心的定价工具。 因为只有 credits/配额体系,才能把免费尝鲜用户、普通订阅用户、重度多模态用户真正分开收费。没有这套机制,你最后只能在两种烂答案里二选一:要么过度限制免费,丢掉增长;要么用便宜订阅补贴高耗能用户,把毛利打穿。
为什么我们反复强调“昂贵模态必须单独收费”?因为文本、语音、视频根本不是一个成本世界。公开价格已经足够说明问题:文本 token 成本很低,但实时语音和视频是另一个数量级。直觉上,一个 9.99 美元的订阅,如果走应用商店分成,净到手大约只剩 8.49 美元;但如果用户每天使用 15 分钟实时语音,仅成本就可能轻松超过这个数字。再往上,如果是 face-to-face 的视频陪伴,成本只会更高。OXYZ资本不害怕高成本功能,害怕的是团队把高成本功能默认送出去。
因此,很多“看起来很火”的产品,其实只是把亏损包装成增长。第一种典型误判,是把免费时长当资产。实际上,在这种赛道里,免费时长往往是最贵的时长。第二种误判,是把所有 engagement 当成同一种 engagement。30 分钟文本,和 30 分钟实时语音/视频,商业含义完全不同。第三种误判,是把平费订阅当成万能解法。只要高成本用户真的高频使用,所谓“月费制”就会迅速暴露出 breakage 假设。第四种误判,是把社交和 UGC 当成天然正外部性,却忽略它同时放大了审核、安全、未成年人和平台规则成本。第五种误判,是忘了这是一个头部极度集中的类目——高时长并不自动等于高收入,更不等于高 LTV。
从 OXYZ资本的投资视角看,最有机会先把单位经济跑顺的,不是最像真人的产品,而是最会做成本分层的产品。 第一类是文本 / 2D 角色生态平台。它们的好处很直接:主循环便宜,SKU 工具箱也最多,订阅、广告、虚拟币、memory、装扮、语音增值都能叠。第二类是剧情 / 社交动作经济产品,例如按 action、context、credits 计费,而不是无脑卖“无限陪伴”,这种结构天然更健康。第三类是有 B 端 fallback 的 hybrid 多模态公司,它们至少可以把高成本能力卖给更能承受单价的企业客户,而不是全压在消费端 ARPPU 上。
反过来,最难做顺的三类也很清楚。第一类,是低价平费却主打无限语音、无限视频、无限长记忆的 companion。第二类,是云端 3D 或超写实数字人先行,把最贵的具身化能力放进默认主循环。第三类,是广告优先的私密关系产品。它们的问题其实是同一个:把最贵的能力,放在了最难定价的位置。 这种项目从外面看,往往很“未来”;从里面看,经常只是一个没有被说穿的负毛利结构。
所以,OXYZ资本在看这条赛道的早期项目时,最先要的从来不是“用户有多喜欢”,而是“财务上谁在补贴谁”。如果一个团队拿不出这组数,我们通常不会进 IC:收入拆分、iOS/Android/web 的净收入结构、text/voice/video 的模态成本拆分、free/subscriber/heavy payer 的收入和 COGS、cohort contribution margin、quota 兑付率,以及举报率、封禁率、人工审核率。因为在这个赛道里,DAU 和时长只是表象,真正的生死线藏在分层收入和模态成本里。
OXYZ资本对创始团队也有一条非常直接的红旗判断:如果一个团队只会讲 DAU、时长、沉浸感,却讲不出按模态拆的成本;如果它把 9.99 美元左右的低价订阅和高频 realtime voice/video 绑在一起;如果它没有 credits、配额或 action economy,却想服务最重度的用户;如果它几乎全靠 App Store 支付、web 占比很低;如果 free 用户贡献了大部分最昂贵的模态消耗;如果 UGC 和社交功能很强,但安全治理还停留在 demo 阶段——那它很可能不是在做“下一代娱乐网络”,而是在做一台延迟爆炸的亏损机器。
它能做成好生意,但只有在“便宜主循环 + 昂贵能力单独定价 + 渠道费可控 + 安全治理前置”同时成立时,才是高质量生意。 也正因为如此,OXYZ资本最值得优先看的,不是“最像真人”的产品,而是那些先用文本、2D、动作和世界机制把留存、社区和关系做出来,再把语音、视频、长记忆和形象付费做成高 ARPPU 增值层的团队。这个赛道未来当然会有明星产品,但真正值得下注的,从来不是“哪家最会烧钱做沉浸”,而是哪家最会把昂贵的沉浸,卖成可持续的利润。

