01高 DAU 的假象
一个 AI 写作助手上线六个月,日活用户稳定在三万,NPS 分数 47,三个月留存率 62%。按照传统 SaaS 的标准,这些数字看起来不错。
但当产品经理深挖用户行为数据,她发现了一个令人不安的模式:用户每次打开 Agent,生成一段文字,然后花十到二十分钟修改,最后使用的内容和原始输出的重叠率不到 30%。换句话说,用户不是在使用这个 Agent 完成任务,而是在用它生成一个"需要大量修改的草稿",这个草稿只是他们自己写作的辅助材料,而不是可信赖的输出。
这就是"假 PMF"——产品有留存,有参与度,有良好的传统指标,但用户从来不让它做真正重要的任务,因为他们不信任它的输出质量到可以"托付"的程度。
F16 可靠性 PMF 诊断框架的出发点正是这个洞见:Agent 产品的真正 PMF 信号,不是用户活跃度,而是可托付性——用户愿不愿意把重要任务真正交给它,交出去之后还需不需要大量修改,修改之后下次还愿不愿意再托付。
02核心问题:三个新指标,替代传统 PMF 评估
本框架创新:F16 提出 Reliability-PMF 三指标体系,专为 Agent 产品设计:任务完成率(TCR)≥90%、Override 率(OCR)≤20%、Re-delegation 率(RDR)≥60%。这三个指标比传统的 DAU/NPS/留存率更能反映 Agent 产品是否达到真正的可托付状态。
三个指标的定义和意义:
任务完成率(TCR,Task Completion Rate)≥90%:Agent 独立完成任务的比例——不需要人工干预、没有错误停止、输出质量符合预定标准。这个指标反映的是技术层面的可靠性,是其他两个指标的前提。如果 TCR 不达标,其他指标没有意义。
Override 率(OCR)≤20%:用户修改 Agent 输出的比例,以及修改幅度。这个指标反映的是输出质量是否达到可信赖水平。OCR 高意味着用户不信任 Agent 的输出,需要大量手动纠正。一个 OCR 超过 40% 的 Agent,用户实际上是在把它当做一个"需要持续监督的实习生",而不是可以托付任务的系统。
Re-delegation 率(RDR)≥60%:用户在经历一次(可能包含修改的)任务之后,下次再遇到同类任务仍然选择交给 Agent 的比例。这个指标反映的是信任积累——用户是否在持续的使用中建立了对 Agent 能力的信任,以至于愿意持续托付。RDR 低意味着用户虽然用了,但没有"上瘾",随时可能切换到其他方案。
03假 PMF 的四个识别信号
F16 框架总结了四种最常见的假 PMF 状态:
新奇驱动型留存:用户因为新鲜感留存,但 RDR 持续下降——六个月的留存掩盖了用户"试过了就不再托付"的真实状态。
辅助工具型使用:高 DAU,但 TCR 和 OCR 数据显示用户把 Agent 当成辅助工具而不是结果交付者。这个模式在 AI 写作工具里极为常见。
低风险任务托付型:用户只把无关紧要的任务交给 Agent,重要任务仍然自己做。三指标看起来不错,但任务的实际业务价值极低。
惯性使用型:用户已经把 Agent 嵌入工作流,不用会觉得"麻烦",但他们其实并不信任输出质量,只是切换成本太高。这个状态看起来像真 PMF,但一旦出现更好的替代品,流失会很快。
04PMF 路径设计
当三指标低于目标时,F16 框架提供了基于指标组合的诊断路径:TCR 低 → 优先解决技术可靠性(F15 上下文优化、F17 VERITAS 评估);OCR 高但 TCR 可以 → 输出质量方向问题(提示词优化、JTBO 结果重新定义);RDR 低但 TCR 和 OCR 都达标 → 信任建立机制问题(可能需要 F18 CATER 的可逆性设计来降低托付门槛)。
05在体系中的位置
F16 是模块三"产品重写"的质量诊断框架,承接 F13-F15 的产品定位、任务定义和上下文设计,提供验证这些设计是否真正达到了"可托付"状态的评估体系。它是从"建产品"到"验产品"的关键节点。
上承 F14(JTBO,结果定义决定了 PMF 的评估标准)和 F15(上下文设计,质量是否达标依赖上下文是否到位)→ 本框架(Reliability-PMF,三指标可托付性评估)→ 下启 F17(VERITAS 七维评估,对可靠性维度的更深入诊断)→ F18(CATER 治理信任评估,为高风险场景提供额外的治理维度)。
😊 情感依恋程度
DAU / MAU / NPS / 留存率 — 制造"假 PMF"的风险:用户喜欢但只用在无足轻重的事情上。
✓ 任务完成率
成功完成到用户满意的任务比例——定义来自 JTBO 结果层。能力信任的基础指标。
👤 用户推翻率
用户推翻 AI 判断的频率。高 = 不信任信号。传统指标完全缺失——托付意愿最强的预测因子。
🔁 再委托率
失败后是否再次委托而非自己处理。区分"偶然失败"与"系统性问题"——托付关系韧性的指标。
01"假 PMF"——智能体产品特有的增长陷阱
智能体产品团队经常会遇到一种令人困惑的处境:产品数据看起来很好——DAU 在增长,留存率达标,NPS 评分不错,用户调研反馈积极,很多人表示"很喜欢这个产品"。
但当你深入看用户的实际使用行为时,会发现一个令人不安的模式:用户用这个智能体处理的,几乎全是无足轻重的事情。写一个无关紧要的草稿,查询一个不重要的信息,生成一个无需准确的创意。真正重要的工作——决策、客户沟通、财务分析、战略规划——用户始终自己做,从来不交给这个智能体。
这是"假 PMF",是智能体产品特有的一种增长陷阱。它的危险在于:在产品真正有价值的使用场景里,它根本没有被使用——但常规指标不会告诉你这件事。
02传统 PMF 指标的系统性失效
本框架创新:针对智能体产品提出"托付型产品市场匹配"概念,将 PMF 的判断维度从"情感依恋"升级为"信任委托";提出三个托付型指标作为真 PMF 的量化标准。
产品市场匹配(PMF)是产品领域最重要的概念之一。Sean Ellis 在 2007 年将其量化为一个著名的测试:如果产品消失了,有多少用户会"非常失望"?超过 40%,说明达到了 PMF。这个标准后来被各种形式的留存率、NPS 和 DAU/MAU 比率所细化。
这套指标体系在传统软件产品里相当有效,因为它们能可靠地捕捉"用户在多大程度上依赖这个产品"。但在智能体产品里,这套指标体系有一个根本性的盲点:它测量的是情感依恋程度,而不是信任委托程度。
一个用户可以非常喜欢一个智能体——觉得它聪明、有趣、有用——但同时在心理上对它保持着根深蒂固的不信任,不愿意把真正重要的任务交给它。这两种状态可以完全共存,而传统 PMF 指标无法区分它们。
对于传统软件工具,这个区分不重要——你喜欢一个工具,意味着你会频繁使用它。对于智能体产品,这个区分至关重要——一个智能体只有在用户愿意把重要的事情托付给它的时候,才真正实现了它的价值定位。
03"托付"作为核心设计目标
思考智能体产品的真正价值,需要回到一个根本问题:用户雇佣这个智能体的最高期待是什么?
不是"给我提供信息",而是"帮我完成一件事"。不是"让我感觉有帮助",而是"让我可以放心地不管它"。"托付"(Delegation)是智能体产品的价值天花板——用户把一件对他们重要的事情交给智能体,然后去做别的事,相信它会被正确处理。
托付关系的建立,需要两种性质不同的信任:
- 能力信任(相信它能把事情做好)
- 可靠性信任(相信它在各种情况下都表现稳定、不会犯严重错误、出问题时能被发现和处理)
传统 PMF 主要捕捉的是能力信任的信号,而阻止用户真正托付的,往往是可靠性信任的缺失。一个用户可以认为一个智能体很聪明,但同时担心它会在某个关键时刻犯一个非常蠢的错误。在重要任务上,这种担心会战胜能力信任,用户选择自己来做。
04三个托付型指标
判断一个智能体产品是否达到了真正的 PMF,D-PMF 框架提出三个核心指标,它们必须同时健康,才算真正实现了托付。
任务完成率(Task Completion Rate)
智能体在接受任务后,成功完成到用户满意程度的比例。这是能力信任的基础指标。值得注意的是,"任务完成"的定义必须来自 JTBO 框架的结果层,而不是任务层——不是"执行了所有步骤",而是"结果真正达成"。
Override 率(User Override Rate)
用户在智能体给出建议或执行动作后,选择推翻或修改它的频率。这是可靠性信任最直接的量化信号。高 Override 率意味着用户频繁不信任智能体的判断,即使他们还在使用产品。Override 率是传统指标里完全缺席的一个维度,但它往往是托付意愿最强的预测因子。
再委托率(Re-delegation Rate)
用户在经历了一次结果不达预期的任务之后,是否会把类似的任务再次委托给智能体,而不是选择自己处理。高再委托率意味着用户认为失败是偶然的、可修复的;低再委托率意味着每一次失败都在侵蚀托付关系。
三个指标需要同时被追踪和分析。一个任务完成率高、Override 率低、再委托率高的智能体,才是真正建立了托付关系的产品。
05托付关系是真正的护城河
D-PMF 揭示的,是智能体产品的核心竞争力来自哪里。
在传统软件产品的竞争里,核心竞争力来自功能优势——更多的功能、更好的体验、更低的价格。在智能体产品的竞争里,能力是基础,但托付关系才是真正的护城河。
一个用户愿意把重要的事情托付给某个智能体,这个关系一旦建立,转移成本极高。不是因为没有更强的竞争对手,而是因为托付关系的建立需要时间——用户需要观察、验证、积累信任,这个过程不能被简单复制。
一个已经被深度托付的智能体,拥有的是一种基于时间和信任积累的护城河,这比任何技术优势都更难被复制。反过来,一个没有建立托付关系的智能体,即使技术上更强、体验上更好,也只是在和所有竞争对手争夺"被喜欢"的用户,而不是建立真正的用户依赖。
T1理论来源与学术引证
以下为本框架的理论基础说明,提炼自正文中的理论注释块。
本框架创新:针对智能体产品提出"托付型产品市场匹配"概念,将 PMF 的判断维度从"情感依恋"升级为"信任委托";提出三个托付型指标作为真 PMF 的量化标准。
T2框架定位与适用边界
本框架是管理实践工具,为高管和研究者提供结构化分析视角,不提供可直接验证的因果预测。其有效性依赖于:分析者对所在行业的深度认知、可获取的组织数据质量、以及将分析结论与具体决策场景相结合的能力。
智能体时代的框架有一个共同的时效性问题——AI 技术演化速度快于传统战略框架的更新周期。建议每 12–18 个月对本框架的核心假设进行一次复盘,检视其前提条件是否仍然成立。