---
name: agentops-maturity-assessment
version: 2.0
framework: 智能体管理学 · 模块五 · 框架F27
type: 评估型
description: >
  智能体运营成熟度评估——判断组织AgentOps处于哪个阶段（M1-M5），
  识别维度短板，规划跃迁路径。触发词：成熟度评估、AgentOps阶段、运营能力诊断、
  运维成熟度、可观测性评估
governance_nerves: [意图管理, 边界与升级]
upstream_frameworks: [F26_SLO体系, F28_CPTA成本核算]
downstream_frameworks: [F29_Agent绩效考核, F32_风险治理框架]
---

# F27 智能体运营成熟度模型（AgentOps Maturity Model）

## SKILL定位

**核心命题**：AgentOps不是一个工具，是一套运营能力的进化阶梯。每个级别有明确的能力特征和跃迁门槛，不可跳级。

**五级成熟度定义**：

| 级别 | 名称 | 核心特征 | 标志性能力 |
|------|------|----------|-----------|
| M1 | 实验期 | 手动无观测 | 能跑就行，出了事人工看日志 |
| M2 | 监控期 | 基础日志+人工检查 | 有Dashboard，有人盯着看 |
| M3 | 量化期 | 自动化+SLI/SLO+CPTA可追踪 | 指标驱动决策，成本可归因 |
| M4 | 优化期 | PRT质量门禁+Error Budget | 自动化质量门禁，预算制管理 |
| M5 | 自治期 | 自监控自优化 | Agent自己发现问题并修复 |

**关键认知**：M1→M2→M3是三个完全不同的思维跃迁。M1到M2是从"看不见"到"看得见"，M2到M3是从"看得见"到"量得出"，M3到M4是从"量得出"到"管得住"。

---

## 信息采集（INPUT模板）

```yaml
assessment_input:
  # 一、组织基础信息
  org:
    name: ""                    # 组织名称
    agent_count: 0              # 在运行的Agent数量
    agent_types: []             # Agent类型列表（客服/分析/创作/...）
    deployment_duration: ""     # 部署时长（月）
    team_size: 0                # 运维团队人数

  # 二、五维现状评估（每维1-5分）
  dimensions:
    observability:              # 可观测性
      has_logging: false        # 是否有日志系统
      has_tracing: false        # 是否有链路追踪
      has_metrics: false        # 是否有指标采集
      has_alerting: false       # 是否有告警机制
      real_time_visibility: false # 是否实时可见
      score: 0                  # 自评1-5

    metrics:                    # 指标体系
      has_sli_defined: false    # 是否定义了SLI
      has_slo_target: false     # 是否设定了SLO
      has_cpta_tracking: false  # 是否追踪CPTA
      has_business_metrics: false # 是否有业务指标
      score: 0

    automation:                 # 自动化水平
      manual_review_ratio: 0    # 人工审核比例（%）
      auto_retry: false         # 是否自动重试
      auto_rollback: false      # 是否自动回滚
      cicd_pipeline: false      # 是否有CI/CD
      score: 0

    cost_optimization:          # 成本优化
      cost_tracking: false      # 是否追踪成本
      cost_attribution: false   # 是否成本归因到Agent
      budget_control: false     # 是否有预算控制
      optimization_actions: false # 是否有优化行动
      score: 0

    compliance:                 # 合规治理
      has_risk_register: false  # 是否有风险登记
      has_hitl_policy: false    # 是否有人类介入策略
      has_data_policy: false    # 是否有数据策略
      audit_trail: false        # 是否有审计追踪
      score: 0

  # 三、跃迁障碍
  blockers:
    biggest_gap: ""             # 最大短板
    resource_constraint: ""     # 资源约束
    organizational_resistance: "" # 组织阻力
```

---

## 执行分析引擎（S1-S4四步法）

### S1：定位当前级别（Diagnose）

**任务**：基于五维评估，确定组织当前所处的成熟度级别。

**评估矩阵**：

```
级别判定规则：
- M1：五维均≤2，无系统化运营
- M2：可观测性≥3，其他维度≤2，能看见但不能量化
- M3：可观测性≥3 + 指标体系≥3 + 成本追踪≥3，三者同时满足
- M4：五维均≥3，且自动化≥4 或 合规≥4
- M5：五维均≥4，且自动化=5
```

**输出模板**：
```yaml
current_level:
  overall: M2                  # 综合级别
  dimension_scores:
    observability: 3
    metrics: 2
    automation: 2
    cost_optimization: 1
    compliance: 2
  weakest_dimension: "成本优化" # 最弱维度
  level_rationale: "具备基础监控但缺乏量化指标体系，成本几乎不可见"
```

### S2：识别跃迁差距（Gap Analysis）

**任务**：从当前级别到下一级别，识别关键差距。

**跃迁门槛定义**：

| 跃迁 | 必须达成的能力 |
|------|----------------|
| M1→M2 | 部署日志系统 + 至少1人专职看管 + 基础Dashboard |
| M2→M3 | 定义≥3个SLI + 设定SLO目标 + CPTA可追踪 + 自动化告警 |
| M3→M4 | PRT质量门禁上线 + Error Budget机制 + 成本预算制 |
| M4→M5 | Agent自监控 + 自动修复 + 人类仅处理异常 |

**输出模板**：
```yaml
gap_analysis:
  current: M2
  target: M3
  gaps:
    - dimension: "指标体系"
      current_state: "仅有基础Dashboard"
      target_state: "定义≥3个SLI并设定SLO"
      effort: "中"
      timeline: "4-6周"
    - dimension: "成本优化"
      current_state: "无法追踪成本"
      target_state: "CPTA可追踪"
      effort: "高"
      timeline: "6-8周"
  estimated_timeline: "8-12周"
```

### S3：规划跃迁路径（Roadmap）

**任务**：制定从当前级别到目标级别的行动计划。

**路径规划原则**：
1. **先补短板**：最弱维度优先投入
2. **不可跳级**：每个级别必须稳固运行≥1个月才能跃迁
3. **并行推进**：非依赖关系的维度可并行提升
4. **里程碑验收**：每阶段有可验证的验收标准

**输出模板**：
```yaml
roadmap:
  phase_1:
    name: "补齐可观测性"
    duration: "2-3周"
    actions:
      - "部署统一日志系统"
      - "配置基础告警规则"
      - "建立日常巡检机制"
    milestone: "所有Agent日志可查询，告警10分钟内触达"
  phase_2:
    name: "建立指标体系"
    duration: "4-6周"
    actions:
      - "定义3-5个核心SLI"
      - "设定SLO目标值"
      - "接入CPTA追踪"
    milestone: "SLI/SLO Dashboard上线，周报自动生成"
  estimated_total: "8-12周"
```

### S4：验证与治理（Validate & Govern）

**任务**：建立跃迁后的验证机制和治理框架。

**验收检查清单**：
- [ ] 所有目标维度的评估得分达到下一级别要求
- [ ] 稳定运行≥1个月无重大降级
- [ ] 团队能力匹配新级别的运营要求
- [ ] 治理流程（告警→响应→复盘）已建立
- [ ] 文档完整，新人可接手

**治理神经检查**：
- **意图管理**：成熟度提升的目标是否与业务价值对齐？
- **边界与升级**：达到新级别后，人类介入的边界是否重新定义？

---

## 输出格式

```yaml
agentops_maturity_report:
  org: "XX公司"
  assessment_date: "2026-04-27"
  current_level: M2
  dimension_scores:
    observability: 3
    metrics: 2
    automation: 2
    cost_optimization: 1
    compliance: 2
  overall_score: 2.0
  target_level: M3
  gaps:
    - "指标体系：缺乏SLI定义和SLO目标"
    - "成本优化：CPTA不可追踪"
  roadmap_summary: "预计8-12周达到M3，分两阶段推进"
  key_risks:
    - "成本优化需要基础设施支持，可能延期"
    - "团队缺乏SRE经验，需要外部支持"
  next_action: "启动Phase 1：补齐可观测性"
```

---

## 质量自检

- [ ] 五维评估是否每项都有具体证据支撑？
- [ ] 级别判定是否符合矩阵规则，而非主观臆断？
- [ ] 跃迁路径是否遵循"不可跳级"原则？
- [ ] 路线图是否包含可验证的里程碑？
- [ ] 是否考虑了团队能力与成熟度的匹配？

---

## 典型误区

1. **"我们有监控就是M2"**：有工具≠有能力。M2要求的是有人持续关注和响应，不是装了Prometheus就算数
2. **"直接跳到M4更高效"**：M3是地基——没有量化能力，M4的Error Budget和质量门禁无从谈起
3. **"成熟度评估是一次性的"**：成熟度会退化，需要季度复评
4. **"技术成熟度=组织成熟度"**：工具到位但流程没跟上，是典型的"伪高级别"

---

## 框架衔接

| 方向 | 框架 | 衔接关系 |
|------|------|----------|
| ↑ 上游 | F26 SLO体系 | M3跃迁需要SLI/SLO体系支撑 |
| ↑ 上游 | F28 CPTA成本核算 | M3跃迁需要CPTA追踪能力 |
| ↓ 下游 | F29 Agent绩效考核 | 成熟度级别决定了绩效评估的精细度 |
| → 并行 | F32 风险治理框架 | M4跃迁需要风险治理能力支撑 |