01会用工具不等于有能力
一家科技公司的CHRO在做年度人才规划时,发现了一个困扰:AI培训已经进行了一年,全员参与率超过90%,大多数员工都能说出几个他们在使用的AI工具。但是,当她问到"哪些员工真正改变了工作方式"时,没有人能给出清晰的答案。
她尝试了几种评估方法:测试员工知道多少AI工具——没有区分度;测试员工能否完成某个具体的AI任务——通过率很高,但与实际工作效率无关;请员工自我评估AI能力——几乎所有人都认为自己"已经很好地掌握了AI工具"。
真正的问题出现了:公司的AI工具使用率很高,但生产力提升数据不如预期。培训投入了,工具买了,但那个"从根本上改变工作方式"的转变,没有发生在大多数员工身上。
02四层能力的本质差异
ACMM四个层级的区别,不在于工具的多少或者技术知识的深浅,而在于工作方式的根本差异。
L1:工具使用者。把AI当搜索引擎,交互模式以单次问答为主。"帮我写一段邮件"、"这段代码什么意思"——问一个问题,得到一个答案。AI是辅助工具,人仍然是核心执行主体。这个层级的标志性特征是:AI离开了,工作还是那样,只是少了一个帮手。
L2:协作设计者。开始有意识地设计与AI的协作方式:拆解任务、分配角色、迭代优化提示词。这是一个重要进步,但本质上,执行者还是自己——AI帮忙做一些子任务,人汇总完成。L2的标志性特征是:在描述自己的工作时,会说"我用AI帮我做X"。
L3:系统驾驭者。能够设计端到端的Agent工作流,让Agent系统替自己完成工作,自己只需要做判断和审核。产出可以规模化——同样的工作流可以处理更多任务,而不需要增加自己的执行时间。L3的标志性特征是:在描述自己的工作时,会说"我设计了一个系统,它在帮我做X"。
L4:系统构建者。从零构建供他人使用的AI能力基础设施,包含Eval体系,能够自我评估和迭代。L4的稀缺性远高于L3——一个L4人才可以赋能整个团队达到L3,但10个L3人才无法自动产生一个L4。L4是当前企业AI能力最稀缺、最宝贵的人才类型。
03L2到L3:最关键也最困难的跃迁
理解ACMM框架的核心,需要深刻理解L2到L3之间的跃迁为什么如此关键。
L2到L3不是量的积累,而是质的转变:从"和AI一起做事"到"让AI替自己做事",从"执行者"到"设计者和审核者"。这个转变要求一种根本不同的工作心态——放手,相信系统,把判断和设计视为自己的核心价值,而不是执行本身。
这个转变为什么困难?因为它触及了许多人对"工作"的深层认知:觉得自己必须亲自做才能保证质量("AI做的我不放心");不知道如何把工作拆解成Agent可执行的流程("不知道从哪里开始");不清楚哪些该交给AI、哪些必须自己做("没有明确的判断标准")。
L2到L3的生产力差距可达5-10倍。停留在L2是当前最普遍也最危险的能力陷阱——不是因为L2没有价值,而是因为市场对L3能力的需求正在快速增长,而供给严重不足。一个停留在L2的人,在未来两三年内面临的竞争压力,会远大于一个已经迈入L3的人。
04评估的对象是工作方式,不是知识储备
ACMM评估最常见的误用,是把它变成了知识测试或工具清单评估。一个人可以能说出二十个AI工具的名字,但仍然处于L1;一个人可以只用三个工具,但已经在L3工作。工具数量与ACMM等级无关,知识储备量与ACMM等级无关,使用AI的年限也与ACMM等级无关。
正确的评估问题是具体的行为问题:"你设计过端到端的Agent工作流吗?""你能否设计一个72小时无需人工干预的自动化流程?""你的工作流在过去一个月处理了多少任务?你花了多少时间在设计和审核上,而不是执行上?"
ACMM等级的评估,需要有具体的行为证据支撑,而不是主观感受。"我感觉自己处于L3"不是证据;"我设计了一个每天自动处理200份合同的工作流,我只需要审核标记为异常的5%"才是证据。
05跃迁路径的设计
识别了当前等级和跃迁障碍之后,ACMM框架的最终输出是一份可执行的跃迁路径设计。这个设计的核心是工作方式重构计划,而不是培训课程清单。
L1到L2的跃迁,重点是培养协作意识:开始有意识地拆解任务,为AI分配角色,追踪哪种提示词模式效果更好。这个阶段需要的不是新的技术知识,而是一种新的工作习惯。
L2到L3的跃迁,需要真实项目实践,而不是培训。找到工作中一个重复性强、有明确输出标准的任务,尝试设计一个能够自主完成它的Agent工作流。第一个工作流会很粗糙,但完成这个过程,比任何培训都更有价值。
L3到L4的跃迁,需要系统构建能力:从零设计一个包含Eval体系的Agent系统,供他人使用。这要求工程化思维,能够将个人的工作方式转化为可复用的基础设施。
06那个CHRO的解决方案
那家科技公司的CHRO,在引入ACMM框架之后,重新设计了AI能力评估体系。这一次,评估不是测试"你知道多少AI工具",而是要求员工提交一份工作方式变化的证明:展示你在过去一个月中,如何改变了某个工作流程,节省了多少时间,质量如何变化。
评估结果揭示了一个更真实的能力分布:全员中约65%处于L1,25%处于L2,9%处于L3,只有1%处于L4。L1和L2的大量存在,解释了为什么工具使用率高但生产力提升有限——人们在用工具,但没有改变工作方式。
基于这份诊断,公司制定了差异化的培训和激励策略:将L3人才识别出来并给予更多资源;设计专门的L2→L3跃迁项目,让员工在真实工作项目中完成工作方式的重构;重新设计绩效考核,开始评估"你让系统做了多少工作",而不只是"你做了多少工作"。一年后,L3比例从9%提升到了21%。
01"AI 工具用户"和"AI 系统构建者"之间的鸿沟
企业在推进 AI 能力建设时,通常会发现两类人之间存在一道奇怪的鸿沟:一类是 AI 工具的积极用户,他们掌握了大量工具的使用技巧,能够熟练地用 AI 完成各种日常任务;另一类是 AI 系统的构建者,他们能够设计和实现复杂的智能体工作流。
让人惊讶的是,这两类人之间几乎没有重叠,从第一类成长到第二类的路径也不清晰。企业发现,培训了大量的"AI 工具用户"之后,"AI 系统构建者"仍然极度稀缺。
这个现象背后的原因,被大多数团队误解了。他们认为是熟练程度的问题——用工具够熟练了自然就会构建系统。但实际上,这是两种需要完全不同能力结构的工作,熟练程度的积累不能自动完成这个跨越。
02"调用思维"和"编排思维"的认知差异
本框架创新:将德雷福斯模型应用于 AI 协作能力领域,重新定义四级成熟度,以"调用思维→编排思维"的认知转变替代"初学者→专家"的单维度进阶。
德雷福斯兄弟在 1980 年提出的技能习得模型,把技能学习从初学者到专家分为五个阶段。这个模型的核心洞察是:技能的高级阶段不只是"做得更多更快",而是认知方式本身发生了质变。
智能体协作能力的成熟度,也有类似的质变节点,但它的质变不发生在"初学者→专家"的传统技能轴上,而是发生在"工具使用→系统驾驭"的维度转换上。
工具使用的认知模式
了解一个工具能做什么,学习使用这个工具的方法,在适当的场景下调用这个工具。这是一种"调用"思维。
系统驾驭的认知模式
理解一个系统的能力边界在哪里,在业务需求和系统能力之间进行翻译,设计多个组件如何协作来实现一个更大的目标。这是一种"编排"思维。
从调用思维到编排思维,不是通过练习使用更多工具来实现的,而是通过一种认知模式的根本性转变——从"我要做什么,可以用什么工具"变成"我要达成什么目标,需要设计什么样的人机协作结构"。
03四级能力成熟度
IACMM 把个人的 AI 协作能力,分为四个成熟度级别。
L1 · 工具使用者(Tool User)
能够使用单个 AI 工具完成明确的具体任务。理解工具的主要功能,能够按照工具的设计方式使用它。核心特征:任务导向——给一个具体的任务,知道用什么工具,知道怎么用。绝大多数参加过 AI 培训的从业者,处于 L1 到 L2 之间。
L2 · 协作设计者(Collaboration Designer)
能够设计 AI 辅助的工作流程,理解在哪些环节引入 AI 可以提升效率,知道如何把工作分解成"AI 适合做的部分"和"人类更适合做的部分"。核心特征:流程导向。
L3 · 系统驾驭者(System Orchestrator)★
能够构建和管理多智能体协作系统,把复杂的业务需求转化为可执行的智能体系统规格,评估和优化系统的整体表现。核心特征:系统导向——从单个工具或工作流,跃升到了"系统"视角。这是当前市场最稀缺的人才级别,也是绝大多数 AI 战略落地的瓶颈所在。
L4 · 能力创造者(Capability Creator)
能够开发新的 AI 能力,将其系统化为可以被组织复用的 Skill 文件,推动组织整体 AI 能力水平的提升。核心特征:生态导向——把个人的探索成果转化为组织的资产。
04L2 到 L3:那道最难跨越的门槛
在四个级别里,L2→L3 的跨越是最难的,也是最关键的。
L1→L2 的跨越,主要是思维方式的扩展:从"这个任务用什么工具"扩展到"这个流程怎么设计"。这个扩展是自然的,可以通过项目实践和方法论培训来推动。
L2→L3 的跨越,是一种更深层的认知结构转变:从"设计流程"到"构建系统"。系统和流程的根本区别在于:流程是静态的步骤序列,系统是动态的、有状态的、可以自适应的。理解"系统"需要一种新的认知工具——能够在脑子里维持一个复杂的、多组件相互作用的动态模型。
具体来说,L3 的人需要具备三种 L2 的人通常不具备的能力:
- 边界感知能力:知道智能体在什么情况下会失效,能够预见系统的失效模式
- 组合设计能力:知道如何把多个智能体组合成一个整体能力大于部件之和的系统
- 评估能力:能够量化地评估系统的表现,区分随机波动和系统性问题
这三种能力,在传统工作中都没有对应的培养路径,需要通过刻意的实践积累来形成。
05AI 时代人才供需最关键的结构性错配
IACMM 揭示的,是 AI 时代人才供需最关键的结构性错配:企业需要的是 L3,市场培训出来的是 L1/L2。
大量 AI 培训项目的设计目标是"让更多人会用 AI 工具"——这对应 L1 的能力。一些更进阶的培训覆盖了工作流设计——这对应 L2 的能力。但 L3 所需要的"系统驾驭"能力,几乎没有对应的系统性培养路径,因为它需要的不是知识传授,而是在构建和运维真实系统的过程中积累的直觉和经验。
这个错配的后果是:企业的 AI 能力瓶颈不在"会不会用工具"上,而在"有没有能设计和管理 AI 系统的人"上。
把大量培训资源投入 L1/L2 的能力建设,而 L3 的人才缺口持续扩大,是一种系统性的资源错配。
T1理论来源与学术引证
以下为本框架的理论基础说明,提炼自正文中的理论注释块。
本框架创新:将德雷福斯模型应用于 AI 协作能力领域,重新定义四级成熟度,以"调用思维→编排思维"的认知转变替代"初学者→专家"的单维度进阶。
T2框架定位与适用边界
本框架是管理实践工具,为高管和研究者提供结构化分析视角,不提供可直接验证的因果预测。其有效性依赖于:分析者对所在行业的深度认知、可获取的组织数据质量、以及将分析结论与具体决策场景相结合的能力。
智能体时代的框架有一个共同的时效性问题——AI 技术演化速度快于传统战略框架的更新周期。建议每 12–18 个月对本框架的核心假设进行一次复盘,检视其前提条件是否仍然成立。