AI 让员工变快了,为什么公司没变强?
AI 让员工变快了,为什么公司没变强?
所有人都在用 ChatGPT,为什么公司业绩没有起飞?
这不是个例。DX 跟踪了 400 家公司 16 个月,发现 AI 工具使用量涨了 65%,代码交付量只涨了不到 10%。美国国家经济研究局调查 6000 名企业高管,超过 80% 说 AI 对生产力没有可测量的影响。
AI 确实让每个人都变快了,但公司没有变强。生产力去了哪里?
AI 让员工变快了,为什么公司没变强?
所有人都在用 ChatGPT,为什么公司业绩没有起飞?
这不是个例。DX 跟踪了 400 家公司 16 个月,发现 AI 工具使用量涨了 65%,代码交付量只涨了不到 10%。美国国家经济研究局调查 6000 名企业高管,超过 80% 说 AI 对生产力没有可测量的影响。
AI 确实让每个人都变快了,但公司没有变强。生产力去了哪里?
一个 130 年前的故事

1890 年代,工厂换上电动机,所有人都以为生产力会爆发。结果之后 30 年,产出几乎没变。
直到 1920 年代,有人拆掉旧厂房,按电力的逻辑重新设计生产线,红利才释放出来。
130 年过去了,同样的错误在重演。
我们换了电机,但还没有重新设计工厂。
四个隐藏的陷阱

1. 协调崩溃
每个员工都有自己的 ChatGPT 用法、prompt 风格、输出格式。市场部用 AI 写的品牌话术和产品部用 AI 写的功能描述可能完全是两种语言。
100 个员工各自用 AI,没人在想 100 条 AI 工作流之间怎么对齐。
聪明的人朝不同方向使劲,等于原地不动。
2. 噪音倍增
AI 让「生成」变得零成本,但分辨好坏的成本更高了。
私募行业的人说,去年收到 10 个交易机会,今年 50 个,每个 BP 都经过 AI 精心打磨。噪音多了 5 倍,信号没变。
3. 生产力幻觉
AI 安全研究机构 METR 做了一个实验:让经验丰富的开发者分别在有 AI 工具和没有 AI 工具的情况下完成编程任务。
结果是,使用 AI 的开发者实际上慢了 19%,但他们自认为快了 20%。
感知和现实之间差了 39 个百分点。
更麻烦的是组织消化不了。个人产出提升 10 倍,审批、协作、质量把关还是老样子,瓶颈从「做得不够」变成了「消化不了」。
4. 判断力侵蚀
数据显示 LLM 在 58% 的情况下表现出谄媚行为。你越自信地表达观点,它越倾向于无条件赞同你。
一个长期在工作中得不到正面反馈的人,突然有了一个永远同意他的「超级智能」。
他会对自己说:人类历史上最聪明的系统都认为我是对的,是我的经理搞错了。
这种感觉令人上瘾,也对组织有毒。
根本性错误
但这四重困境还不是最根本的问题。
大多数公司在用效率的框架去思考一个关于效果的问题。
- 效率: 写报告快了、整理纪要快了(对已有任务的优化)
- 效果: 多做成几笔交易、多打开一个市场(对业务结果的改变)
即使效率真的提升了 10 倍,如果企业的业务逻辑和决策方式没有跟着变,一家公司依然不会因此多做成一笔交易。
Deloitte 调查印证了这个判断:只有 34% 的组织在用 AI 做深度转型,37% 仍停留在「换电机」阶段。
ATM vs iPhone
有一个更近的故事可以帮助理解。
ATM(1970s): 被发明的时候,所有人以为银行柜员会消失。结果从 1970 年代到 2010 年,美国银行柜员不降反升。ATM 降低了单个网点的运营成本,银行就开了更多网点,雇了更多柜员。
iPhone(2010): 手机银行让客户根本不需要去网点了。2010 到 2022 年,美国银行柜员从 33.2 万降到 16.4 万。
区别:
- ATM 在旧范式里把任务做得更快更便宜
- iPhone 创造了新范式,让那些任务不必存在
给员工装 ChatGPT 就是在银行网点里多放一台 ATM。组织需要找到自己的 iPhone 时刻。
到底该改什么?
1920 年代的工厂主到底改了什么?
1. 流程重设计
传统假设是人执行、工具辅助。AI-native 的流程翻转了这个假设。
Goldman Sachs 称 Cognition 的 Agent Devin 为「our new employee」,不是辅助工具,直接作为工程团队的成员。
当 AI 从工具变成员工,流程设计完全不同。
2. 角色重定义
管理者开始变成编排者,管的不再只是人,而是人和 AI 组成的混合团队。
新角色正在涌现:
- AI Agent Manager
- Intent Engineer
- 流程工程师
3. 决策机制
组织需要能说「不」的 AI。
方向包括 AI 投委会成员、AI 审计、AI 合规官。组织级 AI 的目标不是让决策更快,是让决策更好。
4. 信息流重构
Unprompted AI: 系统在你问之前就把问题发现了。
场景:系统持续监控投资组合数据流,发现某家被投公司的运营资本连续三个月恶化,在基金任何人打开相关 PDF 文件之前就发出预警。
办公效率 ≠ 经营场景
过去两年,市场上涌现了大量企业 AI Agent,大多数落在办公场景:写邮件、总结会议、整理文档、自动化审批流程。
这些确实有用,也确实在普及。但它们还是在让人更快地做同样的事,还是 ATM 的逻辑。
企业每天真正在做的事情,其实是另外一些:理解市场,定义产品,研究用户,制定策略,推动增长。
这些才是真正决定一家公司变强还是变弱的经营场景。
上下文是壁垒

当所有人都能用同样的模型时,模型就不再是壁垒。
GPT、Claude、Gemini、DeepSeek、Qwen,你能用,你的竞争对手也能用。
那什么才是壁垒?Context。上下文。
同一个模型,给它公开信息,出来一个通用答案。给它你企业独有的上下文,出来一个只有你能得到的答案。
模型产生智能,上下文产生价值。
斯坦福大学教授吴恩达发布了开源项目 ContextHub,解决的问题几乎一模一样:即使是最强的模型,没有正确的上下文也会产出不可靠的结果。
一个中国案例
特赞做了很多年 DAM(数字资产管理),管理的是企业最丰富也最难被机器理解的非结构化数据:图片、文案、视频、3D 模型。
AI 时代释放了一种以前不存在的能力:对非结构化数据的理解。
非结构化数据从「被存储的文件」变成「被理解的上下文」。
特赞在 DAM 的基础上做了 Context System,又在 Context System 的基础上做了 GEA(Generative Enterprise Agent)。
数据: 同样的企业内容资产,过去每千个素材被人调用 12 次,部署 Context System 后被 Agent 调用超过 23,000 次。
利用率差了近 2000 倍。
这 2000 倍不是因为 Agent 在做重复的事,而是因为 Agent 在做人做不到的事:7x24 小时不间断地从你的上下文中发现关联、提取洞察、驱动决策。
个体觉醒仍然是底座
Asana 的数据说,10% 的「超级生产者」每周通过 AI 节省 20 小时以上。
问题是,这 10% 的超级生产者并没有让他们所在的公司成为超级公司。
个体觉醒解决不了协调问题。一个人用得再好,团队里十个人用法各不相同,产出还是碎片化的。
「人 AI 合一」是底座,「组织重设计」是上层建筑。
没有前者后者是空谈,只有前者后者不会自动发生。
今天,你的组织是为 AI 设计的吗?
真正的问题不是「你的员工在用 AI 吗」。
而是:
- 流程有没有围绕 AI 的能力重新设计过?
- 角色分工有没有把 AI agent 当作编制内的成员?
- 决策机制里有没有 AI 的制衡?
- 企业上下文是在等着流失,还是已经变成了 Agent 可以调用的系统资产?
过去十年,企业买的是软件。过去三年,企业试的是模型。从今天开始,企业需要的是一个能理解你的上下文、拥有判断力、并且持续进化的智能系统。
是时候拆掉旧工厂了。
参考资料:
- a16z: Institutional AI vs Individual AI
- DX: AI productivity gains are 10 percent not 10x
- METR: Early 2025 AI experienced OS dev study
- Asana: AI super productivity paradox
- Deloitte: State of AI in enterprise
原文来源: Founder Park
评论