产品的两个入口:为什么 AI 时代要同时为人类和 Agent 设计
昨天看到一个观点,觉得对做产品的人来说非常重要:
AI 时代的产品,可能得同时为人类和 Agent 设计两个入口。
不是二选一,不是 UI 死了 Skills 活了,是两条路同时走,各自服务各自的用户,最终汇入同一个能力内核。
LibTV 是我看到的第一个真正这样做的产品。
两个入口,一套能力
LibTV 是 Liblib 做的 AI 视频创作工具。它有两个完全不同的入口:
给人类的是一个无限画布。节点式界面,支持连线和参数调整,覆盖剧本、图片、视频、音频全链路。专业到什么程度?有真实的摄像机 UI(光圈、焦距),有多角度 3D 预览,有一键改光(轮廓光都能生成),有网格切分,有脚本到分镜的自动转换。看着复杂,但对专业创作者来说,这些复杂度就是武器。
给 Agent 的是一个 Skills。安装一句话搞定,支持 Claude Code、Codex、OpenClaw。用户只需要说”帮我生成一个 10 秒的芭蕾舞者视频”,Agent 调用 Skills,后端处理分镜、选模型、调参数、生成视频,结果自动返回。
同一个产品,同一套底层能力,两个完全不同的入口。
接口开放,大脑保护
LibTV 的 Skills 设计有一个很聪明的地方:用户侧的 Skills 只负责触发和通信,真正的能力全部跑在后端 Agent 上。
这意味着:
- 对外发布的是接口,不是大脑
- 核心的 Prompt、模型调用策略、分镜生成逻辑,外面看不到
- 可以不断迭代后端,用户无感知升级
为什么要这样?因为现在很多 Skills 是完全开源的,核心经验和 Know-how 全部裸奔。没有壁垒就没有保护,没有保护就没有商业化空间,没有商业化生态就转不起来。
Agent 生态需要开放,但开放不等于把核心竞争力全部送出去。
Agent 出初稿,人类做精修
还有一个设计细节很妙:Agent 生成的每个任务,会自动成为画布上的一个项目,节点都串好了。
这意味着工作流是这样的:
- 普通用户对 Agent 说一句话
- Agent 调用 LibTV 生成 70 分的初稿
- 如果满意,直接用
- 如果要精修,打开画布,所有素材和节点都在,专业调整
Agent 负责从 0 到 70,人类负责从 70 到 100。两个入口不是割裂的,是打通的。
对做产品的人意味着什么
这个案例给了几个很实际的启示:
第一,从一开始就设计 Agent 友好的接口。不要等产品做完再加 Agent 入口,那时候底层架构可能已经不支持了。
第二,底层能力要原子化。生图、改图、生视频、改视频、生音频——每个能力都是独立的原子,UI 和 Skills 只是不同的调用方式。
第三,专业用户和普通用户不再是一个非此即彼的选择。专业用户用 UI,复杂度是他们的武器。普通用户用 Agent,一句话搞定。同一个产品同时服务两类人。
第四,Skills 是接口不是大脑。开放触发和通信,保护核心逻辑。这是 Agent 生态中可持续商业化的关键。
未来的产品形态
我越来越觉得,这可能就是 Agent 时代产品设计的标准形态:
┌─────────────────────────────────┐
│ 底层原子化能力 │
│ (生图/改图/生视频/音频/脚本...) │
└──────────┬──────────┬───────────┘
│ │
┌──────┴───┐ ┌────┴─────┐
│ UI 入口 │ │ Agent 入口│
│ (画布/IDE)│ │ (Skills) │
└──────────┘ └──────────┘
│ │
专业用户 普通用户
精细控制 一句话搞定
两个入口背后,是底层能力的原子化重组。人类与 Agent 共生,各取所需。
对于正在做桌面软件的开发者来说,这个思路值得从第一天就纳入架构设计。
评论