产品的两个入口：为什么 AI 时代要同时为人类和 Agent 设计

昨天看到一个观点，觉得对做产品的人来说非常重要：

AI 时代的产品，可能得同时为人类和 Agent 设计两个入口。

不是二选一，不是 UI 死了 Skills 活了，是两条路同时走，各自服务各自的用户，最终汇入同一个能力内核。

LibTV 是我看到的第一个真正这样做的产品。

两个入口，一套能力

LibTV 是 Liblib 做的 AI 视频创作工具。它有两个完全不同的入口：

给人类的是一个无限画布。节点式界面，支持连线和参数调整，覆盖剧本、图片、视频、音频全链路。专业到什么程度？有真实的摄像机 UI（光圈、焦距），有多角度 3D 预览，有一键改光（轮廓光都能生成），有网格切分，有脚本到分镜的自动转换。看着复杂，但对专业创作者来说，这些复杂度就是武器。

给 Agent 的是一个 Skills。安装一句话搞定，支持 Claude Code、Codex、OpenClaw。用户只需要说”帮我生成一个 10 秒的芭蕾舞者视频”，Agent 调用 Skills，后端处理分镜、选模型、调参数、生成视频，结果自动返回。

同一个产品，同一套底层能力，两个完全不同的入口。

接口开放，大脑保护

LibTV 的 Skills 设计有一个很聪明的地方：用户侧的 Skills 只负责触发和通信，真正的能力全部跑在后端 Agent 上。

这意味着：

对外发布的是接口，不是大脑
核心的 Prompt、模型调用策略、分镜生成逻辑，外面看不到
可以不断迭代后端，用户无感知升级

为什么要这样？因为现在很多 Skills 是完全开源的，核心经验和 Know-how 全部裸奔。没有壁垒就没有保护，没有保护就没有商业化空间，没有商业化生态就转不起来。

Agent 生态需要开放，但开放不等于把核心竞争力全部送出去。

Agent 出初稿，人类做精修

还有一个设计细节很妙：Agent 生成的每个任务，会自动成为画布上的一个项目，节点都串好了。

这意味着工作流是这样的：

普通用户对 Agent 说一句话
Agent 调用 LibTV 生成 70 分的初稿
如果满意，直接用
如果要精修，打开画布，所有素材和节点都在，专业调整

Agent 负责从 0 到 70，人类负责从 70 到 100。两个入口不是割裂的，是打通的。

对做产品的人意味着什么

这个案例给了几个很实际的启示：

第一，从一开始就设计 Agent 友好的接口。不要等产品做完再加 Agent 入口，那时候底层架构可能已经不支持了。

第二，底层能力要原子化。生图、改图、生视频、改视频、生音频——每个能力都是独立的原子，UI 和 Skills 只是不同的调用方式。

第三，专业用户和普通用户不再是一个非此即彼的选择。专业用户用 UI，复杂度是他们的武器。普通用户用 Agent，一句话搞定。同一个产品同时服务两类人。

第四，Skills 是接口不是大脑。开放触发和通信，保护核心逻辑。这是 Agent 生态中可持续商业化的关键。

未来的产品形态

我越来越觉得，这可能就是 Agent 时代产品设计的标准形态：

┌─────────────────────────────────┐
│         底层原子化能力            │
│  (生图/改图/生视频/音频/脚本...)  │
└──────────┬──────────┬───────────┘
           │          │
    ┌──────┴───┐ ┌────┴─────┐
    │  UI 入口  │ │ Agent 入口│
    │ (画布/IDE)│ │ (Skills) │
    └──────────┘ └──────────┘
         │            │
    专业用户       普通用户
    精细控制       一句话搞定

两个入口背后，是底层能力的原子化重组。人类与 Agent 共生，各取所需。

对于正在做桌面软件的开发者来说，这个思路值得从第一天就纳入架构设计。

参考

原文推文
作者：数字生命卡兹克 (@Khazix0918)
产品：LibTV（Liblib）