prompt → skills → harness → OPC：我的 AI 实践与思考

0. 总体地图：从技术路线到创业操作系统

0.1 主路径

flowchart LR P["Prompt 提问与表达能力"] --> S["Skills 经验资产化能力"] S --> H["Harness 系统编排与验证能力"] H --> O["OPC / Founder OS AI-native 创业操作系统"] P --> P1["让 LLM 进入更高质量的生成空间"] S --> S1["把反复有效的经验封装成可复用能力"] H --> H1["让多个 agent 稳定完成长期复杂任务"] O --> O1["把技术能力放进 Idea → MVP → Launch → Scale"]

0.2 这场分享的核心判断

prompt → skills → harness 是我目前认为普通人学习 AI 最合理的一条技术路线。

它们构成三层能力升级：

flowchart TB A["Prompt"] --> A1["一次对话的质量"] B["Skills"] --> B1["一类任务的复用"] C["Harness"] --> C1["一个系统的稳定运行"] A1 --> D["个人 AI 能力"] B1 --> D C1 --> D D --> E["AI-native Founder OS"] E --> E1["把个人 AI 能力转化为创业流程"]

最终落点：

prompt 训练表达,skills 训练流程,harness 训练系统。 Founder OS 训练判断:什么值得做,什么时候做,做到什么程度。

0.3 四个模块的承接关系

flowchart LR A["1. Prompt 输入如何影响 LLM 输出"] --> B["2. Skills 把有效经验沉淀成模块"] B --> C["3. Harness 用工程结构稳定调度 agent"] C --> D["4. Founder OS 把 AI 能力放进创业闭环"] A2["发散 / 收敛"] --> A B2["SKILL.md / 原子化"] --> B C2["Orchestrator / Workers / Validator"] --> C D2["Idea / MVP / Launch / Scale"] --> D

1. 开场:我的实践路径

这条路径是怎么长出来的:

最开始从 prompt 入手
后来发现反复有效的 prompt 应该沉淀成 skills
再后来发现复杂任务需要 harness 来保证稳定性
最近读 Anthropic《The Founder’s Playbook》,把这条技术路线放进创业流程里重新理解

开场图

timeline title 我的 AI 实践路径 Prompt : 学会提问 : 理解输入如何影响 LLM 输出 Skills : 沉淀能力 : 把反复有效的流程写进 SKILL.md Harness : 编排系统 : 让多个 agent 接力完成复杂任务 Founder OS : 服务创业 : 把 AI 能力放进 Idea-MVP-Launch-Scale

2. 第一节:Prompt 依然是重要能力

2.1 本节主线

flowchart TB A["Prompt 的重要性"] --> B["LLM 工作原理"] B --> C["输入影响生成空间"] C --> D["两种能力"] D --> E["发散 升维 / 创造力 / 打开空间"] D --> F["收敛 约束 / 确定性 / 锁定标准"] E --> G["姜胡说小报童 认知悖论 / 核心数字资产"] F --> H["姜胡说长 prompt 知识萃取 / 证据等级 / 输出格式"] H --> I["两个工具 Prompt Master / 乔木快捷提示词"]

2.2 本节主要讲什么

Prompt 依然重要。

模型能力越强,prompt 越像一种”方向盘”:

发散时,prompt 决定 AI 往哪里想
收敛时,prompt 决定 AI 按什么标准交付
协作时,prompt 暴露人的问题定义能力、上下文组织能力和判断标准

这一节讲两部分:

LLM 的工作原理
写好 prompt 的两种思路:发散 vs 收敛

2.3 LLM 工作原理:输入在塑造生成空间

LLM 根据上下文生成后续内容。你的输入会影响它接下来生成什么、以什么层级生成、采用什么语气和结构生成。

可以从四个信号讲:

flowchart LR A["用户输入"] --> B["任务信号"] A --> C["上下文信号"] A --> D["专业度信号"] A --> E["质量标准信号"] B --> F["LLM 输出空间"] C --> F D --> F E --> F

要点:

模糊输入通常得到平均答案
高质量输入会提高输出上限
专业词、任务边界、上下文和验收标准都会改变模型输出
prompt 能力本质上是问题定义能力

参考资料:

2.4 写好 prompt 的两种思路:发散 vs 收敛

flowchart LR A["Prompt"] --> B["发散型"] A --> C["收敛型"] B --> B1["目标:打开空间"] B --> B2["方法:升维、对比、悖论、反常识"] B --> B3["适合:选题、洞察、产品方向、商业机会"] C --> C1["目标:稳定交付"] C --> C2["方法:标准、边界、输出格式、验收条件"] C --> C3["适合:分析报告、知识卡片、结构化产出"]

本节核心判断:

发散型 prompt 负责打开空间,收敛型 prompt 负责锁定质量。

2.5 发散型 prompt:升维

发散型 prompt 的重点是定义思考方向。

它不急着规定格式,也不急着控制步骤。它通过关键词、对比关系、反常识问题,把 AI 推进更高价值的思考空间。

案例 1:认知悖论

在[个人成长/赚钱致富/自媒体]领域,普遍存在的认知悖论是什么——即那些人们深信不疑,却在根本上阻碍他们成功的想法。

讲解重点:

“认知悖论”让 AI 去找矛盾结构
“深信不疑”让 AI 找共识里的盲点
“根本阻碍成功”让 AI 找高影响因子
这类 prompt 的价值在于升维

案例 2:核心数字资产

请你找到对我来说已经轻车熟路,但是对其他人难如登天的"核心数字资产",稍加更改对他们来说就特别有用的"产品"。

讲解重点:

“轻车熟路 vs 难如登天”构成价值差
这比直接问”我能做什么产品”更好
它把产品思考从”市场上有什么”转到”我的不对称优势是什么”

2.6 收敛型 prompt:约束

收敛型 prompt 的重点是定义质量标准。

它不只是”写得长”。它真正有价值的部分是:

输入边界
角色定位
北极星目标
证据等级
排除规则
输出结构
质量门槛

案例:长内容洞见提取 prompt

flowchart TB A["原始内容"] --> B["专家角色"] B --> C["北极星目标"] C --> D["候选洞见挖掘"] D --> E["质量筛选"] E --> F["证据等级 A/B/C"] F --> G["最终输出格式"]

讲解重点:

它的细节集中在质量标准、筛选门槛和交付格式
它把”好洞见”从感觉变成可检查条件
它适合结构化产出,不适合所有探索任务

2.7 Prompt 部分的两个小工具

工具 1:Prompt Master

链接:nidhinjs/prompt-master

适合把模糊需求整理成可复制 prompt
补齐任务、目标工具、输出格式、约束、输入材料、上下文、受众、成功标准、样例
可以现场演示:把”我要做一个 AI 分享”改写成更清晰的 prompt

工具 2:乔木快捷提示词 Chrome 插件

链接:乔木快捷提示词 Chrome 插件

管理常用 prompt
浏览器里搜索、复制、分类
让 prompt 从聊天记录变成可复用资产

3. 第二节:Skills,把经验沉淀成可复用能力

3.1 本节主线

flowchart TB A["学习 Agent Skills"] --> B["读 Anthropic 官方文档"] B --> C["拆高手写的 skill"] C --> D["自己造 skill"] D --> E["踩坑:大而全 skill 不灵活"] E --> F["重构:原子化 skill"] F --> G["Claude Code 让 skill 成为可执行能力包"]

3.2 本节主要讲什么

Skills 是第二层能力。

Prompt 解决一次对话。Skill 解决一类任务的复用。

本节讲三件事:

Anthropic Agent Skills 的底层机制
自己学习 skill 的路径
为什么 skill 要原子化

3.3 Agent Skills 的机制

参考资料:

要点:

Anthropic 的贡献在于:把 Agent Skills 做成了 Claude 体系里的正式机制
一个 skill 是一个目录
核心文件是 SKILL.md
可以包含 scripts、references、assets
Claude 通过 progressive disclosure 按需加载

3.4 Progressive disclosure

概念解释:progressive disclosure(渐进式披露)——分步逐步展示信息,先显核心内容,按需展开详情。

flowchart LR A["Metadata name / description"] --> B["SKILL.md 完整说明"] B --> C["References 细节资料"] B --> D["Scripts 可执行脚本"] B --> E["Assets 模板 / 示例"]

AI 先知道有哪些能力
任务相关时才读完整说明
真正需要细节时再读 references / scripts
这解决的是上下文效率问题

3.5 我的 skill 学习路径

flowchart LR A["读官方文档"] --> B["安装一个高手 skill"] B --> C["用一次看效果"] C --> D["打开 SKILL.md 看结构"] D --> E["自己造"] E --> F["真实使用中迭代"]

每一步:

读官方文档:理解结构和加载机制
学最佳实践:看别人的 description、触发条件、工作流、禁止事项、references、scripts
自己造:从真实需求出发,用一次改一次

3.6 原子化:skill 像乐高

旧结构:大而全内容 skill

flowchart LR A["获取灵感"] --> B["选题"] B --> C["画伞风格"] C --> D["手动改写"] D --> E["反向优化 skill"] E --> F["生成配图"]

问题:

想单独用生图能力时,要从大 skill 里拆
agent 读了很多无关上下文
完整工作流会带偏单点任务
功能越多,边界越模糊

新结构:多个原子 skill

flowchart LR A["analyze"] --> B["outline"] B --> C["draft"] C --> D["polish"] D --> E["ill"]

核心判断:

skill 的价值来自清晰边界。边界越清楚,越容易单独使用,也越容易组合。

3.7 Claude Code 和 Agent Skills 为什么一起流行

参考资料:

Claude Code 官方页

flowchart TB A["Claude Code"] --> B["LLM"] A --> C["文件系统"] A --> D["Bash / CLI"] A --> E["Git"] A --> F["测试命令"] A --> G["MCP / 外部工具"] A --> H["权限确认"] B --> I["理解任务"] C --> I D --> J["执行动作"] E --> J F --> K["验证结果"] G --> J H --> L["人类控制边界"]

Claude Code 让 LLM 进入真实工作环境
Bash 是关键的”手”,文件系统、Git、测试、权限确认和执行循环共同构成闭环
文件系统让 skill 有地方放
scripts 让 skill 不只是文字说明
测试和 Git 让 agent 能闭环验证

3.8 小故事:我学 AI 的一个习惯,先把缩写还原成英文

很多 AI 工具、工程工具、命令行概念都是缩写。学习时先把缩写还原成完整英文,能快速理解它到底在做什么。

例子 1:

cd = change directory

这个命令每天都会看到。还原成英文以后就很直观:切换目录。

例子 2:

bash = Bourne Again Shell

Bash 的名字来自一个程序员冷笑话:

Stephen Bourne 创建了早期 Unix 的 Bourne Shell,也就是 sh
Brian Fox 后来开发了 Bash,本质上是在重写和增强 Bourne Shell
所以 Bash 叫 Bourne Again Shell
这里同时致敬 Bourne Shell,也借用了英语里的 Born Again,也就是”重生”这个双关

可以用一张小图解释:

flowchart LR A["Stephen Bourne"] --> B["Bourne Shell sh"] B --> C["Bourne Again Shell bash"] C --> D["Born Again 重生双关"]

这个小故事服务一个判断:

学 AI 不能只学工具按钮。常见词背后的英文原意、历史来源和使用场景,往往会帮你更快理解工具的能力边界。

4. 第三节:Harness Engineering,把能力组织成稳定系统

4.1 本节主线

flowchart TB A["长任务问题"] --> B["单个 session 有极限"] B --> C["拆成多个短 session"] C --> D["Orchestrator 调度"] D --> E1["Worker A"] D --> E2["Worker B"] D --> E3["Worker C"] E1 --> F["Handoff 文件"] E2 --> F E3 --> F F --> G["Validator 独立验证"] G --> H{"PASS / FAIL"} H -->|PASS| I["进入下一阶段"] H -->|FAIL| J["返工 / 拆细 / 补约束"]

4.2 本节主要讲什么

Harness 是第三层能力。

Prompt 解决单次对话质量。Skill 解决能力复用。Harness 解决长任务可靠性。

本节讲:

单个 agent 为什么跑不长
harness 解决哪些问题
Orchestrator / Worker / Validator 的协作结构
FloatTrans 和 cmux 是实践案例

4.3 Harness 的定义

Harness 是一套工程结构,用来让 AI agent 在长任务里持续、稳定、可验证地工作。

它包括:

agent 怎么启动
拿到什么上下文
能用什么工具
当前任务边界是什么
产出写在哪里
谁来验证
失败后怎么恢复
下一个 agent 怎么接上

参考资料:

4.4 Harness 解决的问题

flowchart TB A["长任务可靠性"] --> B["上下文退化"] A --> C["状态继承"] A --> D["任务拆分"] A --> E["验证机制"] A --> F["失败恢复"] A --> G["多 Agent 协作"] B --> B1["context window"] B --> B2["context rot"] B --> B3["context pollution"] C --> C1["handoff"] E --> E1["validator"]

要点:

长上下文会降低质量,但这只是 harness 的一部分
状态继承依赖文件、commit、handoff 这类外部载体
验证必须独立出来
并行 worker 需要明确边界和依赖关系

4.5 三角色架构:Orchestrator / Workers / Validator

flowchart TB O["Orchestrator 规划 / 调度 / 决策升级"] --> W1["Worker A Feature 1"] O --> W2["Worker B Feature 2"] O --> W3["Worker C Feature 3"] W1 --> H1["Handoff A"] W2 --> H2["Handoff B"] W3 --> H3["Handoff C"] H1 --> V["Validator 独立模型 / 独立标准"] H2 --> V H3 --> V V --> P{"PASS?"} P -->|Yes| N["下一个 milestone"] P -->|No| R["返工 / 拆细 / 补约束"]

Orchestrator 编排者/总指挥

做规划和调度
管依赖关系
判断什么时候并行
判断什么时候要问人
不直接写实现

Workers 执行者

每个 worker 做一个边界清楚的任务
worker 最好 fresh context
三个 worker 并行表达 agent teams 的价值
并行前提:任务没有强文件依赖

Validator 验证器/质检员

独立验证,不做橡皮图章
最好用不同模型或不同 provider
至少要独立 session + 独立验收标准
输出 PASS / FAIL 和原因

4.6 FloatTrans 实践

FloatTrans 是第一次完整跑 harness 思路的项目
Phase 1 拆成 11 个 feature / 4 个 milestone
Worker 执行单个任务
Handoff 文件传状态
Validator 独立审查
最重要的收获:状态传递比 prompt 本身更重要

flowchart LR A["FloatTrans Phase 1"] --> B["11 features"] B --> C["4 milestones"] C --> D["Workers"] D --> E["Handoff"] E --> F["Validator"] F --> G["经验沉淀"]

4.7 cmux 多 Agent 实践

参考资料:

cmux 官方仓库

cmux 给了多 agent 协作的基础设施:

查看 agent 拓扑
读取某个 agent 屏幕内容
给某个 agent 发送任务
让 Orchestrator 直接调度 worker / validator

核心判断:

人的角色从传话筒变成决策官。

4.8 OpenClaw / Hermes 的位置

参考资料:

OpenClaw GitHub
Hermes Agent GitHub
它们是值得研究的 agent / harness 系统
我还没有深入使用,不展开评价
可以作为后续学习方向
本次只讲自己真实实践过的 FloatTrans / cmux / harness 经验

4.9 本节收束

Harness 把 AI 协作从”一次生成”推进到”可拆分、可交接、可验证、可恢复”。

5. 第四节:Founder Playbook,把技术路线放进创业系统

5.1 本节主线

flowchart LR A["技术路线 prompt → skills → harness"] --> B["创业操作系统"] B --> C["Idea"] C --> D["MVP"] D --> E["Launch"] E --> F["Scale"] C --> C1["验证问题"] D --> D1["构建最小产品"] E --> E1["发布与反馈"] F --> F1["运营自动化"]

5.2 本节主要讲什么

Anthropic《The Founder’s Playbook》把思路从 Learn by building 收敛到:

Idea → MVP → Launch → Scale

核心转变:

AI 不只参与 coding。AI 应该参与创业全流程。

参考资料:

5.3 从 individual contributor 到 orchestrator

参考资料:徐文浩中英对照版 Chapter 2:角色之变

创始人的工作重心上移
AI 承担越来越多执行
创始人更像 orchestrator
关键能力变成判断、取舍、设计系统

5.4 Idea:验证问题

参考资料:徐文浩中英对照版 Chapter 3:构思

Idea 阶段要让 AI 帮你做:

市场研究
竞品分析
用户访谈问题设计
反证分析
需求假设拆解

关键问题:

这个问题真实吗
谁有这个问题
现在怎么解决
有没有高频或高痛感
有没有付费信号

5.5 MVP:边界由人定义,构建交给 AI 加速

参考资料:徐文浩中英对照版 Chapter 4:MVP

MVP 阶段可以用 Claude Code / Codex / Cursor / OpenClaw / Hermes 这类工具。

人要定义:

验证哪一个假设
只做哪一个核心动作
不做哪些功能
验收标准是什么
什么情况算失败

核心判断:

AI coding 能力越强,人越要有边界感。

5.6 Launch:发布和反馈

参考资料:徐文浩中英对照版 Chapter 5:发布

AI 可以帮你快速做:

landing page
发布文案
FAQ
用户反馈整理
bug triage
指标面板

关键观察:

用户是否回来
是否愿意付费
是否主动反馈
是否把产品嵌进工作流
失去它会不会难受

5.7 Scale:运营自动化

参考资料:徐文浩中英对照版 Chapter 6:规模化

Scale 阶段,AI 的价值在重复运营流程:

周报自动汇总
用户反馈自动归类
CRM 自动更新
文档自动同步
内容日历自动生成
数据异常自动提醒

核心判断:

一人公司最稀缺的是注意力。AI-native Founder OS 的价值,是把注意力留给判断。

5.8 网页 ChatGPT + Codex 的实际分工

参考资料:OpenAI Help: Using Codex with your ChatGPT plan

flowchart LR A["网页 ChatGPT"] --> A1["讨论"] A --> A2["研究"] A --> A3["需求分析"] A --> A4["PRD"] A --> A5["视觉探索"] B["Codex"] --> B1["读代码"] B --> B2["改文件"] B --> B3["跑测试"] B --> B4["修 bug"] B --> B5["重构"]

核心判断:

网页 ChatGPT 负责想清楚,Codex 负责做出来。

5.9 本节收束

AI-native Founder OS 是把 prompt、skills、harness 这三层技术能力,放进 Idea、MVP、Launch、Scale 的创业闭环。

6. 最终收束

6.1 收束图

flowchart LR A["Prompt"] --> A1["表达与问题定义"] B["Skills"] --> B1["流程与经验资产"] C["Harness"] --> C1["系统与验证"] D["Founder OS"] --> D1["判断与创业闭环"] A --> B B --> C C --> D

6.2 最终判断

AI 能力会继续变强。

执行会越来越便宜。

普通人要同时练四件事:

能不能问出高质量问题
能不能把经验沉淀成模块
能不能把模块组织成系统
能不能把系统服务于真实目标

最终句:

AI 时代最大的风险,是 build 太容易以后,人更容易逃避”这件事到底值不值得做”。

0. 总体地图：从技术路线到创业操作系统

0.1 主路径

0.2 这场分享的核心判断

0.3 四个模块的承接关系

1. 开场:我的实践路径

开场图

2. 第一节:Prompt 依然是重要能力

2.1 本节主线

2.2 本节主要讲什么

2.3 LLM 工作原理:输入在塑造生成空间

2.4 写好 prompt 的两种思路:发散 vs 收敛

2.5 发散型 prompt:升维

案例 1:认知悖论

案例 2:核心数字资产

2.6 收敛型 prompt:约束

案例:长内容洞见提取 prompt

2.7 Prompt 部分的两个小工具

工具 1:Prompt Master

工具 2:乔木快捷提示词 Chrome 插件

3. 第二节:Skills,把经验沉淀成可复用能力

3.1 本节主线

3.2 本节主要讲什么

3.3 Agent Skills 的机制

3.4 Progressive disclosure

3.5 我的 skill 学习路径

3.6 原子化:skill 像乐高

旧结构:大而全内容 skill

新结构:多个原子 skill

3.7 Claude Code 和 Agent Skills 为什么一起流行

3.8 小故事:我学 AI 的一个习惯,先把缩写还原成英文

4. 第三节:Harness Engineering,把能力组织成稳定系统

4.1 本节主线

4.2 本节主要讲什么

4.3 Harness 的定义

4.4 Harness 解决的问题

4.5 三角色架构:Orchestrator / Workers / Validator

Orchestrator 编排者/总指挥

Workers 执行者

Validator 验证器/质检员

4.6 FloatTrans 实践

4.7 cmux 多 Agent 实践

4.8 OpenClaw / Hermes 的位置

4.9 本节收束

5. 第四节:Founder Playbook,把技术路线放进创业系统

5.1 本节主线

5.2 本节主要讲什么

5.3 从 individual contributor 到 orchestrator

5.4 Idea:验证问题

5.5 MVP:边界由人定义,构建交给 AI 加速

5.6 Launch:发布和反馈

5.7 Scale:运营自动化

5.8 网页 ChatGPT + Codex 的实际分工

5.9 本节收束

6. 最终收束

6.1 收束图

6.2 最终判断

7. 相关资料链接

Prompt

Skills

Harness

Founder OS