prompt → skills → harness → OPC:我的 AI 实践与思考

普通人学习 AI 的技术路线,如何进一步长成自己的 AI-native Founder OS。

普通人学习 AI 的技术路线,如何进一步长成自己的 AI-native Founder OS。


0. 总体地图:从技术路线到创业操作系统

0.1 主路径

Prompt

提问与表达能力

Skills

经验资产化能力

Harness

系统编排与验证能力

OPC / Founder OS

AI-native 创业操作系统

让 LLM 进入更高质量的生成空间

把反复有效的经验封装成可复用能力

让多个 agent 稳定完成长期复杂任务

把技术能力放进 Idea → MVP → Launch → Scale

0.2 这场分享的核心判断

prompt → skills → harness 是我目前认为普通人学习 AI 最合理的一条技术路线。

它们构成三层能力升级:

Prompt

一次对话的质量

Skills

一类任务的复用

Harness

一个系统的稳定运行

个人 AI 能力

AI-native Founder OS

把个人 AI 能力转化为创业流程

最终落点:

prompt 训练表达,skills 训练流程,harness 训练系统。 Founder OS 训练判断:什么值得做,什么时候做,做到什么程度。

0.3 四个模块的承接关系

1. Prompt

输入如何影响 LLM 输出

2. Skills

把有效经验沉淀成模块

3. Harness

用工程结构稳定调度 agent

4. Founder OS

把 AI 能力放进创业闭环

发散 / 收敛

SKILL.md / 原子化

Orchestrator / Workers / Validator

Idea / MVP / Launch / Scale


1. 开场:我的实践路径

这条路径是怎么长出来的:

  • 最开始从 prompt 入手
  • 后来发现反复有效的 prompt 应该沉淀成 skills
  • 再后来发现复杂任务需要 harness 来保证稳定性
  • 最近读 Anthropic《The Founder’s Playbook》,把这条技术路线放进创业流程里重新理解

开场图

Prompt学会提问理解输入如何影响LLM 输出Skills沉淀能力把反复有效的流程写进SKILL.mdHarness编排系统让多个 agent接力完成复杂任务Founder OS服务创业把 AI 能力放进Idea-MVP-Launch-Scale我的 AI 实践路径

2. 第一节:Prompt 依然是重要能力

2.1 本节主线

Prompt 的重要性

LLM 工作原理

输入影响生成空间

两种能力

发散

升维 / 创造力 / 打开空间

收敛

约束 / 确定性 / 锁定标准

姜胡说小报童

认知悖论 / 核心数字资产

姜胡说长 prompt

知识萃取 / 证据等级 / 输出格式

两个工具

Prompt Master / 乔木快捷提示词

2.2 本节主要讲什么

Prompt 依然重要。

模型能力越强,prompt 越像一种”方向盘”:

  • 发散时,prompt 决定 AI 往哪里想
  • 收敛时,prompt 决定 AI 按什么标准交付
  • 协作时,prompt 暴露人的问题定义能力、上下文组织能力和判断标准

这一节讲两部分:

  1. LLM 的工作原理
  2. 写好 prompt 的两种思路:发散 vs 收敛

2.3 LLM 工作原理:输入在塑造生成空间

LLM 根据上下文生成后续内容。你的输入会影响它接下来生成什么、以什么层级生成、采用什么语气和结构生成。

可以从四个信号讲:

用户输入

任务信号

上下文信号

专业度信号

质量标准信号

LLM 输出空间

要点:

  • 模糊输入通常得到平均答案
  • 高质量输入会提高输出上限
  • 专业词、任务边界、上下文和验收标准都会改变模型输出
  • prompt 能力本质上是问题定义能力

参考资料:

2.4 写好 prompt 的两种思路:发散 vs 收敛

Prompt

发散型

收敛型

目标:打开空间

方法:升维、对比、悖论、反常识

适合:选题、洞察、产品方向、商业机会

目标:稳定交付

方法:标准、边界、输出格式、验收条件

适合:分析报告、知识卡片、结构化产出

本节核心判断:

发散型 prompt 负责打开空间,收敛型 prompt 负责锁定质量。

2.5 发散型 prompt:升维

发散型 prompt 的重点是定义思考方向。

它不急着规定格式,也不急着控制步骤。它通过关键词、对比关系、反常识问题,把 AI 推进更高价值的思考空间。

案例 1:认知悖论

在[个人成长/赚钱致富/自媒体]领域,普遍存在的认知悖论是什么——即那些人们深信不疑,却在根本上阻碍他们成功的想法。

讲解重点:

  • “认知悖论”让 AI 去找矛盾结构
  • “深信不疑”让 AI 找共识里的盲点
  • “根本阻碍成功”让 AI 找高影响因子
  • 这类 prompt 的价值在于升维

案例 2:核心数字资产

请你找到对我来说已经轻车熟路,但是对其他人难如登天的"核心数字资产",稍加更改对他们来说就特别有用的"产品"。

讲解重点:

  • “轻车熟路 vs 难如登天”构成价值差
  • 这比直接问”我能做什么产品”更好
  • 它把产品思考从”市场上有什么”转到”我的不对称优势是什么”

2.6 收敛型 prompt:约束

收敛型 prompt 的重点是定义质量标准。

它不只是”写得长”。它真正有价值的部分是:

  • 输入边界
  • 角色定位
  • 北极星目标
  • 证据等级
  • 排除规则
  • 输出结构
  • 质量门槛

案例:长内容洞见提取 prompt

原始内容

专家角色

北极星目标

候选洞见挖掘

质量筛选

证据等级 A/B/C

最终输出格式

讲解重点:

  • 它的细节集中在质量标准、筛选门槛和交付格式
  • 它把”好洞见”从感觉变成可检查条件
  • 它适合结构化产出,不适合所有探索任务

2.7 Prompt 部分的两个小工具

工具 1:Prompt Master

链接:nidhinjs/prompt-master

  • 适合把模糊需求整理成可复制 prompt
  • 补齐任务、目标工具、输出格式、约束、输入材料、上下文、受众、成功标准、样例
  • 可以现场演示:把”我要做一个 AI 分享”改写成更清晰的 prompt

工具 2:乔木快捷提示词 Chrome 插件

链接:乔木快捷提示词 Chrome 插件

  • 管理常用 prompt
  • 浏览器里搜索、复制、分类
  • 让 prompt 从聊天记录变成可复用资产

3. 第二节:Skills,把经验沉淀成可复用能力

3.1 本节主线

学习 Agent Skills

读 Anthropic 官方文档

拆高手写的 skill

自己造 skill

踩坑:大而全 skill 不灵活

重构:原子化 skill

Claude Code 让 skill 成为可执行能力包

3.2 本节主要讲什么

Skills 是第二层能力。

Prompt 解决一次对话。Skill 解决一类任务的复用。

本节讲三件事:

  1. Anthropic Agent Skills 的底层机制
  2. 自己学习 skill 的路径
  3. 为什么 skill 要原子化

3.3 Agent Skills 的机制

参考资料:

要点:

  • Anthropic 的贡献在于:把 Agent Skills 做成了 Claude 体系里的正式机制
  • 一个 skill 是一个目录
  • 核心文件是 SKILL.md
  • 可以包含 scripts、references、assets
  • Claude 通过 progressive disclosure 按需加载

3.4 Progressive disclosure

概念解释:progressive disclosure(渐进式披露)——分步逐步展示信息,先显核心内容,按需展开详情。

Metadata

name / description

SKILL.md

完整说明

References

细节资料

Scripts

可执行脚本

Assets

模板 / 示例

  • AI 先知道有哪些能力
  • 任务相关时才读完整说明
  • 真正需要细节时再读 references / scripts
  • 这解决的是上下文效率问题

3.5 我的 skill 学习路径

读官方文档

安装一个高手 skill

用一次看效果

打开 SKILL.md 看结构

自己造

真实使用中迭代

每一步:

  1. 读官方文档:理解结构和加载机制
  2. 学最佳实践:看别人的 description、触发条件、工作流、禁止事项、references、scripts
  3. 自己造:从真实需求出发,用一次改一次

3.6 原子化:skill 像乐高

旧结构:大而全内容 skill

获取灵感

选题

画伞风格

手动改写

反向优化 skill

生成配图

问题:

  • 想单独用生图能力时,要从大 skill 里拆
  • agent 读了很多无关上下文
  • 完整工作流会带偏单点任务
  • 功能越多,边界越模糊

新结构:多个原子 skill

analyze

outline

draft

polish

ill

核心判断:

skill 的价值来自清晰边界。边界越清楚,越容易单独使用,也越容易组合。

3.7 Claude Code 和 Agent Skills 为什么一起流行

参考资料:

Claude Code

LLM

文件系统

Bash / CLI

Git

测试命令

MCP / 外部工具

权限确认

理解任务

执行动作

验证结果

人类控制边界

  • Claude Code 让 LLM 进入真实工作环境
  • Bash 是关键的”手”,文件系统、Git、测试、权限确认和执行循环共同构成闭环
  • 文件系统让 skill 有地方放
  • scripts 让 skill 不只是文字说明
  • 测试和 Git 让 agent 能闭环验证

3.8 小故事:我学 AI 的一个习惯,先把缩写还原成英文

很多 AI 工具、工程工具、命令行概念都是缩写。学习时先把缩写还原成完整英文,能快速理解它到底在做什么。

例子 1:

cd = change directory

这个命令每天都会看到。还原成英文以后就很直观:切换目录。

例子 2:

bash = Bourne Again Shell

Bash 的名字来自一个程序员冷笑话:

  • Stephen Bourne 创建了早期 Unix 的 Bourne Shell,也就是 sh
  • Brian Fox 后来开发了 Bash,本质上是在重写和增强 Bourne Shell
  • 所以 Bash 叫 Bourne Again Shell
  • 这里同时致敬 Bourne Shell,也借用了英语里的 Born Again,也就是”重生”这个双关

可以用一张小图解释:

Stephen Bourne

Bourne Shell

sh

Bourne Again Shell

bash

Born Again

重生双关

这个小故事服务一个判断:

学 AI 不能只学工具按钮。常见词背后的英文原意、历史来源和使用场景,往往会帮你更快理解工具的能力边界。


4. 第三节:Harness Engineering,把能力组织成稳定系统

4.1 本节主线

PASS

FAIL

长任务问题

单个 session 有极限

拆成多个短 session

Orchestrator 调度

Worker A

Worker B

Worker C

Handoff 文件

Validator 独立验证

PASS / FAIL

进入下一阶段

返工 / 拆细 / 补约束

4.2 本节主要讲什么

Harness 是第三层能力。

Prompt 解决单次对话质量。Skill 解决能力复用。Harness 解决长任务可靠性。

本节讲:

  1. 单个 agent 为什么跑不长
  2. harness 解决哪些问题
  3. Orchestrator / Worker / Validator 的协作结构
  4. FloatTrans 和 cmux 是实践案例

4.3 Harness 的定义

Harness 是一套工程结构,用来让 AI agent 在长任务里持续、稳定、可验证地工作。

它包括:

  • agent 怎么启动
  • 拿到什么上下文
  • 能用什么工具
  • 当前任务边界是什么
  • 产出写在哪里
  • 谁来验证
  • 失败后怎么恢复
  • 下一个 agent 怎么接上

参考资料:

4.4 Harness 解决的问题

长任务可靠性

上下文退化

状态继承

任务拆分

验证机制

失败恢复

多 Agent 协作

context window

context rot

context pollution

handoff

validator

要点:

  • 长上下文会降低质量,但这只是 harness 的一部分
  • 状态继承依赖文件、commit、handoff 这类外部载体
  • 验证必须独立出来
  • 并行 worker 需要明确边界和依赖关系

4.5 三角色架构:Orchestrator / Workers / Validator

Yes

No

Orchestrator

规划 / 调度 / 决策升级

Worker A

Feature 1

Worker B

Feature 2

Worker C

Feature 3

Handoff A

Handoff B

Handoff C

Validator

独立模型 / 独立标准

PASS?

下一个 milestone

返工 / 拆细 / 补约束

Orchestrator 编排者/总指挥

  • 做规划和调度
  • 管依赖关系
  • 判断什么时候并行
  • 判断什么时候要问人
  • 不直接写实现

Workers 执行者

  • 每个 worker 做一个边界清楚的任务
  • worker 最好 fresh context
  • 三个 worker 并行表达 agent teams 的价值
  • 并行前提:任务没有强文件依赖

Validator 验证器/质检员

  • 独立验证,不做橡皮图章
  • 最好用不同模型或不同 provider
  • 至少要独立 session + 独立验收标准
  • 输出 PASS / FAIL 和原因

4.6 FloatTrans 实践

  • FloatTrans 是第一次完整跑 harness 思路的项目
  • Phase 1 拆成 11 个 feature / 4 个 milestone
  • Worker 执行单个任务
  • Handoff 文件传状态
  • Validator 独立审查
  • 最重要的收获:状态传递比 prompt 本身更重要

FloatTrans Phase 1

11 features

4 milestones

Workers

Handoff

Validator

经验沉淀

4.7 cmux 多 Agent 实践

参考资料:

cmux 给了多 agent 协作的基础设施:

  • 查看 agent 拓扑
  • 读取某个 agent 屏幕内容
  • 给某个 agent 发送任务
  • 让 Orchestrator 直接调度 worker / validator

cmux send

cmux send

cmux send

cmux send

handoff

handoff

handoff

PASS / FAIL

关键决策

Orchestrator

Worker A

Worker B

Worker C

Validator

Human

核心判断:

人的角色从传话筒变成决策官。

4.8 OpenClaw / Hermes 的位置

参考资料:

  • OpenClaw GitHub

  • Hermes Agent GitHub

  • 它们是值得研究的 agent / harness 系统

  • 我还没有深入使用,不展开评价

  • 可以作为后续学习方向

  • 本次只讲自己真实实践过的 FloatTrans / cmux / harness 经验

4.9 本节收束

Harness 把 AI 协作从”一次生成”推进到”可拆分、可交接、可验证、可恢复”。


5. 第四节:Founder Playbook,把技术路线放进创业系统

5.1 本节主线

技术路线

prompt → skills → harness

创业操作系统

Idea

MVP

Launch

Scale

验证问题

构建最小产品

发布与反馈

运营自动化

5.2 本节主要讲什么

Anthropic《The Founder’s Playbook》把思路从 Learn by building 收敛到:

Idea → MVP → Launch → Scale

核心转变:

AI 不只参与 coding。AI 应该参与创业全流程。

参考资料:

5.3 从 individual contributor 到 orchestrator

参考资料:徐文浩中英对照版 Chapter 2:角色之变

  • 创始人的工作重心上移
  • AI 承担越来越多执行
  • 创始人更像 orchestrator
  • 关键能力变成判断、取舍、设计系统

5.4 Idea:验证问题

参考资料:徐文浩中英对照版 Chapter 3:构思

Idea 阶段要让 AI 帮你做:

  • 市场研究
  • 竞品分析
  • 用户访谈问题设计
  • 反证分析
  • 需求假设拆解

关键问题:

  • 这个问题真实吗
  • 谁有这个问题
  • 现在怎么解决
  • 有没有高频或高痛感
  • 有没有付费信号

5.5 MVP:边界由人定义,构建交给 AI 加速

参考资料:徐文浩中英对照版 Chapter 4:MVP

MVP 阶段可以用 Claude Code / Codex / Cursor / OpenClaw / Hermes 这类工具。

人要定义:

  • 验证哪一个假设
  • 只做哪一个核心动作
  • 不做哪些功能
  • 验收标准是什么
  • 什么情况算失败

核心判断:

AI coding 能力越强,人越要有边界感。

5.6 Launch:发布和反馈

参考资料:徐文浩中英对照版 Chapter 5:发布

AI 可以帮你快速做:

  • landing page
  • 发布文案
  • FAQ
  • 用户反馈整理
  • bug triage
  • 指标面板

关键观察:

  • 用户是否回来
  • 是否愿意付费
  • 是否主动反馈
  • 是否把产品嵌进工作流
  • 失去它会不会难受

5.7 Scale:运营自动化

参考资料:徐文浩中英对照版 Chapter 6:规模化

Scale 阶段,AI 的价值在重复运营流程:

  • 周报自动汇总
  • 用户反馈自动归类
  • CRM 自动更新
  • 文档自动同步
  • 内容日历自动生成
  • 数据异常自动提醒

核心判断:

一人公司最稀缺的是注意力。AI-native Founder OS 的价值,是把注意力留给判断。

5.8 网页 ChatGPT + Codex 的实际分工

参考资料:OpenAI Help: Using Codex with your ChatGPT plan

网页 ChatGPT

讨论

研究

需求分析

PRD

视觉探索

Codex

读代码

改文件

跑测试

修 bug

重构

核心判断:

网页 ChatGPT 负责想清楚,Codex 负责做出来。

5.9 本节收束

AI-native Founder OS 是把 prompt、skills、harness 这三层技术能力,放进 Idea、MVP、Launch、Scale 的创业闭环。


6. 最终收束

6.1 收束图

Prompt

表达与问题定义

Skills

流程与经验资产

Harness

系统与验证

Founder OS

判断与创业闭环

6.2 最终判断

AI 能力会继续变强。

执行会越来越便宜。

普通人要同时练四件事:

  • 能不能问出高质量问题
  • 能不能把经验沉淀成模块
  • 能不能把模块组织成系统
  • 能不能把系统服务于真实目标

最终句:

AI 时代最大的风险,是 build 太容易以后,人更容易逃避”这件事到底值不值得做”。


7. 相关资料链接

Prompt

Skills

Harness

Founder OS