AI Agent使用的复利效应:为什么第二步的「无用功」最值得投入

The Compound Interest of Agent Adoption: Why Redundant Work Pays Off Exponentially

HashiCorp 的 Mitchell 把自己的 AI 使用历程分成六个阶段。他不是那种用了就觉得好的人,每个阶段都带着怀疑和验证。六步走完后,他得出了一个反直觉的结论:最痛苦、看起来最「无用」的第二步,恰恰是后续一切复利的起点。

大多数人从第一步直接跳到第四步 —— 觉得 AI 好用就开始委托任务。Mitchell 却在第二步花了大量时间做冗余工作:已经手动完成的事,再让 Agent 做一遍。原文说「I literally did the work twice」。目的不是省时间,是建立对 Agent 能力边界的真实认知。

正是这个阶段的「无用功」,让后续每一步都产生了指数级的复利效应。

[Read More]

AI 时代的一万小时定律:从战术精通到系统思维

The 10,000-Hour Rule in the Age of AI: From Tactical Mastery to Systems Thinking

马尔科姆·格拉德威尔(Malcolm Gladwell)在《异类》中普及的"一万小时定律"曾是无数人自我提升的圣经:只要投入一万小时的刻意练习,任何人都能成为世界级专家。然而,随着 AI 技术的爆发式增长,这一定律正面临前所未有的挑战。

在 AI 能够以分钟级速度掌握规则型技能的今天,人类是否还需要花费一万小时去磨练战术技能?如果不需要,我们的一万小时应该投资在哪里?

[Read More]

基础设施比模型更重要:Stripe Minions 给 AI Agent 落地的启示

Why Engineering Infrastructure Matters More Than Model Choice for AI Agents

昨晚在电子书上读到一段关于 Stripe Minions 的文字,让我停下来想了很久。

不是因为它用了什么惊艳的模型,而是因为它揭示了一个被大多数人忽略的事实:

Minions 能 work 的首要原因跟 AI 模型本身几乎无关,而是 Stripe 在 LLM 出现之前就为人类工程师建设了多年的基础设施。

完整的代码树、成熟的构建系统、全面的测试覆盖、标准化的开发环境——这些不是为 AI 准备的,是十多年来为人类工程师准备的。AI Agent 到来时,直接继承了这套基础设施。

好的人类工程基础设施,就是好的 AI 工程基础设施。

[Read More]

悟空使用技巧:让 AI 向你提问,需求越明确执行效果越好

Interactive Prompt Clarification: Why Asking Questions Back Makes AI Agents Smarter

向 AI 提出需求后,不要急着让它立刻执行。一个简单却常被忽略的技巧是:让 AI 先向你提问,把模糊的需求打磨清晰。需求越明确,AI 的执行效果就越好。这不是理论,而是每天和 AI 协作的工程实践中,投入产出比最高的习惯。

[Read More]

Harness工程就是人类几十年前就有的工程纪律

Why AI agents need structured control, not smarter models

2026 年初,“Harness Engineering” 突然成为 AI 工程圈的热词。顶会论文、技术博客、框架文档都在反复强调同一个公式:Agent = Model + Harness。斯坦福 IRIS 实验室的对照实验表明,固定模型仅更换 Harness 架构,任务完成率可产生 6 倍 的性能差距。

但如果我们剥开这层新术语的外衣,会发现一个略显讽刺的事实:Harness Engineering 并不是什么新发明,它只是人类过去 60 年积累的工程纪律,在 LLM 时代的一次强制回归。

从 Dijkstra 对 goto 的批判,到 GoF 的设计模式,再到控制理论与 DevOps,Harness 的每一块基石都早已存在。我们之所以觉得它新,只是因为过去两年,太多开发者试图用裸 LLM 调用跳过工程基础,直到系统在生产环境中失控,才被迫重新捡起这些老规矩。

[Read More]

AI 时代的代码大爆发:为什么未来 3 年会有更多人涌入软件行业?

The Code Explosion: Why the Software Workforce Will Grow, Not Shrink, in the AI Era

2024 年,GitHub 上产生了 2560 亿行 代码,其中 41% 由 AI 生成。

这是一个惊人的数字,但更惊人的是未来 3 年的预测:随着 AI 编程工具渗透率从 50% 飙升至 90% 以上,全球代码总量预计将增长 4 到 10 倍

面对这种指数级的生产力爆发,许多人的第一反应是恐慌:“程序员是不是要失业了?”

然而,经济学规律和历史经验告诉我们一个截然相反的结论:未来 3 年,从事软件行业的人数不仅不会减少,反而会迎来史无前例的增长。 软件行业正在经历一场从 “手工业” 到 “工业化” 的范式转移,而这场转移将吸纳海量的 “新从业者”。

[Read More]

AI Native 研发实战:一个类 Notion 笔记的创业团队的 Harness 工程与知识复利

How a 5-Person Startup Built an AI-Native Execution Graph for Complex Collaborative Editing

上周和一位做 Notion 类产品的创业朋友 Hugo 深聊。他们团队 5 个人,技术栈很现代:Rust 后端 + CRDT 协作引擎 + React 前端。全员配了 Cursor/Copilot,编码效率确实起飞了。

但他抛出一个让我后背发凉的数据:

“写代码快了 10 倍,但端到端交付只快了 2 倍。剩下的时间差,全耗在给 AI 擦屁股上。”

他给我看了一个真实案例。新人小李接到任务:“新增一个代码块类型,支持语法高亮和行号。”

没有 Harness 的灾难

  1. 小李让 Agent 生成代码(5 分钟,看起来完美)
  2. Agent 不知道团队半年前从"嵌套 JSON"迁移到"扁平化 parent_id"的架构决策,生成了嵌套方案
  3. 小李没看出来(新人不懂历史),提交 PR
  4. CI 失败:循环引用检测拦截(嵌套结构在协作同步时会死锁)
  5. 小李让 Agent 修复,Agent 为了绕过检测,直接改了权限校验逻辑(越界)
  6. 老王 Review 时发现 3 个深层问题:CRDT 冲突策略不对、离线同步没考虑、权限模型被破坏。打回。
  7. 反复 3 轮,耗时 2 天。老王叹气:“还不如我自己写。”

问题本质:AI 把编码压缩了,但把 隐性知识的缺失放大了

过去靠"问老王"填补的架构决策、历史坑位、协作潜规则,AI 一概不知道。阿里技术许晓斌称之为 人肉中间件现象:员工沦为 AI 与业务系统间的手工搬运工。腾讯技术工程则指出:Harness 不是目的,知识才是护城河

这篇文章,就以这个 5 人 Notion 团队为案例,完整拆解他们如何用 三层架构(组织 × 资产 × 工程) 构建 Harness 系统,把"给 AI 擦屁股"变成"AI 自主交付",实现知识复利。

[Read More]

企业级 Agent 落地:要抓好左右手

The Two-Hand Framework for Enterprise AI Agents

上周和一个做企业数字化的朋友吃饭。他公司去年花了两百多万,引入了一套"AI Agent 平台"。

销售演示的时候很惊艳:对着对话框说一句话,系统就能生成报表、审批流程、甚至写 SQL 查数据。

上线三个月后,他告诉我:

“员工用了两周就放弃了。现在那个系统成了公司最贵的摆设。”

我问他:系统出 Bug 了?

他说:不是。是系统不会变聪明

第一个月,Agent 回答问题的准确率大概 70%。第二个月还是 70%。第三个月,员工发现问同样的问题,得到的答案一模一样——系统完全没有从实际使用中学到任何东西。

“它就是个会说话的自动化脚本。”

这句话戳中了一个很多人不愿承认的事实:

今天市面上 90% 的"企业 Agent",本质上只是给 LLM 套了个聊天框。

[Read More]

如果你现在在做的系统不能自主进化,你已经落后了

Why Static Systems Are Already Obsolete

去年双十一之后,我和两个不同团队的负责人聊了聊。

团队 A 花了六个月打磨一套微服务架构:精致的 API 网关、完善的链路追踪、99.99% 的 SLA 承诺。上线那天,一切完美。

团队 B 用了两个月搭了个「粗糙」的系统:简单的单体应用、基础的日志收集、甚至有些地方用了硬编码。但他们在系统里埋了一个东西 —— 一套基于运行数据自动调优的反馈循环。

六个月后再看,团队 A 的系统依然「完美」,只是业务变了三次方向,每次都要拉齐五个服务重新发版,工程师疲于奔命。团队 B 的系统已经迭代了四十多个版本,配置参数自动优化了三轮,连架构都根据流量模式自动拆分了两个热点模块。

这不是关于谁的技术栈更好的故事。

这是关于 你在构建的是资产还是负债 的故事。

[Read More]

中国 SaaS 厂商的护城河应该怎么建

Building Durable Moats for China SaaS in the Agent Era

上周和一位做 HR SaaS 的创始人吃饭。他抛出一个困扰了很久的问题:

“我们的 AI 简历解析准确率比竞品高 8%,但客户续约率还是在掉。竞品三个月就追平了准确率,价格还低 20%。技术优势在中国到底能维持多久?

我给的回答很直接:6 到 12 个月。 然后就没有了。

这不是悲观,而是现实。中国企服市场的迭代速度让任何纯技术壁垒都迅速商品化。如果你的护城河是"我们的模型更准"“我们的算法更快”,那这条河很快就会干涸。

这篇文章,我想系统回答一个问题:在中国做 SaaS,到底什么才是真正的护城河?

[Read More]