技术沉淀

AI Agent 播客观察技术沉淀

2026-05-25 00:15 北京时间 15 分钟阅读难度：入门

造 Agent 的工具，也会成为 Agent 时代的生意

晚点聊从 OpenAI 开发者日聊到 Agentic Tooling，提醒我们不要只盯 Agent 应用。每一波应用爆发前，都需要构建、调试、评估、部署、监控和权限管理工具先成熟。

Agentic Tooling 面向开发者、创业团队和企业平台团队，而不只是终端用户。

阅读全文

AI Agent 播客观察技术沉淀

2026-05-25 00:15 北京时间 15 分钟阅读难度：进阶

Agent 新范式在环境里学习

硅谷 101 E191 最值得拿出来写的判断是：Agent 的进化让模型进入可操作、可反馈、可评估的环境。环境定义得越清楚，Agent 越可能稳定落地。

Agent 的关键是能否从环境反馈里修正行动。

阅读全文

AI Agent 播客观察技术沉淀

2026-05-25 00:15 北京时间 15 分钟阅读难度：入门

Agent 开发上半场，硬仗在 Context 和工具

42 章经把 Agent 拆成 LLM、Context 和 Tool Use 三件事。这个框架朴素但有用：Agent 能不能干活，往往不由模型一句话决定，而由上下文组织、工具暴露、环境反馈和失败恢复共同决定。

Agent 三要素可以先看 LLM、Context、Tool Use，别只盯模型。

阅读全文

AI Agent API 技术沉淀

2026-05-24 23:01 北京时间 11 分钟阅读难度：进阶

cch 随机请求头为什么会坑到第三方 API 用户

cch 真正坑人的地方不在随机字符本身，而在它把客户端归因、缓存命中、网关兼容和第三方 API 成本绑在了一起。对直连用户这可能只是实现细节，对代理、Bedrock、兼容层和企业网关来说，它会变成稳定性问题。

cch 不是普通随机数，它出现在归因字符串里，并且会让请求形状随调用变化。

阅读全文

技术沉淀 AI 编程软件工程

2026-04-12 10:20 北京时间 12 分钟阅读难度：进阶

在原生 Windows 上，重搭 AI 编程命令行栈

一次原生 Windows 命令行整治记录：把 PowerShell、PATH 和 UTF-8 的反复故障，收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。

原生 Windows 下，PowerShell 适合系统管理，不适合承担高频中文文本处理主流程。

阅读全文

AI Agent AI 编程技术沉淀

2026-04-11 12:10 北京时间 11 分钟阅读难度：进阶

Hermes 安装指南：macOS 和 Windows 怎么装

Hermes 不难装。macOS 直接跑官方安装器，Windows 先装 WSL2 再按 Linux 路线装。装完别先闲聊，先用并行读仓库和定时任务两个例子，看看它适不适合你。

macOS 原生可装，Windows 走 WSL2，别在原生 PowerShell 路线上耗时间。

阅读全文

技术沉淀 AI Agent Anthropic

2026-04-09 19:35 北京时间 14 分钟阅读难度：进阶

Anthropic 为什么要把 Managed Agents 做成平台层

Claude Managed Agents 重点是 Anthropic 把 Agent 从模型接口推进到官方运行时平台的一步。重要的变化，重点是 Anthropic 开始接管 session、memory、vault、observability 和 prompt versioning 这一层基础设施。

Anthropic 现在提供的不只是模型，而是一套托管式 agent harness，把 agent、environment、session 和 events 打包成官方平台能力。

阅读全文

技术沉淀 AI 编程 AI Agent

2026-04-09 00:20 北京时间 20 分钟阅读难度：硬核

把多窗口 AI 工作流重构成单一控制面

需要重构的重点是项目控制层。多窗口同时写文章没有错，问题在于写作、主干集成、部署和恢复过去没有被放进同一套状态机里管理；而且这套控制面现在已经开始落成具体脚本和状态文件。

多 Console 并发写作不是问题，问题是过去没有把主干合并和部署收口成单写者流程。

阅读全文

技术沉淀 AI Agent

2026-04-09 00:01 北京时间 18 分钟阅读难度：硬核

Hermes 和 OpenClaw 怎么选：先看层级

Hermes 最近热起来，不代表它会直接替代 OpenClaw。两者都挂着 agent 这面旗，但一个更像执行内核，一个更像个人助手入口和控制平面，个人用户与企业用户后面的答案会完全不同。

Hermes 更像 agent runtime，OpenClaw 更像个人助手入口和 control plane。

阅读全文

技术沉淀 AI 编程 AI Agent

2026-04-07 21:22 北京时间 17 分钟阅读难度：进阶

GSD2 和 OMX 怎么选：两套 AI 编程工作流的分水岭

GSD2 在管项目，OMX 在管 Codex。两边都能做长任务，但不在同一层：一个更像执行内核，一个更像编排外挂。把它们看成同一层工具，后面基本都会用错。

GSD2 把项目压成 milestone、slice、task 和落盘状态，更像执行内核。

阅读全文

技术沉淀 AI 编程软件工程

2026-03-30 22:20 北京时间 13 分钟阅读难度：进阶

别把 AI 当外包商：软件研发里更稳的协作四分法

团队需要的是一套能按风险、可验证性和学习价值来分工的方法。研发协作的关键，不在全信或全禁，而在于给不同任务安排不同的人机关系，让交付、审查和学习都能继续成立。

同一个 AI 工具，不应该用同一种协作方式处理所有研发任务，关键在于先给任务分级，而不是先给工具站队。

阅读全文

技术沉淀 AI 编程软件工程

2026-03-30 22:19 北京时间 19 分钟阅读难度：进阶

AI 改写了编码，为什么软件复杂性还在

AI 已经改写了编码、测试和局部修复这些实现层工作，很多团队也真实感受到了提速，但软件复杂性没有一起消失。系统边界、组织协作和长期演化，仍然决定大多数难题。

编码这一层已经被明显改写，AI 正在接管一段连续的软件工程工作流。

阅读全文

行业观察技术沉淀

2026-03-30 14:50 北京时间 13 分钟阅读难度：进阶

为什么越往后走，AI 竞争越不像模型竞赛，越像一场基础设施竞赛

模型当然仍是 AI 竞争的底座，但越往后走，真正锁定客户、提高迁移成本、决定长期利润结构的，越来越是连接器、运行时、评测、权限、协议和部署能力这些基础设施层。

模型决定能力上限，基础设施决定能力怎样进入组织、留在组织，并最终形成迁移成本。

阅读全文

技术沉淀行业观察

2026-03-30 14:35 北京时间 12 分钟阅读难度：进阶

我们今天聊 AI，常常把能力和可用性混成一件事

AI 模型会做一件事，不等于它已经适合进入真实工作。很多讨论把「能力展示」和「长期可用」混在一起，结果高估了模型的落地速度，也低估了系统建设的难度。

能力回答的是「它能不能做出来」，可用性回答的是「它能不能在真实环境里长期做、稳定做、低摩擦地做」。

阅读全文

技术沉淀行业观察

2026-03-30 14:03 北京时间 13 分钟阅读难度：进阶

很多人以为 AI 的难点在模型，真正麻烦的是系统

对很多真实场景来说，模型能力当然重要，但最先把项目拖慢、拖贵、拖得难以上线的，往往是模型外面那一整套系统：工具接入、上下文管理、评测、权限、回滚和组织协作。

模型像发动机，决定上限；系统像整辆车，决定它能不能上路、能开多远、坏了以后怎么修。

阅读全文

行业观察技术沉淀

2026-03-30 08:50 北京时间 12 分钟阅读难度：进阶

AI 行业开始换问题了：模型还重要，系统正在变成主战场

这一轮 AI 的核心变化，是行业开始把注意力从「谁更强」转向「谁更能进入真实世界并长期工作」。模型还是底座，但系统能力正在决定价值能不能落地。

AI 行业没有停止比模型，但系统比较已经抬头：工具接入、成本控制、稳定性和工作流整合都在抬高权重。

阅读全文

技术沉淀 AI

2026-03-30 00:20 北京时间 12 分钟阅读难度：进阶

AI 到底是指数增长，还是已经进入加速段

先用图讲清线性、指数和增长率继续上升三种曲线，再回答一个更具体的问题：截至 2026 年 3 月，AI 前沿能力已出现加速迹象，但整体经济层面还没有同步进入加速指数增长。

先分清固定增量、固定比例和增长率上升，才不会把三种曲线混成一句口号。

阅读全文

技术沉淀 AI Agent 行业观察

2026-03-26 20:58 北京时间更新：2026-03-31 07:20 北京时间 22 分钟阅读难度：硬核

更强 AI 的下一步，也许不在「更像人」这条线上

如果意识不是工程目标，那么更强 AI 的演化方向就没必要沿着「更像人」展开。值得追踪的，是架构、记忆、工具使用、世界模型和多代理协作这些更具体的系统变量。

未来更强 AI 的主战场，更像系统架构，而不只是参数规模。

阅读全文

技术沉淀 AI 编程软件工程

2026-03-26 00:05 北京时间更新：2026-03-31 00:19 北京时间 18 分钟阅读难度：硬核

当顶级程序员开始少写代码，软件工程的重心移到了哪里

Karpathy、Yegge 与 Peter Steinberger 指向的，是软件工程分工的上移：代码生成更便宜后，规格、验证、门禁、回滚和长期维护变成更稀缺的环节。变化的核心是责任位置重排。

顶级程序员减少手写代码，背后是工程重心从编码转向约束、验证和审计。

阅读全文

技术沉淀 AI Agent 软件工程

2026-03-23 11:30 北京时间更新：2026-04-01 22:58 北京时间 17 分钟阅读难度：进阶

从信息流到知识层：怎样筛出值得长期沉淀的可靠知识

做知识库最容易犯的错误，是把所有信息都当知识留下来。值得长期保留的，应该是 30 天后、90 天后还能支持判断、设计和行动的内容，而不是今天最热的链接。

信息排序解决的是「今天先看什么」，知识沉淀解决的是「未来还该保留什么」，这两个问题不能共用一个分数。

阅读全文

技术沉淀大模型 AI Agent

2026-03-21 10:35 北京时间 20 分钟阅读难度：进阶

想建立 2026 年 AI 判断，先别只追新闻

先挑出那些三个月后仍会重写你判断的原文。这 10 篇博客覆盖 Agent 定义、评测偏差、软件工程、推理路线、系统安全和 Agent 公司结构这几条关键线。

这十篇里最重要的是它们分别重写了 Agent 定义、评测方法和工程边界。

阅读全文

技术沉淀 AI Agent 软件工程

2026-03-19 22:20 北京时间 10 分钟阅读难度：入门

08｜小团队 + Agent，会不会变成新默认配置

Agent 不是只改变个人怎么写代码，它也在改团队怎么协作。swyx 这篇最值得翻出来的地方，是它把「少人团队为什么会越来越能打」讲成了一套组织问题，而不只是技术问题。

Tiny Teams 不只是少招人这么简单，它更像是把 AI 放进组织设计之后形成的新运作模式。

阅读全文

技术沉淀 AI 编程技术沉思

2026-03-19 22:10 北京时间 10 分钟阅读难度：入门

07｜别一把梭哈给 AI：和它一步一步把问题做完

很多人以为用 AI 编程就是把任务扔过去、等它回一坨结果。Jeremy Howard 这篇有用的，是它提醒大家：更可持续的方式，是把问题拆成小步，让人和 AI 在同一个反馈回路里一起往前走。

真正稳定的人机协作，不靠一次生成很多代码，而靠连续的小步对话和验证。

阅读全文

技术沉淀 AI Agent AI 编程

2026-03-19 22:00 北京时间 12 分钟阅读难度：进阶

06｜2025 年，Agent 编程为什么突然变了

过去一年如果你总觉得模型、Agent、写代码方式都像在突然提速，这篇可以帮你把变化串起来。Karpathy 的价值，在于他把 2025 年几个改变格局的转折点挑了出来。

2025 年最关键的变化，不只是模型更强，训练与推理范式也都在变。

阅读全文

技术沉淀 AI 编程 AI Agent

2026-03-19 21:50 北京时间 10 分钟阅读难度：进阶

05｜Coding Agent 需要熟练操作者，它不会替你负责

Coding agent 当然有用，但它最依赖的，恰恰是前面那个会提清楚任务、会判断结果、会继续追问的人。真正被放大的，从来重点是操作者本身的清晰度和收口能力。

Coding agents 依赖熟练操作者，不会天然替代熟练操作者。

阅读全文

技术沉淀 AI Agent AI 创业

2026-03-19 21:40 北京时间 11 分钟阅读难度：进阶

04｜下一波 AI 大公司，为什么可能出在 Agent 层

模型公司当然重要，但下一波真正贴着用户、贴着任务、贴着业务结果长大的 AI 公司，未必还是卖模型的人，更可能是把模型、工具、工作流和场景绑在一起卖结果的人。这正是 swyx 这篇最值得抓住的判断。

Model Labs 和 Agent Labs 的重心不同，一个更偏模型能力，一个更偏任务结果与系统编排。

阅读全文

技术沉淀 AI 编程 AI Agent

2026-03-19 21:30 北京时间 10 分钟阅读难度：进阶

03｜为什么代码会最先成为 AI 的关键突破口

如果你想理解为什么 AI 在代码、数学、规则题上进步得这么快，这篇几乎是一把钥匙。Karpathy 把问题压缩成一个词：可验证性。越容易自动判断对错的任务，越容易被优化，进展也越快。

软件 1.0 自动化的是你能明确规定的任务，软件 2.0 更擅长自动化你能自动验收的任务。

阅读全文

技术沉淀 AI 编程软件工程

2026-03-19 21:20 北京时间 11 分钟阅读难度：进阶

02｜别把 AI 写代码，最后写成一地鸡毛

AI 可以让写代码更快，但如果你把「更快」理解成「我可以不理解」，最后只会把自己带进更脆弱的软件和更浅的能力。Jeremy Howard 这篇最值得翻成中文的地方，是把「用 AI 还要不要讲基本功」说得很具体。

AI 写代码不会取消软件工程，只会放大你对工程的理解深浅。

阅读全文

技术沉淀 AI Agent AI 编程

2026-03-19 21:10 北京时间 10 分钟阅读难度：进阶

01｜Agent 到底是什么：先把这个词说清楚

如果「Agent」这个词你已经听烦了，这篇最有价值的地方就是把它重新说清楚了。对今天的工程语境来说，Agent 更接近「用工具、跑循环、为了目标持续行动的 LLM 系统」，别再把它混成玄学人格或自动员工。

「Agent」一词终于开始有了在工程沟通里可用的共同定义。

阅读全文

技术沉淀 AI Agent AI 编程

2026-03-19 21:00 北京时间 12 分钟阅读难度：进阶

00｜如果你刚开始用 Agent 干活，先读这 4 个人

如果你最近开始用 Claude、ChatGPT、Cursor 或 Copilot 干活，这个系列不是拿来补 AI 史。它更像一条近作导读路线，帮你看懂 Agent 到底是什么、怎么用、哪里会翻车、团队会怎么变。

这不是经典文章库。更准确地说，它是一条更贴近 2025 到 2026 现实变化的 Agent 陪读路线。

阅读全文

长文库

造 Agent 的工具，也会成为 Agent 时代的生意

Agent 新范式在环境里学习

Agent 开发上半场，硬仗在 Context 和工具

cch 随机请求头为什么会坑到第三方 API 用户

在原生 Windows 上，重搭 AI 编程命令行栈

Hermes 安装指南：macOS 和 Windows 怎么装

Anthropic 为什么要把 Managed Agents 做成平台层

把多窗口 AI 工作流重构成单一控制面

Hermes 和 OpenClaw 怎么选：先看层级

GSD2 和 OMX 怎么选：两套 AI 编程工作流的分水岭

别把 AI 当外包商：软件研发里更稳的协作四分法

AI 改写了编码，为什么软件复杂性还在

为什么越往后走，AI 竞争越不像模型竞赛，越像一场基础设施竞赛

我们今天聊 AI，常常把能力和可用性混成一件事

很多人以为 AI 的难点在模型，真正麻烦的是系统

AI 行业开始换问题了：模型还重要，系统正在变成主战场

AI 到底是指数增长，还是已经进入加速段

更强 AI 的下一步，也许不在「更像人」这条线上

当顶级程序员开始少写代码，软件工程的重心移到了哪里

从信息流到知识层：怎样筛出值得长期沉淀的可靠知识

想建立 2026 年 AI 判断，先别只追新闻

08｜小团队 + Agent，会不会变成新默认配置

07｜别一把梭哈给 AI：和它一步一步把问题做完

06｜2025 年，Agent 编程为什么突然变了

05｜Coding Agent 需要熟练操作者，它不会替你负责

04｜下一波 AI 大公司，为什么可能出在 Agent 层

03｜为什么代码会最先成为 AI 的关键突破口

02｜别把 AI 写代码，最后写成一地鸡毛

01｜Agent 到底是什么：先把这个词说清楚

00｜如果你刚开始用 Agent 干活，先读这 4 个人