长文库

技术、行业、人物与 Agent 系统观察。

Latest Archive

软件工程

软件工程 时间线。

2026-05-29 21:35 北京时间 12 分钟 阅读难度:进阶

Git 入门:先看懂版本、分支和协作

Git 的核心价值,是让一个项目的每次可靠变化都留下可回退、可比较、可协作的记录。初学者先理解版本快照、暂存区、分支和远程仓库,再学命令会轻松很多。

  • Git 记录的是项目在不同时间点的快照,提交历史就是一条可回看的变化链。
阅读全文
2026-05-25 00:33 北京时间 16 分钟 阅读难度:进阶

Agent 时代,编程语言不会消失,只会重新分工

Agent 时代不会让编程语言变得不重要。变化恰好相反:语言会从人的偏好问题,变成 Agent 能否理解、修改、验证、部署和长期维护系统的协作界面。

  • 自然语言会成为任务入口,但不会替代编程语言承担系统边界。
阅读全文
2026-05-24 13:47 北京时间 10 分钟 阅读难度:进阶

多 Agent 系统最难的重点是控制权转交

多 Agent 系统的关键在于什么时候转交、转给谁、带着什么上下文转交,以及转交后谁对结果负责。

  • handoff 不是普通工具调用,它会改变谁拥有下一步对话或任务控制权。
阅读全文
2026-05-24 13:38 北京时间 10 分钟 阅读难度:进阶

沙箱不只是安全层,而是 Agent 产品的运行界面

Agent 沙箱不能只按安全容器理解。影响产品体验的,是它如何准备依赖、挂载仓库、限制网络、保留状态、运行测试,并把结果交还给人。

  • 沙箱的核心价值不只是隔离风险,还在于把仓库、依赖、工具链、网络和测试变成可复用的执行现场。
阅读全文
2026-05-24 11:19 北京时间 10 分钟 阅读难度:进阶

Agent 的下一块战场,是屏幕上的真实工作流

GUI Agent 的把浏览器、桌面、手机和办公软件变成可观察、可执行、可回放的工作环境。谁能控制屏幕,谁才真正接近用户每天做事的地方。

  • GUI Agent 的关键是能不能稳定理解界面状态、执行动作并在失败时恢复。
阅读全文
2026-05-24 11:19 北京时间 10 分钟 阅读难度:进阶

Agent 的流程税:省下的代码时间,可能还给了审查和返工

Coding agent 的成本不只在账单里,也在流程里。它能节省写代码的时间,也可能把成本转移到规格、审查、CI、回滚、权限和人类收口上。

  • Agent 的流程税来自规格、验证、审查、回滚、权限和预算归因,不会自动出现在 token 单价里。
阅读全文
2026-05-24 11:15 北京时间 11 分钟 阅读难度:进阶

AI 编程的包月幻觉正在结束

AI 编程工具正在从座席订阅走向资源计量。Codex 限流、Copilot AI Credits、代码审查消耗 Actions minutes,说明团队必须开始按任务管理 token、并发、上下文和验证成本。

  • GitHub 从 premium request 转向 AI Credits,并按 token 消耗计算,打破了短问答和多小时 autonomous coding session 成本相同的订阅错觉。
阅读全文
2026-05-24 11:10 北京时间 12 分钟 阅读难度:入门

Agent 安全重点是运行时问题

能调用工具的 Agent 不能再按聊天机器人管理。它会读文件、跑命令、连服务、写数据,安全边界必须放在运行时:权限、隔离、拦截、审计和回滚。

  • Agent 的风险来自工具调用和真实副作用,提示词约束挡不住文件操作、shell 命令、HTTP 请求和多步攻击链。
阅读全文
2026-05-24 03:57 北京时间 11 分钟 阅读难度:进阶

Agent 可观测性会成为新的基础设施

Agent 真正进入生产之后,问题不再只是能不能回答,而是每一步为什么这样做、花了多少成本、调用了什么工具、失败在哪里。可观测性会从辅助日志变成 Agent 平台的核心层。

  • Agent 的结果对错只是最后一帧,需要管理的是中间轨迹、工具选择、上下文消耗和失败原因。
阅读全文
2026-05-24 03:28 北京时间 10 分钟 阅读难度:进阶

Agent Skills 正在变成新的软件包

Skills 把流程、工具、脚本、文件和调用约定打包成可安装资产。Agent 生态的下一层竞争,会落到谁能分发、治理和复用这些能力包。

  • Skills 的价值不在把提示词写长,而在把稳定流程、工具调用、脚本和检查方式封装成可复用单元。
阅读全文
2026-05-24 03:10 北京时间 10 分钟 阅读难度:进阶

Agent 安全的边界正在从提示词移到运行时

Agent 安全不能继续只押在提示词上。模型会被外部内容误导,安全设计要限制的是它随后能访问什么、执行什么、改写什么,以及谁能复盘这些动作。

  • Prompt injection 的麻烦在于指令和数据混在同一个输入通道里,不能只靠写更强提示词来消除风险。
阅读全文
2026-05-24 02:10 北京时间 11 分钟 阅读难度:进阶

Agent 不是免费同事:企业开始重新计算 AI 的真实工时

企业开始发现,agent 的成本一项任务从启动、运行、审查、返工到归责的完整工时账。

  • Agent 成本不能只按模型调用价格看,还要算任务描述、上下文管理、review、返工和事故复盘。
阅读全文
2026-05-24 01:58 北京时间 10 分钟 阅读难度:进阶

Coding Agent 正在竞争企业运行层

这一周的信号说明,Coding Agent 的竞争不再只看模型会不会写代码,而是看谁能把沙箱、权限、验证、成本和工作流一起接进企业工程系统。

  • Dropbox Nova 把 coding agent 接进 monorepo、Bazel 和内部验证路径,说明落地重点已经转向工程系统集成。
阅读全文
2026-05-18 12:00 北京时间 7 min 阅读难度:进阶

02|本周 GitHub AI 趋势,评估栈第一次跑过框架

这周 GitHub 上速度最快的 AI 仓库不再是新框架,而是评估工具。原因不复杂:上线越多,evals 越值钱。

  • Agent 评估工具的关注度第一次稳定地超过新框架。
阅读全文
2026-05-18 12:00 北京时间 8 min 阅读难度:入门

04|上下文工程的成本,正在被 HN 重新算一遍

上下文越长不等于效果越好。最近 HN 上几条讨论又把这件事翻了一遍,焦点不是窗口尺寸,而是上下文的质量、组织和重读成本。

  • 上下文窗口的尺寸已经不是核心约束,组织方式才是。
阅读全文
2026-04-12 10:20 北京时间 12 分钟 阅读难度:进阶

在原生 Windows 上,重搭 AI 编程命令行栈

一次原生 Windows 命令行整治记录:把 PowerShell、PATH 和 UTF-8 的反复故障,收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。

  • 原生 Windows 下,PowerShell 适合系统管理,不适合承担高频中文文本处理主流程。
阅读全文
2026-04-07 22:25 北京时间 更新:2026-04-08 20:42 北京时间 7 min 阅读难度:入门

03|Memoir 在补长期上下文管理这层

Memoir 把长期上下文单独拎出来做,关心的是项目常识怎么跨会话、跨工具继续带着走。

  • 最容易反复丢的,是团队约定、项目偏好和历史决策理由这些跨会话信息。
阅读全文
2026-04-07 22:15 北京时间 更新:2026-04-08 20:42 北京时间 7 min 阅读难度:进阶

02|Coasts 把 agent 运行时问题直接摆出来了

Coasts 把依赖、端口、网络和共享服务这些平时埋在脚手架里的问题直接摆到了产品正面。

  • Coasts 关心的是进程、端口、网络和共享服务怎么一起管。
阅读全文
2026-04-04 09:30 北京时间 18 分钟 阅读难度:硬核

为什么 Zig 最近总让人想重写底层工具

Zig 最近总被拿来讨论「重写旧工具」,因为它把语言、编译器、交叉编译、C 互操作和构建系统捆成了一套更完整的底层工具链,让很多旧原生工具第一次值得重做。

  • Zig 最有杀伤力的地方,是把语言、编译器、构建和跨平台分发合成了一套统一工具链。
阅读全文
2026-04-02 20:45 北京时间 更新:2026-04-03 00:40 北京时间 10 分钟 阅读难度:入门

外刊精读|3 月底英文新稿,把 AI 编程拉回 harness

3 月底这批英文新稿真正补上的,是 AI 编程背后的 harness。测试集、浏览器里的 ground truth、用途隔离、日志和回滚边界,正在重新决定哪些任务能稳稳交给 AI。

  • 这周最值得补的英文材料,都在回答什么样的 harness 才能把 AI 编程推向生产。
阅读全文
2026-03-30 22:20 北京时间 13 分钟 阅读难度:进阶

别把 AI 当外包商:软件研发里更稳的协作四分法

团队需要的是一套能按风险、可验证性和学习价值来分工的方法。研发协作的关键,不在全信或全禁,而在于给不同任务安排不同的人机关系,让交付、审查和学习都能继续成立。

  • 同一个 AI 工具,不应该用同一种协作方式处理所有研发任务,关键在于先给任务分级,而不是先给工具站队。
阅读全文
2026-03-30 22:19 北京时间 19 分钟 阅读难度:进阶

AI 改写了编码,为什么软件复杂性还在

AI 已经改写了编码、测试和局部修复这些实现层工作,很多团队也真实感受到了提速,但软件复杂性没有一起消失。系统边界、组织协作和长期演化,仍然决定大多数难题。

  • 编码这一层已经被明显改写,AI 正在接管一段连续的软件工程工作流。
阅读全文
2026-03-30 22:18 北京时间 14 分钟 阅读难度:进阶

AI Agent 对软件工程的替代,究竟推进到了哪一步

关于 AI 是否替代软件工程师,真正麻烦的不在答案太极端,关键在于证据来自不同层面。能力、采用、岗位和组织四条线并不总是同向移动,眼下更像一场分层推进,而不是一次整齐替代。

  • 从任务能力看,AI 已经能吃下相当一部分编码、调试和界面实现工作,但这不等于整份工作已经被整体替代。
阅读全文
2026-03-29 00:35 北京时间 10 分钟 阅读难度:进阶

群友的 AI Agent 协作方法论参考

与 Agent 协作时,最关键的先判断任务是否落在它的能力边界内,再决定该放手、补足,还是拆解。拉开效果差距的,是边界判断、任务粒度、验证机制和干预时机。

  • 控制强度应与能力缺口成正比,覆盖度高就放手,覆盖度一般就补信息,覆盖不了就拆任务。
阅读全文
2026-03-26 00:05 北京时间 更新:2026-03-31 00:19 北京时间 18 分钟 阅读难度:硬核

当顶级程序员开始少写代码,软件工程的重心移到了哪里

Karpathy、Yegge 与 Peter Steinberger 指向的,是软件工程分工的上移:代码生成更便宜后,规格、验证、门禁、回滚和长期维护变成更稀缺的环节。变化的核心是责任位置重排。

  • 顶级程序员减少手写代码,背后是工程重心从编码转向约束、验证和审计。
阅读全文
2026-03-25 00:42 北京时间 更新:2026-03-31 00:19 北京时间 17 分钟 阅读难度:硬核

QVeris、LangChain 与 Agent 分层

QVeris 更像能力发现与统一执行层,LangChain、LangGraph 和 Deep Agents 则分别落在 framework、runtime 和 harness。把它们写成同类替代品,会直接讲乱技术栈边界。

  • QVeris 当前公开交付的是 tool search + tool execution,更像能力路由层。
阅读全文
2026-03-24 12:30 北京时间 更新:2026-04-01 22:58 北京时间 14 分钟 阅读难度:入门

Self-Evolving Agents:自进化研究地图

自进化 agent 听上去像终局叙事,但当前研究真正提供的,更多是一张问题地图:评估如何设计、反馈如何形成、记忆怎样约束、改进怎样不失控。地图重要,胜利尚早。

  • 它的核心贡献,是把自进化 Agent 研究整理成四条主轴和问题边界。
阅读全文
2026-03-24 12:26 北京时间 更新:2026-03-31 00:19 北京时间 16 分钟 阅读难度:入门

Swarms:多 Agent 工厂化的野心与代价

Swarms 的吸引力在于它不满足于单个 agent,而是试图把多 agent 策略批量化、模块化、产品化。但一旦走向工厂化,复杂度、调试成本和可靠性问题也会同时放大。

  • Swarms 的核心是用一组预制架构把多 Agent 协作做成可选择、可切换的策略集合。
阅读全文
2026-03-24 12:22 北京时间 更新:2026-04-01 22:58 北京时间 16 分钟 阅读难度:入门

OxyGent:多 Agent 底盘为什么先要可伸缩

OxyGent 想解决的是多 agent 协作一旦进入长链路任务,状态、扩展性和系统稳定性如何一起成立。可伸缩性不是锦上添花,而是多 Agent 底盘前提。

  • OxyGent 的核心表达把工具、模型和 Agent 抽象成可拼装的 Oxy 组件。
阅读全文
2026-03-24 12:14 北京时间 更新:2026-03-31 00:19 北京时间 16 分钟 阅读难度:入门

crewAI:把多 Agent 从概念秀拉回工作流

crewAI 值得看的地方,把角色分工、任务编排和流程可见性收回到工程可执行的范围。它代表的是多 agent 从演示叙事向工作流产品的回落。

  • crewAI 最早吸引人的是角色协作,后来真正补强的是 Flows、Memory 和可观测性。
阅读全文
2026-03-24 12:10 北京时间 更新:2026-04-01 22:58 北京时间 15 分钟 阅读难度:入门

Agent Orchestrator:并行 Agent 的后勤层

并行 agent 的难点,不在再多开几个模型窗口,而在任务拆分、依赖协调、结果合并与失败回收。Agent Orchestrator 的价值,是把这些后勤工作从演示效果推进成可持续工程。

  • 它的核心,在于给每个 Agent 独立 worktree、分支和 PR 槽位。
阅读全文
2026-03-23 11:30 北京时间 更新:2026-04-01 22:58 北京时间 17 分钟 阅读难度:进阶

从信息流到知识层:怎样筛出值得长期沉淀的可靠知识

做知识库最容易犯的错误,是把所有信息都当知识留下来。值得长期保留的,应该是 30 天后、90 天后还能支持判断、设计和行动的内容,而不是今天最热的链接。

  • 信息排序解决的是「今天先看什么」,知识沉淀解决的是「未来还该保留什么」,这两个问题不能共用一个分数。
阅读全文
2026-03-22 18:20 北京时间 13 分钟 阅读难度:进阶

WordPress 和 Hexo 之外,独立博主还需要什么

对认真独立建站的博主来说,缺的往往是一套能同时承接采集、生成、审计、发布、主题切换和运维的内容操作系统。WordPress 和 Hexo 很成熟,但它们主要解决的仍是上一代建站问题。

  • WordPress 解决的是后台运营,Hexo 解决的是静态生成,但两者都还不是一条 Agent 原生的内容生产线。
阅读全文
2026-03-22 01:31 北京时间 11 分钟 阅读难度:进阶

AI 程序员面试答案:10 题评分点与识别信号

AI 时代的程序员面试,答案不该停留在「我会写提示词」。更有区分度的,是看候选人能不能把 AI 放进明确的任务边界、验证完整流程和责任链里。下面这篇把前一篇 10 道题,进一步拆成优秀回答、中等回答和危险信号。

  • 每道题都给出优秀回答、中等回答和危险信号,方便快速区分候选人的真实水平。
阅读全文
2026-03-22 01:30 北京时间 10 分钟 阅读难度:进阶

AI 写代码之后,程序员面试该问什么

如果代码越来越多由 AI 生成,面试就不该再把重点放在徒手写实现,而该转向任务定义、上下文组织、验证完整流程和责任承担。下面这 10 道题,适合直接拿来面试允许使用 AI 的程序员候选人。

  • 这 10 道题不考候选人会不会背提示词,而是考他能不能把问题说清、把边界压清、把结果验清。
阅读全文
2026-03-19 22:46 北京时间 21 分钟 阅读难度:硬核

AI 开发者时代的四种关键原型与方法

如果你最近也在一边用 AI 写代码,一边又担心自己只是更快地试错,这篇文章想看的正是 4 种更稳的方向:Karpathy 讲学习,Simon 讲工程,Jeremy 讲主动权,swyx 讲生态与组织。

  • 这四个人放在一起看,更像教学、观察、方法与组织四种 AI 影响力。
阅读全文
2026-03-19 22:20 北京时间 10 分钟 阅读难度:入门

08|小团队 + Agent,会不会变成新默认配置

Agent 不是只改变个人怎么写代码,它也在改团队怎么协作。swyx 这篇最值得翻出来的地方,是它把「少人团队为什么会越来越能打」讲成了一套组织问题,而不只是技术问题。

  • Tiny Teams 不只是少招人这么简单,它更像是把 AI 放进组织设计之后形成的新运作模式。
阅读全文
2026-03-19 21:20 北京时间 11 分钟 阅读难度:进阶

02|别把 AI 写代码,最后写成一地鸡毛

AI 可以让写代码更快,但如果你把「更快」理解成「我可以不理解」,最后只会把自己带进更脆弱的软件和更浅的能力。Jeremy Howard 这篇最值得翻成中文的地方,是把「用 AI 还要不要讲基本功」说得很具体。

  • AI 写代码不会取消软件工程,只会放大你对工程的理解深浅。
阅读全文
2026-03-19 09:00 北京时间 9 分钟 阅读难度:进阶

00|AI 进入组织之后,8 个岗位会先重排责任链

这组文章追踪的重点是软件组织里的责任链会如何被重排:哪些执行环节变轻,哪些判断权上移,哪些角色会因为 Agent 变强而重新变贵,以及团队该怎样重新分工。

  • 这组系列真正关心的,重点是责任、边界和交付链会怎样迁移。
阅读全文
2026-03-19 09:00 北京时间 9 分钟 阅读难度:进阶

03. 产品经理在 Agent 时代,会转向成功定义与边界设计

产品经理这类岗位短期更像是在换重心,而不是被整体替代。需求文档、调研摘要和会议纪要会更容易自动化,但成功定义、边界处理和取舍判断会变得更重要。

  • 需求文档和纪要整理会更容易自动化,但目标定义和取舍判断并没有变轻。
阅读全文
2026-03-19 09:00 北京时间 9 分钟 阅读难度:入门

04. 测试工程师会更靠近评测与放行规则

测试工程师不会因为 AI 更会生成用例就自然淡出团队,先变化的更像是测试岗位里的重复执行层。越往前走,测试越会靠近评测工程、verifier 设计、安全边界和放行规则。

  • 最先变化的,是机械执行测试这一层,而不是负责质量边界和放行条件的人。
阅读全文
2026-03-19 09:00 北京时间 10 分钟 阅读难度:入门

05. 架构师在 Agent 时代,会更像运行时设计者

架构师的工作不会因为 AI 更会写代码就自然缩小,真正被重新筛选的,是只停留在图纸层、不碰运行细节的那种工作方式。Agent 时代更稀缺的,是能设计状态、协议、权限和运行边界的人。

  • 先被削弱的,重点是那种长期脱离执行、只在上层画图的工作方式。
阅读全文
2026-03-19 09:00 北京时间 8 分钟 阅读难度:进阶

06. 项目管理进入 Agent 时代之后,会更像流程编排层

项目管理不会整体淡出团队,但信息同步、状态跟进和会议纪要整理这类环节会更早自动化。更有价值的部分,会逐渐转向流程编排、升级路径、依赖管理、人工接管点和例外治理。

  • 状态同步和信息搬运会更早自动化,但例外治理和依赖编排并没有变轻。
阅读全文
2026-03-19 09:00 北京时间 8 分钟 阅读难度:进阶

07. 当 Agent 开始读文档,文档会变成运行时上下文

文档不会因为生成式 AI 普及就失去价值,但那些「为了交付而交付」的说明书会更快商品化。更重要的文档,正在变成 Agent 和人共同消费的运行时上下文与约束层。

  • 低价值文档最容易被生成式 AI 商品化,高价值文档反而会因为 Agent 普及而更重要。
阅读全文
2026-03-19 09:00 北京时间 9 分钟 阅读难度:入门

08. AI 工具扩散之后,IT 部门会更像内部 AI 平台

IT 部门不会因为团队自助用 AI 工具就自然边缘化,先被压缩的更像是装机、开账号和工单分发这类旧式支持工作。接下来更重要的 IT,会更像内部 AI 平台、权限控制和治理团队。

  • 先被压缩的,是 helpdesk 型、工单搬运型 IT,而不是负责身份、权限和审计边界的人。
阅读全文
2026-03-16 03:35 北京时间 24 分钟 阅读难度:硬核

从实践到原则:Harness Engineering 的落地方法

Harness Engineering 要做的,是把代码仓库、执行环境、验证门禁和反馈回路改造成 Agent 可读、可控、可评估的工程系统,让 AI 能在真实项目里稳定交付。

  • Harness Engineering 的对象重点是 Agent 所处的整个工程执行环境与治理回路。
阅读全文
2026-03-15 20:38 北京时间 26 分钟 阅读难度:硬核

Pi 内部原理:从会话树到 RPC 接入

Pi 的核心并不神秘:它用 `createAgentSession()` 把模型、资源加载、工具集合、会话树和运行模式装配起来,再由 `AgentSession` 接管工具执行、上下文管理、自动压缩与 RPC 集成。

  • Pi 的核心抽象重点是 `AgentSession` 这层把状态、工具、扩展和模式统一起来的运行时。
阅读全文
2026-03-15 19:02 北京时间 更新:2026-03-31 19:10 北京时间 15 分钟 阅读难度:硬核

AI 时代的代码评审,还算 Review 吗

AI 已经能写代码、审代码,甚至自己在 PR 里给出修改建议;但如果 review 只剩「高吞吐检查」和形式签字,它就不再是软件工程里的真正 review。更值得追问的,是谁还真的看懂、敢签字、能补救。

  • AI code review 已经规模化进入工程流程,但「能给评论」不等于「能承担 review 的责任」。
阅读全文
2026-03-15 18:47 北京时间 14 分钟 阅读难度:硬核

从假引语到假代码:AI 正在逼近人类核验的极限

Ars Technica 的假引语风波真正警示的,不只是新闻业会被 AI 绊倒,而是当代码生成速度远超人类核验速度时,软件工程的责任链、风险边界和上线契约都需要重写。

  • 研究和行业调查已经显示,AI 代码产出增长得远快于人类核验能力,「验证债」正在形成。
阅读全文
2026-03-15 10:06 北京时间 15 分钟 阅读难度:进阶

机器上桌之后之六:Martin Fowler

在 AI Agent 时代,Martin Fowler 之所以仍然很重要,因为当生成变快、代理变多、系统边界更容易被穿透时,重构、边界划分、渐进式演化和技术判断反而比以前更像硬约束。

  • Martin Fowler 的重要性,在于他持续把复杂技术变化翻译成团队能执行的工程判断,而不只是抽象观点。
阅读全文
2026-03-15 10:05 北京时间 14 分钟 阅读难度:进阶

机器上桌之后之五:Guido van Rossum

AI Agent 时代如果有一种基础设施级的默认语言,几乎就是 Python;Guido van Rossum 依然重要,不只因为他创造了 Python,更因为他把可读性、演化节奏与工程现实捏成了稳定底座。

  • Guido van Rossum 在 Agent 时代的重要性,首先来自 Python 作为默认工程语言的持续统治力。
阅读全文
2026-03-15 10:04 北京时间 14 分钟 阅读难度:进阶

机器上桌之后之四:Kent Beck

如果说 AI 编程正在把代码生成这件事推到前所未有的速度上,那么 Kent Beck 之所以依然重要,是因为反馈回路、整洁设计和小步试错这些老办法,恰好是驾驭这种速度最可靠的刹车与方向盘。

  • Kent Beck 的方法在 AI 时代重新变重要,因为高速生成更需要快速反馈和小步验证。
阅读全文
2026-03-15 10:03 北京时间 15 分钟 阅读难度:进阶

机器上桌之后之三:Robert C. Martin

在 AI 越来越快地产生代码之后,Robert C. Martin 之所以仍值得重读,因为测试、边界、命名和职业责任这些老问题,正在被生成式工具重新放大。

  • Robert C. Martin 并非 AI 圈明星,却是 AI 写代码时代最容易被重新想起的老派工程人物之一。
阅读全文
2026-03-15 10:02 北京时间 15 分钟 阅读难度:进阶

机器上桌之后之二:Steve Yegge

如果说 AI 编程工具正在从补全器变成能拆任务、会写代码、会组织工作流的代理,那么 Steve Yegge 是最早一批把这条路讲清楚、写透并持续鼓动行业往前走的人。

  • Steve Yegge 的价值,在于他很早就把 AI 编程的方向感写成了行业语言。
阅读全文
2026-03-15 03:00 北京时间 更新:2026-03-31 19:10 北京时间 15 分钟 阅读难度:进阶

我如何在 48 小时里,从零打造自己的个人博客站

这 48 小时里,我搭起来的一套能长期写下去的个人母站:草稿在本地,发布可校验,内容能归档,也能继续分发到各个平台,后续写作不用再从零搭架子。

  • 这 48 小时搭起来的一套从草稿到上线都能完整流程运转的表达系统。
阅读全文
2026-03-15 02:54 北京时间 更新:2026-03-15 11:25 北京时间 18 分钟 阅读难度:进阶

编程 Agent 的基础结构:模型、工具、状态与验证完整流程

编程 Agent 是一套能围绕目标读取上下文、调用工具、执行步骤并根据结果继续推进的系统。把这条线看懂,模型、工具、状态和评测这些基础概念就会立刻落地。

  • 理解 Agent 的第一步,是先看清它和聊天、补全、工作流之间的边界。
阅读全文
2026-03-15 01:17 北京时间 26 分钟 阅读难度:进阶

Java 后端如何转向 AI Agent 工程

Java 后端转向 AI Agent,是把过去积累的系统边界感、异常经验和工具工程能力,重新组织成运行时、评测完整流程和治理能力,并把业务流程改造成可审计的执行系统。

  • Java 旧栈不会失效,它会重新定价成工具层、状态层、观测层和治理层能力。
阅读全文
2026-03-14 23:40 北京时间 更新:2026-03-31 18:30 北京时间 18 分钟 阅读难度:进阶

如何转成 AI Agent 工程师:一份基于最新研究的转型路线图

如果你还把 AI Agent 工程师理解成「更会写 Prompt 的人」,那大概率会转错方向。真正有价值的 Agent 工程,是把模型、工具、状态、评测和治理串成可交付系统能力。

  • 从官方实践到最新论文都在指向同一个结论:Agent 工程的核心是系统能力。
阅读全文
2026-03-14 21:30 北京时间 更新:2026-03-31 19:10 北京时间 16 分钟 阅读难度:进阶

SSE 不是 WebSocket 的退役通知,而是更好的默认值

「SSE 可以让 WebSocket 退役」这种说法,方向对了一半,但结论下得太满。更准确的判断是:在浏览器里的单向实时推送和文本流场景里,SSE 常常是更稳妥的默认值。

  • 对单向实时更新,SSE 通常比 WebSocket 更轻、更省心,尤其适合浏览器里的文本流。
阅读全文
2026-03-14 10:30 北京时间 更新:2026-03-31 19:10 北京时间 14 分钟 阅读难度:进阶

Agent 积累的是 Knowhow,不只是数据

Agent 的长期价值,主要来自持续沉淀任务拆解、工具调用、异常处理和验证标准这些可迁移的 knowhow,而不只是在数据和微调上继续加码。

  • Agent 的长期进步,更常来自工作流和验证完整流程不断变强,不只靠参数自己长出新能力。
阅读全文
2026-03-13 19:00 北京时间 更新:2026-03-31 18:30 北京时间 18 分钟 阅读难度:硬核

长时间 AI Agent:从研究叙事到生产系统

长时间 Agent 的真正难点,不在单步够不够聪明,而在跨很多轮、很多上下文和很多工具调用之后,能不能继续保持状态连续、结果可验证和错误可恢复。

  • METR 证明的是任务跨度能力在增长,不等于企业级稳定性已经成熟。
阅读全文
2026-03-13 18:30 北京时间 更新:2026-03-31 19:10 北京时间 22 分钟 阅读难度:硬核

长时间 AI Agent 生产架构蓝图

如果一个 Agent 要连续运行二十分钟、两小时甚至更久,系统默认该长什么样?这篇文章把分层架构、状态模型、检查点、验证和上线顺序全部拆开讲清楚。

  • 默认架构让 Orchestrator 调度很多短而可验证的小步骤。
阅读全文