在原生 Windows 上,重搭 AI 编程命令行栈
一次原生 Windows 命令行整治记录:把 PowerShell、PATH 和 UTF-8 的反复故障,收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。
- 原生 Windows 下,PowerShell 适合系统管理,不适合承担高频中文文本处理主流程。
这里汇总的是 Freelemon 的长文。现在列表页不再只有单一时间线,而是把搜索、标签和专题阅读放到同一层里: 技术沉思 偏系统、方法与工程判断, 访谈 偏一手观点整理与人物表达, 行业观察 偏竞争格局、平台变化与商业判断。
Latest Archive
这里保留 软件工程 标签下的时间线。专题区负责导读,这里负责完整归档和顺序回看。
一次原生 Windows 命令行整治记录:把 PowerShell、PATH 和 UTF-8 的反复故障,收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。
Memoir 把长期上下文单独拎出来做,关心的是项目常识怎么跨会话、跨工具继续带着走。
Coasts 把依赖、端口、网络和共享服务这些平时埋在脚手架里的问题直接摆到了产品正面。
Zig 最近总被拿来讨论“重写旧工具”,因为它把语言、编译器、交叉编译、C 互操作和构建系统捆成了一套更完整的底层工具链,让很多旧原生工具第一次值得重做。
3 月底这批新材料真正补上的,是 AI 编程背后的 harness。测试集、浏览器里的 ground truth、用途隔离、日志和回滚边界,正在重新决定哪些任务能稳稳交给 AI。
团队真正需要的不是“尽量多把活扔给 AI”,而是一套能按风险、可验证性和学习价值来分工的方法。研发协作的关键,不在全信或全禁,而在于给不同任务安排不同的人机关系。
AI 已经改写了编码、测试和局部修复这些实现层工作,很多团队也真实感受到了提速,但软件复杂性没有一起消失。系统边界、组织协作和长期演化,仍然决定大多数难题。
关于 AI 是否替代软件工程师,真正麻烦的不在答案太极端,关键在于证据来自不同层面。能力、采用、岗位和组织四条线并不总是同向移动,眼下更像一场分层推进,而不是一次整齐替代。
与 Agent 协作时,最关键的不是把提示词越写越细,而是先判断任务是否落在它的能力边界内,再决定该放手、补足,还是拆解。真正拉开效果差距的,是边界判断、任务粒度、验证机制和干预时机。
Karpathy、Yegge 与 Peter Steinberger 指向的,是软件工程分工的上移:代码生成更便宜后,规格、验证、门禁、回滚和长期维护变成更稀缺的环节。变化的核心是责任位置重排。
QVeris 更像能力发现与统一执行层,LangChain、LangGraph 和 Deep Agents 则分别落在 framework、runtime 和 harness。把它们写成同类替代品,会直接讲乱技术栈边界。
自进化 agent 听上去像终局叙事,但当前研究真正提供的,更多是一张问题地图:评估如何设计、反馈如何形成、记忆怎样约束、改进怎样不失控。地图重要,胜利尚早。
Swarms 的吸引力在于它不满足于单个 agent,而是试图把多 agent 策略批量化、模块化、产品化。但一旦走向工厂化,复杂度、调试成本和可靠性问题也会同时放大。
OxyGent 想解决的不是再造一个会聊天的 agent,而是多 agent 协作一旦进入长链路任务,状态、扩展性和系统稳定性如何一起成立。可伸缩性不是锦上添花,而是底盘前提。
crewAI 值得看的地方,不是把多 agent 说得更宏大,而是把角色分工、任务编排和流程可见性收回到工程可执行的范围。它代表的是多 agent 从演示叙事向工作流产品的回落。
并行 agent 的难点,不在再多开几个模型窗口,而在任务拆分、依赖协调、结果合并与失败回收。Agent Orchestrator 的价值,是把这些后勤工作从演示效果推进成可持续工程。
做知识库最容易犯的错误,不是漏掉几条信息,而是把所有信息都当知识留下来。真正值得长期保留的,不是“今天重要”的内容,而是 30 天后、90 天后还能支持判断、设计和行动的内容。
对认真独立建站的博主来说,真正缺的往往不是再多一个博客程序,而是一套能同时承接采集、生成、审计、发布、主题切换和运维的内容操作系统。WordPress 和 Hexo 很成熟,但它们主要解决的仍是上一代建站问题。
AI 时代的程序员面试,答案不该停留在“我会写提示词”。更有区分度的,是看候选人能不能把 AI 放进明确的任务边界、验证闭环和责任链里。下面这篇把前一篇 10 道题,进一步拆成优秀回答、中等回答和危险信号。
如果代码越来越多由 AI 生成,面试就不该再把重点放在徒手写实现,而该转向任务定义、上下文组织、验证闭环和责任承担。下面这 10 道题,适合直接拿来面试允许使用 AI 的程序员候选人。
如果你最近也在一边用 AI 写代码,一边又担心自己只是更快地试错,这篇文章想看的正是 4 种更稳的方向:Karpathy 讲学习,Simon 讲工程,Jeremy 讲主动权,swyx 讲生态与组织。
Agent 不是只改变个人怎么写代码,它也在改团队怎么协作。swyx 这篇最值得翻出来的地方,是它把“少人团队为什么会越来越能打”讲成了一套组织问题,而不只是技术问题。
AI 可以让写代码更快,但如果你把“更快”理解成“我可以不理解”,最后只会把自己带进更脆弱的软件和更浅的能力。Jeremy Howard 这篇最值得翻成中文的地方,是把“用 AI 还要不要讲基本功”说得非常具体。
这组文章追踪的不是哪类岗位会被 AI 整批替代,而是软件组织里的责任链会如何被重排:哪些执行环节变轻,哪些判断权上移,哪些角色会因为 Agent 变强而重新变贵。
产品经理这类岗位短期更像是在换重心,而不是被整体替代。需求文档、调研摘要和会议纪要会更容易自动化,但成功定义、边界处理和取舍判断会变得更重要。
测试工程师不会因为 AI 更会生成用例就自然淡出团队,先变化的更像是测试岗位里的重复执行层。越往前走,测试越会靠近评测工程、verifier 设计、安全边界和放行规则。
架构师的工作不会因为 AI 更会写代码就自然缩小,真正被重新筛选的,是只停留在图纸层、不碰运行细节的那种工作方式。Agent 时代更稀缺的,是能设计状态、协议、权限和运行边界的人。
项目管理不会整体淡出团队,但信息同步、状态跟进和会议纪要整理这类环节会更早自动化。更有价值的部分,会逐渐转向流程编排、升级路径、依赖管理、人工接管点和例外治理。
文档不会因为生成式 AI 普及就失去价值,但那些“为了交付而交付”的说明书会更快商品化。更重要的文档,正在变成 Agent 和人共同消费的运行时上下文与约束层。
IT 部门不会因为团队自助用 AI 工具就自然边缘化,先被压缩的更像是装机、开账号和工单分发这类旧式支持工作。接下来更重要的 IT,会更像内部 AI 平台、权限控制和治理团队。
Harness Engineering 不是给 Agent 多接几个工具,而是把代码仓库、执行环境、验证门禁和反馈回路改造成 Agent 可读、可控、可评估的工程系统,让 AI 真正能在真实项目里稳定交付。
Pi 的核心并不神秘:它用 `createAgentSession()` 把模型、资源加载、工具集合、会话树和运行模式装配起来,再由 `AgentSession` 接管工具执行、上下文管理、自动压缩与 RPC 集成。
AI 已经能写代码、审代码,甚至自己在 PR 里给出修改建议;但如果 review 只剩“高吞吐检查”和形式签字,它就不再是软件工程里的真正 review。更值得追问的,是谁还真的看懂、敢签字、能兜底。
Ars Technica 的假引语风波真正警示的,不只是新闻业会被 AI 绊倒,而是当代码生成速度远超人类核验速度时,软件工程的责任链、风险边界和上线契约都需要重写。
在 AI Agent 时代,Martin Fowler 之所以仍然很重要,不是因为他代表旧时代的架构教科书,而是因为当生成变快、代理变多、系统边界更容易被穿透时,重构、边界划分、渐进式演化和技术判断反而比以前更像硬约束。
AI Agent 时代如果有一种基础设施级的默认语言,几乎就是 Python;Guido van Rossum 依然重要,不只因为他创造了 Python,更因为他把可读性、演化节奏与工程现实捏成了稳定底座。
如果说 AI 编程正在把代码生成这件事推到前所未有的速度上,那么 Kent Beck 之所以依然重要,是因为反馈回路、整洁设计和小步试错这些老办法,恰好是驾驭这种速度最可靠的刹车与方向盘。
在 AI 越来越快地产生代码之后,Robert C. Martin 之所以仍值得重读,不是因为他代表过去,而是因为测试、边界、命名和职业责任这些老问题,正在被生成式工具重新放大。
如果说 AI 编程工具正在从补全器变成能拆任务、会写代码、会组织工作流的代理,那么 Steve Yegge 是最早一批把这条路讲清楚、写透并持续鼓动行业往前走的人。
这 48 小时里,我真正搭起来的不是一个会发文章的页面,而是一套能长期写下去的个人母站:草稿在本地,发布可校验,内容能归档,也能继续分发到各个平台。
编程 Agent 不是更会聊天的聊天框,而是一套能围绕目标读取上下文、调用工具、执行步骤并根据结果继续推进的系统。把这条线看懂,模型、工具、状态和评测这些基础概念就会立刻落地。
Java 后端转向 AI Agent,并不是从零改行,而是把过去积累的系统边界感、异常经验和工具工程能力,重新组织成运行时、评测闭环和治理能力。
如果你还把 AI Agent 工程师理解成“更会写 Prompt 的人”,那大概率会转错方向。真正有价值的 Agent 工程,是把模型、工具、状态、评测和治理串成可交付系统能力。
“SSE 可以让 WebSocket 退役”这种说法,方向对了一半,但结论下得太满。更准确的判断是:在浏览器里的单向实时推送和文本流场景里,SSE 常常是更稳妥的默认值。
Agent 的长期价值,主要来自持续沉淀任务拆解、工具调用、异常处理和验证标准这些可迁移的 knowhow,而不只是在数据和微调上继续加码。
长时间 Agent 的真正难点,不在单步够不够聪明,而在跨很多轮、很多上下文和很多工具调用之后,能不能继续保持状态连续、结果可验证和错误可恢复。
如果一个 Agent 要连续运行二十分钟、两小时甚至更久,系统默认该长什么样?这篇文章把分层架构、状态模型、检查点、验证和上线顺序全部拆开讲清楚。