为什么 2025 下半年突然像换了范式｜Karpathy 年度回顾摘译

返回文章列表

技术沉淀 AI 编程 AI Agent

Feature Essay

为什么 2025 下半年突然像换了范式｜Karpathy 年度回顾摘译

很多人都感觉 2025 下半年开始，AI 编程和 Agent 的体感突然变了，但说不清是哪里变了。这篇的价值就在于，它把模型、推理和应用层的变化拧成了一张能解释现实工作流的图。

2026-03-20 18:50 北京时间 7 分钟难度：进阶

66 阅读 0 点赞

快速答案

Karpathy 这篇复盘最重要的贡献，是把 2025 年的变化从零散新闻压成几条改变工作流的线：RLVR、test-time compute、代码与数学等可验证任务，以及 Cursor、Claude Code 这类产品形态。

2025 年的重要性在训练、推理和应用层开始一起咬合。
RLVR 和可验证任务，让代码与数学继续成为模型能力最快兑现的场景。
从聊天框到 agent 工作流，体感变化来自底层条件真的换了一档。

Karpathy 在复盘哪几条真正变硬的主线

Karpathy 这篇年终回顾最有价值的地方在于把 2025 年改变格局的几条线索压成了少数几个关键词。你会看到他反复回到 RLVR、test-time compute、代码与数学场景、agent 产品形态，以及 vibe coding 对生产方式的冲击。

它等于在回答一个经常被说得很模糊的问题：为什么很多人都觉得 2025 年下半年开始，AI 编程和 Agent 编程突然像换了范式？Karpathy 给出的解释，重点是几条条件开始同时咬合。

我会留下的五个判断

变化重点是训练方式、推理方式和应用形态开始一起变，形成了更强的复合效应。
RLVR 和各类可验证奖励，让代码和数学这类任务继续成为模型能力兑现最明显的场景。
更长的推理链和 test-time compute，让模型在复杂任务上的行为不再只是「更会答题」，而更像「能推进一段过程」。
Cursor、Claude Code 这一层产品形态说明，模型价值正在更多地通过工作流和系统包装进入普通开发者日常。
vibe coding 的流行在提示软件生产方式已经发生位移，尽管位移的质量仍然取决于反馈和验证。

这篇复盘今天为什么仍有用

这篇很适合拿来更新系统假设。你不需要每周追所有新模型，但需要知道哪些变化已经足够稳定地进入工作流。比如上下文更长、推理更强、工具调用更顺，这些条件组合起来后，应用层就不再只是「问一句答一句」。

对团队来说，这也意味着评估工具时不能只看 benchmark，要看它是否真的能读上下文、推进任务、留下可检查的过程，并把失败风险控制在可接受范围里。Karpathy 这篇的价值，在于帮你把下注前该看的变量重新排好顺序。

说明

这页是基于原文的中文摘译与导读，不是官方全文翻译。关键表述和细节请以原文为准。

更新附注

版本：v1.1

更新日期：2026-04-02 更新原因：纳入全站文本风格整改的 digest 首批，重写标题、首屏字段与中段结构，减少「年终综述模板」口吻，把文章收束为几条改变工作流的主线。

参考来源

Andrej Karpathy: 2025 LLM Year in Review

还没有评论，你可以写下第一条。

继续阅读

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-04-11 12:10 北京时间 11 分钟同主题：AI Agent 等 3 个标签

Hermes 安装指南：macOS 和 Windows 怎么装

Hermes 不难装。macOS 直接跑官方安装器，Windows 先装 WSL2 再按 Linux 路线装。装完别先闲聊，先用并行读仓库和定时任务两个例子，看看它适不适合你。

2026-04-09 00:20 北京时间 20 分钟同主题：技术沉淀等 3 个标签

把多窗口 AI 工作流重构成单一控制面

需要重构的重点是项目控制层。多窗口同时写文章没有错，问题在于写作、主干集成、部署和恢复过去没有被放进同一套状态机里管理；而且这套控制面现在已经开始落成具体脚本和状态文件。

2026-04-07 21:22 北京时间 17 分钟同主题：技术沉淀等 3 个标签

GSD2 和 OMX 怎么选：两套 AI 编程工作流的分水岭

GSD2 在管项目，OMX 在管 Codex。两边都能做长任务，但不在同一层：一个更像执行内核，一个更像编排外挂。把它们看成同一层工具，后面基本都会用错。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-05-29 21:35 北京时间 12 分钟编辑精选

下一篇 最后一篇

阅读难度

进阶

信息密度适中，适合连续阅读。

要点

2025 年的重要性在训练、推理和应用层开始一起咬合。
RLVR 和可验证任务，让代码与数学继续成为模型能力最快兑现的场景。
从聊天框到 agent 工作流，体感变化来自底层条件真的换了一档。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

为什么 2025 下半年突然像换了范式｜Karpathy 年度回顾摘译

快速答案

Karpathy 在复盘哪几条真正变硬的主线

我会留下的五个判断

这篇复盘今天为什么仍有用

说明

更新附注

参考来源

评论（0）

继续阅读

同主题延伸

Hermes 安装指南：macOS 和 Windows 怎么装

把多窗口 AI 工作流重构成单一控制面

GSD2 和 OMX 怎么选：两套 AI 编程工作流的分水岭

编辑精选

Git 入门：先看懂版本、分支和协作

TerminalWorld：终端 Agent 评测不能只靠人造题

Agentic CLEAR：只做可观测还不够，Agent 需要解释型评测