先把问题换掉

如果问题是“中文前五、英文前五分别是什么”,答案很容易写成一张漂亮表格。但这张表格对真正学习 AI Agent 帮助不大。

原因很简单:AI Agent 还没有稳定成一门课程。它同时在四条线上变化。

一条是课程线。人们需要知道工具调用、检索增强生成、上下文工程、评测、编排框架怎么组合。

一条是工程线。真正的 agent 进到浏览器、终端、仓库、云沙箱和企业权限系统以后,会遇到依赖、身份、日志、成本、回滚、权限和长期任务管理。

一条是研究线。模型能力、强化学习、长上下文、记忆、推理、工具使用和多模态能力还在快速移动。

一条是产业线。OpenAI、Anthropic、Google DeepMind、微软、AWS、NVIDIA、创业公司和开源社区都在争不同入口。

这四条线目前主要用英文更新。中文内容当然有价值,但如果把中文 YouTube 硬凑成“前五”,很快会把质量线拉低。更稳的做法,是先用英文来源搭主骨架,再用少数中文频道补解释、补背景、补本土语境。

第一层:系统课程看 DeepLearning.AI

DeepLearning.AI 适合放在第一层,因为它解决的是“先把基本动作做对”。

AI Agent 的入门很容易被工具名带偏。LangChain、LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、MCP,每一个名字都能开一条学习线。但初学者真正需要先搞清楚的是几个基本问题:

  • agent 什么时候只是 workflow,什么时候真的需要自主循环
  • 工具调用失败后怎么重试、降级和交给人
  • 检索、记忆、上下文窗口和外部状态分别放在哪里
  • 如何评估一个 agent 是否真的完成任务
  • 多步骤任务怎样拆成可观察、可回放、可控制的运行链路

DeepLearning.AI 的优点是结构化。它不会给你最多八卦,也不会第一时间追所有新项目,但适合做第一轮地基。看完之后,再去看会议演讲和访谈,很多词会变得更清楚。

建议从 Agentic AI、LangGraph、RAG、evaluations 相关课程看起。不要追求一口气看完所有课。先挑一个能自己跑起来的小项目,把 tool use、状态管理和评测串起来,比连续刷十个课程标题更有用。

第二层:工程现场看 AI Engineer

如果 DeepLearning.AI 是课桌,AI Engineer 更像施工现场。

这里最值得看的地方,不在某一条单独视频,而在它把一线开发者、框架作者、基础设施团队和创业公司拉到同一个场子里。MCP、SWE agents、reasoning、RL、代码 agent、agent runtime、评测和部署细节,都会以演讲和 panel 的方式出现。

这类内容的价值在于,它能暴露课程里不容易出现的问题。

课程会讲 agent 如何调用工具。工程现场会讨论工具描述如何被注入、权限如何隔离、沙箱如何控制、长期任务如何恢复。

课程会讲多 agent 协作。工程现场会让人看到,很多所谓多 agent 问题其实是队列、锁、状态同步、日志追踪和停止条件问题。

课程会讲评测。工程现场会逼你承认,真实 agent 的评测很难只有一个分数。浏览器任务、终端任务、代码任务、文档任务和企业系统任务,很可能需要完全不同的基准。

所以 AI Engineer 适合在看完基础课程后再看。它更适合校正判断,而不是承担入门教学。你会更快知道,一个工具是真在解决工程问题,还是只是把 demo 包装成平台叙事。

第三层:AI 工程访谈看 Latent Space

Latent Space 适合长期订阅,尤其适合关注 AI coding、Agent、模型平台和开发者工具的人。

它的强项不在逐段讲论文,而在把“谁在做什么、为什么这么做、产品和工程约束在哪里”问出来。比如代码 agent、后台 agent、Anthropic 的本地优先 agent、agent cloud、企业里的 AI coworker,这些话题单看官方发布通常只能看到包装,放到长访谈里会露出更多真实取舍。

看 Latent Space 时,不要只记嘉宾观点。更值得留意的是嘉宾反复避开的地方。

一个创业者说 agent 可以替代某类工作,要看他是否解释了交付边界、失败处理、权限控制和客户验收。

一个基础设施团队说自己在做 agent runtime,要看它到底管理的是计算环境、工具协议、状态记录,还是只是把 API 调用包成任务队列。

一个开发工具公司说效率提升多少倍,要看提升发生在 demo、个人项目、企业仓库,还是真实多人协作代码库。

Latent Space 的价值正在这里。它能把发布稿里的形容词拆回工程约束。

第四层:人物深访看 Dwarkesh 和 No Priors

如果只看短视频,很容易把 AI 行业理解成模型发布节奏。真正影响方向的,往往是少数研究者、创始人和投资人对未来三到五年的判断。

Dwarkesh Patel 适合看重访谈质量的人。Ilya Sutskever、Andrej Karpathy、Richard Sutton 这类嘉宾,本身就处在关键技术路线分歧上。长访谈里的价值不在新闻点,而在他们如何组织问题。

Ilya 讲 research age,重点不止是 scaling 到底还够不够,也包括下一阶段模型能力来自哪里。Sutton 讲强化学习和经验,真正有用的部分是他如何反驳当下 LLM 路线的局限。Karpathy 讲 coding agent 和 loopy era,值得看的是他怎样把人、模型、工具和反馈环放在一个系统里。

No Priors 更偏创业、产品和技术商业化。它适合补另一种视角:AI 公司如何进入行业、如何卖给客户、如何从工具变成工作流、如何在垂直场景里拿到数据和分发。

这两类访谈都不适合倍速扫完。最好拿着一个问题去看:这个人到底相信哪条路线?他的判断边界是什么?如果他错了,会错在哪里?

第五层:底层直觉看 Karpathy

Andrej Karpathy 的频道更新不密集,但每条都值得放进长期学习路径。

很多 AI Agent 的讨论会直接跳到“下一代软件形态”。这很容易让人忘记一个基础事实:agent 的表现首先受制于语言模型本身的能力、上下文处理方式、训练过程和推理习惯。

Karpathy 的长讲座适合补这一层直觉。看完 Deep Dive into LLMs,再看各种 agent 框架,很多问题会变得更具体:

  • 为什么同一个 prompt 在不同任务里表现不稳定
  • 为什么上下文越长不等于记忆越好
  • 为什么代码 agent 需要测试、反馈和回放,不能只依赖更强模型
  • 为什么人的角色会从逐行写代码,转向搭环境、写约束、审结果和做验收

Karpathy 的内容不一定给出最新工具清单,但能帮你少被工具清单牵着走。

第六层:快速概念补课看 IBM Technology

IBM Technology 的定位可以简单一点:它是概念速查,不承担深度研究。

如果你刚遇到一个词,比如 agentic AI、multi-agent systems、RAG、vector database、LLM architecture、model governance,可以先用 IBM 的短解释建立初步坐标。它的好处是表达清楚,结构稳定,适合在正式看课程或论文前扫盲。

但它不适合替代深度来源。一个概念视频能告诉你 multi-agent 大致是什么,却不会真正回答多 agent 系统为什么会在真实任务里失控,也不会帮你判断什么时候根本不该用多 agent。

用法很简单:碰到陌生概念,先看 IBM Technology。概念清楚后,马上回到课程、工程演讲或长访谈。

第七层:行业判断看 Sequoia 和 Lex Fridman

Sequoia Capital 的 AI 内容适合看商业化和创业叙事。Karpathy 谈 agentic engineering、Anthropic 工程负责人谈代码、Demis Hassabis 谈 AGI,这类内容都不只是访谈,也是风向标。

这里要带着一点防御心看。投资机构的内容天然会放大机会、压低不确定性。它们很适合看“市场正在如何讲故事”,但不适合直接当技术结论。

Lex Fridman 的长访谈更适合偶尔看重量级人物和大主题。比如模型能力、scaling laws、中国 AI、GPU、AGI、安全、自动驾驶。它的优点是覆盖大,缺点是单集很长,信息密度不稳定。

这两类来源可以放在低频层。每周追课程和工程内容,每月挑一两条 Sequoia 或 Lex 的长访谈,看行业叙事有没有发生转向。

中文来源怎么用

中文 YouTube 不建议硬凑成五个同等优先级来源。质量最高、最稳定的用途,是补三类内容。

第一类是课程。李宏毅的生成式 AI 和 AI Agent 相关课程值得看。它的优势是教学能力强,能把 Agent、上下文工程、模型内部机制讲得比较完整。对中文读者来说,这是很好的入门和复习材料。

第二类是行业背景。硅谷101适合看 AI 公司、DeepMind、世界模型、机器人、DeepSeek、创业公司和产业叙事。它不是纯技术课,更像一条理解人、公司、资本和技术路线关系的辅助线。

第三类是资讯入口。机器之心适合追论文、模型和国内外 AI 热点。这里要把它当入口,不要当终点。看到一个论文或模型新闻,最好继续回到论文、项目页、官方博客或英文访谈核对。

这三类中文来源都值得保留,但它们不应该替代英文主信息流。尤其是 AI Agent 这种还在快速移动的方向,中文内容经常会慢半拍,或者把英文发布、社区讨论和论文结论压缩成二手摘要。

一条实际观看路线

如果从零开始,可以按这个顺序来,不必同时订阅十几个频道。

第一步,看 DeepLearning.AI。目标是把 tool use、RAG、evaluation、workflow 和 agent loop 跑通。

第二步,看 Karpathy。目标是补 LLM 的底层直觉,知道模型为什么会这样工作,也知道 agent 的上限和不稳定性来自哪里。

第三步,看 AI Engineer。目标是看到真实工程约束,尤其是 MCP、SWE agent、runtime、sandbox、eval 和部署。

第四步,看 Latent Space。目标是跟上 AI 工程师社区正在争的具体问题,少被官方发布牵着走。

第五步,看 Dwarkesh 或 No Priors。目标是理解关键人物和公司到底押注哪条路线。

第六步,用 IBM Technology、Sequoia、Lex Fridman 和中文频道补缺口。概念不清时查 IBM,产业叙事看 Sequoia 和 Lex,中文语境看李宏毅、硅谷101和机器之心。

这条路线的好处是,它不会把学习变成追热点。课程负责打底,Karpathy 负责底层直觉,AI Engineer 负责工程现实,Latent Space 负责社区现场,Dwarkesh 和 No Priors 负责人物判断。其他来源只补缺,不抢主线。

最后保留一个筛选标准

AI 内容会越来越多,订阅列表很快会膨胀。真正需要保留的频道,应该至少满足一个条件:它能改变你的判断或改变你的做法。

只给新闻,不给判断的,可以少看。

只讲愿景,不讲约束的,可以少看。

只展示 demo,不解释失败边界的,可以少看。

只复述论文标题,不回到实验、数据和限制的,可以少看。

长期看 AI Agent,目的不是知道今天又多了哪个框架。更重要的是更快判断:这个东西能不能进真实任务,成本在哪里,失败后谁负责,怎么验证,怎么长期维护。

按这个标准筛一遍,订阅列表会短很多,学习质量反而会高很多。