长文库

技术、行业、人物与 Agent 系统观察。

Latest Archive

大模型

大模型 时间线。

2026-05-25 00:38 北京时间 15 分钟 阅读难度:进阶

AMD 现在的关键问题:还能不能从二供变成 AI 平台

AMD 现在不是简单的「英伟达二供」故事。Q1 2026 财报、OpenAI 和 Meta 的 6GW 合作、Helios 机架平台和 MI450 路线,说明它正在争取从芯片供应商变成 AI 基础设施平台。

  • Q1 2026 数据中心收入 57% 增长,AMD 的主叙事已经从 PC 转向 AI 基础设施。
阅读全文
2026-05-24 23:44 北京时间 15 分钟 阅读难度:硬核

运营商卖 Token,国内 AI 计费会怎么变

我看好运营商卖 Token 的企业侧影响,不看好它短期变成大众像买流量一样主动购买的消费品。真正机会不在低价词元包,而在把 AI 调用做进企业账单、办公应用、政企服务和成本管理。

  • 普通用户买的是 AI 搜索、写作、总结、办公助手等具体权益。
阅读全文
2026-04-04 20:13 北京时间 14 分钟 阅读难度:进阶

Gemma 4 本地部署与型号选择指南

如果你关心的是 Gemma 4 能不能在自己机器上稳定跑起来,而不是排行榜又赢了谁,结论很简单:31B 代表上限,26B A4B 是最值得部署的均衡版本,E4B 和 E2B 则把轻量本地模型推进到了真正可用的一档。

  • Gemma 4 26B A4B 是这代最值得评估的型号,质量、延迟和本地硬件门槛最平衡。
阅读全文
2026-04-03 18:39 北京时间 12 分钟 阅读难度:硬核

光纤代替内存?这不是今天的新闻,也还不是 AI 硬件革命

「32TB/s、光纤代替 DRAM、AI 硬件要变天」这串说法的底层算术并不荒唐,但它更像一个顺序流式缓存脑洞,而不是通用内存替代方案。值得追踪的变化,是光互连、CXL 内存池化和 photonic fabric 正在重写内存层级。

  • 所谓「32TB/s」主要来自 256Tb/s 光链路的线速换算,算术成立,但不等于获得了可随机访问的通用内存。
阅读全文
2026-04-03 17:28 北京时间 16 分钟 阅读难度:硬核

2026 年看 Agent 与大模型,还没做完的六件事

到 2026 年 4 月,主流产品已经把推理、工具调用、短期记忆和基础 Agent 形态做成标配,但决定下一代能力上限的几块底盘仍未完成:算力分配、验证器、持续记忆、长时程执行、长上下文工作记忆与可验证推理。

  • 更长的思考时间已经商品化,但「把额外算力稳定转成成功率」仍然没有被产品层彻底解决。
阅读全文
2026-03-21 10:35 北京时间 20 分钟 阅读难度:进阶

想建立 2026 年 AI 判断,先别只追新闻

先挑出那些三个月后仍会重写你判断的原文。这 10 篇博客覆盖 Agent 定义、评测偏差、软件工程、推理路线、系统安全和 Agent 公司结构这几条关键线。

  • 这十篇里最重要的是它们分别重写了 Agent 定义、评测方法和工程边界。
阅读全文
2026-03-21 10:30 北京时间 18 分钟 阅读难度:入门

近期最值得看的 10 场 AI 播客与 YouTube 访谈

如果你只想补最近一轮 AI 讨论里最有信息密度的 10 场播客与 YouTube 访谈,这份清单足够覆盖模型、Agent、评测、编码、世界模型、机器人和 AI for Science 这几条主线。

  • 最值得补的重点是能解释 2026 年技术与产业分岔点的长访谈。
阅读全文
2026-03-20 00:30 北京时间 10 分钟 阅读难度:进阶

xAI 到底是不是一家独立的 AI 公司

把独立 AI 公司理解为产品入口、数据来源、资本边界和组织边界都相对清楚的主体,xAI 就从来不是那种公司。它确实有模型、API 和超算,但更像马斯克商业体系里的 AI 中枢,而不是边界稳定的独立公司。

  • xAI 不是空壳:它有 Grok、公开 API、独立应用和 Colossus 超算,这些能力都是真实存在的。
阅读全文
2026-03-19 22:14 北京时间 16 分钟 阅读难度:入门

张小珺技术解读地图:DeepSeek、Agent 与 VLA

如果前几篇张小珺系列文章是在看谁坐在哪张桌上,这一篇要解决的是另一件事:当你想补上她节目里最有价值的技术背景板,应该先听哪几期、按什么顺序、每一摞节目到底解决什么问题。

  • 这条线和人物深访不是同一类内容:前者给你人物处境,后者补技术地板,两者合起来才是完整的时代切面。
阅读全文
2026-03-19 17:10 北京时间 22 分钟 阅读难度:入门

从张小珺的 AI 深访里,看清中国大模型创业到底在争什么

把杨植麟、王小川、李开复几场最关键的对谈放在一起看,会发现中国大模型创业争的重点是 AGI 北极星、技术与场景的咬合、推理成本和产品入口怎样同时成立。

  • 杨植麟把问题拉回长期主义:用户规模和模型规模要一起扩张,应用重点是验证 AGI 路线的必要环节。
阅读全文
2026-03-19 16:35 北京时间 24 分钟 阅读难度:硬核

中国大厂 AI 最近 70 天:入口、执行权与控制面的重新分配

今年一季度国内大厂的 AI 动作已经从「发模型」转向「抢位置」:阿里推进执行系统,腾讯卡住微信分发链,百度稳技术与云,字节加速 Agent 产品化,华为下探网络与运维控制面。

  • 阿里正把千问从聊天入口往任务执行器推进,目标直指更长的服务调度链。
阅读全文
2026-03-16 13:26 北京时间 18 分钟 阅读难度:硬核

OpenJarvis 与端侧 AI 的未来五年

端侧大模型下一阶段的核心变化,重点是智能效率、统一内存、带宽、功耗和软件栈一起成熟;未来 1 年先吃下单轮助手与轻代理,3 年进入持续多模态,5 年才接近个人本地 AI 系统。

  • 端侧大模型的约束已经是智能效率、内存容量、带宽、功耗和软件协同的组合瓶颈。
阅读全文
2026-03-16 04:20 北京时间 8 分钟 阅读难度:入门

公司小传:六家关键 AI 公司的六条路线

这组公司小传重点是借六种不同公司形态拆开今天产业竞争结构:谁做模型,谁做科学发现,谁把安全当主轴,谁握住工作入口,谁押注开放生态,谁提供算力底盘。

  • 这组文章的重点落在六家公司各自代表的产业路线和组织选择上,不在公司八卦。
阅读全文
2026-03-16 03:42 北京时间 12 分钟 阅读难度:入门

公司小传之一:OpenAI 的三次变身

OpenAI 过去十年的关键是三次改写公司边界:从研究实验室,到用户入口,再到主动组织 AI 基础设施,并把自己推向产业总枢纽,成为模型、开发者和算力之间的连接点。

  • OpenAI 的关键转折,落在 2019、2020、2022 和 2025 这几次组织与商业形态切换上。
阅读全文
2026-03-16 03:15 北京时间 15 分钟 阅读难度:入门

Mustafa Suleyman 与 AI 入口之争

Mustafa Suleyman 最值得写的,不在他待过哪些公司,而在他始终在争同一件事:AI 该以什么姿态进入人的日常和工作。到了微软,这条路线已经从 AI companion 一路推进到企业工作流与 Agent 治理层。

  • Mustafa 的独特性在于,他是在长期围绕「AI 入口关系」做产品与组织选择。
阅读全文
2026-03-16 03:14 北京时间 15 分钟 阅读难度:进阶

塑造 AI 时代之五:Mira Murati 与协作式前沿 AI

Mira Murati 最值得写的是她长期站在研究、产品与发布节奏的交汇处;创办 Thinking Machines Lab 后,她押注的是更可理解、更可定制、更能协作的前沿 AI。

  • Mira 的关键价值,在于长期处在「研究能力如何长成产品体验」的接口位置,这比单纯的技术或运营角色更稀缺。
阅读全文
2026-03-16 03:13 北京时间 14 分钟 阅读难度:入门

塑造 AI 时代之四:Ilya Sutskever 与单目标组织

Ilya Sutskever 今天最值得写的,不在传奇履历,而在他对组织形式的极端选择:SSI 几乎把公司、产品和商业压力都压缩成一个目标。这并非摆姿态,而是他对超级智能问题的回答。

  • Ilya 的独特性不只是重视安全,而是把公司目标、产品定义与激励结构都收缩到单一终局上。
阅读全文
2026-03-16 03:12 北京时间 15 分钟 阅读难度:进阶

塑造 AI 时代之三:Dario Amodei 与部署安全

Dario Amodei 最容易被误读成「安全派」,但更准确的说法是,他是把强大 AI 视为近程现实的部署现实主义者:既相信能力会快速逼近,也坚持把可解释性、组织纪律和社会治理提前写进公司运行方式,而不是等出事后再补一份道歉声明。

  • Dario 的独特性不在保守,而在于他对强大 AI 到来的预设本身就很激进,因此才要求安全和部署纪律前置。
阅读全文
2026-03-16 03:11 北京时间 更新:2026-04-04 10:51 北京时间 16 分钟 阅读难度:进阶

Sam Altman 在把 AGI 做成基础设施工程

Sam Altman 最值得写的,是他把 AGI 从宏大叙事压成了算力、能源、资本、开发者生态与全球伙伴关系同时开工的超大基础设施工程系统。

  • Sam 的核心能力,在于把算力、资本、伙伴、政策和开发者生态捆成一场基础设施战争。
阅读全文
2026-03-16 03:10 北京时间 15 分钟 阅读难度:入门

塑造 AI 时代之一:Demis Hassabis 与科学机器

Demis Hassabis 今天最值得写的,早已不止 AlphaGo 或诺奖;关键的是,他一直在把 AI 从「会赢的系统」推进成「会做科学的机器」。如果这条路走通,AI 时代最深的入口可能是实验室。

  • Demis 的主线始终围着同一件事:把智能系统持续推进成科学研究的生产力工具。
阅读全文
2026-03-15 17:24 北京时间 更新:2026-03-31 18:30 北京时间 16 分钟 阅读难度:硬核

谁在塑造 AI 时代:6 位关键掌门人与三条分叉路线

今天前沿 AI 的主导权,已经从单看模型分数,变成同时看科学突破、算力基建、产品入口与安全治理;Demis、Sam、Dario、Ilya、Mira、Mustafa,正分别卡在这几条最关键的链路上。

  • 这六个人分别卡住了科学突破、平台分发、安全路径与产品入口,所以比一般 CEO 更值得写。
阅读全文
2026-03-15 01:16 北京时间 22 分钟 阅读难度:进阶

Opus 4.6 vs GPT-5.4:主力模型怎么选

如果今天只能为团队选一个主力模型,我的结论是:追求完整产品化能力,优先看 GPT-5.4;追求长时编码和持续执行,Opus 4.6 依然最锋利;追求激进多模态和 benchmark,Gemini 3.1 Pro 是最大变量。

  • GPT-5.4 的看点不只是模型升级,而是 OpenAI 把 agent 平台能力正式收口成产品。
阅读全文