长文库

技术、行业、人物与 Agent 系统观察。

Latest Archive

模型评测

模型评测 时间线。

2026-04-04 20:13 北京时间 14 分钟 阅读难度:进阶

Gemma 4 本地部署与型号选择指南

如果你关心的是 Gemma 4 能不能在自己机器上稳定跑起来,而不是排行榜又赢了谁,结论很简单:31B 代表上限,26B A4B 是最值得部署的均衡版本,E4B 和 E2B 则把轻量本地模型推进到了真正可用的一档。

  • Gemma 4 26B A4B 是这代最值得评估的型号,质量、延迟和本地硬件门槛最平衡。
阅读全文
2026-03-15 01:16 北京时间 22 分钟 阅读难度:进阶

Opus 4.6 vs GPT-5.4:主力模型怎么选

如果今天只能为团队选一个主力模型,我的结论是:追求完整产品化能力,优先看 GPT-5.4;追求长时编码和持续执行,Opus 4.6 依然最锋利;追求激进多模态和 benchmark,Gemini 3.1 Pro 是最大变量。

  • GPT-5.4 的看点不只是模型升级,而是 OpenAI 把 agent 平台能力正式收口成产品。
阅读全文