模型评测 - Freelemon

长文库

技术、行业、人物与 Agent 系统观察。

Latest Archive

模型评测

模型评测时间线。

模型评测大模型 AI 编程

2026-04-04 20:13 北京时间 14 分钟阅读难度：进阶

Gemma 4 本地部署与型号选择指南

如果你关心的是 Gemma 4 能不能在自己机器上稳定跑起来，而不是排行榜又赢了谁，结论很简单：31B 代表上限，26B A4B 是最值得部署的均衡版本，E4B 和 E2B 则把轻量本地模型推进到了真正可用的一档。

Gemma 4 26B A4B 是这代最值得评估的型号，质量、延迟和本地硬件门槛最平衡。

模型评测大模型 AI 编程

2026-03-15 01:16 北京时间 22 分钟阅读难度：进阶

Opus 4.6 vs GPT-5.4：主力模型怎么选

如果今天只能为团队选一个主力模型，我的结论是：追求完整产品化能力，优先看 GPT-5.4；追求长时编码和持续执行，Opus 4.6 依然最锋利；追求激进多模态和 benchmark，Gemini 3.1 Pro 是最大变量。

GPT-5.4 的看点不只是模型升级，而是 OpenAI 把 agent 平台能力正式收口成产品。