
从 GPT-1 到 GPT-5,从 Llama 1 到 Llama 4,AI 大模型的迭代速度正在以月为单位加速。本文用数据与时间表,呈现一场看不见硝烟的军备竞赛。
一、闭源巨头:版本号背后的迭代逻辑#
1.1 OpenAI:从年更到季度更#
| 版本 | 发布时间 | 间隔周期 | 核心变化 |
|---|
| GPT-1 | 2018.06 | — | Transformer 解码器,1.17 亿参数 |
| GPT-2 | 2019.02 | 8 个月 | 15 亿参数,生成能力质变 |
| GPT-3 | 2020.06 | 16 个月 | 1750 亿参数,涌现能力初现 |
| GPT-3.5 | 2022.03 | 21 个月 | 指令微调 + RLHF,ChatGPT 前身 |
| GPT-4 | 2023.03 | 12 个月 | 多模态,推理能力跃升 |
| GPT-4o | 2024.05 | 14 个月 | 原生多模态,速度成本优化 |
| GPT-4.5 | 2025.02 | 9 个月 | “Orion” 项目成果 |
| GPT-5 | 2025.08 | 6 个月 | 三组件架构,PhD 级能力 |
观察: OpenAI 的迭代周期从 2 年缩短到半年,速度提升了 4 倍。2023 年后进入"季度更新"模式。
1.2 Google Gemini:后发先追的加速度#
| 版本 | 发布时间 | 间隔 | 关键特性 |
|---|
| Gemini 1.0 | 2023.12 | — | 三种规格:Ultra / Pro / Nano |
| Gemini 1.5 Pro | 2024.02 | 2 个月 | 1000 万 token 上下文 |
| Gemini 1.5 Flash | 2024.05 | 3 个月 | 轻量高速 |
| Gemini 2.0 Flash | 2025.01 | 8 个月 | 全面升级 |
| Gemini 2.5 Pro | 2025.03 | 2 个月 | 登顶 LMArena |
| Gemini 2.5 Flash | 2025.04 | 1 个月 | 成本效率 |
| Gemini 3.0 Pro | 2025.11 | 7 个月 | 新一代架构 |
| Gemini 3.5 Flash | 2026.05 | 6 个月 | 最新迭代 |
观察: Google 采用小步快跑策略,2024-2025 年间平均每 2-3 个月发布一个新版本。
1.3 Anthropic Claude:稳健派的质量优先#
| 版本 | 发布时间 | 间隔 | 标志性提升 |
|---|
| Claude 1 | 2023.03 | — | 宪法 AI,安全优先 |
| Claude 2 | 2023.07 | 4 个月 | 公开可用,10 万 token |
| Claude 2.1 | 2023.11 | 4 个月 | 20 万 token 上下文 |
| Claude 3 (Opus/Sonnet/Haiku) | 2024.03 | 4 个月 | 三代同堂,多尺寸策略 |
| Claude 3.5 (Sonnet) | 2024.06 | 3 个月 | Artifacts 功能 |
| Claude 4 (Opus/Sonnet) | 2025.05 | 11 个月 | 长推理能力 |
| Claude 4.5-4.8 | 2025-2026 | 频繁小更新 | 持续优化 |
观察: Claude 的更新规律性最强,几乎每 4 个月一次大版本,体现 Anthropic 的审慎风格。
二、开源阵营:社区驱动的能力跃迁#
| 版本 | 发布时间 | 间隔 | 参数规模 | 训练数据 |
|---|
| Llama 1 | 2023.02 | — | 7B-65B | 1-1.4T tokens |
| Llama 2 | 2023.07 | 5 个月 | 7B-70B | 2T tokens |
| Llama 3 | 2024.04 | 9 个月 | 8B-70B | ~15T tokens |
| Llama 3.1 | 2024.07 | 3 个月 | 8B-405B | 未公开 |
| Llama 4 | 2025.04 | 9 个月 | 17B(激活)-400B | 30T+ tokens |
关键指标演进:
- 上下文长度:2K → 4K → 128K → 10M (Llama 4 Scout)
- 训练成本:6,300 → 21,000 → 100,000 → 440,000 petaFLOPS-day
- 商业化:仅限研究 → 可商用 → 多语言 + 多模态
2.2 DeepSeek:颠覆者的效率奇迹#
| 里程碑 | 时间 | 核心特征 |
|---|
| 公司成立 | 2023.07 | 杭州深度求索,幻方量化背景 |
| DeepSeek-LLM / Coder | 2023.11 | 首个系列模型 |
| DeepSeek-MoE | 2024.01 | 稀疏专家架构探索 |
| DeepSeek-V2 | 2024.05 | MoE + MLA 创新 |
| DeepSeek-V3 | 2024.12 | 671B 参数,训练成本仅 $6M |
| DeepSeek-R1 | 2025.01 | 推理模型,媲美 o1 |
| DeepSeek-V3.1 | 2025.08 | 混合架构 |
| DeepSeek-R1 0528 | 2025.05 | R1 重大更新 |
| DeepSeek-V3.2 | 2025.12 | 稀疏注意力优化 |
| DeepSeek-V4 | 2026.04 | 1.6T 参数,1M 上下文 |
震撼数据:
- V3 训练成本仅 $6M,约为 GPT-4 的 1/16
- 使用计算资源约为 Llama 3.1 的 1/10
- R1 发布当天引发英伟达股价暴跌 18%,市值蒸发 $6000 亿
2.3 Qwen (通义千问):阿里生态的全家桶#
| 版本 | 时间 | 规模 | 亮点 |
|---|
| Qwen 1 | 2023.04 (beta); 09 (public) | 1.8B-72B | 阿里首代大模型 |
| Qwen2 | 2024.06 | 密集 + MoE | 开源权重 + 闭源 API 并行 |
| Qwen2.5 系列 | 2024.09-11 | 多尺寸 | 代码、视觉、数学专版 |
| Qwen3 | 2025.04 | 0.6B-235B | Apache 2.0 全开源 |
| Qwen3.5 | 2026.02 | 开源权重 | 持续迭代 |
| Qwen3.6 | 2026.04 | 35B-A3B | 速度成本优化 |
生态数据:
- Hugging Face 上超过 20 万个 Qwen 衍生模型
- Qwen3-VL-2B-Instruct 全球下载超 1800 万
- 2026 年 5 月,Qwen 应用用户达 2.34 亿
2.4 Mistral:欧洲开源之星的起伏#
| 版本 | 时间 | 特点 |
|---|
| Mistral 7B | 2023.09 | 欧洲最强开源模型 |
| Mixtral 8x7B (MoE) | 2023.12 | 首个开源 MoE,7B 激活 |
| Mixtral 8x22B | 2024 | 更大规模 |
| Mistral Large / Small | 2024 | 闭源商业模型 |
| Mistral Small 3.2 | 2025 | 持续迭代,但声量下降 |
三、Web 平台模型换代时间轴对比#
以下表格对比三大主流聊天平台用户可感知的模型切换节奏:
| 时间节点 | ChatGPT (OpenAI) | Gemini (Google) | Claude (Anthropic) |
|---|
| 2022.11 | GPT-3.5 → ChatGPT 上线 | — | — |
| 2023.03 | GPT-4 上线 | Bard (LaMDA) | Claude 1 上线 |
| 2023.05 | — | Bard 换 Gemini Pro | — |
| 2023.07 | — | — | Claude 2 上线 |
| 2023.11 | GPT-4 Turbo | Gemini 1.0 | Claude 2.1 |
| 2024.03 | — | — | Claude 3 三代同堂 |
| 2024.05 | GPT-4o 上线 | Gemini 1.5 Pro | — |
| 2024.06 | — | — | Claude 3.5 Sonnet |
| 2024.09 | o1-preview / o1-mini | Gemini 1.5 Flash-002 | — |
| 2025.01 | — | Gemini 2.0 Flash | — |
| 2025.02 | GPT-4.5 上线 | — | — |
| 2025.03 | — | Gemini 2.5 Pro | Claude 4 上线 |
| 2025.05 | — | Gemini 2.5 Flash | — |
| 2025.08 | GPT-5 上线 | — | — |
| 2025.11 | — | Gemini 3.0 Pro | — |
| 2026.02 | — | — | Claude Fable 5 / Mythos |
| 2026.04 | — | — | — |
| 2026.05 | — | Gemini 3.5 Flash | — |
四、能力迭代:数字背后的跃迁#
4.1 参数规模增长曲线#
| 模型家族 | 初代 | 当前最新 | 增长倍数 |
|---|
| GPT 系列 | 1.17 亿 (GPT-1) | GPT-5 (未公开,预估万亿级) | >1000× |
| Llama 系列 | 65B (Llama 1) | 400B 总参 / 17B 激活 (Llama 4) | 6× 总参,MoE 效率更高 |
| DeepSeek | 未公开 (Coder) | 1.6T (V4-Pro) | 指数级增长 |
| Qwen | 72B | 235B (Qwen3 MoE) | 3.3× |
4.2 上下文长度军备竞赛#
| 年份 | 代表模型 | 上下文长度 |
|---|
| 2022 | GPT-3 | 2,048 |
| 2023 | Claude 2.1 | 200,000 |
| 2024 | Gemini 1.5 Pro / Llama 3.1 | 1,000,000 / 128,000 |
| 2025 | Llama 4 Scout | 10,000,000 |
| 2026 | DeepSeek-V4 | 1,000,000 |
4.3 训练效率的革命#
| 模型 | 训练成本 (估算) | 发布时间 | 单位成本性能 |
|---|
| GPT-4 | ~$100M | 2023.03 | 基准 |
| Llama 2 | ~$14M | 2023.07 | 提升 7× |
| Llama 3 | 已上升至几十亿级 | 2024.04 | 规模效应 |
| DeepSeek-V3 | $6M | 2024.12 | 提升 16× |
| DeepSeek-V4 | ~$50M (估算) | 2026.04 | 1.6T 参数效率 |
五、趋势判断:未来 12 个月会发生什么?#
- 更新周期将进一步压缩至 1-2 个月:Google Gemini 已经示范了月度迭代的可行性
- 开源与闭源的性能鸿沟正在消失:DeepSeek-V4 在多项基准上已逼近 GPT-5
- 多模态成为标配:文本→图像→音频→视频的端到端模型将在 2026 年普及
- 长上下文成为新战场:1M 上下文将成为基础门槛,10M+ 开始实用化
- 推理能力的民主化:DeepSeek-R1 / QwQ 证明推理能力不再是闭源特权
延伸阅读#
数据来源:OpenAI Help Center、Google Gemini Enterprise Platform、Anthropic API Docs、Meta AI Blog、DeepSeek API Docs、Alibaba Cloud Qwen、Wikipedia、各模型官方技术报告。统计截至 2026 年 5 月。
本文中部分远期日期(2025 下半年后)基于公开 roadmap 与行业趋势推演,实际发布时间请以官方为准。