大模型定价追踪

国内外旗舰 API 一手牌价 · input / output / cache 三维 · 中美对比。价格统一归一为 USD / 1M tokens

模型发布时间参数量激活参数量InputOutputCacheCoding 均价来源
deepseek-v4-pro2026-04-241.6T49B0.440.890.0040.080官方
mimo-v2.5-pro2026-04-221.02T42B0.440.890.0040.080官方
MiniMax M32026-06-01428B22B0.301.200.0600.142搜索
Doubao-Seed-2.0-pro2026-02-14//0.472.370.0950.254官方
GLM-5.12026-04-07754B40B0.893.550.1920.435官方
K2.7 Code2026-06-121T32B0.963.990.1920.466官方
qwen3.7-max2026-05-19//1.775.321.996官方
Grok 4.32026-04-30//1.252.500.2000.393官方
Gemini 3.5 Flash2026-05-20//1.509.000.1500.766官方
Gemini 3.1 Pro2026-02-19//2.0012.000.2001.022官方
Claude Sonnet 4.62026-02-17//3.0015.000.3001.345官方
Claude Opus 4.82026-05-28//5.0025.000.5002.242官方
GPT-5.52026-04-24//5.0030.000.5002.555官方
Claude Fable 52026-06-09//10.0050.001.0004.484官方
GPT-5.5 Pro2026-04-24//30.00180.0039.375官方

价格全部归一为 USD / 1M tokens;国产价取国内平台人民币牌价折算成 USDCoding 均价 = [15×(95%×cache + 5%×input) + output] / 16 —— 模拟 coding agent 负载(input:output 15:1、input 95% 命中 cache)。参数量 闭源厂商未公布的标「/」。
官方 = 直接抓官方定价页;搜索 = 官方页抓不到、搜索兜底(需人工复核)。

国产原币 CNY 牌价(官方人民币标价) · 点击展开
模型InputOutputCache口径
deepseek-v4-pro¥3.00¥6.00¥0.025/ 1M tokens · 官方 CNY 牌价
mimo-v2.5-pro¥3.00¥6.00¥0.025/ 1M tokens · 官方 CNY 牌价
Doubao-Seed-2.0-pro¥3.20¥16.00¥0.640/ 1M tokens · 官方 CNY 牌价
GLM-5.1¥6.00¥24.00¥1.300/ 1M tokens · 官方 CNY 牌价
K2.7 Code¥6.50¥27.00¥1.300/ 1M tokens · 官方 CNY 牌价
qwen3.7-max¥12.00¥36.00/ 1M tokens · 官方 CNY 牌价

中国厂商官方以人民币计价;主表已按当前 USDCNY 折算为 USD。此处为未折算的原始 牌价。Cache = 缓存命中读取价(¥/1M)。

代际定价对比

各家旗舰最近 3 代 · 用 Coding 均价 ($/1M) 看「新代 vs 老代」定价演进 —— commoditization / 价格战 / token economics 拐点信号。

厂商上上一代上一代当前代 · 含 vs 最老代涨跌
GPT
$1.113
GPT-5.2 · 2025-12
$1.277
GPT-5.4 · 2026-03
$2.666
GPT-5.5 · 2026-04
▲ +140%
Claude
$2.242
Claude Opus 4.5 · 2025-11
$2.242
Claude Opus 4.7 · 2026-04
$2.242
Claude Opus 4.8 · 2026-05
→ +0%
Gemini
$0.795
Gemini 2.5 Pro · 2025-03
$1.022
Gemini 3 Pro · 2025-11
$1.022
Gemini 3.1 Pro · 2026-02
▲ +29%
Grok
$3.750
Grok 4 · 2025-07
$0.393
Grok 4.20 · 2026-03
$0.393
Grok 4.3 · 2026-04
▼ -90%
DeepSeek
$0.154
DeepSeek-V3.1 · 2025-08
$0.154
DeepSeek-V3.2 · 2025-12
$0.080
DeepSeek-V4-Pro · 2026-04
▼ -48%
Qwen
$1.054
Qwen3-Max (首发) · 2025-09
$0.176
Qwen3-Max · 2026-01
$1.996
Qwen3.7-Max · 2026-05
▲ +89%
Kimi
$0.307
Kimi K2-0905 · 2025-09
$0.439
Kimi K2.6 · 2026-04
$0.466
Kimi K2.7 Code · 2026-06
▲ +52%
GLM
$0.545
GLM-4.7 · 2025-12
$0.721
GLM-5 · 2026-02
$1.054
GLM-5.1 · 2026-04
▲ +93%
Doubao
$0.101
Doubao-Seed-1.6 · 2025-06
$0.101
Doubao-Seed-1.8 · 2025-12
$0.254
Doubao-Seed-2.0-pro · 2026-02
▲ +153%
MiniMax
$0.120
MiniMax-M2 · 2025-10
$0.148
MiniMax-M2.7 · 2026-03
$0.295
MiniMax-M3 · 2026-06
▲ +146%
MiMo
$0.427
MiMo-V2-Pro · 2026-03
$0.080
MiMo-V2.5-Pro · 2026-04
▼ -81%

每格:Coding 均价 $/1M · 型号 · 发布月。代际趋势 = 当前代 vs 最老一代 Coding 均价变化( 涨 / 跌)。国产取国内人民币牌价折 USD。Coding 均价 = [15×(95%×cache + 5%×input) + output] / 16。某代或 cache 缺数据的,用可得项近似。

Cloud OAI Price

OpenAI 各模型云端 blended 单价($/1M tokens)· 月度 Jan–May 2026 · 数据源 yipit

模型Jan-26Feb-26Mar-26Apr-26May-26
Embeddings$0.07$0.07$0.07$0.06$0.06
GPT 3.5$0.79$0.77$0.75$0.69$0.69
GPT 4$16.63$18.93$19.39$18.64$20.20
GPT 4.1$1.47$1.38$1.41$1.35$1.33
GPT 4.1 (Mini/Nano)$0.26$0.27$0.27$0.24$0.24
GPT 4.1 (Stealth)
GPT 4.5
GPT 4o$2.26$2.17$1.99$1.86$1.92
GPT 4o (Mini)$0.14$0.14$0.14$0.14$0.14
GPT 5$1.74$1.49$1.53$1.63$1.41
GPT 5 (Codex)$0.37$0.35$0.47$0.55$0.39
GPT 5 (Mini/Nano)$0.32$0.20$0.22$0.31$0.30
GPT 5 (Pro)$42.72$64.88$38.74$39.23$36.61
GPT 5 (Stealth)
GPT 5.1$1.47$1.30$1.10$1.07$1.05
GPT 5.1 (Codex)$0.35$0.27$0.28$0.40$0.48
GPT 5.1 (Stealth)
GPT 5.2$1.57$1.54$1.56$1.60$1.71
GPT 5.2 (Codex)$0.81$0.83$1.27$0.56$0.67
GPT 5.2 (Pro)$30.23$29.23$32.31$35.34$32.68
GPT 5.3$1.53$1.33$1.28
GPT 5.3 (Codex)$0.74$0.71$0.57$0.47
GPT 5.4$1.27$1.38$1.57
GPT 5.4 (Image)$11.68$11.92
GPT 5.4 (Mini/Nano)$0.33$0.35$0.36
GPT 5.4 (Pro)$41.52$46.31$41.94
GPT 5.5$1.89$1.59
GPT 5.5 (Pro)$42.37$40.15
GPT Audio$4.67$1.76$3.04$2.62$2.26
GPT Image$26.52$27.81$27.45$28.43$26.36
GPT Realtime$3.52$2.95$3.26$2.88$2.33
o1-o4$2.11$2.25$2.29$2.48$2.43
OpenAI OSS$0.05$0.05$0.05$0.04$0.04
Other$1.01$36.65$23.06$21.57$4.16

数据源 yipit。各 OpenAI 模型 API blended 实际单价($/1M tokens),按月。 = 该月无数据 / 模型未上线或已下线。

Ornn Price Tracker

GPU 租赁价指数(OCPI)· H100 / H200 / B200 / A100 / RTX 5090 的 $/hr 走势 · 数据源 Ornn

H100$2.48 /hr
3M ▲ +45.0%
1M ▼ -22.3%
1W ▼ -20.0%
H200$3.59 /hr
3M ▲ +38.1%
1M ▼ -43.9%
1W ▼ -22.0%
B200$4.50 /hr
3M ▲ +35.1%
1M ▼ -20.8%
1W ▼ -3.4%
A100$1.05 /hr
3M ▲ +16.7%
1M ▼ -11.8%
1W ▼ -1.9%
RTX 5090$0.69 /hr
3M ▲ +50.0%
1M ▲ +15.0%
1W ▼ -21.6%

数据源 Ornn OCPI · dashboard.ornnai.com(API api.ornnai.com)· $/hr · 截至 2026-06-15。每卡:当前 $/hr + 3M / 1W 涨跌( 涨 / 跌)+ 近 3 月日频走势(鼠标悬停看每日数值)。OCPI = 基于真实成交的归一化指数(live traded spot prices,非云厂 list price);约 3 个月滚动日频。