定价

模型倍率、缓存命中与 API 首购

模型定价说明

我们按 1 亿 Tokens 为单位计费:1 倍率 40 元,100 万 Tokens 仅 0.4 元。先看计费规则、缓存命中和模型倍率,再按套餐完成首购。

老用户入口已有 API Key,直接去充值台补量充值、查单、确认到账都走这里,不用重复首购流程。立即前往充值台
计费

计费规则说明

我们采用按 1 亿 Tokens 为单位的计费方式。倍率只是不同模型成本差异的映射,一个 Key 通用全模型,不用频繁换 Key。

核心换算先把基准价格看明白
1 亿 Tokens40 元

1 倍率基础价

100 万 Tokens0.4 元

按 1 倍率换算

1 刀等价¥0.2

NewAPI $2 / 1M 对应 1 倍率标准

100 万 Tokens 仅需 0.4 元,我们的 1 刀等价 0.2 元。NewAPI 模型广场里 $2 / 1M,对应我们的 1 倍率标准。

一个 Key 通用全模型,倍率只是不同模型的成本差异映射,让你不用换 Key、不用手算复杂价格,直接按业务场景选模型就行。

基础计费标准倍率速查表
倍率1 亿 Tokens100 万 Tokens
1 倍率40 元0.4 元
2 倍率80 元0.8 元
5 倍率200 元2 元
10 倍率400 元4 元
接入 URL优先用带 /v1 的地址
推荐 Base URLhttps://gpt-agent.cc/v1

大多数客户端先用这个;如果报错,再切备用地址。

备用 Base URLhttps://gpt-agent.cc

不同 API 转发平台对 Base URL 校验不一样,换模型或换客户端时建议自己实际测一遍。

统一额度一个 Key 通用全模型
  • 倍率只是不同模型成本差异的映射,计费逻辑始终统一。
  • 不用为不同模型反复换 Key,切模型时直接按倍率估算即可。
  • 额度不限时、不清零,适合长周期调试和稳定业务使用。
缓存

缓存命中说明

当请求里有一部分内容和之前处理过的内容相同,系统就可以复用之前的计算结果,不必重新完整计算。

什么是缓存命中重复上下文会被直接复用

这样做的好处是响应更快、消耗更低、计费更省。尤其在多轮对话、连续追问、工作流调用、代码补全这些场景里,实际消耗通常会比你想象得更低。

  • 正常输入:按模型对应倍率计费。
  • 重复且命中的缓存部分:按 0.1 倍率计费。
  • Opus 等高成本模型在波动时期,缓存可能升到 0.2 倍,极端情况下可能暂时不开缓存。
举个简单例子

如果你连续多轮对话时反复带上大量相同上下文,重复且命中的那部分就会按更低倍率扣费,所以长对话、连续追问和工作流调用会更省额度。

缓存命中按 0.1 倍率

命中的缓存部分仅按普通输入成本的 10% 计费。

长对话更省

连续追问、工作流调用、代码补全等场景更容易把重复上下文复用起来。

Opus 会随波动调整

成本高且波动大的时期,缓存可能提到 0.2 倍,极端情况下也可能暂时不开缓存。

注:是否产生缓存命中,取决于请求内容是否满足系统缓存复用条件。

定价

模型价格参考

同一页直接看清倍率、折算单价和推荐上下文,方便你挑模型和估成本。

claude-sonnet-4-6 并发模型说明

claude-sonnet-4-6 非 Anthropic 官方模型,为大客户特供的并发模型,采用多国产聚合轮询模型,适合高并发工作流、Python 脚本和文本数据处理。

Anthropic 官方模型说明

当前页面里按官方说明重点对照的 Anthropic 官方模型为 claude-opus-4-6claude-haiku-4-5-20251001

Python 并发限制

Python 脚本并发仅允许 claude-sonnet-4-6。其他模型跑并发会影响其他客户,请按场景选择。

2026-04-22 调整当前模型折算单价与倍率

按当前平台倍率整理,便于在购买前先看明白各模型的大致成本区间。

假设 max_tokens=8192
1 倍率 = 40 元 / 1 亿 Tokens缓存命中最低按 0.1 倍率最高 990k 上下文
厂家模型名称倍率按模型倍率折算100 万 Tokens换算价格推荐上下文假设 max_tokens=8192
国产聚合模型
claude-sonnet-4-6
高并发推荐Python 并发
龙虾响应超快,1000 并发
0.8 倍率0.32 元196000
字节跳动
doubao-seed-2.0-code
2 倍率0.8 元200k
字节跳动
doubao-seed-2.0-pro
2 倍率0.8 元128k
字节跳动
doubao-seed-2.0-lite
1 倍率0.4 元32k
小米
mimo-v2-pro
4 倍率1.6 元990000
小米
mimo-v2-omni
4 倍率1.6 元253000
深度求索
deepseek-v3.2
3 倍率1.2 元128000
MiniMax
MiniMax-M2.7
0.8 倍率0.32 元196000
MiniMax
MiniMax-M2.7-highspeed龙虾响应超快
1 倍率0.4 元196000
Kimi
kimi-k2.5
1 倍率0.4 元253000
Kimi
kimi-k2.6
2 倍率0.8 元253000
智谱
glm-5.1
4 倍率1.6 元253000
智谱
glm-4.7
1 倍率0.4 元253000
海外(OpenAI)
gpt-5.4
5 倍率2 元990000
海外(OpenAI)
gpt-5.4-mini
2 倍率0.8 元390000
海外(OpenAI)
gpt-5.3-codex-spark
4 倍率1.6 元125000
海外(Anthropic)
claude-haiku-4-5-20251001
5 倍率2 元990000
海外(Anthropic)
claude-opus-4-6
20 倍率8 元990000
海外(Anthropic)
claude-opus-4-6-thinking
20 倍率8 元990000
海外(Anthropic)
claude-opus-4-7
20 倍率8 元990000
国产聚合模型推荐上下文 196000
claude-sonnet-4-6
高并发推荐Python 并发
龙虾响应超快,1000 并发
倍率0.8 倍率
100 万 Tokens0.32 元
context window196000
字节跳动推荐上下文 200k
doubao-seed-2.0-code
倍率2 倍率
100 万 Tokens0.8 元
context window200k
字节跳动推荐上下文 128k
doubao-seed-2.0-pro
倍率2 倍率
100 万 Tokens0.8 元
context window128k
字节跳动推荐上下文 32k
doubao-seed-2.0-lite
倍率1 倍率
100 万 Tokens0.4 元
context window32k
小米推荐上下文 990000
mimo-v2-pro
倍率4 倍率
100 万 Tokens1.6 元
context window990000
小米推荐上下文 253000
mimo-v2-omni
倍率4 倍率
100 万 Tokens1.6 元
context window253000
深度求索推荐上下文 128000
deepseek-v3.2
倍率3 倍率
100 万 Tokens1.2 元
context window128000
MiniMax推荐上下文 196000
MiniMax-M2.7
倍率0.8 倍率
100 万 Tokens0.32 元
context window196000
MiniMax推荐上下文 196000
MiniMax-M2.7-highspeed龙虾响应超快
倍率1 倍率
100 万 Tokens0.4 元
context window196000
Kimi推荐上下文 253000
kimi-k2.5
倍率1 倍率
100 万 Tokens0.4 元
context window253000
Kimi推荐上下文 253000
kimi-k2.6
倍率2 倍率
100 万 Tokens0.8 元
context window253000
智谱推荐上下文 253000
glm-5.1
倍率4 倍率
100 万 Tokens1.6 元
context window253000
智谱推荐上下文 253000
glm-4.7
倍率1 倍率
100 万 Tokens0.4 元
context window253000
海外(OpenAI)推荐上下文 990000
gpt-5.4
倍率5 倍率
100 万 Tokens2 元
context window990000
海外(OpenAI)推荐上下文 390000
gpt-5.4-mini
倍率2 倍率
100 万 Tokens0.8 元
context window390000
海外(OpenAI)推荐上下文 125000
gpt-5.3-codex-spark
倍率4 倍率
100 万 Tokens1.6 元
context window125000
海外(Anthropic)推荐上下文 990000
claude-haiku-4-5-20251001
倍率5 倍率
100 万 Tokens2 元
context window990000
海外(Anthropic)推荐上下文 990000
claude-opus-4-6
倍率20 倍率
100 万 Tokens8 元
context window990000
海外(Anthropic)推荐上下文 990000
claude-opus-4-6-thinking
倍率20 倍率
100 万 Tokens8 元
context window990000
海外(Anthropic)推荐上下文 990000
claude-opus-4-7
倍率20 倍率
100 万 Tokens8 元
context window990000

以上为按倍率换算后的参考价。实际扣费以平台模型倍率和请求消耗为准,额度不限时、不清零。

下一步

定价看清楚后,再去独立购买页下单

定价页只负责把倍率、缓存命中和模型成本讲清楚,不把解释和首购表单揉在一起。新用户去独立购买页下单,老用户直接去充值台补量。