定价

模型倍率、缓存命中与 API 首购

模型定价说明

我们按 1 亿 Tokens 为单位计费：1 倍率 40 元，100 万 Tokens 仅 0.4 元。先看计费规则、缓存命中和模型倍率，再按套餐完成首购。

进入购买页已有 API Key？前往充值台查看接入文档

老用户入口已有 API Key，直接去充值台补量充值、查单、确认到账都走这里，不用重复首购流程。立即前往充值台

计费

计费规则说明

我们采用按 1 亿 Tokens 为单位的计费方式。倍率只是不同模型成本差异的映射，一个 Key 通用全模型，不用频繁换 Key。

核心换算先把基准价格看明白

1 亿 Tokens40 元

1 倍率基础价

100 万 Tokens0.4 元

按 1 倍率换算

1 刀等价¥0.2

NewAPI $2 / 1M 对应 1 倍率标准

100 万 Tokens 仅需 0.4 元，我们的 1 刀等价 0.2 元。NewAPI 模型广场里 $2 / 1M，对应我们的 1 倍率标准。

一个 Key 通用全模型，倍率只是不同模型的成本差异映射，让你不用换 Key、不用手算复杂价格，直接按业务场景选模型就行。

基础计费标准倍率速查表

倍率	1 亿 Tokens	100 万 Tokens
1 倍率	40 元	0.4 元
2 倍率	80 元	0.8 元
5 倍率	200 元	2 元
10 倍率	400 元	4 元

接入 URL优先用带 /v1 的地址

推荐 Base URLhttps://gpt-agent.cc/v1

大多数客户端先用这个；如果报错，再切备用地址。

备用 Base URLhttps://gpt-agent.cc

不同 API 转发平台对 Base URL 校验不一样，换模型或换客户端时建议自己实际测一遍。

统一额度一个 Key 通用全模型

倍率只是不同模型成本差异的映射，计费逻辑始终统一。
不用为不同模型反复换 Key，切模型时直接按倍率估算即可。
额度不限时、不清零，适合长周期调试和稳定业务使用。

缓存

缓存命中说明

当请求里有一部分内容和之前处理过的内容相同，系统就可以复用之前的计算结果，不必重新完整计算。

什么是缓存命中重复上下文会被直接复用

这样做的好处是响应更快、消耗更低、计费更省。尤其在多轮对话、连续追问、工作流调用、代码补全这些场景里，实际消耗通常会比你想象得更低。

正常输入：按模型对应倍率计费。
重复且命中的缓存部分：按 0.1 倍率计费。
Opus 等高成本模型在波动时期，缓存可能升到 0.2 倍，极端情况下可能暂时不开缓存。

举个简单例子

如果你连续多轮对话时反复带上大量相同上下文，重复且命中的那部分就会按更低倍率扣费，所以长对话、连续追问和工作流调用会更省额度。

缓存命中按 0.1 倍率

命中的缓存部分仅按普通输入成本的 10% 计费。

长对话更省

连续追问、工作流调用、代码补全等场景更容易把重复上下文复用起来。

Opus 会随波动调整

成本高且波动大的时期，缓存可能提到 0.2 倍，极端情况下也可能暂时不开缓存。

注：是否产生缓存命中，取决于请求内容是否满足系统缓存复用条件。

定价

模型价格参考

同一页直接看清倍率、折算单价和推荐上下文，方便你挑模型和估成本。

2026-04-22 调整当前模型折算单价与倍率

按当前平台倍率整理，便于在购买前先看明白各模型的大致成本区间。

假设 max_tokens=8192

1 倍率 = 40 元 / 1 亿 Tokens缓存命中最低按 0.1 倍率最高 990k 上下文

厂家	模型名称	倍率按模型倍率折算	100 万 Tokens换算价格	推荐上下文假设 max_tokens=8192
国产聚合模型	claude-sonnet-4-6 高并发推荐Python 并发龙虾响应超快，1000 并发	0.8 倍率	0.32 元	196000
字节跳动	doubao-seed-2.0-code	2 倍率	0.8 元	200k
字节跳动	doubao-seed-2.0-pro	2 倍率	0.8 元	128k
字节跳动	doubao-seed-2.0-lite	1 倍率	0.4 元	32k
小米	mimo-v2-pro	4 倍率	1.6 元	990000
小米	mimo-v2-omni	4 倍率	1.6 元	253000
深度求索	deepseek-v3.2	3 倍率	1.2 元	128000
MiniMax	MiniMax-M2.7	0.8 倍率	0.32 元	196000
MiniMax	MiniMax-M2.7-highspeed龙虾响应超快	1 倍率	0.4 元	196000
Kimi	kimi-k2.5	1 倍率	0.4 元	253000
Kimi	kimi-k2.6	2 倍率	0.8 元	253000
智谱	glm-5.1	4 倍率	1.6 元	253000
智谱	glm-4.7	1 倍率	0.4 元	253000
海外（OpenAI）	gpt-5.4	5 倍率	2 元	990000
海外（OpenAI）	gpt-5.4-mini	2 倍率	0.8 元	390000
海外（OpenAI）	gpt-5.3-codex-spark	4 倍率	1.6 元	125000
海外（Anthropic）	claude-haiku-4-5-20251001	5 倍率	2 元	990000
海外（Anthropic）	claude-opus-4-6	20 倍率	8 元	990000
海外（Anthropic）	claude-opus-4-6-thinking	20 倍率	8 元	990000
海外（Anthropic）	claude-opus-4-7	20 倍率	8 元	990000

国产聚合模型推荐上下文 196000

claude-sonnet-4-6

高并发推荐Python 并发

龙虾响应超快，1000 并发

倍率0.8 倍率

100 万 Tokens0.32 元

context window196000

字节跳动推荐上下文 200k

doubao-seed-2.0-code

倍率2 倍率

100 万 Tokens0.8 元

context window200k

字节跳动推荐上下文 128k

doubao-seed-2.0-pro

倍率2 倍率

100 万 Tokens0.8 元

context window128k

字节跳动推荐上下文 32k

doubao-seed-2.0-lite

倍率1 倍率

100 万 Tokens0.4 元

context window32k

小米推荐上下文 990000

mimo-v2-pro

倍率4 倍率

100 万 Tokens1.6 元

context window990000

小米推荐上下文 253000

mimo-v2-omni

倍率4 倍率

100 万 Tokens1.6 元

context window253000

深度求索推荐上下文 128000

deepseek-v3.2

倍率3 倍率

100 万 Tokens1.2 元

context window128000

MiniMax推荐上下文 196000

MiniMax-M2.7

倍率0.8 倍率

100 万 Tokens0.32 元

context window196000

MiniMax推荐上下文 196000

MiniMax-M2.7-highspeed龙虾响应超快

倍率1 倍率

100 万 Tokens0.4 元

context window196000

Kimi推荐上下文 253000

kimi-k2.5

倍率1 倍率

100 万 Tokens0.4 元

context window253000

Kimi推荐上下文 253000

kimi-k2.6

倍率2 倍率

100 万 Tokens0.8 元

context window253000

智谱推荐上下文 253000

glm-5.1

倍率4 倍率

100 万 Tokens1.6 元

context window253000

智谱推荐上下文 253000

glm-4.7

倍率1 倍率

100 万 Tokens0.4 元

context window253000

海外（OpenAI）推荐上下文 990000

gpt-5.4

倍率5 倍率

100 万 Tokens2 元

context window990000

海外（OpenAI）推荐上下文 390000

gpt-5.4-mini

倍率2 倍率

100 万 Tokens0.8 元

context window390000

海外（OpenAI）推荐上下文 125000

gpt-5.3-codex-spark

倍率4 倍率

100 万 Tokens1.6 元

context window125000

海外（Anthropic）推荐上下文 990000

claude-haiku-4-5-20251001

倍率5 倍率

100 万 Tokens2 元

context window990000

海外（Anthropic）推荐上下文 990000

claude-opus-4-6

倍率20 倍率

100 万 Tokens8 元

context window990000

海外（Anthropic）推荐上下文 990000

claude-opus-4-6-thinking

倍率20 倍率

100 万 Tokens8 元

context window990000

海外（Anthropic）推荐上下文 990000

claude-opus-4-7

倍率20 倍率

100 万 Tokens8 元

context window990000

以上为按倍率换算后的参考价。实际扣费以平台模型倍率和请求消耗为准，额度不限时、不清零。

下一步

定价看清楚后，再去独立购买页下单

定价页只负责把倍率、缓存命中和模型成本讲清楚，不把解释和首购表单揉在一起。新用户去独立购买页下单，老用户直接去充值台补量。

进入购买页已有 Key 去充值