比较来自 19 个供应商的 1166 个模型价格
| 比较 | 供应商 | 模型 | 输入价格 | 输出价格 |
|---|---|---|---|---|
| 阿里云百炼 | ¥4 | ¥16 | ||
| 阿里云百炼 | ¥4 | ¥16 | ||
| 阿里云百炼 | ¥1 | ¥3 | ||
| 阿里云百炼 | ¥2 | ¥6 | ||
| 阿里云百炼 | ¥0.5 | ¥1 | ||
| 阿里云百炼 | ¥2 | ¥8 | ||
| 阿里云百炼 | ¥4 | ¥12 | ||
| 阿里云百炼 | ¥2 | ¥3 | ||
| 阿里云百炼 | ¥2 | ¥3 | ||
| 阿里云百炼 | ¥1 | ¥2 | ||
| 阿里云百炼 | ¥12 | ¥24 | ||
| 阿里云百炼 | ¥20 | ¥20 | ||
| 阿里云百炼 | ≤32K¥3 32K–96K¥4 | ¥14 ¥16 | ||
| 阿里云百炼 | ≤32K¥0.8 32K–96K¥1.2 | ¥6 ¥8 | ||
| 阿里云百炼 | ≤32K¥3 32K–166K¥4 | ¥14 ¥16 | ||
| 阿里云百炼 | ≤32K¥3 32K–166K¥4 | ¥14 ¥16 | ||
| 阿里云百炼 | ≤32K¥4 32K–198K¥6 | ¥18 ¥22 | ||
| 阿里云百炼 | ≤32K¥6 32K–200K¥8 | ¥24 ¥28 | ||
| 阿里云百炼 | ¥1.5 | ¥4.5 | ||
| 阿里云百炼 | — | 1080P¥1.6 720P¥0.9 | ||
| 阿里云百炼 | — | 1080P¥1.6 720P¥0.9 | ||
| 阿里云百炼 | — | 1080P¥1.6 720P¥0.9 | ||
| 阿里云百炼 | — | ¥2100 | ||
| 阿里云百炼 | — | ¥0.18 | ||
| 阿里云百炼 | ¥4 | ¥16 | ||
| 阿里云百炼 | ¥4 | ¥21 | ||
| 阿里云百炼 | ¥6.5 | ¥27 | ||
| 阿里云百炼 | ¥4 | ¥21 | ||
| 阿里云百炼 | ¥6.5 | ¥27 | ||
| 阿里云百炼 | — | 1K¥0.2 2K¥0.2 | ||
| 阿里云百炼 | — | 1K¥0.2 2K¥0.2 4K¥0.4 | ||
| 阿里云百炼 | ¥2.1 | ¥8.4 | ||
| 阿里云百炼 | ¥2.1 | ¥8.4 | ||
| 阿里云百炼 | ¥2.1 | ¥8.4 | ||
| 阿里云百炼 | ¥2.1 | ¥8.4 | ||
| 阿里云百炼 | ¥2.1 | ¥8.4 | ||
| 阿里云百炼 | ¥4 | ¥16 | ||
| 阿里云百炼 | ¥12 | ¥36 | ||
| 阿里云百炼 | ¥8 | ¥32 | ||
| 阿里云百炼 | ¥8 | ¥32 | ||
| 阿里云百炼 | ¥2 | ¥5 | ||
| 阿里云百炼 | ¥2 | ¥5 | ||
| 阿里云百炼 | ¥3.5 | ¥7 | ||
| 阿里云百炼 | ¥3.5 | ¥7 | ||
| 阿里云百炼 | ¥2 | ¥6 | ||
| 阿里云百炼 | ¥2 | ¥6 | ||
| 阿里云百炼 | ¥54 | ¥163 | ||
| 阿里云百炼 | ¥0.6 | ¥1 | ||
| 阿里云百炼 | ≤128K¥0.15 128K–256K¥0.6 256K–1M¥1.2 | ¥1.5 ¥6 ¥12 | ||
| 阿里云百炼 | ¥0.25 | ¥1.5 |
每百万词元 · 人民币 · 来源: 官方定价页面
Mistral OCR (25.05)(Google Vertex AI)目前提供最低的文本输入价格,每百万 Token 仅需 $0.0005。
在已追踪的模型中,Meta: Llama 4 Scout(OpenRouter)支持最大的上下文窗口,达 10M。
大多数大模型 API 分别对输入 Token(您的提示词和对话历史)和输出 Token(模型的回复)收费。输出 Token 的价格通常是输入价格的 2–5 倍。许多供应商还提供批量折扣、提示词缓存以及长上下文附加费等选项。
LLMRates.ai 追踪来自 Anthropic, Google, OpenAI, AWS Bedrock, Azure AI, Cohere, DeepSeek, Google Vertex AI 等供应商的模型,涵盖国内外主流 AI 提供商。
价格直接从各供应商官方定价页面抓取,每日更新。重大价格变动通常在 24 小时内同步更新。
提示词缓存可以存储重复的提示词前缀(如系统提示或大型文档),使模型无需在每次请求时重新处理。Anthropic 和 Google 等供应商对缓存输入 Token 提供标准价格 70–90% 的折扣,是生产应用中降低成本的关键手段。
gpt-realtime-1.5(OpenAI)的输入价格为每百万 Token $32,输出价格为每百万 Token $64。
Claude Sonnet 4.6(Anthropic)的输入价格为每百万 Token $3,输出价格为每百万 Token $15。
Gemini 3.5 Flash(Google)的输入价格为每百万 Token $1.5,输出价格为每百万 Token $9。
以下为主流模型中输入价格最低的选项(美元,标准档位,每百万 Token):
AI Agent 以多步循环方式运行——每次迭代都会重新发送累积的对话历史、工具调用结果和执行计划,因此 Token 费用会快速叠加。建议优先选择输入价格低、工具调用能力强的模型。Anthropic 和 Google 的提示词缓存功能可将重复上下文的成本降低 70–90%。以下是兼具低价与工具支持的热门模型:
推理模型(如 glm-4.5, glm-4.5-air, glm-4.6, glm-4.7)在回答前会进行内部思维链推理。由于推理 Token 需要额外的算力,这类模型的价格通常是标准模型的 5–20 倍。部分供应商会对推理过程中产生的思考 Token 单独计费。