Compara precios de 1166 modelos de 19 proveedores
| Comparar | Proveedor | Modelo | Precio de Entrada | Precio de Salida |
|---|---|---|---|---|
| Anthropic | €0.687 | €3.44 | ||
| Anthropic | €0.8588 | €4.29 | ||
| Anthropic | €12.88 | €64.41 | ||
| Anthropic | €12.88 | €64.41 | ||
| Anthropic | €4.29 | €21.47 | ||
| Anthropic | €4.29 | €21.47 | ||
| Anthropic | €4.29 | €21.47 | ||
| Anthropic | €4.29 | €21.47 | ||
| Anthropic | €2.58 | €12.88 | ||
| Anthropic | €2.58 | €12.88 | ||
| Anthropic | €2.58 | €12.88 | ||
| AWS Bedrock | €25.76/1K búsquedas | — | ||
| AWS Bedrock | €25.76/1K búsquedas | — | ||
| AWS Bedrock | €1.07 | — | ||
| AWS Bedrock | €2.58 | — | ||
| AWS Bedrock | €0.2576 | — | ||
| AWS Bedrock | €0.0344/imagen | — | ||
| AWS Bedrock | €0.0515 | — | ||
| AWS Bedrock | €0.0301 | — | ||
| AWS Bedrock | €0.058 {priceOf!bedrock/bedrock!fWTU_nxHvSmnGvjH1erX6tTZZ— | — | ||
| AWS Bedrock | €0.1159 {priceOf!bedrock/bedrock!Zfo8texvBEL9ZYfvvuztxH_ja— | — | ||
| AWS Bedrock | €25.76/1K búsquedas | — | ||
| AWS Bedrock | €0.687 | — | ||
| AWS Bedrock | €0.8588 | — | ||
| AWS Bedrock | €0.0687/video | — | ||
| AWS Bedrock | €2.92 | — | ||
| AWS Bedrock | €0.004294/imagen | — | ||
| AWS Bedrock | €0.00687/imagen | — | ||
| AWS Bedrock | €0.00687/imagen | — | ||
| AWS Bedrock | €0.000172/imagen | — | ||
| AWS Bedrock | €0.0859 | — | ||
| AWS Bedrock | €0.0172 | — | ||
| AWS Bedrock | €0.1718 | — | ||
| AWS Bedrock | €0.1288 | — | ||
| AWS Bedrock | €0.4294 | — | ||
| AWS Bedrock | €6.87 | €20.61 | ||
| AWS Bedrock | €6.87 | €20.61 | ||
| AWS Bedrock | €0.2147 | €1.07 | ||
| AWS Bedrock | €12.88 | €64.41 | ||
| AWS Bedrock | €2.58 | €12.88 | ||
| AWS Bedrock | €0.687 | €3.44 | ||
| AWS Bedrock | €2.58 | €12.88 | ||
| AWS Bedrock | €5.15 | €25.76 | ||
| AWS Bedrock | €2.58 | €12.88 | ||
| AWS Bedrock | €5.15 | €25.76 | ||
| AWS Bedrock | €2.58 | €12.88 | ||
| AWS Bedrock | €0.9447 | €4.72 | ||
| AWS Bedrock | €0.8588 | €4.29 | ||
| AWS Bedrock | €0.687 | €2.06 | ||
| AWS Bedrock | €12.88 | €64.41 |
por 1M tokens · Euro · Fuente: Páginas de precios oficiales
Mistral OCR (25.05) (Google Vertex AI) ofrece actualmente el precio de entrada más bajo a $0.0005 por millón de tokens para generación de texto.
Meta: Llama 4 Scout (OpenRouter) admite la ventana de contexto más grande entre los modelos rastreados, con 10M.
La mayoría de las API de LLM cobran por separado los tokens de entrada (tu prompt e historial de conversación) y los tokens de salida (la respuesta del modelo). Los tokens de salida suelen costar entre 2 y 5 veces más que los de entrada. Muchos proveedores también ofrecen precios por lotes, caché de prompts para prefijos repetidos y recargos por contextos largos.
LLMRates.ai rastrea modelos de Anthropic, Google, OpenAI, AWS Bedrock, Azure AI, Cohere, DeepSeek, Google Vertex AI, y más, cubriendo proveedores de IA tanto de EE.UU. como de China.
Los precios se extraen directamente de las páginas oficiales de precios de los proveedores y se actualizan diariamente. Los cambios de precio importantes suelen reflejarse en un plazo de 24 horas.
El caché de prompts almacena un prefijo de prompt repetido, como un prompt de sistema o un documento grande, para que el modelo no tenga que procesarlo de nuevo en cada solicitud. Proveedores como Anthropic y Google ofrecen tokens de entrada en caché con un descuento del 70–90% respecto al precio estándar, lo que lo convierte en una herramienta clave para reducir costos en aplicaciones de producción.
gpt-realtime-1.5 (OpenAI) cuesta $32 por millón de tokens de entrada y $64 por millón de tokens de salida.
Claude Sonnet 4.6 (Anthropic) cuesta $3 por millón de tokens de entrada y $15 por millón de tokens de salida.
Gemini 3.5 Flash (Google) cuesta $1.5 por millón de tokens de entrada y $9 por millón de tokens de salida.
Los modelos populares más asequibles por precio de entrada (USD, nivel estándar, por millón de tokens):
Los agentes de IA operan en bucles de múltiples pasos — cada iteración reenvía el historial de conversación acumulado, los resultados de herramientas y el plan, por lo que los costos de tokens se acumulan rápidamente. Prioriza modelos con precios de entrada bajos y buen soporte de llamadas a herramientas. El caché de prompts (Anthropic, Google) puede reducir los costos en contexto repetido hasta un 70–90%. Modelos asequibles con buen soporte de herramientas:
Los modelos de razonamiento —como glm-4.5, glm-4.5-air, glm-4.6, glm-4.7— realizan un razonamiento interno de cadena de pensamiento antes de responder. Suelen costar entre 5 y 20 veces más que los modelos estándar debido al cómputo adicional para los tokens de razonamiento. Algunos proveedores cobran por separado los tokens de pensamiento generados durante el proceso.