qwen2.5-coder-32b-instruct
qwen2.5-coder-32b-instruct (custom) — 128K context, Coding tier. Precio entrada $2/M · Precio salida $6/M · Latencia 24ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
Entrada / 1M: $2/M · Salida / 1M: $6/M · TTFT: 24ms
Specifications
- Desarrollador: custom
- Categoría: Coding
- Ventana de contexto: 128K
- Precio entrada: $2 / 1M
- Precio salida: $6 / 1M
- Latencia: 24 ms
- SLA: B
Typical use cases
- Generación de código
- RAG y herramientas
- Razonamiento multi-paso
FAQ
- ¿Precio de qwen2.5-coder-32b-instruct en Routara? — Entrada $2/M, salida $6/M — facturación por uso.
- ¿qwen2.5-coder-32b-instruct es compatible con OpenAI? — Sí. base_url: https://api.routara.ai/v1
- ¿qwen2.5-coder-32b-instruct admite streaming? — Sí cuando la ruta está live (stream: true).
Related models
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- kling-advanced-custom-elements (/detail/kling-advanced-custom-elements)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen2.5-coder-32b-instruct","messages":[{"role":"user","content":"Hello"}],"stream":true}'