qwen3-coder-flash
qwen3-coder-flash (qwen3-coder-flash) — 128K context, Coding tier. Prix entrée $0.5/M · Prix sortie $4/M · Latence 24ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
Entrée / 1 M: $0.5/M · Sortie / 1 M: $4/M · TTFT: 24ms
Specifications
- Éditeur: qwen3-coder-flash
- Catégorie: Coding
- Fenêtre de contexte: 128K
- Prix entrée: $0.5 / 1M
- Prix sortie: $4 / 1M
- Latence: 24 ms
- SLA: A
Typical use cases
- Génération de code
- RAG et appels d’outils
- Raisonnement multi-étapes
FAQ
- Tarification de qwen3-coder-flash sur Routara ? — Entrée $0.5/M, sortie $4/M — facturation à l’usage.
- qwen3-coder-flash est-il compatible OpenAI ? — Oui — base_url : https://api.routara.ai/v1
- qwen3-coder-flash supporte le streaming ? — Oui si la route est live (stream: true).
Related models
- qwen3-coder-480b-a35b-instruct (/detail/qwen3-coder-480b-a35b-instruct)
- gpt-5.1-codex (/detail/gpt-5-1-codex)
- gpt-5.1-codex-max (/detail/gpt-5-1-codex-max)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen3-coder-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'