qwen3-coder-flash

qwen3-coder-flash (qwen3-coder-flash) — 128K context, Coding tier. Precio entrada $0.5/M · Precio salida $4/M · Latencia 24ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.

Entrada / 1M: $0.5/M · Salida / 1M: $4/M · TTFT: 24ms

Specifications

  • Desarrollador: qwen3-coder-flash
  • Categoría: Coding
  • Ventana de contexto: 128K
  • Precio entrada: $0.5 / 1M
  • Precio salida: $4 / 1M
  • Latencia: 24 ms
  • SLA: A

Typical use cases

  • Generación de código
  • RAG y herramientas
  • Razonamiento multi-paso

FAQ

  • ¿Precio de qwen3-coder-flash en Routara? — Entrada $0.5/M, salida $4/M — facturación por uso.
  • ¿qwen3-coder-flash es compatible con OpenAI? — Sí. base_url: https://api.routara.ai/v1
  • ¿qwen3-coder-flash admite streaming? — Sí cuando la ruta está live (stream: true).

Related models

  • qwen3-coder-480b-a35b-instruct (/detail/qwen3-coder-480b-a35b-instruct)
  • gpt-5.1-codex (/detail/gpt-5-1-codex)
  • gpt-5.1-codex-max (/detail/gpt-5-1-codex-max)

Quick integration

  • curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen3-coder-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'