qwen2.5-coder-32b-instruct

qwen2.5-coder-32b-instruct (custom) — 128K context, Coding tier. Prix entrée $2/M · Prix sortie $6/M · Latence 24ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.

Entrée / 1 M: $2/M · Sortie / 1 M: $6/M · TTFT: 24ms

Specifications

  • Éditeur: custom
  • Catégorie: Coding
  • Fenêtre de contexte: 128K
  • Prix entrée: $2 / 1M
  • Prix sortie: $6 / 1M
  • Latence: 24 ms
  • SLA: B

Typical use cases

  • Génération de code
  • RAG et appels d’outils
  • Raisonnement multi-étapes

FAQ

  • Tarification de qwen2.5-coder-32b-instruct sur Routara ? — Entrée $2/M, sortie $6/M — facturation à l’usage.
  • qwen2.5-coder-32b-instruct est-il compatible OpenAI ? — Oui — base_url : https://api.routara.ai/v1
  • qwen2.5-coder-32b-instruct supporte le streaming ? — Oui si la route est live (stream: true).

Related models

  • MiniMax-File-Upload (/detail/minimax-file-upload)
  • MiniMax-Voice-Clone (/detail/minimax-voice-clone)
  • kling-advanced-custom-elements (/detail/kling-advanced-custom-elements)

Quick integration

  • curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen2.5-coder-32b-instruct","messages":[{"role":"user","content":"Hello"}],"stream":true}'