qwen-max-longcontext
qwen-max-longcontext (ali) — 1M context, General tier. Prix entrée: $3.2/M · Prix sortie: $3.2/M · Latence 32ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
Prix entrée: $3.2/M · Prix sortie: $3.2/M · TTFT: 32ms
Specifications
- Éditeur: ali
- Catégorie: General
- Fenêtre de contexte: 1M
- Prix entrée: $3.2 / 1M
- Prix sortie: $3.2 / 1M
- Latence: 32 ms
- SLA: B
Typical use cases
- Chatbots multilingues
- RAG et appels d’outils
- Génération de code
FAQ
- Tarification de qwen-max-longcontext sur Routara ? — Entrée $3.2/M, sortie $3.2/M — facturation à l’usage.
- qwen-max-longcontext est-il compatible OpenAI ? — Oui — base_url : https://api.routara.ai/v1
- qwen-max-longcontext supporte le streaming ? — Oui si la route est live (stream: true).
Related models
- mj_custom_zoom (/detail/mj-custom-zoom)
- mj_inpaint (/detail/mj-inpaint)
- multimodal-embedding-v1 (/detail/multimodal-embedding-v1)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen-max-longcontext","messages":[{"role":"user","content":"Hello"}],"stream":true}'