qwen-1.8b-longcontext-chat
qwen-1.8b-longcontext-chat (custom) — 1M context, General tier. Input-Preis: $75/M · Output-Preis: $75/M · Latenz 32ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
Input-Preis: $75/M · Output-Preis: $75/M · TTFT: 32ms
Specifications
- Entwickler: custom
- Kategorie: General
- Kontextfenster: 1M
- Input-Preis: $75 / 1M
- Output-Preis: $75 / 1M
- Latenz: 32 ms
- SLA: B
Typical use cases
- Mehrsprachige Chatbots
- RAG und Tool-Aufrufe
- Code-Generierung
FAQ
- Wie wird qwen-1.8b-longcontext-chat auf Routara abgerechnet? — Input $75/M, Output $75/M — nutzungsbasiert ohne Plattformgebühr.
- Ist qwen-1.8b-longcontext-chat OpenAI-kompatibel? — Ja. base_url: https://api.routara.ai/v1
- Unterstützt qwen-1.8b-longcontext-chat Streaming? — Ja, wenn die Route live ist (stream: true).
Related models
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- mj_custom_zoom (/detail/mj-custom-zoom)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen-1.8b-longcontext-chat","messages":[{"role":"user","content":"Hello"}],"stream":true}'