glm-4-flash
glm-4-flash (zhipu_4v) — 128K context, Lightweight tier. Prix entrée: $0.3/M · Prix sortie: $1.2/M · Latence 18ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
Prix entrée: $0.3/M · Prix sortie: $1.2/M · TTFT: 18ms
Specifications
- Éditeur: zhipu_4v
- Catégorie: Lightweight
- Fenêtre de contexte: 128K
- Prix entrée: $0.3 / 1M
- Prix sortie: $1.2 / 1M
- Latence: 18 ms
- SLA: S
Typical use cases
- Classification haut débit
- Chatbots multilingues
- RAG et appels d’outils
FAQ
- Tarification de glm-4-flash sur Routara ? — Entrée $0.3/M, sortie $1.2/M — facturation à l’usage.
- glm-4-flash est-il compatible OpenAI ? — Oui — base_url : https://api.routara.ai/v1
- glm-4-flash supporte le streaming ? — Oui si la route est live (stream: true).
Related models
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- MiniMax-Hailuo-02 (/detail/minimax-hailuo-02)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"glm-4-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'