glm-4.5-flash
glm-4.5-flash (custom) — 128K context, Lightweight tier. Preço entrada $0.02/M · Preço saída $0.08/M · Latência 18ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
Entrada / 1M: $0.02/M · Saída / 1M: $0.08/M · TTFT: 18ms
Specifications
- Desenvolvedor: custom
- Categoria: Lightweight
- Janela de contexto: 128K
- Preço entrada: $0.02 / 1M
- Preço saída: $0.08 / 1M
- Latência: 18 ms
- SLA: A
Typical use cases
- Classificação alto QPS
- Chatbots multilíngues
- RAG e ferramentas
FAQ
- Preço do glm-4.5-flash na Routara? — Entrada $0.02/M, saída $0.08/M — cobrança por uso.
- glm-4.5-flash é compatível com OpenAI? — Sim. base_url: https://api.routara.ai/v1
- glm-4.5-flash suporta streaming? — Sim quando a rota está live (stream: true).
Related models
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- kling-advanced-custom-elements (/detail/kling-advanced-custom-elements)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"glm-4.5-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'