glm-4-flash
glm-4-flash (zhipu_4v) — 128K context, Lightweight tier. 入力単価: $0.3/M · 出力単価: $1.2/M · 平均レイテンシ 18ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
入力単価: $0.3/M · 出力単価: $1.2/M · 初回トークン遅延: 18ms
Specifications
- 開発元: zhipu_4v
- カテゴリ: Lightweight
- コンテキスト: 128K
- 入力単価: $0.3 / 1M
- 出力単価: $1.2 / 1M
- 平均レイテンシ: 18 ms
- SLA: S
Typical use cases
- 高QPS分類
- 多言語チャットボット
- RAG とツール呼び出し
FAQ
- glm-4-flash の Routara 料金は? — 入力 $0.3/M、出力 $1.2/M。リクエストごとに課金、プラットフォーム手数料なし。
- glm-4-flash は OpenAI 互換? — はい。base_url を https://api.routara.ai/v1 に設定してください。
- glm-4-flash はストリーミング対応? — ルートが live のとき stream: true で利用可能です。
Related models
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- MiniMax-Hailuo-02 (/detail/minimax-hailuo-02)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"glm-4-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'