glm-4-flash の Routara 料金は？

入力 $0.3/M、出力 $1.2/M。リクエストごとに課金、プラットフォーム手数料なし。

glm-4-flash は OpenAI 互換？

はい。base_url を https://api.routara.ai/v1 に設定してください。

glm-4-flash はストリーミング対応？

ルートが live のとき stream: true で利用可能です。

glm-4-flash

glm-4-flash (zhipu_4v) — 128K context, Lightweight tier. 入力単価: $0.3/M · 出力単価: $1.2/M · 平均レイテンシ 18ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.

入力単価: $0.3/M · 出力単価: $1.2/M · 初回トークン遅延: 18ms

Specifications

開発元: zhipu_4v
カテゴリ: Lightweight
コンテキスト: 128K
入力単価: $0.3 / 1M
出力単価: $1.2 / 1M
平均レイテンシ: 18 ms
SLA: S

Typical use cases

高QPS分類
多言語チャットボット
RAG とツール呼び出し

FAQ

glm-4-flash の Routara 料金は？ — 入力 $0.3/M、出力 $1.2/M。リクエストごとに課金、プラットフォーム手数料なし。
glm-4-flash は OpenAI 互換？ — はい。base_url を https://api.routara.ai/v1 に設定してください。
glm-4-flash はストリーミング対応？ — ルートが live のとき stream: true で利用可能です。

Related models

MiniMax-File-Upload (/detail/minimax-file-upload)
MiniMax-Voice-Clone (/detail/minimax-voice-clone)
MiniMax-Hailuo-02 (/detail/minimax-hailuo-02)

Quick integration

curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"glm-4-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'