glm-4.5-flash

glm-4.5-flash (custom) — 128K context, Lightweight tier. 入力単価 $0.02/M · 出力単価 $0.08/M · 平均レイテンシ 18ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.

入力 / 100万: $0.02/M · 出力 / 100万: $0.08/M · 初回トークン遅延: 18ms

Specifications

  • 開発元: custom
  • カテゴリ: Lightweight
  • コンテキスト: 128K
  • 入力単価: $0.02 / 1M
  • 出力単価: $0.08 / 1M
  • 平均レイテンシ: 18 ms
  • SLA: A

Typical use cases

  • 高QPS分類
  • 多言語チャットボット
  • RAG とツール呼び出し

FAQ

  • glm-4.5-flash の Routara 料金は? — 入力 $0.02/M、出力 $0.08/M。リクエストごとに課金、プラットフォーム手数料なし。
  • glm-4.5-flash は OpenAI 互換? — はい。base_url を https://api.routara.ai/v1 に設定してください。
  • glm-4.5-flash はストリーミング対応? — ルートが live のとき stream: true で利用可能です。

Related models

  • MiniMax-File-Upload (/detail/minimax-file-upload)
  • MiniMax-Voice-Clone (/detail/minimax-voice-clone)
  • kling-advanced-custom-elements (/detail/kling-advanced-custom-elements)

Quick integration

  • curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"glm-4.5-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'