glm-4.5-flash
glm-4.5-flash (custom) — 128K context, Lightweight tier. 입력 가격 $0.02/M · 출력 가격 $0.08/M · 평균 지연 18ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.
입력 / 백만: $0.02/M · 출력 / 백만: $0.08/M · 첫 토큰 지연: 18ms
Specifications
- 개발사: custom
- 카테고리: Lightweight
- 컨텍스트: 128K
- 입력 가격: $0.02 / 1M
- 출력 가격: $0.08 / 1M
- 평균 지연: 18 ms
- SLA: A
Typical use cases
- 고QPS 분류
- 다국어 챗봇
- RAG 및 도구 호출
FAQ
- glm-4.5-flash Routara 요금은? — 입력 $0.02/M, 출력 $0.08/M. 요청별 과금, 플랫폼 수수료 없음.
- glm-4.5-flash OpenAI 호환? — 예. base_url을 https://api.routara.ai/v1 로 설정하세요.
- glm-4.5-flash 스트리밍 지원? — 라우트가 live일 때 stream: true 사용 가능.
Related models
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- kling-advanced-custom-elements (/detail/kling-advanced-custom-elements)
Quick integration
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"glm-4.5-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'