qwen2.5-coder-32b-instruct
qwen2.5-coder-32b-instruct (custom) — 128K context, Coding tier. 输入价格 $2/M · 输出价格 $6/M · 平均延迟 24ms. 经 Routara 统一 OpenAI 兼容端点路由,支持多区域故障转移与按量计费。
输入 / 百万: $2/M · 输出 / 百万: $6/M · 首字延迟: 24ms
技术规格
- 开发商: custom
- 类别: Coding
- 上下文窗口: 128K
- 输入价格: $2 / 1M
- 输出价格: $6 / 1M
- 平均延迟: 24 ms
- SLA 等级: B
典型场景
- 代码生成、审查与单测
- RAG 与工具调用流水线
- 多步推理与 Agent 工作流
常见问题
- qwen2.5-coder-32b-instruct 在 Routara 上如何计费? — 输入 $2/M tokens,输出 $6/M tokens,按请求计量,无额外平台费。
- qwen2.5-coder-32b-instruct 是否兼容 OpenAI SDK? — 兼容。将 base_url 设为 https://api.routara.ai/v1,model 使用下方 Routara slug。
- qwen2.5-coder-32b-instruct 是否支持流式输出? — 当上游路由在线时支持流式。在 chat.completions 中设置 stream: true。
相关模型
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- kling-advanced-custom-elements (/detail/kling-advanced-custom-elements)
快速接入
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"qwen2.5-coder-32b-instruct","messages":[{"role":"user","content":"Hello"}],"stream":true}'