deepseek-r1-distill-qwen-32b

deepseek-r1-distill-qwen-32b (coze) — 128K context, Reasoning tier. 输入价格 $2/M · 输出价格 $6/M · 平均延迟 48ms. 经 Routara 统一 OpenAI 兼容端点路由,支持多区域故障转移与按量计费。

输入 / 百万: $2/M · 输出 / 百万: $6/M · 首字延迟: 48ms

技术规格

  • 开发商: coze
  • 类别: Reasoning
  • 上下文窗口: 128K
  • 输入价格: $2 / 1M
  • 输出价格: $6 / 1M
  • 平均延迟: 48 ms
  • SLA 等级: B

典型场景

  • 多步推理与 Agent 工作流
  • RAG 与工具调用流水线
  • 代码生成、审查与单测

常见问题

  • deepseek-r1-distill-qwen-32b 在 Routara 上如何计费? — 输入 $2/M tokens,输出 $6/M tokens,按请求计量,无额外平台费。
  • deepseek-r1-distill-qwen-32b 是否兼容 OpenAI SDK? — 兼容。将 base_url 设为 https://api.routara.ai/v1,model 使用下方 Routara slug。
  • deepseek-r1-distill-qwen-32b 是否支持流式输出? — 当上游路由在线时支持流式。在 chat.completions 中设置 stream: true。

相关模型

  • audio1.0 (/detail/audio1-0)
  • gpt-5.3-thinking-all (/detail/gpt-5-3-thinking-all)
  • gpt-5.4-thinking-all (/detail/gpt-5-4-thinking-all)

快速接入

  • curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"deepseek-r1-distill-qwen-32b","messages":[{"role":"user","content":"Hello"}],"stream":true}'