DeepSeek-V4-Flash
DeepSeek-V4-Flash (DeepSeek) — 128K context, Lightweight tier. 输入价格 $0.14/M · 输出价格 $0.28/M · 平均延迟 18ms. 经 Routara 统一 OpenAI 兼容端点路由,支持多区域故障转移与按量计费。
输入 / 百万: $0.14/M · 输出 / 百万: $0.28/M · 首字延迟: 18ms
技术规格
- 开发商: DeepSeek
- 类别: Lightweight
- 上下文窗口: 128K
- 输入价格: $0.14 / 1M
- 输出价格: $0.28 / 1M
- 平均延迟: 18 ms
- SLA 等级: A
典型场景
- 高并发分类与路由
- 多语言客服与对话机器人
- RAG 与工具调用流水线
常见问题
- DeepSeek-V4-Flash 在 Routara 上如何计费? — 输入 $0.14/M tokens,输出 $0.28/M tokens,按请求计量,无额外平台费。
- DeepSeek-V4-Flash 是否兼容 OpenAI SDK? — 兼容。将 base_url 设为 https://api.routara.ai/v1,model 使用下方 Routara slug。
- DeepSeek-V4-Flash 是否支持流式输出? — 当上游路由在线时支持流式。在 chat.completions 中设置 stream: true。
相关模型
- MiniMax-File-Upload (/detail/minimax-file-upload)
- MiniMax-Voice-Clone (/detail/minimax-voice-clone)
- MiniMax-Hailuo-02 (/detail/minimax-hailuo-02)
快速接入
- curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"deepseek/deepseek-v4-flash","messages":[{"role":"user","content":"Hello"}],"stream":true}'