Baidu Ernie 4 5 21b A3b Thinking

baidu/ernie-4.5-21B-a3b-thinking (Baidu) — 128K context, Reasoning tier. Input-Preis: $0.07/M · Output-Preis: $0.28/M · Latenz 48ms. Routed via Routara OpenAI-compatible endpoint with multi-region failover and metered billing.

Live-Gateway-Preise · automatisches Routing zum besten Upstream für Ihre Region

Specifications

  • Entwickler: Baidu
  • Kategorie: Reasoning
  • Kontextfenster: 128K
  • Input-Preis: $0.07 / 1M
  • Output-Preis: $0.28 / 1M
  • Latenz: 48 ms
  • SLA: S+

Typical use cases

  • Mehrstufiges Reasoning
  • RAG und Tool-Aufrufe
  • Code-Generierung

FAQ

  • Wie wird baidu/ernie-4.5-21B-a3b-thinking auf Routara abgerechnet? — Input $0.07/M, Output $0.28/M — nutzungsbasiert ohne Plattformgebühr.
  • Ist baidu/ernie-4.5-21B-a3b-thinking OpenAI-kompatibel? — Ja. base_url: https://api.routara.ai/v1
  • Unterstützt baidu/ernie-4.5-21B-a3b-thinking Streaming? — Ja, wenn die Route live ist (stream: true).

Related models

  • Kling V3 (/detail/kling-kling-v3)
  • Kling V3 Omni (/detail/kling-kling-v3-omni)
  • audio1.0 (/detail/audio1-0)

Quick integration

  • curl https://api.routara.ai/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"baidu/ernie-4.5-21B-a3b-thinking","messages":[{"role":"user","content":"Hello"}],"stream":true}'