Einheitliche Preise
Listenpreis $0.333/1M. Stufenrabatte. Bonus nicht auszahlbar.
Mitgliederrabatt gilt nur für chinesische/inländische Modelle. GPT & Claude werden zum Listenpreis +5 % berechnet.
Architektur-Leitfaden & FAQ
- Wie löst das Unified Token Gateway die Fragmentierung von LLM-Anbietern? — Eine OpenAI-kompatible API leitet zu den kostengünstigsten oder latenzärmsten Upstream-Clustern über Qwen, DeepSeek, Hunyuan und mehr.
- Was ist die Base-URL für die Integration? — Nutzen Sie ein beliebiges OpenAI-SDK mit base_url auf unser Gateway und Ihrem Dashboard-Geheimschlüssel. Abrechnung pro 1M Tokens zum Listenpreis.
- Reduzieren Caching und Geo-Routing die Kosten? — Semantische Cache-Lines in US-, EU- und Asien-Clustern können wiederholte Prompts mit bis zu 90 % Rabatt bedienen — mit Live-Latenz-Telemetrie.
- Können Admins automatisierte Preispipelines überschreiben? — Ja — die Admin-Konsole unterstützt manuelle Preisobergrenzen und Modell-Overrides für Enterprise-Kontingente.