Jede KI-Operation kostet ab sofort eine definierte Anzahl an Credits. Die Credits werden vor Beginn der Streaming-Antwort abgebucht, sodass Nutzer ihr Kontingent nicht mitten in einer Anfrage überschreiten können. Fehlen ausreichend Credits, wird die Anfrage mit einer klaren Fehlermeldung abgelehnt – noch bevor ein Provider-Aufruf stattfindet.
Jedes Abonnement-Tier erhält ein monatliches Credit-Kontingent, das mit dem Abrechnungszyklus zurückgesetzt wird. Nicht verbrauchte Credits verfallen. Das Kontingent skaliert mit dem Tier und passt sich den erwarteten Nutzungsmustern an – von der leichtgewichtigen Erkundung im Free-Plan bis hin zu hochvolumigen Produktions-Workloads im Enterprise-Bereich.
| Tier | Credits / Monat |
|---|---|
| Free | 20 |
| Basic | 100 |
| Pro | 1.000 |
| Enterprise | 10.000 |
Die Credit-Kosten pro Operation variieren je nach Modell und Funktion. RAG-Abfragen kosten mehr als einfache Chat-Completions, da sie neben dem LLM-Aufruf auch Embedding-Generierung und Vector-Retrieval beinhalten.