Microsoft Azure OpenAI Service bietet zwei verschiedene Abrechnungsmodelle – Standard (On-Demand) und Provisioned Throughput Units (PTUs). Die Preismodelle sind flexibel, sodass Sie die Kosten entsprechend Ihrer Nutzung und Anforderungen steuern können. Dafür ist es wichtig, die grundsätzliche Preisgestaltung zu verstehen, da sie von vielen Faktoren abhängig ist. Microsoft bietet dafür einen Kostenrechner an.
Standard (On-Demand)
Das Modell ist für Anwendungen mit unvorhersehbarem oder variablem Nutzungsverhalten gedacht. Der Preis basiert auf der Verwendung sogenannter Tokens. Einen Token können Sie grob als ein Wort oder den Teil eines Wortes betrachten – es ist die kleinste Einheit von Text, die das jeweilige KI-Modell verarbeiten kann (z. B.: GPT-4o, Dall-E 3, Davinci-002).
Sie bezahlen sowohl für die Eingabe als auch für die Ausgabe. Die Preise für die Nutzung variieren allerdings je nach verwendeter KI. Ein von Dall-E 3 kreiertes Bild in High Definition ist natürlich teurer als ein einzelner Textbaustein von GPT-4o.
Ein Beispiel wäre, dass Sie ein kleines JavaScript in Python konvertieren möchten. Dafür könnten Sie die KI Davinci-002 mit einem JavaScript füttern, dessen Länge etwa 1.000 Token entspricht. Der Output, den Sie in Python erhalten, ist in etwa gleich lang und kostet daher noch einmal 1.000 Token. Den Preis dafür können Sie der jeweils aktuellen Preistabelle entnehmen.
Provisioned Throughput Units (PTUs)
Dieses Abrechnungsmodell ist für Anwendungen geeignet, die eine hohe und konstante Leistung benötigen. Eine PTU ist eine Abrechnungseinheit für eine bestimmte Menge Rechenleistung. Das bedeutet, Sie sichern sich Ressourcen. Das empfiehlt sich bei Echtzeitanwendungen, um geringe Latenzzeiten zu gewährleisten. In der Praxis sind das etwa Chatbots oder virtuelle Assistenten, die im Kundensupport zum Einsatz kommen, oder Onlineshops, die personalisierte Produktempfehlungen in Echtzeit anbieten.
Daneben können beim Microsoft Azure OpenAI Service weitere Kosten anfallen. Etwa für die Feinabstimmung (das Training und Hosting), wenn Sie KI-Modelle an Ihre spezifischen Anforderungen anpassen möchten. Für Anwendungen, die eine große Menge an Daten verarbeiten, gibt es außerdem spezielle Preismodelle.