GPT-OSS für Entwickler

OpenAI lanciert lokal nutzbare Open-Weight-Modelle

Uhr
von Joël Orizet und NetzKI Bot und fsi

OpenAI hat zwei Open-Weight-Modelle veröffentlicht, die User auf eigener Infrastruktur betreiben und weiterentwickeln können. Das grössere Modell soll die Leistung von o4-mini auf einer einzelnen GPU erreichen, während die kleinere Variante speziell für den Einsatz auf Edge-Geräten konzipiert ist.

(Source: Levart_Photographer / Unsplash.com)
(Source: Levart_Photographer / Unsplash.com)

OpenAI hat mit GPT-OSS-120B und GPT-OSS-20B zwei neue Open-Weight-Reasoning-Modelle vorgestellt. Ein Open-Weight-Modell ist ein KI-Sprachmodell, dessen trainierte Parameter – also die gelernten Gewichtungen (Weights) – frei zugänglich sind; es lässt sich dadurch analysieren, testen oder weitertrainieren. Im Unterschied zu einem Open-Source-Modell ist der zugrunde liegende Code jedoch nicht zwingend offen oder vollständig frei nutzbar.

Das grössere Modell mit 120 Milliarden Parametern erreicht laut Unternehmensangaben die Leistung des hauseigenen Reasoning-Modells o4-mini – benötigt dafür aber nur eine einzelne 80-Gigabyte-GPU. Die kleinere Variante mit 20 Milliarden Parametern liefere hingegen Reasoning-Fähigkeiten bereits auf 16-Gigabyte-Edge-Geräten, teilt OpenAI mit. 

Mit der Veröffentlichung unter der Apache-2.0-Lizenz wolle man die Einstiegshürden für Entwickler und Organisationen senken, insbesondere in Hochsicherheitsumgebungen oder Schwellenländern, die KI auf eigener Infrastruktur betreiben und anpassen möchten. Die Gewichte der Modelle stellt das Unternehmen unter anderem auf der Plattform Hugging Face bereit.

Ein Screenshot der Demo, mit der Entwickler die beiden neuen Open-Weight-Modelle von OpenAI ausprobieren können.

Entwickler können die neuen Open-Weight-Modelle von OpenAI im Rahmen einer Demo ausprobieren. (Source: openai.com)

Neuer Sicherheitsstandard

Begleitend führt OpenAI ein neues Sicherheitsprotokoll namens "Worst-Case-Fine-Tuning" ein. Dieses soll die missbräuchliche Nutzung der Modelle in sensiblen Bereichen wie Biologie und Cybersicherheit simulieren. "Externe Experten" hätten diese Methodik überprüft, verspricht der Hersteller. Das Unternehmen stellt zudem den Evaluierungscode, die Prompts und die Bewertungsrichtlinien bereit. Dies soll den Sicherheitsstandard für Open-Weight-Modelle anheben.

Um die Implementierung zu erleichtern, stellt OpenAI Entwicklerhandbücher und Tools für die Integration mit Hugging Face, vLLM, Ollama, llama.cpp sowie einschlägigen GPU-/Beschleunigerplattformen zur Verfügung. 

"Geprägt von demokratischen Werten"

Sam Altman, CEO von OpenAI, bezeichnet die Veröffentlichung als Ergebnis "von Milliarden US-Dollar an Forschung". Man wolle KI "in die Hände möglichst vieler Menschen" bringen sowie neue Formen von Forschung und Produktkategorien ermöglichen.

Ein Foto von Sam Altman.

Sam Altman, CEO von OpenAI. (Source: openai.com)

Seit der Gründung von OpenAI im Jahr 2015 verfolge das Unternehmen das Ziel, eine AGI (Artificial General Intelligence), also eine allgemeine künstliche Intelligenz, zu entwickeln, die der Menschheit zugutekommen soll. "In diesem Sinne freuen wir uns, dass die Welt künftig auf einem offenen KI-Stack aufbauen kann – entwickelt in den USA, geprägt von demokratischen Werten, kostenlos zugänglich und zum breiten Nutzen aller", lässt sich Altman in der Mitteilung zitieren. 

 

Übrigens: GPT-5, OpenAIs KI-Modell der nächsten Generation, steht angeblich kurz vor dem Start. Hinter den Kulissen scheint das Unternehmen die Produktvielfalt zu verschlanken - GPT-5 soll nämlich gleich mehrere Modelle in sich vereinen. Mehr dazu lesen Sie hier

Webcode
tVHBgKcR