Editiert Bilder per Textprompts

Apple stellt neues KI-Bildwerkzeug vor

Uhr
von Dejan Wäckerlin und rja

Apple präsentiert ein neues KI-Tool, mit dem sich bereits existierende Bilder bearbeiten und modifizieren lassen. Das Programm lässt sich über Textprompts bedienen.

(Source: pvproductions / freepik.com)
(Source: pvproductions / freepik.com)

Apple hat auf der International Conference on Learning Representations ein neues KI-Programm vorgestellt, mit dem sich Bilder bearbeiten und retuschieren lassen. Das "MLLM-Guided-Image Editing"-Modell (MGIE), das Apple in Zusammenarbeit mit der University of Santa Barbara entwickelte, kann auf entsprechende Textanweisungen hin das Bild schneiden, ändern, drehen und dem Bild im Stil von Photoshop Modifikationen hinzufügen, wie das Onlineportal Golem schreibt.

Laut den Forschern der Universität Santa Barbara funktioniert das System durch die Integration grosser, multimodaler Sprachmodelle. Zunächst nutze MGIE dafür ein "Multimodal Large Language Model" (MLLM), um die Texteingabe des Nutzers zu interpretieren. Dann "stellt" es sich vor, wie das bearbeitete Bild aussehen soll, wie "Theverge" erklärt. Ein User kann laut dem Bericht beispielsweise Folgendes eingeben: "Mach den Himmel blauer". Daraus würde das MGIE eine präzise Anweisung wie "Erhöhe die Sättigung der Himmelsregion um 20 %" herleiten.

In Demonstrationen würde MGIE beweisen, dass es eine Vielzahl von Bearbeitungsszenarien bewältigen könne – von einfachen Anpassungen wie Beschneiden und Drehen bis hin zu komplexen Objektmanipulationen, wie aus dem Paper hervorgeht. Der KI-Assistent könne hierbei sowohl das ganze Bild bearbeiten, um etwa die Bildqualität insgesamt zu verbessern, als auch bestimmte Regionen, Objekte oder Attribute anpassen.

Im Gegensatz zu anderen Unternehmen, darunter Microsoft, Meta oder Google, ist Apple aktuell kein grosser Akteur im Bereich der KI, wie "Theverge" weiter schreibt. Dennoch befasste sich das Unternehmen 2023 vermehrt mit dem Thema und möchte mehr KI-Funktionen in seine Geräte integrieren.

Übrigens: Apple bastelt an seinem eigenen grossen Sprachmodell namens AppleGPT. Intern soll die Lösung bereits Anwendung finden, wie Sie hier lesen können.

Webcode
sbu6ZEwF