Alibaba Cloud lanciert Open-Source-KI für Videoproduktion
Alibaba Cloud hat das Open-Source-KI-Modell Wan 2.1-Vace vorgestellt, das mit multimodalen Eingaben verschiedene Videoproduktions- und Bearbeitungsaufgaben bündelt. Die Technologie soll KI-gestützte Videoerstellung vereinfachen.

Alibaba Cloud lanciert das Open-Source-KI-Modell Wan 2.1-Vace für Videoproduktion und -bearbeitung. Wie das Unternehmen mitteilt, integriert das Tool zahlreiche Funktionen in einer Plattform, darunter das Generieren von Videos auf Basis von Text-, Bild- oder Video-Eingaben, das gezielte Bearbeiten einzelner Videobereiche sowie das Erweitern von Videoinhalten über intelligente Füllmethoden.
Das KI-Modell nutze die sogenannte Video Condition Unit, um unterschiedliche Eingabetypen zu verarbeiten, und setze eine Context-Adapter-Struktur zur flexiblen Steuerung zeitlicher und räumlicher Merkmale ein, heisst es weiter. Zu den unterstützten Funktionen zählen Bewegungs- und Tiefensteuerung, Posenübertragung, Neueinfärbung sowie die Bearbeitung von Einzelobjekten und deren Umgebung.
Alibabas Open-Source-KI-Modell Wan 2.1-Vace bündelt unterschiedliche Videobearbeitungsfunktionen. (Source: zVg)
Wan 2.1-Vace eigne sich für die Produktion von Inhalten für Social Media, Werbung, Film und Fernsehen sowie für die Erstellung von Schulungsvideos. Wie Alibaba Cloud weiter schreibt, soll der offen zugängliche Quellcode die Einstiegshürden für Nutzende senken und eine individuell anpassbare und kosteneffiziente Produktion von Videoinhalten ermöglichen.
Das Modell ist in zwei Open-Source-Versionen - eine mit 1,3 sowie eine mit 14 Milliarden Parametern - kostenlos auf Hugging Face, Github und Modelscope, der Open-Source-Community von Alibaba Cloud, verfügbar.
Wan 2.1-Vace gehört zur Wan 2.1-Serie, die seit Februar 2025 über das Open-Source-Angebot von Alibaba Cloud erhältlich ist und nach Angaben des Unternehmens bislang über 3,3 Millionen Mal heruntergeladen wurde - mehr dazu können Sie hier lesen.

Lenovo verkauft Medion-Anteile

Trend Micro lanciert KI-basiertes SIEM

Oracle integriert Googles Gemini-Modelle

Die Welt aus der Sicht eines Segelschiffs

Diese Schwerpunkte setzt Jura in seiner Digitalstrategie

EPFL-Forschende entwickeln Propaganda-Detektor für Telegram

Swisscom gründet Sparte für Videoüberwachung

US-Technologie dominiert zwei Drittel der Schweizer Firmen

Alibaba Cloud lanciert besonders geschützte Plattform für KI-Entwicklung
