Alibaba Cloud lanciert Open-Source-KI für Videoproduktion
Alibaba Cloud hat das Open-Source-KI-Modell Wan 2.1-Vace vorgestellt, das mit multimodalen Eingaben verschiedene Videoproduktions- und Bearbeitungsaufgaben bündelt. Die Technologie soll KI-gestützte Videoerstellung vereinfachen.

Alibaba Cloud lanciert das Open-Source-KI-Modell Wan 2.1-Vace für Videoproduktion und -bearbeitung. Wie das Unternehmen mitteilt, integriert das Tool zahlreiche Funktionen in einer Plattform, darunter das Generieren von Videos auf Basis von Text-, Bild- oder Video-Eingaben, das gezielte Bearbeiten einzelner Videobereiche sowie das Erweitern von Videoinhalten über intelligente Füllmethoden.
Das KI-Modell nutze die sogenannte Video Condition Unit, um unterschiedliche Eingabetypen zu verarbeiten, und setze eine Context-Adapter-Struktur zur flexiblen Steuerung zeitlicher und räumlicher Merkmale ein, heisst es weiter. Zu den unterstützten Funktionen zählen Bewegungs- und Tiefensteuerung, Posenübertragung, Neueinfärbung sowie die Bearbeitung von Einzelobjekten und deren Umgebung.
Alibabas Open-Source-KI-Modell Wan 2.1-Vace bündelt unterschiedliche Videobearbeitungsfunktionen. (Source: zVg)
Wan 2.1-Vace eigne sich für die Produktion von Inhalten für Social Media, Werbung, Film und Fernsehen sowie für die Erstellung von Schulungsvideos. Wie Alibaba Cloud weiter schreibt, soll der offen zugängliche Quellcode die Einstiegshürden für Nutzende senken und eine individuell anpassbare und kosteneffiziente Produktion von Videoinhalten ermöglichen.
Das Modell ist in zwei Open-Source-Versionen - eine mit 1,3 sowie eine mit 14 Milliarden Parametern - kostenlos auf Hugging Face, Github und Modelscope, der Open-Source-Community von Alibaba Cloud, verfügbar.
Wan 2.1-Vace gehört zur Wan 2.1-Serie, die seit Februar 2025 über das Open-Source-Angebot von Alibaba Cloud erhältlich ist und nach Angaben des Unternehmens bislang über 3,3 Millionen Mal heruntergeladen wurde - mehr dazu können Sie hier lesen.

Vom IT-Systemintegrator über den Trusted Adviser zum Digital-Transformation-Partner

ETH-Spin-off Tinamu ernennt neuen CTO

Wie die Schweiz ihre digitalen Daten besser schützen kann

Klugheit schützt vor Dummheit nicht

Update: Googles KI-Videotool Veo 3 kommt in die Schweiz

Wieso die KI nur in Albträumen zum wahren Schrecken wird

Schweizer Banken versagen bei Betrugsnotfällen

Ricoh holt neuen Channel-Verantwortlichen für die Schweiz an Bord

Cybergauner fluten die Schweiz mit Echtzeit-Phishing
