Google Deepmind lanciert generatives Musikmodell für Gemini

News

Google Gemini bekommt ein neues generatives Tool: Das Musikmodell Lyria 3 erzeugt Songtexte, komponiert dazu Musik und ergänzt diese mit Gesang. An der Entwicklung war auch das Zürcher Team von Google beteiligt.

(Source: freepik / Freepik.com)

Das neu in Google Gemini eingeführte Musikmodell Lyria 3 generiert in wenigen Sekunden einen 30-sekündigen Ohrwurm mit individuellem Cover. Dafür braucht es nur Prompts, Fotos oder Videos, wie Google in einem Blogeintrag schreibt. Im Prompt beschreibt man ein bestimmtes Genre, eine Stimmung, eine Erinnerung oder sogar einen Insider-Witz. Auch ein Foto oder Video kann als Grundlage dienen. Die KI generiert darauf basierend Instrumentalbegleitung und Text. Die Qualität des Ergebnisses hängt vom Prompt ab, wie Google in einem anderen Blogeintrag schreibt.

"Die KI fungiert als Pinsel, aber ihr bleibt die Maler", schreibt Google weiter. Lyria 3 soll drei Punkte in der Audiogenerierung verbessern: User müssen keinen Songtext schreiben, sondern nur einen gut formulierten Prompt eingeben. Sie erhalten zudem mehr kreative Kontrolle über Elemente wie Stil, Gesang und Tempo. Zudem liessen sich realistischere und musikalisch komplexere Tracks erstellen, verspricht Google. Es sei allerdings nicht das Ziel, ein musikalisches Meisterwerk zu schaffen, sondern Nutzerinnen und Nutzern eine unterhaltsame, einzigartige Möglichkeit zu geben, sich individuell auszudrücken.

Der Zürcher Standort von Google war an der Entwicklung des Musikmodells beteiligt. Christine Antlanger-Winter, Country Director Google Switzerland, schreibt in einem Linkedin-Post: "Ich bin besonders stolz darauf, dass Google-Deepmind-Teams aus Zürich und London stark in die Entwicklung dieses neuen Tools eingebunden sind."

Zusammenarbeit gegen Urheberrechtsverletzungen

Google Deepmind stellte Lyria erstmals 2023 vor. Dabei habe man auf verantwortungsvolle Entwicklung und die Kooperation mit der Musik-Community gesetzt, verspricht das Unternehmen. Urheberrechte und Partnervereinbarungen seien beim Training von Lyria 3 ebenfalls ein wichtiger Bestandteil. "Die Musikgenerierung mit Lyria 3 ist auf eigenen künstlerischen Ausdruck ausgelegt, nicht auf das Nachahmen bestehender Künstlerinnen und Künstler", schreibt Google. Das Modell nutzte andere Künstlerinnen und Künstler nur als "Inspiration". Filter sollen die Ausgaben uf mögliche Übereinstimmungen mit bestehenden Inhalten prüfen; eine Meldefunktion soll mögliche Rechtsverletzungen erfassen.

Die generierten Tracks sind mit SynthID versehen - dem nicht wahrnehmbaren Wasserzeichen zur Identifizierung von Google-KI-generierten Inhalten. Ausserdem erweitere Google seine Verifizierungsmöglichkeiten in der Gemini-App auf die Überprüfung von Audio.

Lyria ist ab sofort in Gemini für alle User ab 18 Jahren auf Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Hindi, Japanisch und Koreanisch verfügbar. Künftig soll das Tool in weiteren Sprachen erscheinen. Wer Googles KI-Dienste im Plus-, Pro- oder Ultra-Abo nutzt, sollen von höheren Limits profitieren.

Übrigens: Die Google-Schweiz-Chefin, Christine Antlanger-Winter, ist künftig auch für das Geschäft in Österreich verantwortlich. Lesen Sie hier mehr dazu.

Artikel teilen: