Künstliche Intelligenz produziert neue Lieder per Mausklick

    Lieder per Mausklick:Revolutioniert die KI die Musikindustrie?

    von David Metzmacher
    |

    Wer früher Musik machen wollte, musste viel können - heute reicht ein Prompt und ein KI-Modell. Was bedeutet das für Künstler, die Branche und die Zukunft der Musik?

    Klangwellen im Instrumentenraum - KI-generiertes Bild
    Wie kreativ ist generative Künstliche Intelligenz? (Das Bild wurde mit einer KI generiert)
    Quelle: DALL-E / David Metzmacher

    Generative Künstliche Intelligenz macht auch vor Musik nicht halt: Neue Musik zu schaffen, ist heute so einfach wie nie. Die Musikverwertungsgesellschaft Gema sieht darin, "dass es massenhaft neue KI-generierte Musik geben wird", eine Konkurrenz zu menschlich gemachter Musik. Was bedeutet das für Künstler, Musikproduzenten und die Branche?

    Suno AI - KI-Songs in Radioqualität?

    Seit einigen Wochen erhält Suno AI viel Aufmerksamkeit, denn die neue Version des KI-Modells gilt als Maßstab für Songs per Mausklick. "Als ich das zum ersten Mal getestet habe, war ich sehr überrascht, in welcher Qualität das mittlerweile funktioniert", sagt Musikproduzent Thomas Foster.

    Die KI kann heute einen kompletten Song erstellen, der sich anhört, als hätte jemand ihn geschrieben, der Musik studiert hat und seit 20 Jahren nichts anderes tut als Musik zu komponieren und zu produzieren.

    Thomas Foster, Musikproduzent

    ... ist ein österreichischer Musikproduzent. Foster macht selbst Elektronische Tanzmusik (EDM) und hat mit seinem musikalischen Partner bekannte Jingles produziert, etwa das Intro der Nachrichtensendung "RTL Aktuell".

    Selbsttest: Wie funktioniert Musikproduktion mit KI?

    Ähnlich wie beim Chatbot ChatGPT lassen sich Lieder mit nur wenigen Stichworten, dem Prompt, generieren - inklusive Songtext. Es ist ebenfalls möglich, Lyrics sowie ein gewünschtes Genre vorzugeben. Im Beispiel hat das Programm (in der Bezahlvariante) den Auftrag erhalten, einen Countrysong mit deutschem Text über die Kunst des Pizzabackens zu generieren.
    Bild einer Pizza - erstellt mit DALL-E
    Prompt: "Erstelle ein Lied mit deutschen Texten über die Kunst der Pizzaherstellung, Genre Country."28.03.2024 | 1:26 min

    Ich nehme Mehl und Wasser, eine Prise Salz
    Knete den Teig, mach ihn wunderbar (wunderbar)
    Lege ihn zur Seite und lass ihn ruhen
    Denn die Kunst der Pizza hat gerade begonnen (oh-ja)

    Rolle den Teig aus, dünner als dünn
    Schmiere die Sauce, bis nichts mehr drin (nichts mehr drin)
    Streu den Käse großzügig aus
    Die Kunst der Pizza lässt mich träumen, ganz laut (jaaa)

    Das ist die Kunst der Pizza, so lecker und fein (so fein)
    Jeder Biss ist ein Stück vom Paradies (Paradies)
    Mit jedem Topping, jede Zutat genau richtig
    Die Kunst der Pizza, das ist meine Geschichte (ganz laut)

    Quelle: Suno AI / David Metzmacher

    Der Test zeigt: Suno AI hat auf Basis des Prompts ein in sich stimmiges Lied generiert. Die KI könnte den gleichen Text ebenfalls als Metal-, Rap- oder Opern-Stück interpretieren.

    Songs per Knopfdruck: Nicht alles perfekt

    "Prinzipiell funktioniert das schon ziemlich gut", sagt Professorin Dr. Heike Adel-Vu von der Hochschule der Medien in Stuttgart. "Wenn man sich die Stücke aber im Detail anhört, dann findet man Artefakte und es gibt einiges, was die KI nicht so gut kann." Beispielsweise falle es der KI schwer, über längere Zeit konsistent zu bleiben.

    Die KI hat schließlich keine Ahnung von der Theorie hinter der Musik oder bestimmten Aspekten der Melodieführung.

    Heike Adel-Vu, Professorin für Künstliche Intelligenz für audiovisuelle Medien

    So werden mal Wörter hinzu halluziniert, Silben seltsam ausgesprochen oder Teile einer Strophe plötzlich zum Refrain. Auch Foster sieht Probleme bei den KI-Songs: "Es ist die technische Qualität, also wie das Audiomaterial klingt - das ist noch nicht bei hundert Prozent, das klingt wie ein schlechtes MP3." Zudem klängen die KI-Lieder meist wie von gestern: "KI kann Dinge super replizieren, die sie oft genug gesehen hat. Jeder Song, der heute in den Chart ist, hat irgendetwas, was es so noch nicht gab. Und da glaube ich, wird sich KI schwertun."

    Die wichtigsten Tracks dieser Erde, die weltweit in den Charts landen, werden auch in Zukunft eher von Menschen gemacht werden als von Maschinen.

    Thomas Foster, Musikproduzent

    "Bei generativen KI-Modellen spricht man auch von stochastischen Papageien. Sie plappern potenziell also viel nach, haben aber durchaus Zufallsprozesse, die dann Dinge generieren, die so vorher nicht existiert haben", erklärt Adel-Vu.

    Also insofern kann die KI schon "kreativ" werden. Aber das ist sehr stark eingeschränkt, weil die Modelle sehr abhängig sind von ihren Trainingsdaten.

    Heike Adel-Vu, Professorin für Künstliche Intelligenz für audiovisuelle Medien

    Künstlicher Intelligenz in der Musikindustrie als Chance

    KI-Modelle wie Suno AI können laut Foster die Arbeit von Musikproduzenten nicht ersetzen, aber Inspiration liefern oder beim Komponieren helfen. "Ich glaube, dass man KI gut als Brainstorming-Partner, als Kreativpartner nutzen kann - besonders zu Beginn eines kreativen Prozesses, um schnell verschiedene Stilrichtungen, Melodien oder Texte auszuprobieren", sagt auch Adel-Vu.
    Neben der direkten Generierung neuer Lieder, biete Künstliche Intelligenz auch weitere Möglichkeiten: "Zum Beispiel kann man KI benutzen, um ähnliche Musikstücke oder Samples zu finden. Das ist manuell in großen Datenbanken sehr aufwändig und zeitintensiv - da kann eine Automatisierung durch KI den Prozess extrem beschleunigen." Insgesamt gebe es aber noch viele offene Fragen - wie die nach dem Urheberrecht:

    Sowohl die Frage, wem die KI-generierten Songs gehören als auch, ob die KI-Modelle mit urheberrechtlich geschütztem Material trainiert wurden.

    Heike Adel-Vu, Professorin für Künstliche Intelligenz für audiovisuelle Medien

    KI-Apps auf einem Handydisplay
    Mit großer Mehrheit stimmt das EU-Parlament für den AI Act. Das Gesetz ist das erste seiner Art und sieht etwa die Unterteilung von KI-Systemen in verschiedene Risikogruppen vor.13.03.2024 | 2:29 min

    Gema: Viel Skepsis bei Musikschaffenden

    Auch die Musikverwertungsgesellschaft Gema sieht offene Fragen sowie Risiken für die Branche: "Die größte Sorge der Musikurheberinnen und -urheber ist, dass KI generierte Musik in vielen Bereichen die menschlich gemachte Musik ersetzt." Die Gema fordert mehr Transparenz von den KI-Firmen, einheitliche Kriterien für die Offenlegung der Trainingsdaten sowie eine Beteiligung der Urheber an den Erlösen.
    Bei Musikschaffende überwiegt die Einschätzung, das generative KI eher ein Risiko als eine Chance darstellt - wie eine Ende Januar veröffentlichte Studie zeigt:
    Musikschaffende sind skeptisch gegenüber generativer KI

    ZDFheute Infografik

    Ein Klick für den Datenschutz
    Für die Darstellung von ZDFheute Infografiken nutzen wir die Software von Datawrapper. Erst wenn Sie hier klicken, werden die Grafiken nachgeladen. Ihre IP-Adresse wird dabei an externe Server von Datawrapper übertragen. Über den Datenschutz von Datawrapper können Sie sich auf der Seite des Anbieters informieren. Um Ihre künftigen Besuche zu erleichtern, speichern wir Ihre Zustimmung in den Datenschutzeinstellungen. Ihre Zustimmung können Sie im Bereich „Meine News“ jederzeit widerrufen.

    Im Auftrag der Musikverwertungsgesellschaften Gema (Deutschland) und Sacem (Frankreich) hat Goldmedia eine Studie zum Einsatz von künstlicher Intelligenz in der Musikbranche in Deutschland und Frankreich durchgeführt. Wesentlicher Bestandteil war eine Online-Befragung Mitglieder zwischen dem 30. Oktober und 20. November 2023. Insgesamt nahmen über 15.073 Personen teil, die haupt- oder nebenberuflich als Komponisten, Textdichter oder für Musikverlage tätig sind. Viele der Befragten arbeiten zugleich auch als ausübende Künstler, Produzenten oder für Musiklabels.

    Quelle: Gema

    Besonders betroffen von generativer KI sei laut Gema der Bereich der so genannten "production music" sein, wie Hintergrundmusik, Gebrauchsmusik aber auch Filmmusik.

    KI als Tool soll kreative Arbeit unterstützen und nicht ersetzen.

    Gema

    Auch Musikproduzent Foster geht davon aus, dass generative KI seinen Beruf "deutlich verändern wird". Sorgen mache er sich aber trotzdem nicht:

    Allein das Wissen, dass ein Lied eine KI gemacht hat, die keine Gefühle hat und die nur so tut, als hätte sie welche, macht Zuhörer nicht wirklich glücklich. Deshalb wird es Menschen immer wichtig sein, Musik zu hören, die letztendlich wiederum von Menschen gemacht wird.

    Thomas Foster, Musikproduzent

    Mehr zu generativer Künstlicher Intelligenz