Urheberrecht und Trainingsdaten:Was muss man bei KI-Bildern beachten?
von David Metzmacher
|
Haben KI-generierte Bilder einen Urheber? Worauf muss man bei der Nutzung achten? Und beuten KI-Konzerne unsere Daten aus? Antworten auf die wichtigsten Fragen.
Beim Urheberrecht KI-generierter Werke stellen sich neue Fragen.
Quelle: AFP
Text- und Bildgeneratoren wie ChatGPT mit Künstlicher Intelligenz haben sich für das Training ihrer Modelle an öffentlich verfügbaren Quellen im Internet bedient - ohne sich groß ums Urheberrecht zu scheren. Das beklagen Verlage wie die New York Times als auch Kreativschaffende.
Aber wie ist die rechtliche Lage wirklich? Was müssen Nutzer beim Umgang mit KI-Bilder beachten? Und wie können Kreative Ihre Werke vor KI-Zugriff schützen? Die wichtigsten Fragen und Antworten.
Laut Bildungsexperten der Kultusministerkonferenz hat Künstliche Intelligenz im Bildungsbereich großes Potenzial.17.01.2024 | 1:33 min
Worauf muss ich achten, wenn ich KI-generierte Bilder nutzen möchte?
Juristen sind sich einig, dass KI-generierte Werke im Normalfall keinen Urheber im rechtlichen Sinne haben, sagt Rechtsanwalt Joerg Heidrich, der auch KI-Unternehmen berät: "Für den Nutzer heißt das, er kann ein KI-generiertes Bild frei verwenden und es etwa auf seine Webseite stellen - auf der anderen Seite kann das jeder andere mit dem gleichen Bild aber auch tun."
Kristian Kersting, Professor für maschinelles Lernen am Fachbereich Informatik der Technischen Universität Darmstadt, dagegen meint: "Das ist eine schwierige Frage, die noch nicht abschließend beantwortet ist." Denn die ihr zugrundeliegenden Gesetze stammen schließlich aus einer Zeit ohne generative Künstliche Intelligenz. Kersting empfiehlt in jedem Fall darauf hinzuweisen, wenn ein Bild KI-generiert ist.
Ein anderer Aspekt sei die Natur der Bilder, so Kersting: "In den großen Trainingsdatensätzen sind - wenn auch unabsichtlich - möglicherweise gewaltverherrlichende Bilder dabei". Außerdem neige KI-Output stark zu Stereotypisierung, erklärt Kersting: "So werden asiatisch Frauen häufig anzüglich abgebildet, während Feuerwehrleute meist männlich und kaukasisch dargestellt werden". Da müsse jeder Nutzer abwägen, ob er diese Bilder dann auch nutzen wolle.
Die CES in Las Vegas ist eine der größten Technikmessen der Welt. Zu ihrem Start haben viele der wichtigsten Aussteller den Beginn einer neuen Ära ausgerufen - die Zeit der KI.09.01.2024 | 1:42 min
Muss ich Angst haben, verklagt zu werden?
Das ist sehr unwahrscheinlich, glaubt Heidrich, denn die KI-Bilder haben schließlich keine Urheberschaft. Anders sähe es aus, wenn Nutzer urheberrechtlich geschützte Bilder bei KI-Generatoren hochladen und diese beispielsweise von der KI bearbeiten lassen. Zur Vorsicht rät Heidrich auch bei der Wiedergabe von bekannten Personen oder Filmfiguren.
Ein ungelöstes Problem, so Kersting, sei die Frage, ob ein Bild, das ein KI-Generator ausspuckt, einem Bild aus dem Trainingsdatensatz entspricht oder zumindest gleicht. "Das wäre dann natürlich ein Problem", so Kersting, "aber dieser Abgleich ist in der Theorie zumindest möglich".
Woher kommen die Trainingsdaten für KI-Modelle?
Damit KI-Bildgeneratoren wissen, wie eine Katze, wie ein Hund und wie ein Mensch aussieht, müssen sie zuvor trainiert werden. "Dafür braucht ein KI-Modell sehr, sehr viele Daten", erklärt KI-Experte Kersting. Aber wo kommen diese Daten her?
Es wird aber vermutet, dass die meisten Bilder schlicht aus dem Internet stammen, so Kersting. Bei europäisch geprägten Anbietern ist teils bekannt, welche Datengrundlage sie nutzen, erklärt Jurist Heidrich. Manche Modelle nennen ihren Datensatz.
Das könnte sich durch das neue europäische KI-Gesetz möglicherweise ändern: "Ob das die amerikanischen Anbieter aber beachten werden, steht nochmal auf einem anderen Blatt", sagt Heidrich.
Häufig sieht man Bilder im Internet, die von einer Künstlichen Intelligenz geschaffen wurden. Manche Fälschungen sind offensichtlich. Aber es entstehen immer mehr gefährliche Fakes.27.12.2023 | 1:50 min
Dürfen Unternehmen wie OpenAI einfach Bilder und Texte aus dem Netz zum Training verwenden?
Im amerikanischen Rechtssystem ist das eine Frage des Prinzips "fair use", das die nicht-autorisierte Nutzungen von geschütztem Material gestattet - sofern die Nutzung der öffentlichen Bildung und der Anregung geistiger Produktionen dienen.
"Dazu gibt es aber derzeit viele Diskussionen und Verfahren", so Heidrich. In Europa gibt es seit der letzten Urheberrechtsreform eine Vorgabe, nach der das zulässig ist: Text- und Datamining sind demnach auch für kommerzielle Zwecke erlaubt - das regelt der Paragraph 44b des Urheberrechtsgesetzes.
(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. (2) Zulässig sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining. Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind. (3) Nutzungen nach Absatz 2 Satz 1 sind nur zulässig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugänglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.
Kann ich als Illustrator oder Fotograf verhindern, dass meine Bilder für das KI-Training genutzt werden?
"Ja, in der Theorie können Sie das", sagt Heidrich. Denn das Urheberrecht sieht ein sogenanntes Opt-out vor - Urheber von Werken können sich gegen die Nutzung ihrer Daten aussprechen, etwa im Impressum einer Webseite.
Das andere Problem: Für das Opt-out gibt es derzeit keinen Standard - und ohne Offenlegung der Trainingsdatensätze wäre auch die Einhaltung kaum zu überprüfen.
Wie könnten Illustratoren oder Fotografen am Gewinn mit KI-Modellen beteiligt werden?
In Deutschland ist das Modell der Verwertungsgesellschaften geläufig, wie die VG Wort oder die VG Bildkunst. "Es wäre sicherlich möglich, dass hierzulande etwas ähnliches kommt", so Heidrich. Die Regelung der Verteilung könnte jedoch kompliziert werden.
Auch Kersting glaubt, dass etwas Vergleichbares in Zukunft angewandt wird: "Auch als Musik-Streamingdienste aufkamen, musste sich die Vergütungsstruktur erst neu sortieren - ähnlich könnte das auch bei generativer KI sein."