Die Welt ist aus den Fugen, seit der breiten Öffentlichkeit Ende November 2022 ChatGPT, der Textgenerator des Unternehmens OpenAI, vorgestellt wurde. Nicht nur Schüler und Studenten erfreuen sich einer vereinfachten Bearbeitung ihrer Hausaufgaben, auch im geschäftlichen Umfeld wird diese künstliche Intelligenz (KI) zunehmend eingesetzt, erleichtert sie doch die eigene Denkleistung ungemein. Gleichzeitig werden die Gefahren derartiger Tools heraufbeschworen, von einem „Tsunami des Cheatens“ ist im Magazin Gizmodo die Rede. Erste französische Elite-Universitäten untersagen bereits die Nutzung und New Yorker Schulen verbannen KIs wie ChatGPT von öffentlichen Schulen.
Fragt man ChatGPT, so wird man belehrt, dass ChatGPT auf einem tiefen neuronalen Netzwerk basiere, das auf großen Mengen von Texten trainiert wurde und während des Trainings gelernt habe, Sprachmuster und Zusammenhänge zu erkennen, um menschenähnliche Antworten auf Fragen zu geben. ChatGPT verwende dabei Techniken wie maschinelles Lernen, Sprachmodellierung und künstliche Intelligenz. Um eine Antwort zu generieren, werde eine Methode namens "Generative Pre-trained Transformer" (GPT) verwendet, die auf einer Architektur namens „Transformers“ basiert. Diese Architektur wurde speziell für Sprachverarbeitungsaufgaben entwickelt und ermögliche es, eine große Bandbreite an Sprachmustern zu verstehen und zu generieren.
Neben dem Textgenerator ChatGPT, der aktuell in aller Munde ist, existieren auch zahlreiche Bildgeneratoren wie beispielsweise DallE2, Jasper Art oder Runway. Sie alle basieren auf KI. Mithilfe kurzer Textbefehle, sogenannter prompts, können neue Texte oder Bilder erschaffen werden. Auf einem Modell des Deep Learning beruhend, werden sie mit großen Datenmengen aus dem Internet und sodann mit Algorithmen trainiert, so dass KIs in der Lage sind, eigene, neue Inhalte auszugeben. Anschaulich wurde das Training beispielsweise an Projekten wie Next Rembrandt und auch im Rahmen der Vervollständigung von Beethovens 10. Symphonie. Dabei wurden von der KI wiederkehrende Stilelemente des jeweiligen Künstlers analysiert und extrahiert, um auf dieser Basis neue Werke zu schaffen. Berühmt wurde das Porträt eines gewissen fiktiven Edmond de Belamy, welches aus einem Datenset von 15.000 Porträts beruht und als eines der ersten seiner Gattung bereits 2018 bei Christie’s versteigert wurde.
Inzwischen sind erste Gerichtsverfahren anhängig und nicht nur Getty Images wehrt sich gegen das sogenannte Scraping seines Bildmaterials, das sich auf ein vermeintlich verletztes Repertoire von sage und schreibe 12 Millionen Photographien beläuft. Dies gibt Anlass, sich vertieft mit den rechtlichen Problemen von KI auseinanderzusetzen, allen voran mit dem deutschen Urheberrecht.
Drei urheberrechtliche Themenkomplexe sind zu unterscheiden: erstens die Frage nach der urheberrechtlichen Bewertung im Hinblick auf die in die KI eingespeisten Daten, der sogenannte Input. Zweitens die Frage, wer Urheber der mittels KI generierten Ergebnisse ist oder anders gefragt ob und unter welchem Voraussetzungen Bilder und Texte trotz des Einsatzes von KI eine kreative Leistung desjenigen sein können, der die KI einsetzt. Drittens ist schließlich zu untersuchen, ob durch KI generierte Werke eventuell in bestehende Urheberrechte eingegriffen wird.
Zwangsläufig stellt man sich zuerst die Frage, ob die Verwendung von Datensätzen zum Training von KI-Anwendungen rechtlich überhaupt zulässig ist. So wehrt sich nicht nur Getty Images hiergegen, auch die Künstlerinnen Sarah Andersen, Kelly McKernan und Karla Ortiz klagen vor US-amerikanischen Gerichten gegen die Nutzung ihrer Bilder zu Trainingszwecken mit dem Vorwurf, die Werke seien ohne entsprechende Einwilligung in die Datenbanken der KI-generierte Systeme eingespeist worden.
Nach Angaben von OpenAI stammen die ursprünglichen Datenmengen mit Stand 2020 aus dem Internet, beispielsweise aus Büchern, Wikipedia und anderen frei zugänglichen Textquellen.
Grundsätzlich bedarf es zur Verwendung urheberrechtlich geschützter Texte oder Bilder einer Erlaubnis des Urhebers oder einer gesetzlichen Erlaubnis, dem Grunde nach also auch für die Verwendung von Werken zu Trainingszwecken für eine KI. Nach deutschem Recht greift hier die Schranke des sog. Data Mining ein. Unter Data Mining wird dabei die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken zur Gewinnung von Informationen, insbesondere über Muster, Trends und Korrelationen, verstanden. Nach der auf einer europäischen Richtlinie aus dem Jahr 2019 beruhenden Vorschrift des § 44 b) UrhG sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining auch ohne Einwilligung des jeweiligen Urhebers zulässig.
Das Training einer KI-Anwendungen unter Verwendung von urheberrechtlich geschützten Werken ist dementsprechend grundsätzlich lizenzfrei zulässig. Nach Abschluss des Trainings sind die Daten allerdings zu löschen.
Rechteinhaber haben jedoch die Möglichkeit zum Opt-Out: Sie können einen Vorbehalt gegen ein solches Data Mining erklären, der allerdings zwingend in maschinenlesbarer Form erfolgen muss. Hier herrscht noch weitestgehend Unklarheit, wie dieser Vorbehalt im Einzelnen ausgestaltet sein muss.
Den drei Künstlerinnen wäre daher in Deutschland mit ihrer Klage vermutlich nur wenig Erfolg beschieden, es sei denn, sie hätten vom Opt-Out Gebrauch gemacht. Auch die von ihnen geforderte Vergütung käme vor deutschen Gerichten zu keinem guten Ausgang, da der europäische Gesetzgeber auf eine Vergütungspflicht bewusst verzichtet hat.
Ausgangspunkt der Frage, wer als Urheber des mittels KI kreierten Werkes ist, ist § 2 Abs. 2 UrhG. Urheberrechtlich schutzfähig ist ein Werk jeglicher Art nur dann, wenn es eine persönliche geistige Schöpfung des Urhebers ist. Dabei ist persönlich nur dasjenige, was auf menschliches Schaffen zurückgeht. Daher konnte das berühmte Selfie des Affen Naruto keinen Schutz genießen.
Computerprogramme wie ChatGPT selbst können demgegenüber nach deutschem Urheberrecht grundsätzlich keine persönliche Schöpfung erbringen. OpenAI als das Unternehmen hinter der KI ChatGPT ist mithin nicht Urheber des erzeugten Outputs und die von ChatGPT erzeugten Ergebnisse sind nicht urheberrechtlich geschützt. Daher kann OpenAI an den mittel ChatGPT generierten Inhalten eigentlich auch keine Nutzungs- und Verwertungsrechte einräumen. Interessanterweise hält dies OpenAI nicht davon ab, in seinen Terms und Conditions dem Nutzer sämtliche Rechte einzuräumen: „Open AI assigns you all its right, title and interest in and to Output”.
Naturgemäß kann sich ein Urheber technischer Hilfsmittel bedienen und die hierdurch erschaffenen Werke können schutzfähig sein. Man denke nur an den Einsatz eines Computers oder einer Kamera. Für sämtliche Werke gilt, dass sie ein gewisses Mindestmaß an Schöpfungshöhe erreichen und sich vom Handwerklichen oder Alltäglichen abheben müssen, um in den Genuss des urheberrechtlichen Schutzes - mit einer Dauer von 70 Jahren nach dem Tod des Urhebers - zu kommen.
Als Urheber in Betracht käme derjenige Nutzer, der die Anfrage bei der KI wie ChatGPT stellt, da er die Computersoftware lediglich als Werkzeug/Hilfsmittel nutzt. Man denke nur an die Arbeit des OpenAI Mitarbeiters, der Vermeers berühmtes gemeinfreies Gemälde „Das Mädchen mit dem Perlenohrring“ mittels KI über den Rand hinaus fortsetzen ließ. Um den Schutzanforderungen zu genügen, müsste aber der menschliche Anteil am Output der KI so hoch sein, dass dem Einsatz der KI eine lediglich untergeordnete Bedeutung zukommt. Der Output lässt sich allerdings vom Nutzer im Regelfall nur wenig steuern, so dass kaum davon ausgegangen werden dürfte, dass das Ergebnis dasjenige einer künstlerischen Leitung und eines gestalterischen Prozesses des Eingebenden ist.
Ein Nutzer von Texten und Bildern, die mithilfe von KI generiert wurden, wird sich die Frage stellen, ob er hierdurch ggf. eine Urheberrechtsverletzung begehen könnte. Praktisch relevant ist dies beispielsweise dann, wenn ChatGPT einem urheberrechtlich geschützten Liedtext sehr stark ähnelt oder ein Gedicht nahezu identisch zum Original „ausgespuckt“ wird. Der EuGH hat in der Vergangenheit bereits entschieden, dass ein aus elf Wörtern bestehender Auszug eines geschützten Werkes urheberrechtlich geschützt sein kann. Noch plastischer wird es, wenn man sich vorstellt, dass eine bildgenerierende KI ein neues Bild auswirft, das beispielsweise auf der Grundlage eines berühmten Gemäldes eines noch lebenden Künstlers erschaffen wurde oder diesem stark angelehnt ist.
Aber auch Urheber erfinden seit jeher das Rad nicht neu, sondern knüpfen oft an bereits bestehende schutzfähige Werke an. Dementsprechend regelt § 23 UrhG, dass Bearbeitungen eines Werkes nur mit Zustimmung des Urhebers veröffentlicht und verwertet werden dürfen. Wahrt das neu geschaffene Werk demgegenüber einen hinreichenden Abstand zum benutzten Werk, so liegt keine Bearbeitung, sondern eine freie Benutzung vor.
Die Frage der Abgrenzung zwischen (zulässiger) freier Benutzung und (zustimmungsbedürftiger) Bearbeitung stellte sich auch in der Vergangenheit in der analogen Welt vielfach. Es kommt entscheidend auf den Abstand an, den das neue Werk zum ursprünglichen einhält. Für eine zulässige freie Benutzung müssen angesichts der Eigenart des neu geschaffenen Werks die entlehnten eigenpersönlichen Züge des geschützten älteren Werks verblassen.
Diesen Maßstab wird man auch bei durch KI generierten neuen Werken anwenden. Dabei wird es im Einzelfall darauf ankommen, ob ein mittels KI-generiertes Werk (Text, Bild oder Graphik) einen hinreichenden Abstand zum ursprünglichen Werk aufweist und damit ohne Zustimmung des Urhebers des ursprünglichen Werkes zulässig ist. Das ist stes eine Frage des Einzelfalls.
Sofern eine Rechtsverletzung zu bejahen wäre, gilt im Verhältnis zwischen dem Nutzer und dem verletzten Urheber folgendes: Der Unterlassungsanspruch ist verschuldensunabhängig und der Nutzer wäre Täter der Urheberrechtsverletzung, wenn er selbst die KI generierten Inhalte öffentlich zugänglich macht, beispielsweise durch Verwendung auf seiner Webseite.
Für einen Schadensersatzanspruch wäre darüber hinaus ein vorsätzliches oder fahrlässiges Handeln erforderlich. Dem Nutzer einer KI sind Fehler nicht zuzurechnen, die für ihn – aufgrund seiner Stellung als Nutzer und nicht als Entwickler der KI – nicht erkennbar waren. Allerdings können Nutzer von KI sich wohl in der Regel nicht darauf berufen, dass sie Funktionen der KI nicht kannten bzw. abschätzen konnten und sie dennoch eingesetzt haben. Viele Fragen des Haftungsregimes sind aktuell umstritten. Es ist daher nicht ausgeschlossen, dass insbesondere ein ungeprüftes Übernehmen von durch ChatGPT generierten Inhalten eine eigene Sorgfaltspflichtverletzung seitens des Nutzers darstellt und dass ein Urheber den Nutzer für Rechtsverletzungen durch den Einsatz einer KI verantwortlich macht.
Im Falle von ChatGPT und Dall E wäre auch ein Rückgriff auf OpenAI schwierig. Nach den Nutzungsbedingungen haftet das Unternehmen OpenAI nicht für etwaige Urheberechtsverletzungen, die aus einer Verwendung des ChatGPT resultieren. Vielmehr verweist OpenAI den Nutzer auf seine eigene Verantwortung sicherzustellen, dass die Inhalte, die ChatGPT liefert, angemessen genutzt werden und dass der Nutzer ggf. die erforderlichen Rechte und Genehmigungen besitzt. Auch eine deliktische Haftung von OpenAI wird in den Nutzungsbedingungen ausgeschlossen. Darüber hinaus können ChatGPT und Dall E als KIs auch nicht schuldhaft handeln. Das Unternehmen OpenAI möglicherweise schon.
Die kommerzielle Nutzung von Text- und Bildgeneratoren ist ein Meilenstein. Die Entwicklungen im Bereich der KI und die rechtlichen Antworten hierauf bleiben ein spannendes Feld. Sie wird die Jurisprudenz sicherlich in den nächsten Jahren beschäftigen.
Da für den Nutzer einer KI nicht ersichtlich ist, mit welchen Inhalten eine KI trainiert wurde und dementsprechend unklar ist, ob eventuell Urheberrechte an den verwendeten Inhalten verletzt werden, ist große Sorgfalt geboten. Wenn Output ohne manuelle Prüfung übernommen wird, besteht die Gefahr, dass die Übernahme solcher Inhalte als fahrlässiges, wenn nicht sogar als grob fahrlässiges Verhalten gewertet werden wird. Dafür hätte der Nutzer als Täter der Urheberrechtsverletzung einzustehen. Die Folgen einer Urheberrechtsverletzung sind weitreichend: so bestehen nicht nur – verschuldensunabhängige – Unterlassungsansprüche des Urhebers, sondern darüber hinaus auch noch Schadensersatzansprüche und ggf. auch Rückrufansprüche. Zu denken wäre beispielsweise an die Konstellation, dass von durch KI generierte Marken oder Texte auf Produktverpackungen verwendet werden, was schnell zu beträchtlichen Kosten auf Seiten des Verletzers führen kann. Hier sollte das individuelle Risikoprofil geklärt werden.
Diejenigen, die eine Verwendung ihrer Daten durch KI zu Trainingszwecken verhindern wollen, müssen aktiv werden und das Data und Text Mining untersagen. Hierzu dürfte es nicht ausreichen, in den Nutzungsbedingungen eine Verwendung von Data Mining, Robotern oder ähnlichen Methoden zur Datensammlung oder -extraktion zu verbieten. Erforderlich ist die Implementierung eines maschinenlesbaren Hinweises. Da diese Erklärung aber nicht nachträglich erfolgen kann, sollten Rechteinhaber möglichst schnell aktiv werden.
Alle, die sich vertiefter mit der spannenden Problematik KI auseinandersetzen und sich auch die anderen rechtlichen Minenfelder zu Gemüte führen wollen, empfehlen wir die ADVANT Beiten Broschüre zu diesem Thema, die hier abrufbar ist.