Neue Auseinandersetzung um Meta: Das Unternehmen steht unter Verdacht, zur Schulung seiner KI Llama Tausende urheberrechtlich geschützte Materialien genutzt zu haben. Dokumente, die vor Gericht eingereicht wurden, zeigen, dass Mark Zuckerberg trotz Warnungen einiger seiner Mitarbeiter diesen Weg eingenommen hat.
In den letzten Monaten hat die Technologiebranche durch immer leistungsfähigere KI-Modelle, die Texte, Bilder und sogar Videos generieren, Aufsehen erregt. Um diese beeindruckenden Ergebnisse zu erzielen, benötigen KI-Systeme riesige Datenbestände, die häufig aus dem Internet stammen. Dabei verschwimmt jedoch die Grenze zwischen „fairer Nutzung“ und der unerlaubten Aneignung geschützter Inhalte zunehmend.
Ein visionäres Modell, eine problematische Datenbasis
Meta steht in dieser Debatte im Zentrum der Diskussion über die Moral und Rechtmäßigkeit der Schulung von Sprachmodellen. Die Kläger, zu denen auch namhafte Autoren gehören, beschuldigen das Unternehmen der unerlaubten Verwendung ihrer Werke. Ihr Hauptvorwurf richtet sich gegen eine umfangreiche Textdatenbank namens LibGen, die für ihre illegalen Kopien bekannt ist. Diese Thematik geht über den einzelnen Urheberrechtsverstoß hinaus und stellt auch die Herausforderung dar, technologische Entwicklungen mit dem rechtlichen Rahmen in Einklang zu bringen.
Llama, die neuste KI von Meta, gilt als ein leistungsstarkes Modell, das in der Lage sein soll, mit bestehenden Wettbewerbern mitzuhalten. Die Teams von Meta hatten erklärt, dass sie Llama auf einem speziellen Supercomputer trainieren wollen, der zu den schnellsten der Welt gehört, wenn es um KI geht. Dieses Modell sollte nahezu unbegrenzten Zugriff auf Tausende von Textquellen erhalten.
Ein Teil dieser gewaltigen Datenbank stammt jedoch Berichten zufolge aus Büchern und Artikeln, die auf der LibGen-Plattform bereitgestellt werden, wo fragliche Dokumente angeboten werden, die häufig als unangemessene Kopien betrachtet werden. Trotz interner Warnungen hat die Führung von Meta offenbar an diesem Plan festgehalten. Laut Kritikern zeigt dieses Vorgehen, dass das Unternehmen schnelle Fortschritte und Effizienz bei der Schulung eines Modells über die Notwendigkeit stellt, sich mit den Urheberrechtsinhabern zu beraten.
Rechtsstreit und Debatte über „faire“ Nutzung
Diese Kontroverse hat sofort zahlreiche Reaktionen in der Kreativszene ausgelöst, besonders von Autoren, deren Werke dabei betroffen sind. Einige kritisieren die „missbräuchliche“ Praxis, die direkt von geschützten Inhalten ohne Kompensation oder Zustimmung profitiert. Allgemein wirft die Situation erneut die Frage der fairen Nutzung auf, ein amerikanisches Konzept, das unter bestimmten Bedingungen die Verwendung geschützter Inhalte für die Erstellung neuer Werke oder die Änderung des Originals gestattet.
Urheber, die durch die Nutzung illegaler Daten benachteiligt wurden, behaupten jedoch, dass es keinerlei signifikante Modifikation gäbe, die eine „faire Nutzung“ rechtfertigen könnte. Im Gegenteil, sie sehen dies als eine direkte Ausbeutung von Daten, die primär zur Schaffung eines kommerziellen Produkts dient. Aus rechtlicher Perspektive bleibt die Frage, wie man Innovation und den Respekt vor geistigem Eigentum in Einklang bringen kann, offen und könnte maßgeblichen Einfluss auf die zukünftige Entwicklung der KI haben.
Quelle : Neowin