Meta-KI lernt ganze Bücher auswendig – Das könnte den Konzern jetzt Milliarden kosten

Ein KI-Modell von Meta soll ganze Bücher auswendig gelernt haben. Dies könnte dem Konzern nun eine Strafe in Milliardenhöhe einbringen.

Meta-KI lernt Bücher auswendig – jetzt droht Milliarden-Strafe

Wenn auch nur drei Prozent des umstrittenen Books3-Datensatzes unrechtmäßig verwendet wurden, könnte gegen Meta eine Strafe von fast einer Milliarde Dollar fällig werden. © Anthony Quintano

Die KI-Modelle von Meta könnten Mark Zuckerbergs Konzern teuer zu stehen kommen: Mindestens eines von ihnen hat ganze Bücher nahezu Wort für Wort gespeichert. Besonders stark betroffen sind bekannte Werke englischer Autoren wie J. K. Rowling und George Orwell. In den USA und Großbritannien prüfen Gerichte bereits, ob Tech-Unternehmen wie Meta beim Training ihrer KI-Modelle urheberrechtlich geschützte Bücher verwenden dürfen.

Ein Meta-Modell speicherte komplette Textpassagen

Im Zentrum der Auseinandersetzung steht der sogenannte Books3-Datensatz. Dieser enthält laut New Scientist fast 200.000 Bücher – darunter viele Raubkopien. Die Entwickler von KI-Sprachmodellen, sogenannten Large Language Models (LLMs), nutzten diesen Datensatz, um ihre Systeme zu trainieren.

Insgesamt wurden 13 Open-Source-Modelle unter die Lupe genommen: Neben solchen von Meta wurden auch Modelle von Google, DeepSeek, EleutherAI und Microsoft untersucht. Viele Modelle konnten die Texte dabei nur teilweise korrekt rekonstruieren. Doch eines von Metas Modellen – das Llama 3.1 70B – speicherte nahezu den gesamten Inhalt einiger Bücher.

Dazu zählen Harry Potter und der Stein der Weisen von J. K. Rowling, aber auch The Great Gatsby von F. Scott Fitzgerald und George Orwells 1984.

Für den Test zerlegten die Forscher Buchauszüge in zwei Teile: einen Anfang (Prefix) und einen Schluss (Suffix). Die KI erhielt den Anfangssatz und sollte den Rest ergänzen. Die Forscher berechneten anschließend die Wahrscheinlichkeit, dass die KI den Originaltext exakt wiedergibt. 

Bei Urheberrechtsverstoß droht Milliardenstrafe 

Laut Experten reicht bereits ein Nachweis, dass nur 3 Prozent des Books3-Datensatzes unrechtmäßig verwendet wurden, um gegen Meta eine Strafe von fast einer Milliarde Dollar zu verhängen. Je nach Gewinnlage des Unternehmens könnten die Summen sogar noch höher ausfallen.

Mehrere Verfahren gegen Meta laufen bereits. Besonders im Fokus steht der Fall Kadrey v Meta Platforms. Bei dieser Sammelklage werfen mehrere Autoren, darunter Richard Kadrey, dem Konzern vor, ihre Bücher ohne Erlaubnis zum Training von KI-Modellen genutzt zu haben. Im Zentrum steht der Vorwurf der direkten Urheberrechtsverletzung sowie das Entfernen von Copyright-Informationen. Das Verfahren läuft am Bezirksgericht in Kalifornien und könnte wegweisend sein, inwiefern das Training von KI ohne Lizenz als Fair Use zulässig ist.

Meta verweist auf „Fair Use“, doch britische Regeln sind deutlich strenger

Emil Vazquez, Sprecher von Meta, erklärte: „Die faire Nutzung urheberrechtlich geschützter Materialien ist entscheidend für die Entwicklung unserer KI-Modelle.“ Man sei anderer Meinung als die Kläger und die vollständigen Fakten erzählten „eine andere Geschichte“.

In den USA berufen sich Unternehmen wie Meta auf die sogenannte „Fair Use“-Regel. Diese erlaubt die Nutzung von urheberrechtlich geschützten Inhalten ohne Erlaubnis – zumindest unter bestimmten Bedingungen.

In Großbritannien – dem Land, aus dem die urheberrechtlich geschützten Werke in diesem Fall stammen – gilt hingegen das Prinzip des „Fair Dealing“. Diese Regelung bietet viel weniger Spielraum. Robert Lands von der Kanzlei Howard Kennedy in London sagte, dass die Speicherung ganzer Bücher hier „sehr bedeutend aus urheberrechtlicher Sicht“ sei. Wie die Gerichte letztlich entscheiden, wird große Auswirkungen auf die gesamte KI-Branche haben.

Kurz zusammengefasst:

  • Metas KI hat ganze Bücher nahezu vollständig auswendig gelernt, darunter Bestseller wie Harry Potter.
  • Experten schätzen, dass schon bei 3 Prozent des Datensatzes milliardenschwere Strafen drohen.
  • In den USA und Großbritannien laufen mehrere Urheberrechtsklagen gegen Meta wegen unrechtmäßiger Nutzung geschützter Bücher.

Übrigens: Im Wettlauf um die KI stellt sich ein Start-up aus Heidelberg der Dominanz von Meta. Mehr dazu gibt es in diesem Artikel.

Bild: © Anthony Quintano via Wikimedia Commons unter CC BY 2.0-Lizenz

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert