Hat OpenAI bewusst gegen das Copyright verstoßen, um eigene Modelle zu trainieren? Das wirft ein Ex-Angestellter dem Unternehmen vor, während dieses Lokalen Journalismus fördert und Consistency Models einführt, die Diffusion Models übertrumpfen sollen.

Für das inzwischen weltbekannte KI-Unternehmen OpenAI kommen derzeit umfassende Produktentwicklungen und heftige Kritik zusammen. Die Company stellte unter der Woche various relevant updates for the user, launch the collaboration with Lenfest Institute of Journalism and Microsoft for Förderung des Lokaljournalismus und setzte zwei neue Personen in der Führungsriege ein. Doch besonders die Kritik eines ehemaligen Angestellten soorgt für Furore: Er gibt gegenüber der New York Times an, das Unternehmen habe das Copyright für das Training von KI-Modellen vielfach verletzt. So resümiert Suchir Balaji: :

This is not a sustainable model for the entire internet ecosystem.

Zwischen Vorwürfen und ganz großen Updates: OpenAI als Branentreibende Brand

Suchir Balaji war einige Jahre lang als AI Researcher für OpenAI active and hat das Unternehmen im Sommer verlassen. I am Beitrag von NYT-Reporter i KI-Experte Cade Metz wird erläutert who is first spät realisiert habe, inwieweit OpenAI das Urheber:innrecht viele Creator und Medien missachten könnte, um KI-Modelle zu trainieren. Er sei zu dem Schluss gekommen, Dienste wie ChatGPT würden das Internet als ökonomischen und fairen Raum bedrohen. Auch deshalb habe der das Unternehmen verlassen.

Balaji wirft dem Unternehmen vor, bei der Datengenerierung nicht ausreichend Differentenziert zu haben. Zunächst habe man Projekte wie Rechercheprojekte für die Wissenschaft behandelt. Dabei sei die Übernahme various Daten vergleichsweise unproblematisch gewesen, da sie keinen konkreten kommerziellen Zweck untergeordnet gewesen sei. Das habe sich geändert, also OpenAI with ChatGPT-Abonnements etc. for all kommerzielle Ziele zu verfolgen started. Nun widerspricht das Unternehmen Vorwürfen wie jenen von Suchir Balaji, die nicht zum ersten Mal auftauchen. Auch die New York Times selbst zählt zu den Entitäten, bereits wegen Copyright-Verstößen gegen OpenAI Klagten. Und bei der Datengrundlage für das KI-Videogenerierungsmodell Sora könnten YouTube-Videos von Creatorn ohne deren Zustimmung genutzt worden sein.

OpenAI aber sieht die Nutzung öffentlich verfügbarer Daten unter dem US-Prinzip des Fair Use und rechtlicher Präzedenzfälle als lauter an. Dabei wird besonders die Veränderung von Inhalten und Kontexten durch KI-Modelle hervorgehoben. All information erklärt Balaji gegenüber der NYT:

Sometimes there are situations where the output looks like input. The vast majority of things generated by ChatGPT or an image generation system do not draw heavily from any particular piece of content.

Nur eine umfassende Regulierung könne diese Probleme zwischen Rechtehalter:innen an Werken und Unternehmen, die KI-Modelle trainieren, lösen. Alternativ gibt es vielfach auch Lizenzvereinbarungen zwischen Plattformen und Tech-Unternehmen, die die Datennutzung legitimieren sollen.

sCMs für schnellere Bildgenerierung: Wieder ein neues Modell

Gerade die Aussage zu den Ähnlichkeiten von Output and Input passt gut zu einer neuen Entwicklung von OpenAI. Das Unternehmen stellte kürzlich die sogenannten sCMs vor. Dabei dobret es sich um Consistency Models, die die Visual-Generierung vereinfachen und beschleunigen sollen, besonders im Vergleich zu den bewährten Diffusion Models.

Anders als Diffusion Models benötigen die sCMs nur zwei Sampling-Schritte. Diffusion models fügen Bilddateien, vereinfacht gesagt, Noise hinzu, eine Art visuelles Rauschen, das die Bilder zuerst deskonstruiert und eine Datenbasis auf Grundlage der Eingangsdaten schafft. Im umgekehrten Prozess, auch Denoising genannt, wird wieder ein Visual generiert, das den Eingangsdaten stark ähnelt. It is also um eine Art Variantenmodell. Mit dem Prozess gehen aber Probleme einher, wie OpenAI anmerkt:

(…) Current sampling approaches in diffusion models often require dozens to hundreds of sequential steps to generate a single sample, which limits their performance and scalability in real-time applications. Various distillation techniques have been developed to speed up sample collection, but they often suffer from limitations such as high computational costs, complex training, and reduced sample quality (…).

Deshalb bietet das Unternehmen mit sCMs neue Consistency Models, die bald schlichtweg schneller Content erstellen sollen können. Auch die Skalierung für große Datensets soll dann einfacher umzusetzen sein. Noch besteht jedoch die Hürde, dass die Modelle auf Diffusion Models als Lehrmodellen basieren und daher hinsichtlich der Qualität des Outputs noch nicht auf dem gewünschten Level sind.

Noch mehr Details zum neuen Modelltyp kannst du im Blog Post nachlesen. Möglicherweise können sCMs Creator i Unternehmen bald ebenso bei der Arbeit unterstützen wie die ChatGPT Apps and das new Coworking Tool Canvas.

Endlich ChatGPT Windows Desktop App and Canvas Update

Ekran-Ansicht der ChatGPT Windows Desktop App, Farbverlauf hellblau im Hintergrund© OpenAI on Canva

New tools and new plans for OpenAI and users

In der Tech-Welt vergeht kaum eine Woche ohne große Neuankündigung vonseiten OpenAIs. Jüngst wurde beispielsweise verkündet, dass zwei neue Personen zur Führungsriege dazustoßen. Scott Schools and Chief Compliance Officer Dr. Ronnie Chatterji and Chief Economist.

Diese Neuigkeiten kommen direkt nach der Bekanntgabe zum Start des Lenfest Institute AI Cooperation and scholarship programs. The publishers are Chicago Public Media, The Minnesota Star Tribune, Newsday (Long Island, New York), The Philadelphia Inquirer and The Seattle Times Finanzierungen was created and gleichzeitig by generator KI für den Publishing-Alltag erproben.

Niklas Levantchik

Niklas Lewanczik is a student of Literatur- und Medienwissenschaftler and schreibt für OnlineMarketing.de seit Jahren über various topics in Digital-Marketing-Bereich. Von der Mobile-First-Indexierung über die DSGVO bis hin zum Aufstieg von TikTok hat er schon manche Entwicklung der Branche begleitet.