Wie kann KI Werte schaffen? Das Produktproblem von OpenAI verstehen

Aufgenommen von:

Geschrieben von:

Leitender Direktor und Hauptanalyst

OpenAI kündigte die bevorstehende Markteinführung von DALL-E 3 an, der nächsten Version seines KI-Modells der Bilderzeugung. Diese Ankündigung wurde mit einigem Tamtam aufgenommen: Es gab einen wirklich großen Qualitätssprung zwischen DALL-E und DALL-E 2, und was OpenAI von DALL-E 3 gezeigt hat, ist ... besser? Mehr dazu am Ende des Films. Dennoch hat mich diese Ankündigung dazu gebracht, viel darüber nachzudenken, was KI ist und wie das KI-Geschäft tatsächlich aussieht - und wie weit OpenAI davon entfernt ist, Geld zu verdienen.

Erstens, KI: Es sind mehrere Dinge auf einmal. Im Grunde handelt es sich nur um eine Reihe von linearen algebraischen Gleichungen. Wenn man wirklich wollte, könnte man die Gesamtheit von ChatGPT als eine einzige mathematische Gleichung formulieren, die allerdings unfassbar lang wäre. Es gibt einen großartigen Aufsatz von Stephen Wolfram, den ich Ihnen allen ans Herz legen möchte, der die Funktionsweise von KI genau erklärt. Ich werde KI jedoch kurz als probabilistische Werkzeuge definieren, die auf der Grundlage großer Datenmengen trainiert wurden und die Ergebnisse komplexer Aufgaben replizieren können. Das Wichtigste dabei ist, dass wir KI für Aufgaben trainieren können, für die wir keine gute Theorie haben, wie das Schreiben von Texten oder das Erkennen einer Katze. Eine Katze kann nicht mit reiner Mathematik beschrieben werden, aber ein rein mathematisches Modell (über KI) kann eine Katze identifizieren. Es gibt auch eine gewisse Zufälligkeit in der KI, insbesondere in der generativen KI, die von den Entwicklern absichtlich eingesetzt wird, um eine Vielfalt von Ergebnissen zu fördern. Es ist erwähnenswert, dass das Training von KI viel menschliche Arbeit erfordert - die Daten in eine Form zu bringen, die KI nutzen kann, ist ein ziemlich manueller Prozess. 

Das führt zum zweiten Punkt, den die KI darstellt: ein Werkzeug zur Vermittlung menschlicher Arbeit. Diese Vermittlung erfolgt in erster Linie in Form von Automatisierung (Ersetzen einer menschlichen Aufgabe durch eine Maschine), Dequalifizierung (Erleichterung der Aufgabe), Fragmentierung (Aufteilung großer, komplexer Aufgaben in kleine, einfache Aufgaben) und Gelegenheitsarbeit (Umwandlung eines qualifizierten Berufs in eine Tätigkeit, die als Job ausgeübt werden kann). Die Automatisierungs- und Entbürokratisierungselemente sind bei Bilderzeugungstools wie DALL-E 3 am deutlichsten zu erkennen - das gesamte Branding dreht sich um die Möglichkeit, dass jeder Bilder erstellen kann, für die man sonst große Fähigkeiten benötigt hätte. Aber DALL-E fragmentiert auch den Arbeitskräftepool: Unternehmen wie open AI sind auf die Ausbeutung von Arbeitskräften im globalen Süden angewiesen, um Bilder zu markieren. 

Schließlich ist die KI auch eine potenzielle Quelle für neues Wissen. Ich habe bereits erwähnt, dass wir KI so trainieren können, dass sie Aufgaben ohne ein festes, theoretisches Verständnis dieser Aufgaben erfüllt. Viele Wissenschaftler und Akademiker haben bereits gezeigt, dass der Einsatz von KI den Menschen zu einem neuen Verständnis führen kann, indem er ihn in die Lage versetzt, zunächst das Problem zu modellieren, Lösungen zu finden und dann von diesen Lösungen zu einer nützlichen Theorie zurückzugehen. Dies ist nicht sonderlich neu; die Menschen haben dies mindestens seit 2016 mit einigen der frühesten Arbeiten zur Materialinformatik getan, aber es ist sehr wertvoll für Gruppen, die diese Art von Wissensarbeit leisten. 

Das grundlegende Problem für OpenAI ist, dass DALL-E 3 kein Produkt ist. Was ist das Geschäft, das auf der Bilderzeugung aufsetzen wird? Die naheliegendste Schlussfolgerung wäre eine Online-Bildplattform im Stil von Shutterstock, aber das ist kein sehr attraktives Geschäft (insbesondere nicht für das am meisten gehypte Startup des Jahrzehnts). Shutterstock hat im vergangenen Jahr rund 850 Millionen US-Dollar verdient. Darüber hinaus betrugen die Kosten der verkauften Waren (in erster Linie die Kosten für die Bilder) nur etwa 350 Mio. USD; der weitaus größere Teil der Kosten entfiel auf Marketing, Vertrieb und allgemeine Verwaltung. Wie viel hat OpenAI für DALL-E 3 ausgegeben? Das ist schwer zu sagen, aber die Ausbildung von ChatGPT 4 kostete mehr als 100 Millionen USD. Es ist schwer vorstellbar, dass OpenAI weniger für DALL-E 3 ausgegeben hat, vor allem wenn man bedenkt, wie daten- und arbeitsintensiv die Bildverarbeitung ist. Selbst wenn man davon ausgeht, dass OpenAI das gesamte Geschäft von Shutterstock übernehmen und viel besser machen kann, ist das immer noch nicht wirklich attraktiv. 

Das ist sicherlich nicht der Geschäftsplan, den OpenAI im Sinn hat, aber was ich hier sagen will, ist, dass KI mit aufsehenerregenden Fähigkeiten nicht unbedingt ein gutes Wertversprechen hat. KI schafft auf zweierlei Weise Wert: erstens durch die Automatisierung von Arbeit (die rund 350 Millionen, die OpenAI theoretisch bei Shutterstock einsparen könnte) und zweitens durch die Generierung von Wissen (der Wert, der durch die Beschleunigung von Forschung und Entwicklung oder den Anstoß zu neuen Entdeckungen entsteht). Diese Plattformen zur Bilderzeugung bieten diese Art von Wert nicht wirklich. Dieser Mangel an klarem Wert hat mich skeptisch gemacht, dass OpenAI in absehbarer Zeit tatsächlich echte Unternehmen stören wird. 

All dies setzt voraus, dass die von DALL-E 3 produzierten Bilder genauso gut sind wie die Stockbilder auf Shutterstock. Das sind sie aber nicht. Die Ankündigung von DALL-E 3 enthielt eine Reihe von Bildern, die vermutlich kuratiert wurden - ich würde sicherlich versuchen, mich bei der Einführung eines neuen Produkts von der besten Seite zu zeigen. Doch selbst diese kuratierten Bilder weisen viele der typischen Fehler von KI-generierten Bildern auf - seltsame Details und Probleme, die ein Mensch niemals falsch machen würde. OpenAI behauptet, die Software sei viel benutzerfreundlicher geworden, und vielleicht ist das auch so, aber es gibt nicht annähernd die Verbesserung von DALL-E zu DALL-E 2. Ich kann nur zu dem Schluss kommen, dass es zu schwierig (oder, realistischer, zu teuer) war, das Modell so zu trainieren, dass diese Probleme vermieden werden. Es gibt angeblich kluge Leute wie Eliezer Yudkowsky, die Drohnenangriffe auf Rechenzentren fordern, weil sich die KI zu schnell verbessern könnte, aber das bestfinanzierte KI-Startup der Welt schafft es nicht, dass die KI ein Telefon richtig zeichnet. Wir werden alle gut zurechtkommen. 

Schließen Sie sich uns an!

Die Lux-Foren sind eine erstklassige Gelegenheit für Innovationsentscheider, mehr über die Erkenntnisse der Verbraucher, die Wissenschaft und die Technologie zu erfahren, die für eine menschenzentrierte Innovation erforderlich sind.

Was wollen Sie heuterecherchieren?