Hoe kan AI waarde creëren? Het productprobleem van OpenAI begrijpen

Opgenomen door:

Geschreven door:

Senior directeur en hoofdanalist

OpenAI kondigde de aanstaande lancering aan van DALL-E 3, de volgende versie van zijn beeldgeneratie-AI-model. Deze aankondiging werd met enige fanfare ontvangen: Er was echt een grote sprong in kwaliteit tussen DALL-E en DALL-E 2, en wat OpenAI liet zien van DALL-E 3 is ... beter? Meer hierover aan het einde. Toch heeft deze aankondiging me aan het denken gezet over wat AI is en hoe AI-business er eigenlijk uitziet - en hoe ver OpenAI eigenlijk is van geld verdienen.

Ten eerste AI: het zijn een paar verschillende dingen tegelijk. In de basis is het gewoon een reeks lineaire algebraïsche vergelijkingen; als je echt zou willen, zou je de hele ChatGPT kunnen uitschrijven als één enkele wiskundige vergelijking, maar die zou verbijsterend lang zijn. Er is een geweldig artikel van Stephen Wolfram dat ik jullie allemaal wil aanraden om te lezen en dat dieper ingaat op de werking van AI, maar ik zal AI snel definiëren als probabilistische tools, getraind op grote hoeveelheden data, die de output van complexe taken kunnen repliceren. Het belangrijkste om hieruit op te maken is dat we AI kunnen trainen om taken uit te voeren waar we geen goede theorie voor hebben, zoals het schrijven van tekst of het identificeren van een kat. Een kat kan niet beschreven worden met pure wiskunde, maar een puur wiskundig model (via AI) kan wel een kat identificeren. Er zit ook een zekere mate van willekeur in AI, vooral in generatieve AI, die opzettelijk door de ontwerpers is ingebouwd om een verscheidenheid aan resultaten aan te moedigen. Het is de moeite waard om te vermelden dat het trainen van AI veel menselijke arbeid vergt - die gegevens in een vorm krijgen die AI kan gebruiken is een behoorlijk handmatig proces. 

Dat leidt mooi naar het tweede wat AI is: een hulpmiddel om menselijke arbeid te bemiddelen. Deze bemiddeling komt voornamelijk in de vorm van automatisering (het vervangen van een menselijke taak door een machine), deskilling (het makkelijker maken van de taak), fragmentering (het opsplitsen van grote complexe taken in kleine eenvoudige taken) en casualizing (het veranderen van iets van een geschoold beroep in iets dat kan worden opgepakt als een baan). De automatiserende en bureaucratische elementen zijn het duidelijkst bij tools voor het maken van afbeeldingen zoals DALL-E 3 - de hele branding draait om de mogelijkheid voor iedereen om afbeeldingen te maken waarvoor anders grote vaardigheid nodig zou zijn geweest. Maar DALL-E versnippert ook de arbeidspool: Bedrijven zoals open AI vertrouwen op de uitbuiting van arbeidskrachten in het Zuiden om afbeeldingen te taggen. 

Tot slot is AI potentieel ook een bron van nieuwe kennis. Ik zei al eerder dat we AI kunnen trainen om taken uit te voeren zonder een stevig, theoretisch begrip van die taken. Veel wetenschappers en academici hebben al aangetoond dat het gebruik van AI mensen tot een nieuw begrip kan leiden door hen in staat te stellen om eerst het probleem te modelleren, oplossingen te vinden en vervolgens vanuit die oplossingen terug te werken naar een bruikbare theorie. Dit is niet echt nieuw; mensen doen dit al minstens sinds 2016 met enkele van de vroegste werkzaamheden op het gebied van materiaalinformatica, maar het is erg waardevol voor groepen die dit soort kenniswerk doen. 

Het fundamentele probleem voor OpenAI is dat DALL-E 3 geen product is. Wat is de business die bovenop het genereren van beelden gaat zitten? De meest voor de hand liggende conclusie zou een online afbeeldingsplatform in de stijl van Shutterstock zijn, maar dat is geen erg aantrekkelijke business (zeker niet voor de meest gehypete startup van het decennium). Shutterstock verdiende vorig jaar ongeveer 850 miljoen USD. Bovendien bedroegen de kosten van de verkochte goederen (voornamelijk de kosten van de afbeeldingen) slechts ongeveer USD 350 miljoen; het veel grotere deel van de kosten kwam van marketing, verkoop en algemene administratie. Hoeveel heeft OpenAI uitgegeven aan DALL-E 3? Het is een beetje moeilijk te zeggen, maar ChatGPT 4 kostte meer dan USD 100 miljoen om te trainen. Het is moeilijk voor te stellen dat OpenAI minder heeft uitgegeven aan DALL-E 3, zeker gezien de data- en arbeidsintensieve aard van beeldverwerking. Zelfs als je verwacht dat OpenAI alle activiteiten van Shutterstock kan overnemen en het veel beter kan, is het nog steeds niet zo aantrekkelijk. 

Dat is zeker niet het businessplan dat OpenAI in gedachten heeft, maar het punt dat ik hier wil maken is dat AI met flitsende mogelijkheden niet noodzakelijkerwijs een goede waardepropositie heeft. AI creëert waarde op twee manieren: ten eerste door het automatiseren van arbeid (de ongeveer 350 miljoen die OpenAI theoretisch zou kunnen besparen op Shutterstock) en ten tweede door het genereren van kennis (de waarde die gegenereerd wordt door R&D te versnellen of ons in de richting van nieuwe ontdekkingen te duwen). Deze beeldgeneratieplatforms bieden niet echt dat soort waarde. Door dit gebrek aan duidelijke waarde ben ik sceptisch dat OpenAI binnenkort echte bedrijven zal verstoren. 

Dit alles gaat ervan uit dat de beelden van DALL-E 3 net zo goed zijn als de stockbeelden op Shutterstock. Dat zijn ze echter niet. Bij de aankondiging van DALL-E 3 zat een heleboel beeldmateriaal, dat waarschijnlijk is samengesteld - ik zou zeker proberen mijn beste beentje voor te zetten bij de lancering van een nieuw product. Toch hebben zelfs deze gecureerde beelden veel van de kenmerkende fouten van AI-gegenereerde beelden - vreemde details en problemen die een mens nooit fout zou hebben. OpenAI zegt dat het de software veel gebruiksvriendelijker heeft gemaakt, en misschien is dat ook wel zo, maar de verbetering van DALL-E naar DALL-E 2 is bij lange na niet zo groot. Ik kan alleen maar concluderen dat het te moeilijk was (of, realistischer, te duur) om te proberen het model te trainen om deze problemen te vermijden. Er zijn zogenaamd slimme mensen zoals Eliezer Yudkowsky die oproepen tot drone-aanvallen op datacenters vanwege het gevaar dat AI te snel verbetert, maar de best gefinancierde AI-startup ter wereld kan AI nog geen telefoon nauwkeurig laten tekenen. Het komt allemaal wel goed met ons. 

Doe mee!

De Lux Forums zijn een uitgelezen kans voor besluitvormers op het gebied van innovatie om meer te weten te komen over consumenteninzichten, wetenschap en technologie die nodig zijn om mensgerichte innovatie mogelijk te maken.

Wat wil je vandaagonderzoeken?