De onzichtbare menselijke gevangenen helpen bij het trainen van AI

Betrouwbaarheid
In het kort

Van behoeftige arbeiders uit onderontwikkelde landen tot stagiairs en zelfs gevangenen, AI-bedrijven maken misbruik van goedkope arbeidskrachten om hun algoritmes te voeden tegen hongerlonen. Wat is de schaduwkant van datalabeling en waarom zijn mensen zo noodzakelijk om AI te trainen?

Om kunstmatige intelligentie (AI) te voeden met bruikbare datasets is een gezonde dosis handmatig menselijk werk zeer wenselijk, zo niet een dwingende noodzaak.

Het labelen van gegevens is echter een repetitieve en vaak slopende taak. Veel bedrijven maken gebruik van onderbetaalde arbeid om hun AI’s te voeden met enorme hoeveelheden gegevens. Van behoeftige arbeiders uit onderontwikkelde landen tot stagiairs en zelfs gevangenen, bedrijven die hun investering in “ethische AI” aanprijzen zijn in feite gehaaid als het gaat om het inhuren van enorm onderbetaalde arbeiders.

Zijn mensen echt belangrijk bij het trainen van AI? Wie zijn de armste gegevens labelers en annotators die in digitale sweatshops werken en waar komen ze vandaan? Zijn we er zeker van dat er geen andere alternatieven zijn voor menselijke aanraking als het gaat om het voeden van AI met trainingsgegevens? Laten we eens kijken.

Broosheid, MAD Cows en AI-autofagiestoornissen: waarom mensen noodzakelijk zijn

De menselijke aanraking, of zoals experts het vroeger noemden, human-in-the-loop-modellen, is essentieel om de kwaliteit van gegevens te waarborgen bij het trainen van een AI.

In 2018 betrof een van de eerste dodelijke ongelukken veroorzaakt door een zelfrijdende auto een vrouw die met haar fiets over straat liep. Hoewel de algoritmen een voetganger of een fiets konden herkennen wanneer ze afzonderlijke entiteiten vertegenwoordigen, waren ze niet in staat om te identificeren wat een onverwachte uitkomst voor hen was. Op machine learning gebaseerde modellen zijn extreem rigide en kunnen nauwelijks met dezelfde flexibiliteit reageren als mensen wanneer ze iets tegenkomen waarvoor ze niet zijn getraind.

Mensen moeten al deze “randgevallen” uitzoeken waarbij een weloverwogen beslissing noodzakelijk is. Zo kunnen ze AI redden van de inherente broosheid die ervoor kan zorgen dat het zo snel afbrokkelt voor het onbekende.

Maar dat is niet de enige reden waarom zij (wij) nodig zijn.

Wanneer bedrijven overstappen op andere soorten datasets die geen menselijke labelers nodig hebben om hun slopende taken uit te voeren, zoals door machines gegenereerde of gestructureerde data, zijn de resultaten ook niet zo goed.

Modellen die uitsluitend zijn getraind op andere door AI gegenereerde outputs, raken na een tijdje helemaal van slag. Letterlijk. Volgens een onderzoek van Rice en Stanford University begint de kwaliteit van de outputs af te nemen als er een fenomeen optreedt dat Model Autophagy Disorder (MAD) wordt genoemd. Bij wat er echt uitziet als een neurodegeneratieve aandoening die de hersenen van de machines aantast, worden de outputs, zoals afbeeldingen of video’s, vreemder en absurder. De onderzoekers trokken een parallel met wat er gebeurde met zichzelf consumerende koeien die de beruchte ‘gekkekoeienziekte’ ontwikkelden.

Werknemers uit landen met een laag en gemiddeld inkomen: de gebruikelijke verdachten

Een van de meest gapende wonden van globalisering is, zonder twijfel, de mogelijkheid om banen te delokaliseren in landen waar de lonen extreem laag zijn en de werkomstandigheden zeer slecht. Hoe eenvoudiger en minder gespecialiseerd de taken zijn die voor een baan vereist zijn en hoe meer ze volledig op afstand kunnen worden uitgevoerd, hoe gemakkelijker het voor grotere organisaties wordt om te profiteren van delokalisatie. Overbevolking op werkplekken en hoge verloop cijfers zijn onbelangrijk als iemand die taak zonder enige echte training kan uitvoeren.

Een nieuw leger van mijnwerkers uit de 21e eeuw komt, niet verrassend, uit de minder ontwikkelde economieën van Afrika en Azië, waar de lonen laag zijn en zo vaak de rechten zijn van de werknemers die ze betaald krijgen. Een recent onderzoek van TIME ontdekte dat OpenAI, de maker van de wereldwijd bekende ChatGPT, arbeiders uit Kenia, Oeganda en India heeft uitbesteed om giftigheid, gewelddadige taal en vooroordelen uit zijn chatbot te verwijderen. Naast het feit dat ze met angstaanjagende datasets moesten werken (hier later meer over), ontvingen de Keniaanse werknemers een gigantisch salaris van tussen de $ 1,32 en $ 2 per uur om deze miljardenmarkt te helpen verbeteren. Het bureau achter het werk zou $ 12,50 per uur per werknemer hebben betaald.

‘Clickworkers’

Afrikaanse werknemers zijn niet de enige “clickworkers”, zoals ze vaak worden genoemd, die worden aangenomen tegen wat wij als onmenselijk loon zouden beschouwen. In de Filipijnen brengen duizenden jonge, niet-gespecialiseerde werknemers hun dagen door met het onderscheiden van lantaarnpalen van voetgangers in video’s die worden gebruikt om zelfrijdende auto’s te trainen, het identificeren van foto’s van beroemdheden en het bewerken van tekstfragmenten. Hoeveel krijgen deze mensen betaald? Niet meer dan $ 6 tot $ 10 per dag. Hebben ze basisrechten voor werknemers? Uiteraard niet, aangezien ze worden aangenomen via freelance platforms die hun werk uitbesteden aan de grotere AI-bedrijven.

Dezelfde platforms die hun betalingen vaak een week lang vasthouden, nemen ze in beslag voor elke “vermeende overtreding” waartegen ze geen verhaal hebben of weren ze als ze proberen in te loggen vanaf een ander apparaat. Omdat je loon afhankelijk is van het land waar je vandaan komt, is het gebruik van een VPN een zekere manier om je baan ter plekke te verliezen – en je leven kan heel goed voorbij zijn als je plotseling geen loon meer krijgt. Zeker als dit loon al dicht bij de armoedegrens lag.

Slavenarbeid van de 21e eeuw: het dieptepunt bereiken

Hoe gaat het in de andere, welvarender landen? Niet zo beter – andere plekken, andere tactieken, maar de uitkomst is nog steeds hetzelfde: menselijke uitbuiting. In China besloten elementen van de AI-industrie simpelweg een onheilige deal te sluiten met beroepsopleidingen. Studenten zijn verplicht om moeizame, geduld-uitputtende taken voor het labelen en annoteren van gegevens uit te voeren als vereiste voor hun afstuderen. Ze moeten stages volgen die worden geadverteerd als ‘carrière verbeterende banen’ die niets anders zijn dan goedkope, repetitieve taken aan de lopende band. Alles voor het ontbijt, aangezien ze zelden het lokale minimumloon halen nadat de hebzuchtige beroepsopleidingen hun deel hebben opgeëist.

Maar in de zeer beschaafde westerse wereld bereiken we waarschijnlijk het dieptepunt van echte digitale slavernij. In de Scandinavische landen, waar gegevens moeten worden verzameld in lokale talen die door een zeer klein aantal mensen wordt gesproken, zoals Fins of Deens, is het moeilijker om onderbetaalde Afrikanen of Indiërs in te schrijven. Dus wie kan je werk beter doen voor een fractie van de echte prijs dan een gevangene? Een miezerige €1,54 ($1,65) per uur krijgen in een land waar een Starbucks Espresso €2,8 ($2,99) kost, is ver onder de armoedegrens. Maar hé, je bent een gevangene, dus wat is er beter dan een baan die je “voorbereidt op de digitale wereld van het werk” als je eenmaal vrij bent, zoals het gevangeniswezen beweert?

De horror van een baan die niemand wilt

Oost of west, noord of zuid van de wereld, clickworker banen zijn veel saaier en moeilijker dan iemand zich kan voorstellen. Je zit gewoon voor een pc en klikt, klikt, klikt de hele dag om geld te verdienen. Dat is een stuk beter dan met je rug onder de zon werken in een tomatenveld in Zuid-Europa, toch? Nou ja, misschien, of misschien ook niet. In feite zijn veel van de banen die worden uitgevoerd door gegevensverzamelaars, labelaars en, nog erger, social media moderators behoorlijk afschuwelijk.

De Keniaanse medewerkers van ChatGPT, zoals we hierboven hebben besproken, moesten de giftigheid uit de chatbot verwijderen. Om dat te doen, moesten ze het identificeren en de enige manier om dat te doen was door het te lezen, te bekijken en te ervaren. En giftigheid komt uit de donkerste hoeken van het internet en vaak uit de donkerste hoeken van de menselijke geest. Social media moderators die geacht worden de content moderatie algoritmes te voeden worden vaak blootgesteld aan angstaanjagende beelden, video’s en content vol met geweld tegen mensen en dieren, pornografische content en gore misbruik. En dat alles voor een paar dollar, met werkomstandigheden die vaak ronduit afschuwelijk zijn.

Conclusie

Techbedrijven, groot en klein, gebruiken allerlei uitbuiting tactieken om ervoor te zorgen dat arbeiders geen gerechtigheid krijgen, maar dat weten we al. Maar het systeem zelf is er niet op gebouwd om de omstandigheden van werknemers na verloop van tijd te verbeteren. De laagste bieder krijgt de klus en aangezien outsourcing bureaus en freelance platforms een deel van het geld opstrijken dat aan de arbeiders wordt betaald, zijn hun uiteindelijke lonen nog lager.

De tussenpersonen zorgen ervoor dat er een constante stroom van nieuwe mensen is die bereid zijn om de baan aan te nemen, die op elk moment kunnen worden ingehuurd of ontslagen, met de constante dreiging van een verbod dat hen van toekomstig werk kan uitsluiten. Niet dat je carrière kunt maken met labelen: er is geen echte vaardigheid om te leren, geen manier om jezelf als professional te verkopen en geen kans om na verloop van tijd beter betaald te krijgen.

We stellen ons een wereld die gedomineerd wordt door machines vaak voor als een angstaanjagende realiteit waarin onze synthetische opperheren ons dwingen om te leven in grijze, saaie, repetitieve routines. We zijn niets meer dan radertjes in een gigantisch mechanisme dat ons verslindt als vee zonder namen, gezichten of identiteiten. Toch staan we er zelden bij stil dat de wereld waarin we vandaag de dag leven op zoveel manieren al zo is voor de overgrote meerderheid van de minder bedeelden in de wereld. Hoe kunnen machines het nog erger maken dan het al is?

Gerelateerde begrippen

Gerelateerde artikelen

Claudio Buttice
Data Analist
Claudio Buttice
Data Analist

Dr. Claudio Butticè is een voormalig apotheekdirecteur die voor verschillende grote openbare ziekenhuizen in Zuid-Italië heeft gewerkt, evenals voor de humanitaire NGO Emergency. Hij is nu een ervaren auteur van boeken die heeft geschreven over onderwerpen als geneeskunde, technologie, armoede in de wereld, mensenrechten en wetenschap voor uitgevers als SAGE Publishing, Bloomsbury Publishing en Mission Bell Media. Zijn meest recente boeken zijn "Universal Health Care" (2019) en "What You Need to Know about Headaches" (2022). Als data-analist en freelance journalist zijn veel van zijn artikelen gepubliceerd in tijdschriften zoals Cracked, The Elephant, Digital Journal, The Ring of Fire en Business…