AI training wordt lastiger door tekort aan data

News
woensdag, 15 november 2023 om 10:00
chatgpt laptopf1680510525
Er is het afgelopen jaar veel te doen geweest om AI. ChatGPT en vergelijkbare bots kunnen natuurlijk overkomende taal genereren en ook bots die beelden maken zijn steeds beter en populairder geworden. Maar het verder ontwikkelen van dit soort bots wordt misschien alweer snel moeilijk.
Om een kunstmatige intelligentie te ontwikkelen is veel data nodig om het systeem mee te trainen. ChatGPT is bijvoorbeeld getraind om 570 Gigabyte aan tekst en zou met meer data nog beter moeten kunnen worden. Onderzoekers van Epoch vrezen alleen dat de bruikbare data relatief snel opraakt.
Want hoewel er dagelijks enorme hoeveelheden tekst op het internet worden gepubliceerd, is lang niet alles daarvan kwalitatief goed genoeg om een AI mee te trainen. AI gebruikt data van hoge kwaliteit sneller dan dat het erbij komt. Epoch schat daarom dat de data die AI kan gebruiken nog voor 2026 op raakt.

Moet AI training efficiënter worden?

Ook het trainingsmateriaal voor AI die beelden genereert zal relatief snel opraken. Maar toch is het niet zeker dat de ontwikkeling van AI snel helemaal stilstaat. Als de training van een algoritme efficiënter wordt en dus meer leert van minder data, kan de huidige voorraad nieuwe data langer meegaan.
Bovendien is het door AI ook mogelijk om de hoeveelheid beschikbare data te doen groeien. Met AI-systemen is het bijvoorbeeld makkelijker om potentieel trainingsmateriaal dat nog niet gedigitaliseerd was, nu wel te digitaliseren. Dan is AI niet meer afhankelijk van wat er online geschreven wordt.

Populair Nieuws