Dit is het eerste artikel in onze Technische Diepteduiken serie, waar we de techniek achter AI-agenten in begrijpelijke taal uitleggen.
U hebt waarschijnlijk ChatGPT of Claude gebruikt. U typt een vraag, krijgt een antwoord, typt een volgende vraag, krijgt weer een antwoord. Het voelt als een gesprek. Maar hier is iets wat de meeste mensen niet beseffen: op het moment dat het gesprek eindigt, vergeet de AI alles. Elk detail dat u hebt gedeeld, elke voorkeur die u heeft genoemd, elke beslissing die u samen hebt genomen — weg.
Voor een casual gesprekje is dat prima. Voor een zakelijk hulpmiddel dat uw klanten, uw facturen of uw verkooppijplijn beheert? Dat is een ernstig probleem.
Dit is het geheugenprobleem in AI, en het is één van de grootste uitdagingen voor iedereen die vandaag AI-agenten bouwt. Laten we het uitdiepen.
Hoe AI nu "onthoudt"
Wanneer u met een AI-model zoals GPT-4 of Claude spreekt, voert u geen echt gesprek. Dit gebeurt eigenlijk: telkens wanneer u een bericht verzendt, wordt de volledige gespreksgeschiedenis samen met uw nieuwe bericht naar het model gestuurd. De AI leest alles helemaal opnieuw, genereert een reactie en stuurt die terug. Het heeft geen echt geheugen — het leest het transcript telkens opnieuw.
Deze transcript heet het "contextvenster," en het heeft een harde limiet. Voor de meeste modellen vandaag ligt deze limiet tussen 128.000 en 200.000 tokens — ruwweg 100.000 tot 150.000 woorden. Dat klinkt als veel, totdat uw AI-agent al een week lang klantgesprekken afhandelt en duizenden berichten heeft verwerkt.
Wanneer het contextvenster vol raakt, moet er iets verdwijnen. En wat verdwijnt, wordt permanent vergeten. De AI weet niet dat het iets vergeten is — het ziet die informatie simpelweg nooit meer.
Waarom dit voor bedrijven belangrijk is
Stel, u voert een ondersteuningsagent op WhatsApp. Een klant neemt maandag contact met u op over een defect product. U lost het op, biedt een vervanging aan. Donderdag komt dezelfde klant terug met een vervolgvraag. Als uw agent geen geheugen van maandags gesprek heeft, moet de klant alles opnieuw uitleggen. Ze worden gefrustreerd. Ze verliezen vertrouwen in uw bedrijf.
Dit is geen theoretisch scenario. Onderzoek van Gartner heeft aangetoond dat klanten ongeveer 20% vaker vertrekken in ondersteuningssituaties waar klanten zichzelf moeten herhalen bij AI-agenten. Mensen verwachten continuïteit. Wanneer een AI hen vergeet, voelt dat afwijzend — erger dan met een nieuwe menselijke agent spreken, want die zou zich op zijn minst verontschuldigen omdat het de context mist.
Hetzelfde probleem treft interne zakelijke hulpmiddelen. Een AI-assistent die helpt met projectplanning maar vorige beslissingen vergeet. Een boekhoudagent die niet onthoudt welke facturen al zijn besproken. Een verkoopsagent die elk gesprek dezelfde kwalificatievragen stelt. Zonder geheugen blijven agenten steken in een lus van eerste interacties.
De drie soorten geheugen die een agent nodig heeft
Menselijk geheugen is niet één ding — het zijn verschillende systemen die samenwerken. AI-onderzoekers hebben dit raamwerk overgenomen omdat het blijkt dat agenten dezelfde verscheidenheid nodig hebben.
Kortetermijngeheugen is het gesprek dat nu plaatsvindt. Dit is het contextvenster waarover we het hadden: de AI leest de huidige uitwisseling en reageert coherent erop. Elke AI-chatbot heeft dit al. De uitdaging is dat het tijdelijk en groottebeperkt is.
Langetermijnsemantisch geheugen is feitelijke kennis over de wereld en over specifieke gebruikers. Denk eraan als een archiefkast. "Deze klant is gebaseerd in Gent." "Ze geven de voorkeur aan facturen in het Nederlands." "Hun bedrijf heeft 12 medewerkers." Dit zijn feiten die niet vaak veranderen en die in elke interactie moeten blijven bestaan.
Langetermijn-episodisch geheugen is het verslag van wat werkelijk is gebeurd. "Op 3 maart meldde deze klant een factureringsfout en we gaven een creditnota uit." "Vorige week vroeg de gebruiker naar een upgrade van hun abonnement en we stuurden een vergelijking." Episodisch geheugen geeft de agent een gevoel van geschiedenis — het weet wat het deed, wat werkte en wat niet.
Er is ook procedureel geheugen — weten hoe je dingen moet doen. "Wanneer een klant om een terugbetaling vraagt, controleer eerst hun ordergeschiedenis, verifieer vervolgens het retourraam, en voer dan de verwerking via Stripe uit." Dit gaat minder om feiten onthouden en meer om workflows onthouden.
De meeste AI-agenten vandaag hebben alleen kortetermijngeheugen. De goede hebben langetermijnsemantisch en episodisch geheugen. Procedureel geheugen wordt meestal hardcoded door ontwikkelaars in plaats van door de agent geleerd.
De technische uitdagingen (in duidelijke taal)
Het bouwen van geheugen voor AI-agenten is moeilijker dan het klinkt, om verschillende redenen.
Het contextvenster kost echt geld. Elke token in het contextvenster kost geld — zowel om te verzenden als om te verwerken. GPT-4 berekent ongeveer $5 per miljoen invoertokens. Als u de volledige geschiedenis van elke klantinteractie in elk verzoek stopt, exploderen uw kosten. Een ondersteuningsagent die 200 gesprekken per dag afhandelt, kan gemakkelijk honderden euro's per maand aan tokenkosten verbranden als het geheugen niet goed wordt beheerd.
U kunt niet alles zomaar opslaan. Het opslaan van elk bericht, elk feit en elke gebeurtenis in een gigantische database is technisch mogelijk, maar het ophalen van de juiste informatie op het juiste moment is de echte uitdaging. Wanneer een klant naar hun bestelling vraagt, moet de agent de relevante bestelgegevens vinden — niet elk bericht dat deze klant ooit heeft verzonden. Slecht ophalen betekent dat de agent ofwel belangrijke context mist ofwel verdrinkt in irrelevante informatie, wat de reacties verslechtert.
Informatie verandert. Het adres van een klant, hun abonnement, hun teamgrootte — dat verandert in de loop van de tijd. Als het geheugensysteem "klant heeft 5 medewerkers" uit januari opslaat en "klant heeft 12 medewerkers" uit maart, welke gebruikt de agent? Geheugensystemen moeten updates, conflicten en versiebeheer afhandelen zonder de agent in verwarring te brengen.
Privacy en naleving voegen complexiteit toe. In Europa geeft GDPR klanten het recht om hun gegevens te laten verwijderen. Als uw AI-agent herinneringen over een klant verspreid over vectordatabases, samenvattingslogboeken en gespreksgeschiedenissen heeft, moet u alles op verzoek kunnen vinden en verwijderen. Dit is niet triviaal om goed uit te voeren.
Hoe de industrie het oplost
Er is nog geen enkele oplossing, maar verschillende benaderingen winnen in 2026 aan populariteit.
Schuivend venster met samenvattingen. De eenvoudigste aanpak: houd de laatste N berichten in volledige detail en comprimeer alles wat ouder is in een samenvatting. De AI heeft altijd recent context met hoge betrouwbaarheid en oudere context in gecomprimeerde vorm. Het is niet perfect — samenvattingen verliezen nuance — maar het is praktisch en goedkoop.
Vectordatabases voor semantische zoekopdrachten. Hulpmiddelen zoals Pinecone, Weaviate en pgvector (die in PostgreSQL en Supabase werken) slaan herinneringen op als wiskundige representaties genaamd embeddings. Wanneer de agent context nodig heeft, zoekt het naar herinneringen die semantisch vergelijkbaar zijn met het huidige gesprek. "Klant vraagt naar facturering" haalt vorige factureringsgesprekken op, niet ongerelateerde supporttickets. Dit is de ruggengraat van de meeste productiegeheugensystemen vandaag.
Geheugenextractielagen. Frameworks zoals Mem0 en Zep bevinden zich tussen de agent en de database. Ze halen automatisch feiten en gebeurtenissen uit gesprekken, labelen deze met metadata (wie, wanneer, welke categorie), en slaan ze in gestructureerde formaten op. Wanneer de agent context nodig heeft, haalt de geheugenlaag alleen op wat relevant is. Dit is geavanceerder dan raw vectorzoekopdrachten omdat het het verschil begrijpt tussen een feit ("klant is in België") en een gebeurtenis ("klant klaagde over verzending op 1 maart").
Grafiekgeheugen. Een opkomende aanpak die herinneringen opslaat als verbonden knooppunten — klanten, producten, gebeurtenissen, voorkeuren — gekoppeld door relaties. Grafiekgeheugen is bijzonder goed in het beantwoorden van vragen zoals "welke klanten kochten product X en klaagden ook over feature Y?" omdat het begrijpt hoe dingen met elkaar samenhangen, niet alleen hoe vergelijkbaar ze zijn.
Hybride systemen. De meest productieklare configuraties combineren verschillende benaderingen. Een schuivend venster voor het huidige gesprek, een vectordatabase voor semantische opvraging, en een gestructureerde database voor harde feiten. De geheugenlaag van de agent bepaalt wat op te halen op basis van wat het gesprek nu nodig heeft.
Wat dit voor uw bedrijf betekent
Als u een klein bedrijf bent dat AI-agenten gebruikt of overweegt, hier is wat belangrijk is:
Een agent zonder geheugen is een chatbot. Het beantwoordt vragen, maar het kent uw klanten niet. Het kan niet van vorige interacties leren. Het behandelt elk gesprek als het eerste. Dat is prima voor het beantwoorden van veelgestelde vragen, maar voldoet niet voor enige betekenisvolle klantrelatie.
Een agent met geheugen wordt iets dichter bij een teamlid. Het onthoudt dat een klant het Nederlands boven Engels verkiest. Het weet dat ze vorige maand een probleem hadden dat werd opgelost. Het roept hun ordergeschiedenis op zonder te hoeven vragen. Dat is het verschil tussen een hulpmiddel en een assistent.
Het geheugenprobleem wordt opgelost — de frameworks en databases bestaan vandaag. Maar alles correct met elkaar verbinden, vooral op een manier die GDPR respecteert en de kosten redelijk houdt, vereist echt engineeringwerk.
Volgende keer
In het volgende artikel in deze serie kijken we naar hoe AI-agenten werkelijk beslissingen nemen — het verschil tussen simpel prompt-reactie en het meertrapsredeneringen dat agenten in staat stelt om te plannen, hulpmiddelen te gebruiken en complexe taken af te handelen. Als geheugen de archiefkast van de hersenen is, is redeneren de hersenen zelf.
Hoe Cresly hier past
Bij Cresly voorzien we elke AI-agent die we voor Europese bedrijven bouwen van een goede geheugenarchitectuur — niet alleen een contextvenster, maar persistente opslag die uw klanten onthoudt over gesprekken heen, terwijl het volledig GDPR-compliant en EU-gehost blijft. Als u nadenkt over AI-agenten voor uw bedrijf en wilt dat ze uw klanten echt onthouden, bouwen we dat van dag één in.