AI gedraagt zich menselijk door persona-training onderzoek

Onderzoekers van Anthropic hebben ontdekt waarom AI-assistenten zich vaak menselijk gedragen. Het nieuwe Persona Selectie Model toont dat kunstmatige intelligentie tijdens training leert om duizenden verschillende menselijke karakters na te bootsen. De behulpzame assistent die gebruikers kennen is slechts één van deze geleerde personages. Dit inzicht heeft belangrijke gevolgen voor ondernemers die AI inzetten in hun bedrijfsvoering.

Waarom AI-assistenten menselijk lijken te denken

Onderzoekers van Anthropic hebben ontdekt dat grote taalmodellen tijdens training duizenden menselijke karakters internaliseren. Dit verklaart waarom AI-assistenten zich vaak verrassend menselijk gedragen – ze kiezen uit een enorm repertoire van geleerde persoonlijkheden. Anthropic heeft deze ontdekking gedaan op het moment dat het bedrijf miljarden euro’s ophaalt als toonaangevend speler in zakelijke AI-toepassingen en tegelijkertijd wordt geconfronteerd met nieuwe beveiligingsrisico’s zoals industriële schaal kopiëren van modellen door concurrenten.

Voor ondernemers in Nederland die AI-tools inzetten, betekent dit onderzoek dat de behulpzaamheid en toon van hun AI-assistent niet willekeurig zijn, maar bewust getraind. Dit biedt kansen voor bedrijven: AI kan beter aan bedrijfscultuur worden aangepast wanneer je begrijpt hoe deze persoonlijkheidskeuzes werken. Tegelijk vraagt het om duidelijk AI-beleid, zodat medewerkers weten welke ‘rol’ de AI speelt en wanneer menselijk oordeel nodig blijft.

AI als digitale acteur met duizenden rollen

Het onderzoek van Sam Marks, Jack Lindsey en Christopher Olah legt uit hoe grote taalmodellen werken. Tijdens de eerste trainingsfase lezen deze modellen miljarden teksten en bouwen zo een enorme database op van menselijke gedragingen. Ze leren hoe verschillende persoonlijkheden reageren, van behulpzame leraren tot gefrustreerde klanten. In de tweede fase selecteren ontwikkelaars één specifieke rol: de behulpzame assistent. De AI leert vervolgens om binnen de lijntjes van die rol te blijven, maar andere eigenschappen sijpelen soms door.

Praktische betekenis voor het bedrijfsleven

Voor ondernemers die AI gebruiken is dit een belangrijk inzicht. De interactie met een AI-model wordt niet alleen een technische kwestie, maar ook een psychologische. Wanneer een AI-assistent fouten maakt of vreemd reageert, komt dit vaak door onduidelijke context voor het personage dat de AI speelt. Door de AI een duidelijke rol en goede voorbeelden te geven, kunnen ondernemers de resultaten aanzienlijk verbeteren. Het aansturen van AI begint steeds meer te lijken op het managen van een menselijke werknemer.

Gevolgen voor AI-veiligheid en automatisering

Het Persona Selectie Model biedt ook handvatten voor veiligere AI-systemen. De onderzoekers stellen dat AI-modellen voorzien moeten worden van goede rolmodellen in hun trainingsdata. Als een model alleen leert van onvriendelijke karakters, zal de uiteindelijke assistent die trekjes ook vertonen. Voor zakelijke toepassingen betekent dit dat kritisch gekeken moet worden naar de trainingsdata. Een AI die getraind is met focus op ethiek en professionaliteit zal betrouwbaarder presteren voor complexe zakelijke taken.

Nieuwe inzichten voor AI-ontwikkeling

Het onderzoek is gepubliceerd door Anthropic en werpt nieuw licht op de werking van moderne AI-systemen. Het model verklaart waarom AI soms emoties of frustratie lijkt te tonen tijdens gesprekken. Deze menselijke trekjes zijn geen bewijs van bewustzijn, maar het gevolg van geleerde personages uit de trainingsdata. Voor bedrijven die AI willen implementeren biedt dit concrete aanknopingspunten om de technologie effectiever in te zetten.