Zoeken

Gebruik van AI (2)

Wisselen van AI

In mijn eerste blogpost over AI schreef ik over de keuze voor ChatGPT als machinale medewerker. Die keuze is herzien. Inmiddels werk ik met Claude van Anthropic. De reden is even nuchter als de werkwijze zelf: een betere assistent verdringt een minder goede.

Dat klinkt eenvoudiger dan het is. Het wisselen van AI-omgeving betekent opnieuw een werkprofiel opbouwen, stijlafspraken overdragen, en kijken of de nieuwe omgeving de werkwijze überhaupt aankan. Dat bleek het geval.

Van ChatGPT via Galaxy.ai naar Claude

De overstap verliep niet in één stap. Na ChatGPT volgde een tussenperiode met Galaxy.ai, een platform dat toegang biedt tot meerdere AI-modellen — waaronder Claude — en dat onder meer geschikt is voor beeldgeneratie. Galaxy.ai fungeert inmiddels als vaste omgeving voor het aanmaken van illustraties bij artikelen: historische composities in de stijl van de gebroeders Van Limburg, gegenereerd op basis van een vaste huisstijlprompt. Voor de tekstuele workflow bleek een directe verbinding met Claude via Claude.ai praktischer qua 1) verbruik van credits en 2) de geboden functionaliteit.

Waarom Anthropic?

Anthropic is een Amerikaans AI-bedrijf dat zijn modellen bouwt vanuit een expliciete veiligheidsfilosofie. Dat klinkt abstract, maar het heeft concrete gevolgen voor dagelijks gebruik. Claude is getraind om onzekerheid te benoemen, bronnen kritisch te behandelen, en minder snel stellige antwoorden te geven als de feitelijke basis ontbreekt. Voor een website die op bronkritiek is gebouwd, is dat een bruikbaarder uitgangspunt dan een model dat vlot en zelfverzekerd antwoord geeft, ook als de grond onder de feiten wegzakt.

Het bekende probleem van fabuleren — het verzinnen van niet-bestaande bronnen — is wat mij betreft bij Claude merkbaar veel minder aanwezig dan bij ChatGPT. Dat heeft een praktische verklaring: Anthropic investeert specifiek in het beperken van zogenoemde hallucinaties (beter wellicht fabulaties), waarbij een model iets beweert dat het niet weet maar wel geloofwaardig laat klinken. Volledig afwezig is het probleem niet, maar de frequentie en de overtuigingskracht waarmee gefabriceerde bronnen worden gepresenteerd, ligt lager. Wie een middeleeuwse monografie opvoert die niet bestaat, valt op een website als deze onmiddellijk door de mand, zoals al bleek (zie vorige blogpost over dit onderwerp. Dus loop ik de bronnen (inmiddels steekproefsgewijs, zo goed is het) na.

Ethiek als werkprincipe

Anthropic publiceert zijn veiligheids- en ethische uitgangspunten openbaar, onder de noemer Constitutional AI. Concreet betekent dat een model dat is getraind om eigen beperkingen te erkennen, terughoudend te zijn bij onzekere uitspraken, en geen schijn van autoriteit op te houden als die autoriteit ontbreekt. Dat past bij de houding die op deze website ook van menselijke kant wordt nagestreefd: “vermoedelijk”, “zal wel hebben”, en een expliciete markering van hypothesen.

ChatGPT is een sterk model, maar heeft de neiging om zijn eigen onzekerheid weg te poetsen. Dat is begrijpelijk vanuit commercieel oogpunt — een assistent die twijfelt wekt minder vertrouwen bij een breed publiek — maar historisch onderzoek is gewoonweg falsifieerbare wetenschap, waar waarheidsgetrouwheid wordt nagestreefd.

Een extreem voorbeeld van hoe de principiële keuze voor een ethische werkwijze kan uitpakken, is gebleken toen het Amerikaanse Ministerie van Oorlog de AI van Anthropic naar eigen inzicht wil inzetten en Anthropic hier voor ging liggen. Keuzes hebben gevolgen.

De nieuwe workflow

De werkwijze zelf is niet ingrijpend veranderd, maar wel verfijnd. Het sessiegeheugen in Claude maakt het mogelijk om een omvangrijk werkprofiel op te slaan: stijlrichtlijnen, vermijdlijsten, afspraken over noten en bronnen, een vaste driestaps herziening die naar gelang het soort artikelen dat wordt aangepakt contextueel summier wordt aangepast. Dat profiel is bindend voor elke nieuwe werksessie.

De drie stappen zijn:

  1. Bronnenonderzoek en verbetervoorstel — inclusief verificatie van bronnen, feitencontrole, balansanalyse (Gelre, Oversticht, Drenthe), en een structuurvoorstel.
  2. Volledig herschreven artikel in lopende proza.
  3. Complete HTML, klaar voor directe publicatie in WordPress.

Elke stap vereist expliciete goedkeuring voordat de volgende begint. AI doet voorstellen; de eindredactie blijft mensenwerk. Dat principe is niet veranderd.

Wat nog niet werkt

De nieuwe workflow heeft ook beperkingen. Het geheugen van Claude is per chat beperkt en werkt niet over afzonderlijke sessies heen zonder te herladen. Voor langlopende artikelreeksen is dat omslachtig. Bovendien is het bronnenonderzoek afhankelijk van wat online toegankelijk is; gespecialiseerde regionale historiografie over Oost-Nederland is niet altijd gedigitaliseerd en dus buiten bereik van een AI-gestuurde zoekslag. Op dat moment wordt teruggevallen op de fysieke boeken in mijn eigen bibliotheek, of elders aanwezig.

De mens blijft dus onmisbaar. Niet als toezichthouder op de machine, maar als vakman met een eigen bibliotheek, een eigen oordeel, en een eigen neus voor wat klopt. Foutloos? Vast niet, maar onfeilbaar was ik voor de inzet van AI ook zeker niet!