Welke regels kun je in een llms.txt opnemen?

Het llms.txt bestand wordt steeds vaker gebruikt om aan te geven hoe content wel of niet gebruikt mag worden door taalmodellen. Veel organisaties weten nog niet welke regels ze precies moeten opnemen, waardoor onduidelijkheid ontstaat bij ontwikkelaars en datasetbouwers.

Op llmstxt.nl zijn we gespecialiseerd in het ontwerpen van heldere llms.txt regels die technisch werkbaar en juridisch duidelijk zijn. In dit artikel leggen we concreet uit welke soorten regels je kunt opnemen en geven we direct toepasbare tips en voorbeelden.

Belangrijk onderdeel 1

Toegangs- en gebruiksregels zijn de kern van elk llms.txt bestand. Dit zijn directe instructies voor modelbouwers: mag er getraind worden, mag er gequeryd of gecachet worden, en zijn er beperkingen op toepassingen zoals commerciële exploitatie?

Typische regels zijn eenvoudig te lezen en lijken op robotsturing: aangeven wat is toegestaan en wat niet. Voeg daarnaast opties toe voor nuances, zoals alleen voor onderzoek of alleen met bronvermelding.

Praktische tip of verdieping

  • Voorbeeldregel: Allow: Train of Disallow: Train — duidelijk en direct.
  • Specificeer toepassingsgebied: Allow: Query [non-commercial] voor alleen niet-commercieel gebruik.
  • Gebruik een User-agent-achtig veld om regels per actor te maken, bijvoorbeeld User-agent: * of User-agent: ResearchTeams.
  • Meld uitzonderingen: Exception: Dataset-ID: doi:10.x/yyyy (public domain) voor specifieke items.

Belangrijk onderdeel 2

Metadata en juridische informatie geven context en afdwingbaarheid: welke licentie geldt, wie is contactpersoon en zijn er embargo- of bewaartermijnen? Dit helpt bij verantwoorde verwerking en traceerbaarheid van datasets.

Voeg ook technische metadata toe zoals dataset-ID’s, checksum-hashes en datumstempels. Dat maakt audits en naleving veel eenvoudiger voor modelbouwers en controleurs.

Praktische tip of verdieping

  1. Stap 1: Geef een licentieveld: License: CC-BY-4.0 of License: All Rights Reserved.
  2. Stap 2: Voeg contactinformatie toe: Contact: legal@voorbeeld.nl zodat vragen eenvoudig bij de juiste persoon terechtkomen.
  3. Stap 3: Zet technische referenties: Dataset-ID: doi:10.1234/abcd en Hash: sha256:... voor verificatie.
  4. Stap 4: Noem bewaartermijnen of embargo: Embargo-until: 2026-01-01 of Retention: 30 days.

Praktische extra-regels die vaak nuttig zijn: markeer persoonsinformatie met Personal-data: redact, eist bronvermelding met Attribution: Required, of geef beperkingen per toepassing met Use-case: No-ads. Bij llmstxt.nl adviseren we om altijd duidelijke, machineleesbare labels te gebruiken en een menselijke contactregel toe te voegen voor onvoorziene vragen.

Praktische check: controleer direct of je llms.txt minimaal deze velden heeft — Allow/Disallow, License, Contact en Dataset-ID — zodat modelbouwers snel en correct kunnen handelen.

Scroll to Top