LLMs.txt: Ein Leitfaden für Marketingteams

David Wippel
1. Was ist LLMs.txt?
LLMs.txt ist eine einfache Markdown-Datei im Root-Verzeichnis deiner Website (z. B. example.com/llms.txt). Sie enthält eine kuratierte Liste der Inhalte, die für Sprachmodelle (LLMs) wie ChatGPT relevant sind – etwa Produktseiten, zentrale Infos oder FAQ-Bereiche.
Im Unterschied zur Sitemap listet diese Datei nicht alle Seiten auf, sondern nur die, die dauerhaft hilfreich und repräsentativ für dein Angebot sind. Sprachmodelle können damit gezielt auf Inhalte zugreifen, ohne den kompletten Code oder die Seitenstruktur parsen zu müssen.
Beispielstruktur:
# Mein Unternehmen
> Digitale Lösungen für KMU seit 2015
## Zentrale Seiten
- [Produktübersicht](https://...): Kompakte Einführung
- [FAQ](https://...): Antworten auf häufige Fragen
## Weitere Inhalte
- [Pressebereich (https://...)
2. Unterschiede zur sitemap.xml
sitemap.xml | LLMS.txt | |
---|---|---|
Zielgruppe | Crawler von Suchmaschinen | Sprachmodelle (z. B. ChatGPT, Perplexity) |
Umfang | Alle öffentlichen URLs (oft hunderte) | Auswahl von 10–30 besonders relevanten URLs |
Format | XML | Markdown |
Nutzen | Erleichtert Indexierung durch Suchmaschinen | Liefert Sprachmodellen gezielte Infos in komprimierter Form |
Die Sitemap ist für Google & Co. gedacht. LLMs.txt spricht eine andere Zielgruppe an und hilft dabei, den Zugriff auf Kernthemen zu steuern.
3. Verbreitung (Stand Mai 2025)
Quelle | Anzahl | Kommentar |
---|---|---|
Majestic Million | ca. 105 Domains | entspricht 0,011 % der Top-Seiten |
Öffentliche Verzeichnisse | 170–680 Domains | je nach Quelle |
WordPress | Plugins vorhanden | u. a. "Website LLMs.txt" Plugin |
Noch selten genutzt, aber technisch leicht umzusetzen. Wer jetzt aktiv wird, ist früh dran.
4. Warum es für dein Team relevant sein kann
Markentreue Darstellung in KI-Ergebnissen: Wenn du gezielt die richtigen Inhalte zur Verfügung stellst, steigen die Chancen, dass Modelle nicht auf alte oder unpassende Seiten zugreifen.
Abstimmung im Team: Wer pflegt welche Inhalte? Welche Seiten gelten als verlässlich? LLMs.txt macht diese Fragen transparent.
Verwendbarkeit dokumentieren: Die Datei kann definieren, ob Inhalte für KI-Training, für Inferenz oder gar nicht genutzt werden dürfen.
Einmal eingerichtet, wenig Aufwand: Ein sauberer Markdown-Block, mit geringer Pflegebindung.
5. LLMs.txt vs. LLMs-full.txt
In einigen Kontexten taucht eine zweite Datei auf: llms-full.txt. Diese ist keine Pflicht, wird aber gelegentlich verwendet.
LLMs.txt | LLMs-full.txt | |
---|---|---|
Inhalt | Linkliste + Kurzbeschreibung | Volltexte aller Seiten in einer Datei |
Größe | Klein (wenige KB) | Groß (100+ KB bis MB-Bereich) |
Einsatzzweck | Üblich bei Websites mit mehreren Inhaltsbereichen | Nur sinnvoll bei sehr kleinen Sites oder Dokumentationen |
Pflege | Aktualisierung einzelner Links reicht | Jede Änderung führt zu neuem Volltext-Dump |
Wer eine strukturierte Website mit 10, 20 oder mehr Seiten hat, ist mit llms.txt
in der Regel besser bedient. Sie ist wartbar, einfach zu prüfen und klar strukturiert.
6. Schrittweise Umsetzung
Woche | Aufgabe | Verantwortlich | Hinweise |
---|---|---|---|
1 | Auswahl der wichtigsten Seiten | Content Lead | ca. 10–30 Links |
1 | Markdown-Datei schreiben | SEO/Technik | Beispielstruktur verwenden |
2 | Datei bereitstellen & testen | Dev/Hosting | 200-Status prüfen |
3 | Optional: Markdown-Versionen der Inhalte | Redaktion | Für klare Struktur und Parsing geeignet |
Monatlich | Pflege bei inhaltlichen Änderungen | Team | Regelmäßig wie Sitemap aktualisieren |
7. Grenzen und technische Einschätzung
Es gibt aktuell keine Verpflichtung für AI-Anbieter, llms.txt zu nutzen, aber die Spezifikation ist bekannt
Messbare Vorteile (Traffic, Rankings) sind bislang anekdotisch
Das Format könnte sich weiterentwickeln; möglicherweise kommen neue Varianten hinzu
Fazit
LLMs.txt ist keine Allzwecklösung, aber ein handfestes Werkzeug für Teams, die Klarheit darüber wollen, welche Inhalte im Kontext von AI sichtbar und nutzbar sein sollen. Es passt in bestehende Abläufe, verursacht kaum Overhead und zeigt, dass euer Auftritt strukturiert und durchdacht gepflegt wird.