llms.txt: Datei zur Optimierung für LLMs und ihre Rolle für SEO
llms.txt ist eine Markdown-Datei im Root einer Website, die LLMs strukturiert auf wichtige Inhalte hinweist. Eine SE-Ranking-Studie mit knapp 300.000 Domains aus Januar 2026 fand keinen Citation-Effekt; die Adoption durch Google und OpenAI bleibt aus.
Etwa zehn Prozent der knapp 300.000 von SE Ranking im Januar 2026 untersuchten Domains hatten eine llms.txt-Datei im Einsatz. Das Format wurde im September 2024 als Community-Vorschlag auf llmstxt.org veröffentlicht und richtet sich an Large Language Models, nicht an klassische Suchmaschinen.
Für die Sichtbarkeit in KI-Antworten von ChatGPT, Claude oder Google AI Overview entscheidet allerdings nicht die Existenz dieser Datei allein.
Was ist eine llms.txt Datei?
Eine llms.txt ist eine Markdown-Datei, die im Root-Verzeichnis einer Website unter dem Pfad /llms.txt abgelegt wird und Large Language Models strukturiert auf die wichtigsten Inhalte der Domain hinweisen soll. Der Vorschlag stammt von Jeremy Howard, Co-Founder von Answer.AI und fast.ai, veröffentlicht am 3. September 2024 auf llmstxt.org.
Das Format ist nicht durch W3C, IETF oder eine andere Normungsorganisation standardisiert. Es handelt sich um einen Community-Draft, der von einzelnen Anbietern wie Yoast SEO in Plugins umgesetzt wird.
llms.txt adressiert ein anderes Problem als robots.txt: Während robots.txt den Zugriff von Crawlern regelt, soll llms.txt LLMs zur Inferenz-Zeit eine kompakte, maschinenlesbare Übersicht der wichtigsten Inhalte bieten, also genau dann, wenn ein Modell eine Nutzerfrage beantwortet und Quellen heranzieht.
Der Begriff llms steht für Large Language Models. Die Datei zielt damit auf die neue Klasse generativer KI-Crawler wie GPTBot (OpenAI), ClaudeBot (Anthropic) oder PerplexityBot. Klassische Suchmaschinen-Crawler wie Googlebot ignorieren die Datei.
Wie ist eine llms.txt aufgebaut?
Eine llms.txt folgt einem festen Markdown-Schema mit vier Bestandteilen: einem H1-Titel, einem optionalen Blockquote zur Projektbeschreibung, freiem Markdown-Bereich für Detailinformationen und H2-Sektionen mit Link-Listen. Die Sektion Docs ist Pflicht, Examples und Optional sind ergänzend. Die Spezifikation kennt eine kompakte Variante (llms-ctx.txt) ohne URLs und eine vollständige (llms-ctx-full.txt) mit URLs.
Ein konkretes Beispiel für einen Maschinenbau-Hersteller mit zwölf technischen Datenblättern würde so aussehen:
# Industrie-Manufaktur AG
> Hersteller von CNC-Komponenten für Automotive und Luftfahrt seit 1987.
> Sitz: Stuttgart. Schwerpunkte: Präzisionsdrehteile, Frästeile, Baugruppen.
Dokumentation und Datenblätter zu Produkten, Materialien und Fertigungsverfahren
in maschinenlesbarer Form.
## Docs
- [CNC-Drehteile Übersicht](https://example.com/produkte/drehteile.md): Spezifikationen und Toleranzklassen.
- [Materialdatenblatt 1.4404](https://example.com/material/1-4404.md): Edelstahl V4A.
- [Fertigungsverfahren](https://example.com/verfahren.md): Übersicht der eingesetzten Maschinen.
## Examples
- [Anwendungsfall Automotive](https://example.com/use-cases/automotive.md)
## Optional
- [Unternehmensgeschichte](https://example.com/historie.md)
Die optionale Sektion ist bewusst so benannt, weil LLMs sie bei knappem Kontext-Fenster auslassen können. Die Pflicht-Sektion Docs enthält die Inhalte, die ein Modell zur Beantwortung von Produkt- oder Materialfragen unbedingt sehen sollte.
Die einzelnen Markdown-Links zeigen idealerweise auf Markdown-Versionen der jeweiligen Seite, also auf reine Text-Repräsentationen ohne HTML-Markup, JavaScript oder Tracking-Elemente. Die Spezifikation auf llmstxt.org sieht für jede HTML-Seite eine spiegelnde Markdown-Version unter der gleichen URL mit dem Suffix .md vor.
Wer keine eigenen Markdown-Versionen ausliefert, kann hilfsweise auch auf HTML-Seiten verlinken. Die Inferenz-Effizienz sinkt dann allerdings, weil das Modell zusätzlichen Tokenaufwand für HTML-Parsing aufbringen muss.
Wie unterscheidet sich llms.txt von robots.txt und sitemap.xml?
Jede der drei Dateien adressiert eine andere Crawler-Klasse mit einem anderen Zweck. robots.txt steuert Zugriffsrechte für Suchmaschinen- und AI-Bots, sitemap.xml signalisiert Suchmaschinen-Crawlern Auffindbarkeit und Aktualisierung, llms.txt liefert LLMs zur Inferenz-Zeit eine strukturierte Inhaltsübersicht.
| Datei | Zielgruppe | Zweck | Format | Standardisiert |
|---|---|---|---|---|
| robots.txt | Suchmaschinen-Crawler + AI-Bots | Zugriffsrechte regeln | Plaintext | RFC 9309 |
| sitemap.xml | Suchmaschinen-Crawler | Auffindbarkeit, lastmod-Signal | XML | sitemaps.org |
| llms.txt | Large Language Models | Strukturierte Inhaltsverweise zur Inferenz-Zeit | Markdown | Community-Draft |
robots.txt und sitemap.xml lösen damit Crawl- und Index-Probleme im Vor-Ranking-Stack. llms.txt setzt erst danach an: Wenn ein LLM eine Frage beantwortet und entscheidet, welche Quellen es heranzieht. Die drei Dateien ersetzen sich nicht, sondern adressieren unterschiedliche Stationen im Informationsfluss.
Eine sinnvolle Reihenfolge bei der Implementierung lautet daher: Erst die robots.txt-Regeln für AI-Bots wie GPTBot oder ClaudeBot festlegen, dann die sitemap.xml für klassische Crawler aktuell halten und die llms.txt erst als optionale dritte Schicht ergänzen, wenn die ersten beiden Dateien stabil ausgeliefert werden.
Was ist der Unterschied zwischen llms.txt und llms-full.txt?
Die offizielle Spezifikation auf llmstxt.org spricht von llms-ctx.txt und llms-ctx-full.txt. Die kompakte Variante listet nur Verweise als Markdown-Links, die Vollversion enthält zusätzlich den ausgeklappten Text-Inhalt aller verlinkten Seiten. Im Sprachgebrauch hat sich llms-full.txt als gängige Bezeichnung für die expandierte Variante durchgesetzt, etwa in Yoast-Plugin-Implementierungen.
Praktisch bedeutet die Trennung: llms.txt bleibt klein genug, um in jedes Kontext-Fenster zu passen, während llms-full.txt für tieferen Zugriff bereitsteht, falls das Modell mehr Kontext braucht. Wer nur eine Datei pflegt, wählt llms.txt als Index-Datei.
Hat llms.txt einen messbaren Effekt für SEO oder die Sichtbarkeit in ChatGPT, Perplexity und Co?
Befürworter führen drei Argumente für llms.txt an: erstens niedrige Implementierungskosten, zweitens die strategische Positionierung bei einem möglichen späteren Standard, drittens die Kontrolle darüber, welche Inhalte Modelle bei strukturierten Verweisen sehen. Sistrix zählt zusätzlich Bandbreiten-Einsparungen durch optimierte Markdown-Versionen auf.
Eine Studie von SE Ranking aus dem Januar 2026 mit knapp 300.000 untersuchten Domains widerspricht der erhofften Wirkung allerdings deutlich: Es gibt keinen statistisch signifikanten Zusammenhang zwischen einer vorhandenen llms.txt und der Wahrscheinlichkeit, in AI-Antworten zitiert zu werden. Das genutzte XGBoost-Modell lieferte bessere Vorhersagen, nachdem die llms.txt-Variable entfernt wurde.
Auch in Traffic-Segmenten war kein Muster erkennbar. Die Citation-Quoten lagen in Domains mit hohem (8,27 %), mittlerem (10,54 %) und niedrigem Traffic (9,88 %) ohne erkennbare Korrelation zur llms.txt-Existenz.
John Mueller, Search Advocate bei Google, verglich den Vorschlag mit dem alten Meta-Keywords-Tag, das wegen Missbrauch ignoriert wurde, und empfahl, die Datei mit noindex auszuliefern. Werden Ihre tausenden Produkt-Datenblätter dadurch häufiger in GEO-Antworten zitiert? Die SE-Ranking-Daten geben darauf eine ernüchternde Antwort.
Wie erstellen Sie eine llms.txt?
Wer trotz fehlendem Studien-Beleg eine llms.txt einsetzen will (etwa, um Owned-Asset-Kontrolle zu testen oder eine spätere Standardisierung vorzubereiten), geht in vier Schritten vor:
- Markdown-Datei anlegen: Eine Datei
llms.txterstellen mit H1 (Site-Name), darunter ein Blockquote zur Projektbeschreibung in zwei bis drei Sätzen. - Sektion Docs befüllen: H2
## Docsmit einer Markdown-Liste der wichtigsten Inhalte. Jeder Eintrag besteht aus einem Link auf eine Markdown-Version der Seite und einer kurzen Notiz zum Inhalt. - Optionale Sektionen ergänzen: H2
## Examplesfür Use-Case-Verweise, H2## Optionalfür Inhalte, die bei knappem Kontext-Fenster ausgespart werden dürfen. - Im Root veröffentlichen: Die Datei unter
https://ihre-domain.de/llms.txtablegen. Bei Multi-Domain-Setups erhält jede Domain eine eigene Datei.
Tool-Optionen reduzieren den manuellen Aufwand: Das Yoast-SEO-Plugin generiert llms.txt automatisch aus WordPress-Inhalten. Online-Generatoren wie Creaitor.ai erzeugen eine Vorlage aus einer Sitemap. Wichtig bleibt der Maintenance-Aspekt: Bei Struktur- oder URL-Änderungen muss die Datei manuell oder per Build-Prozess synchronisiert werden.
Wer nutzt llms.txt aktuell, und wer nicht?
Die Adoption-Lage ist Stand Mai 2026 ungleichmäßig. Google lehnt den Vorschlag offiziell ab, Yoast liefert ein Plugin aus, OpenAI äußert sich nicht zur Citation-Relevanz; gleichzeitig zeigen Server-Logs Crawl-Aktivität des OAI-SearchBot. Ein Maschinenbau-Hersteller mit 4.000 technischen Datenblättern hat von einer llms.txt aktuell keinen messbaren Citation-Vorteil. Die Pflichtaufgabe bleibt die Crawl-Steuerung über robots.txt für AI-Bots wie GPTBot, ClaudeBot, OAI-SearchBot und PerplexityBot.
Die beiden verfügbaren Verbreitungs-Stichproben unterscheiden sich deutlich:
- SE Ranking (Januar 2026): 10,13 % der knapp 300.000 untersuchten Domains hatten eine llms.txt im Einsatz. Stichprobe stark in Richtung trafficstarker Domains gewichtet.
- Sistrix (2025): Weniger als 0,005 % aller Websites weltweit. Stichprobe näher am globalen Long-Tail.
Aktuell bewerben einige Agenturen llms.txt als Pflicht-Maßnahme — die SE-Ranking-Studie liefert dafür keine Datengrundlage. Yoast SEO bietet eine automatische Generierung im Plugin an, was die Verbreitung in WordPress-Sites schrittweise erhöhen dürfte. Eine offizielle Stellungnahme von Anthropic, Google oder OpenAI zur Citation-Relevanz fehlt weiterhin.
Fazit & Takeaways
- Verbreitung von llms.txt liegt bei rund 10 % unter den von SE Ranking untersuchten 300.000 Domains, ohne messbaren Citation-Effekt; Re-Evaluation sinnvoll, sobald neue Großstudien vorliegen.
- robots.txt-Strategie für AI-Bots (GPTBot, ClaudeBot, OAI-SearchBot) zuerst sauber etablieren; llms.txt ergänzt, ersetzt aber nicht.
- llms.txt als Owned-Asset-Test ist vertretbar, wenn der Implementierungsaufwand unter zwei Stunden bleibt und ein automatisiertes Update bei URL-Änderungen mitgeplant wird.
- Pflichtquelle für Studienlage: seranking.com/de/blog/llms-txt — Re-Check Q4 2026, ob OpenAI oder Anthropic eine offizielle Citation-Relevanz dokumentieren.
Verwandte Begriffe
- GEO (Generative Engine Optimization): Übergeordnetes Konzept zur Optimierung von Inhalten für KI-Antwortsysteme; llms.txt ist ein Baustein im GEO-Stack.
- Crawler: Programme, die Webseiten systematisch abrufen; AI-Crawler wie GPTBot oder ClaudeBot sind die Adressaten von llms.txt.
- SERP: Klassische Suchergebnisseite; llms.txt zielt nicht auf SERP-Rankings, sondern auf Citations in AI-generierten Antworten.
- Suchmaschinenoptimierung: SEO im klassischen Sinn arbeitet auf SERP-Ebene, llms.txt arbeitet auf der Inferenz-Ebene generativer Modelle.
Autor: Daniel Neubauer, Geschäftsführer RED RAM MEDIA. Über 16 Jahre Agentur- und SEO-Erfahrung, seit 2010 als Agenturinhaber tätig, Entwickler des VISIBL-Frameworks für technisches B2B-SEO.
Häufige Fragen (FAQ)
Wofür steht das llms in llms.txt?
llms steht als Abkürzung für Large Language Models, also generative KI-Sprachmodelle wie GPT-4, Claude oder Gemini. Die Datei richtet sich gezielt an diese Modelle zur Inferenz-Zeit, also dann, wenn ein Modell eine Nutzerfrage beantwortet und dafür Quellen heranzieht. Sie ist keine Datei für klassische Suchmaschinen-Crawler — diese Aufgabe übernehmen weiterhin robots.txt und sitemap.xml.
Wo wird die llms.txt-Datei gespeichert?
llms.txt liegt im Root-Verzeichnis einer Domain unter dem festen Pfad /llms.txt, also beispielsweise unter https://example.com/llms.txt. Die Spezifikation auf llmstxt.org sieht keine alternativen Pfade oder Subdomain-Varianten vor. Bei Multi-Domain-Setups erhält jede Domain eine eigene Datei.
Liest Google die llms.txt?
Google nutzt llms.txt nicht für Ranking- oder Citation-Entscheidungen in den AI Overviews. John Mueller, Search Advocate bei Google, verglich den Vorschlag mit dem alten Meta-Keywords-Tag, das wegen Missbrauchspotenzial ignoriert wird, und empfahl, die Datei mit noindex auszuliefern. Stand Mai 2026 gibt es keine offizielle Unterstützung durch Google.
Brauche ich llms.txt UND robots.txt?
robots.txt ist die Pflichtbasis für jede Website, weil sie den Zugriff von Suchmaschinen-Crawlern UND AI-Bots regelt (Googlebot, GPTBot, ClaudeBot, OAI-SearchBot). llms.txt ist ein optionaler Zusatz für strukturierte Inhaltsverweise an LLMs. Wer beide einsetzen will, beginnt mit der robots.txt-Strategie für AI-Bots und ergänzt llms.txt erst, wenn Crawl-Steuerung sauber etabliert ist.
Ist llms.txt offiziell standardisiert?
llms.txt ist nicht durch W3C, IETF oder eine andere Normungsorganisation standardisiert. Die Spezifikation auf llmstxt.org ist ein Community-Vorschlag, der von einzelnen Anbietern wie Yoast in Plugins umgesetzt wird. Der Status entspricht damit eher einem De-facto-Vorschlag als einem verbindlichen Standard wie RFC 9309 für robots.txt.
Hat llms.txt einen messbaren Einfluss auf AI-Citations?
Eine SE-Ranking-Studie aus Januar 2026 mit knapp 300.000 untersuchten Domains fand keinen statistisch signifikanten Zusammenhang zwischen vorhandener llms.txt und der Wahrscheinlichkeit, in AI-Antworten zitiert zu werden. Das XGBoost-Modell der Studie lieferte bessere Vorhersagen, nachdem die llms.txt-Variable entfernt wurde. Andere belastbare Großstudien zum Citation-Effekt liegen Stand Mai 2026 nicht vor.
Theorie verstanden? So sieht die Praxis aus:
Weitere Begriffe aus dem Lexikon
Search Generative Experience (Google SGE)
Search Generative Experience (Google SGE) war Googles experimentelles KI-Such-Feature in Search Labs (Mai 2023 bis Mai 2024). Seit Mai 2024 läuft das Produkt unter dem Namen AI Overviews.
AEO (Answer Engine Optimization)
Answer Engine Optimization (AEO) ist die Optimierung von Inhalten für die direkte Sichtbarkeit in Antwort-Surfaces wie Featured Snippets, Voice-Assistenten, Google AI Overview, ChatGPT und Perplexity. Wer dort als Quelle erscheint, gewinnt Sichtbarkeit ohne Klick.
GEO (Generative Engine Optimization)
Generative Engine Optimization (GEO) ist die Optimierung von Inhalten für KI-Antwortsysteme wie ChatGPT, Perplexity und Google AI Overview. Wer dort als Quelle erscheint, gewinnt B2B-Sichtbarkeit jenseits klassischer SERP-Rankings.
Von der Definition zur konkreten Umsetzung.
Sie kennen jetzt das Konzept. Die Frage ist: Wie wird daraus ein messbarer Hebel für Ihr B2B-Marketing? In 30 Minuten analysieren wir, ob und wie dieser Ansatz zu Ihren Zielen passt.
30 Minuten · Datenbasiert · Klartext