// glossar-eintrag

Robots.txt

Was ist robots.txt?

Die robots.txt ist eine Textdatei im Root einer Domain, die Suchmaschinen-Bots Regeln für den Zugriff auf Verzeichnisse und URLs gibt. Mit User-agent und Disallow lassen sich Bereiche vom Crawling ausschließen, mit Sitemap-Angabe die XML-Sitemap referenzieren. Wichtig: robots.txt verhindert Crawling, nicht Indexierung — für Indexierungs-Steuerung ist noindex im Seiten-Head zuständig. Bei Waterproof Web Wizard prüfen wir die robots.txt bei jedem Onboarding: fehlerhaft gesetzte Disallow-Regeln gehören zu den häufigsten Ursachen für "warum ranke ich nicht?".

// synonyme

  • robots.txt
  • Robots Exclusion Protocol
Begriff unklar geblieben?

Lass uns 15 Minuten reden

Wenn ein Begriff aus diesem Glossar in deinem Projekt-Kontext nicht ganz klar ist, oder du wissen willst, ob das Konzept für deine Situation relevant ist — frag uns. Erstgespräch ist kostenlos und unverbindlich.

Kostenlos Unverbindlich 15 Minuten