# robots.txt — ΛΞΟΠ Project # https://www.robotstxt.org/ | https://developers.google.com/search/docs/crawling-indexing/robots/intro # # Blocs dédiés : le débogueur Facebook suggère d’autoriser explicitement # facebookexternalhit / Facebot lorsque l’aperçu de lien échoue. User-agent: facebookexternalhit Allow: / User-agent: Facebot Allow: / # La page racine /, /nl/ et /en/ (cf. hreflang) sont indexables par défaut. # On exclut uniquement le chemin technique du front controller Phalcon et # les sous-arbres média lourds qui n'ont aucune raison d'être visités en # deeplink direct depuis un résultat de recherche. User-agent: * Allow: / # Front controller Phalcon : tout passe par /index.php?_url=… après # réécriture .htaccess. Empêcher l'indexation de cette forme évite la # duplication URL canonique vs. URL technique. Disallow: /index.php Disallow: /*?_url= # Sous-arbres média lourds. Les thumbnails restent crawlables pour # l'indexation Google Images / Bing Images : # /resources/pxl/smalls/ (197 fichiers, ~0,7 Mo) ✓ allow # /resources/pxl/mediums/ (197 fichiers, ~4,0 Mo) ✓ allow # /resources/pxl/bigs/ (197 fichiers, ~12,7 Mo) ✗ disallow — pleine résolution lightbox # /resources/loop/tracks/ (8 fichiers, ~50 Mo de MP3) ✗ disallow — pistes audio brutes Disallow: /resources/pxl/bigs/ Disallow: /resources/loop/tracks/ # Sitemap (à générer côté serveur — point 2.2 de l'audit). L'URL ci-dessous # DOIT être absolue et pointer vers le domaine de production réel. Sitemap: https://aeon-project.dev/sitemap.xml