# robots.txt — ΛΞΟΠ Project
# https://www.robotstxt.org/   |   https://developers.google.com/search/docs/crawling-indexing/robots/intro
#
# Blocs dédiés : le débogueur Facebook suggère d’autoriser explicitement
# facebookexternalhit / Facebot lorsque l’aperçu de lien échoue.
User-agent: facebookexternalhit
Allow: /

User-agent: Facebot
Allow: /

# La page racine /, /nl/ et /en/ (cf. hreflang) sont indexables par défaut.
# On exclut uniquement le chemin technique du front controller Phalcon et
# les sous-arbres média lourds qui n'ont aucune raison d'être visités en
# deeplink direct depuis un résultat de recherche.

User-agent: *
Allow: /

# Front controller Phalcon : tout passe par /index.php?_url=… après
# réécriture .htaccess. Empêcher l'indexation de cette forme évite la
# duplication URL canonique vs. URL technique.
Disallow: /index.php
Disallow: /*?_url=

# Sous-arbres média lourds. Les thumbnails restent crawlables pour
# l'indexation Google Images / Bing Images :
#   /resources/pxl/smalls/     (197 fichiers, ~0,7 Mo)        ✓ allow
#   /resources/pxl/mediums/    (197 fichiers, ~4,0 Mo)        ✓ allow
#   /resources/pxl/bigs/       (197 fichiers, ~12,7 Mo)       ✗ disallow — pleine résolution lightbox
#   /resources/loop/tracks/    (8 fichiers, ~50 Mo de MP3)    ✗ disallow — pistes audio brutes
Disallow: /resources/pxl/bigs/
Disallow: /resources/loop/tracks/

# Sitemap (à générer côté serveur — point 2.2 de l'audit). L'URL ci-dessous
# DOIT être absolue et pointer vers le domaine de production réel.
Sitemap: https://aeon-project.dev/sitemap.xml