J'ai installé l'url rewriting sur mon site (Xoops 2.5)... Je sais qu'il existe des solutions pour éviter le Duplicat Content (Canonical.). Mais je voudrais mettre en place sur mon site une solution que j'ai imaginée. Mon site est en cours de construction est n'a pas encore de contenu...
Je voudrais trouver une solution simple qui permet de ne pas autoriser aux visiteurs et aux moteurs de recherche l'accés aux Url commençant par http://www.monsite/modules/...
Il doit bien y avoir la possiblité de mettre un code quelques part permettant de refuser l'accés au page dont l'url commençant par: http://www.monsite/modules/...
Merci d'avance pour votre aide
« Dernière Édition: le 11-01-2011 a 13:18:33 par hamoudi »
Pour interdire l'accès aux robots une simple directive dans le fichier robots.txt devrait suffire :
Code:
User-agent: * Disallow: /modules
Pour ce qui est de l'affichage aux visiteurs, si vous avez le contrôle de votre serveur web la meilleure pratique consiste à stocker le répertoire en dehors du répertoire de publication web. Dans le cas d'un hébergement mutualisé, une solution (ce n'est certainement pas la meilleure) consiste à créer un fichier .htaccess que l'on place à la racine du répertoire à protéger en inscrivant dedans :
placé dans le fichier robots.txt me garantie bien que toutes les pages commençant par http://www.monsite.com/modules/ ne seront pas référencées par Google
Ta deuxième proposition fonctionne bien mais tu ne sembles pas trop l'apprécier... Pourquoi?
Concernant le fichier robots il n'y a pas de garantie absolue. Si tu veux vraiment blinder la chose je pense qu'il faut jouer sur tous les fronts :
- blocage dans le fichier robots - blocage avec un balise meta dans le(s) fichier(s) concernés dans le sous répertoire
Code:
<META NAME="robots" CONTENT="noindex,nofollow">
- envoi d'une 404 pour les anciennes url
Et surtout ne pas oublier de contrôler que ces actions sont efficaces.
En ce qui concerne le deny from all, non pas que je n'apprécie pas la méthode car elle est efficace, mais elle demande à être peaufinée : en effet cette instruction va renvoyer au navigateur web une erreur 403 (Forbidden) et il est très frustrant du point de vue de l'utilisateur de voir cette page. Il vaut mieux créer une 403 personnalisé en html dans laquelle tu pourras indiquer à l'internaute qu'il n'a pas accès à cette partie du site et le rediriger vers une autre page.