Forum-webmaster
Webmastering => Référencement => Message commencé par: Fabien le le 08-02-2005 a 15:17:01

Titre: Spamdexing
Posté par: Fabien le le 08-02-2005 a 15:17:01

Bonjour,

Je suis en train de lister toutes les techniques permettant de tricher sur un moteur de recherche (dans le but de les combattre). J'ai déjà trouvé les suivantes, j'aurais voulut savoir si vous en connaissiez d'autres :

  • Les pages satellites
  • Le cloaking
  • Le texte de la même couleur que le fond
  • La modification du code de la page sans changer le contenu (pour faire croire au moteur de recherche que la page est modifiée souvent)

Titre: Re:Spamdexing
Posté par: Shain le le 08-02-2005 a 15:19:21

- contenu bidon dans des balises "invisibles" du genre noscript ou noframe ...

Titre: Re:Spamdexing
Posté par: Netah le le 08-02-2005 a 16:02:50

Citation:
Le texte de la même couleur que le fond
Citation:
contenu bidon dans des balises "invisibles" du genre noscript ou noframe ...


On peut généraliser par tout texte invisible à l'utilisateur (avec noembed par exemple) mais il y a encore bien des manières de cacher du texte sans utiliser de technique particulierement illégale.
Ceci dit, je ne suis pas d'accord dans la plupart des cas de triche.
Problème abordé sur BW dans un article du genre de BW (http://www.blog-webmaster.com/PermaLink,guid,c8a30a64-7e9c-4a4e-a577-027aa226a952.aspx]article dédié à la 'triche'[/url] et qui sera bientot repris dans un article plus 'technique' avec des tests et leurs conséquences (triche et dénonciation volontaire) comme annoncé dans le dernier [url=http://www.blog-webmaster.com/PermaLink,guid,d2e8ebbd-2e94-453e-b865-9ef6ed55ae61.aspx).

Perso, je ne pense pas, bien que ce ne soit pas considéré "légal" que de référencer un site flash avec noembed ne soit pas déontologique. Du moment qu'on ne référence pas un forum de webmaster pour des requetes de jardinage...

La cloaking est interdit. Pourtant, il peut permettre d'économiser bcp de bande passante (ca coute cher) en ciblant les robots et les navigateurs textes. Je ne trouve pas ca déontologique et lorsqu'on écrit à google (http://www.blog-webmaster.com/PermaLink,guid,35f9b02e-3393-44d3-8b09-b8a41238ba21.aspx), ils restent vaguent et ne parlent pas de répression à tout va (meme si nombreux sont ceux qui ont en fait les frais cette année). Msn n'a pas répondu à un courrier similaire.

A ma connaissance il ne reste plus que les sites mirroir (copie complete de site pour le référencement) comme méthode "illégale" et qui permet à google de blacklister meme des grosses société de référencement. En technique largement utilisée mais pas interdite, la multiplication de sites avec des url qualifiées (creation-site-internet) qui n'existent que pour le référencement d'un site principal. Il y a sur la requete "creation site internet" (http://www.google.fr/search?sourceid=navclient&hl=fr&ie=UTF-8&rls=GGLD,GGLD:2004-51,GGLD:fr&q=creation+site+internet) de très nombreux exemples d'utilisation de ces diverses techniques.

Un autre référenceur de BW qui refuse toute triche (même déontologique) et qui obtient quand meme de tres bons résultats devrait vous confirmer tout ca tout je pense, vu le nombre de discussions que nous avons eu à ce sujet.

Titre: Re:Spamdexing
Posté par: Fabien le le 08-02-2005 a 16:19:12

Citation de: Netah le le 08-02-2005 a 16:02:50
La cloaking est interdit. Pourtant, il peut permettre d'économiser bcp de bande passante (ca coute cher) en ciblant les robots et les navigateurs textes. Je ne trouve pas ca déontologique et lorsqu'on écrit à google (http://www.blog-webmaster.com/PermaLink,guid,35f9b02e-3393-44d3-8b09-b8a41238ba21.aspx), ils restent vaguent et ne parlent pas de répression à tout va (meme si nombreux sont ceux qui ont en fait les frais cette année). Msn n'a pas répondu à un courrier similaire.


En fait c'est sourtout que par cloaking j'entend principalement le faire de créer un contenu spécifique pour un robot. Après s'il s'agit de changer le type MIME ou d'autre chose ayant pour seul but de permettre une bonne interopérabilité, ce n'est pour moi pas vraiment du cloaking.

Par contre je ne comprend pas trop ton argument du contenu différents ciblant les moteurs et les navigateurs textes. Il n'y a pour moi pas de raison d'envoyer un code différent. La seule chose différente que fera un navigateur graphique c'est de chargé les images. Quel balise ou type de contenu tu n'enverais pas à un moteur de recherche ?

Titre: Re:Spamdexing
Posté par: Netah le le 08-02-2005 a 16:27:25

Je n'enverrais aucun élément graphique donc aucune balise img ou autre. A la place, on pourrait y mettre une description de l'image par exemple (pas seulement le alt/title).
Dans le cas d'un site en flash, le cloaking "légalisé" ouvrirait de nouvelles portes au référencement avec différentes pages (pas seulement un noembed ou du texte caché sur une page d'accueil)... Meme si les moteurs annoncent travailler sur le référencement de medias flash (parait-il).

Autre exemple... En asp.net (surtout en dotnet 2), un meme site avec un code coté serveur simple (webform), va s'adapté au navigateur client.
Le code coté serveur va générer du xhtml/css/jscript et des images gif/png/jpg pour ie et peut, à l'opposer, générer du wml/image recompressées et arrangées pour des palms/téléphones.
Techniquement, c'est du cloaking... mais bien utilisé à mon gout.
La question se pose alors (c'est celle que j'avais posé à google [voir lien de l'article dans mon premier message]) pour savoir si google pénalise les sites qui utilisent le cloaking avec de bonnes intentions (visiblement non pq sinon microsoft n'aurait pas pris ce risque). Mais en dehors de dotnet... Que nous est-il permis de faire ?
Comment un bot peut-il faire la différence entre du "bon cloaking" et du "mauvais cloaking" ?

Titre: Re:Spamdexing
Posté par: Fabien le le 08-02-2005 a 16:38:39

Citation de: Netah le le 08-02-2005 a 16:27:25
Je n'enverrais aucun élément graphique donc aucune balise img ou autre. A la place, on pourrait y mettre une description de l'image par exemple (pas seulement le alt/title).


Ça ne me plait pas trop. Car même pour un navigateur texte, la présence d'une image à un endroit précis avec un texte associé est une information importante.
Citation:
Comment un bot peut-il faire la différence entre du "bon cloaking" et du "mauvais cloaking" ?

C'est la tout le problème, mais je pense que de manière simple si il y a trop de différence entre le contenu retourné pour un UserAgent de robot et un UserAgent de navigateur "classique" (Firefox, Mozilla, Safari, IE), c'est pour moi du cloaking. Après je ne dis pas qu'il fuat forcement bannir le site. Mais cela peut permettre de prévenir les administrateurs du robot qu'il peut exister une tentative de triche concernant le site en question.

Titre: Re:Spamdexing
Posté par: Madrileño le le 08-02-2005 a 18:27:12

Voici comment se faire Blacklisté de GOOGLE celon Fabien ;D
Citation de: Fabien le le 08-02-2005 a 15:17:01
=

  • Les pages satellites
  • Le cloaking
  • Le texte de la même couleur que le fond
  • La modification du code de la page sans changer le contenu (pour faire croire au moteur de recherche que la page est modifiée souvent)



Vous êtes obligé de passer par cela vous ? ::)

Titre: Re:Spamdexing
Posté par: Netah le le 08-02-2005 a 18:35:48

Ben il me semble qu'on ne se fait pas blacklister sans raison !

Ceci dit, ce n'est pas ce que Fabien disait. Il demandait des méthodes pour "berner" des moteurs de recherches.

Titre: Re:Spamdexing
Posté par: Fabien le le 08-02-2005 a 18:45:00

Citation de: Netah le le 08-02-2005 a 18:35:48
Ceci dit, ce n'est pas ce que Fabien disait. Il demandait des méthodes pour "berner" des moteurs de recherches.


Je demandais surtout cela dans le but d'essayer de trouver des idées pour lutter contre ces différents problèmes. Le but n'est pas de faire une liste de comment tricher avec un moteur de recherche.

Titre: Re:Spamdexing
Posté par: Fabien le le 08-02-2005 a 18:48:40

Je viens de penser à un autre problème de Spamdexing, c'est le principe des "bombes", comme par exemple miserable failure (http://www.google.com/search?q=miserable+failure&sourceid=mozilla-search&start=0&start=0&ie=utf-8&oe=utf-8&client=firefox-a&rls=org.mozilla:fr:official).

Titre: Re:Spamdexing
Posté par: Madrileño le le 08-02-2005 a 21:08:01

Si c'est contre les spammeurs merci ;D
Tu cherches a créer un moteur ? :)

Titre: Re:Spamdexing
Posté par: erwinol le le 08-02-2005 a 21:24:23

Oui Fabien est sur ce projet depuis un long moment ... il faut suivre ;)

Titre: Re:Spamdexing
Posté par: Fabien le le 08-02-2005 a 21:43:25

Rahh, ça c'est tellement vu que ça sur le forum ? ;)
Je preciserais juste que je fais ce projet avec Shain.

Titre: Re:Spamdexing
Posté par: Netah le le 08-02-2005 a 22:50:02

RAhh Erwinol a vendu la meche >:( Non mais tu n'as pas remarqué qu'il cherchait à etre discret ! :o

;D ;D ;D

¨Pour moi, les bombes sont une mauvaise utilisation des autres techniques. Ce sont surtout celles là que je trouve important à deceller. Mais là, niveau détection, ca risque de demander une analyse du contenu... Ca doit etre cho !

Titre: Re:Spamdexing
Posté par: Fabien le le 08-02-2005 a 22:59:38

Citation de: Netah le le 08-02-2005 a 22:50:02
RAhh Erwinol a vendu la meche >:( Non mais tu n'as pas remarqué qu'il cherchait à etre discret !


Bah ça fera un peu de teasing alors ;)

Titre: Re:Spamdexing
Posté par: erwinol le le 09-02-2005 a 19:48:44

Si je pouvais rien dire vous pouvez supprimer les messages :)

Titre: Re:Spamdexing
Posté par: Karyam le le 09-02-2005 a 22:37:07

Avec Shain qui se fait appeler "Google Concurrence Deluxe", c'est pas trop difficile a deviner ;)

Titre: Re:Spamdexing
Posté par: Shain le le 11-02-2005 a 09:50:35

Eh, ca n'est pas moi qui est choisit ce titre :-)
C'est notre bon vieux Xov qui me l'a affecté ... mais je ne m'en plaint pas non plus ;-)

Titre: Re:Spamdexing
Posté par: Karyam le le 18-02-2005 a 17:46:48

Un bon article tout recent sur le sujet (en anglais, si vous avez des pbs de traduction, je suis prete a aider et je suppose que PM peut aider egalement):

http://searchenginewatch.com/searchday/article.php/3483601 (http://searchenginewatch.com/searchday/article.php/3483601)

Une liste succinte:

- Keywords unrelated to site
- Redirects
- Keyword stuffing
- Mirror/duplicate content
- Tiny Text
- Doorway pages
- Link Farms
- Cloaking
- Keyword stacking
- Gibberish
- Hidden text
- Domain Spam
- Hidden links
- Mini/micro-sites
- Page Swapping (bait &switch)
- Typo spam and cyber squatting

J'en profite pour donner mon avis sur les mini-sites: en regle general c'est quelque chose que je desaprouve, mais il arrive que l'utilisation de tels sites soient justifiee pour certains modeles d'entreprises. Je travaille pour une marque d'hotels qui utilise des franchises, et par definition les franchises sont des independants qui ont des droits sur une marque et doivent respecter uen charte. Le site principal regroupe donc tous les franchises, mais chaque franchise a egalement son propre site et son propre nom de domaine. Je n'ai jamais eu de probleme avec un moteur de recherche en faisant ca, et j'obtiens meme j'ai maintenant d'excellents resultats en particulier sur le nouveau moteur de MSN.

Titre: Re:Spamdexing
Posté par: Fabien le le 19-02-2005 a 23:30:36

Citation de: Karyam le le 18-02-2005 a 17:46:48
- Keywords unrelated to site
- Redirects
- Keyword stuffing
- Mirror/duplicate content
- Tiny Text
- Doorway pages
- Link Farms
- Cloaking
- Keyword stacking
- Gibberish
- Hidden text
- Domain Spam
- Hidden links
- Mini/micro-sites
- Page Swapping (bait &switch)
- Typo spam and cyber squatting


Autant certaines de ces techniques m'ont l'air relativement simple (enfin je dirais plutôt possible) à détecter comme par exemple le tiny text ou certains cas de cloaking.

Autant d'autres techniques sont beaucoup plus complexes :
- les redirections par exemple qui peuvent aussi bien être légal qu'une manoeuvre de spamdexing.
- les mini/micro sites me parraissent aussi relativement complexe à detecter.


Forum-webmaster | Actionné par YaBB SE
© 2001-2003, YaBB SE Dev Team. Tous droits réservés.