Cloaking et robots

[ 8 commentaires]

La course que se livrent les moteurs de recherche et les webmasters qui cherchent à y référencer leurs sites web ressemble par bien des points à celles qui opposent les créateurs de virus et les fabricants d'antivirus, ou Canal+ et les pirates: l'essentiel est d'avoir un coup d'avance.

Quel visage montrer aux moteurs de recherche? Il y a encore quelques mois, le grand jeu consistait à optimiser (truquer?) les balises meta, ces informations invisibles des internautes que les moteurs de recherche utilisaient pour le référencement des sites web. Evidemment des abus, connus sous le nom générique de "spamdexing", se sont produits… On a même vu le site d'un candidat à l'élection présidentielle française de 1995 proposer le mot "sexe" dans ses métas, histoire d'appâter l'électeur coquin. Depuis, les moteurs de recherche ignorent les metas et focalisent sur le contenu des pages...

Qu'à celà ne tienne: le cloaking vient à la rescousse des webmasters. Il permet de présenter aux visiteurs humains des pages agréables à regarder (images, scripts DHTML, animations flash, …), et aux moteurs de recherche des pages optimisées pour le référencement et le positionnement du site (texte dense en mots-clés).

Comment fonctionnent les moteurs de recherche ?

les robots en action Contrairement aux annuaires (Yahoo!, DMoz, Nomade, …) constitués par des humains, et donc impossible à cloaker, les moteurs de recherche (Google, Altavista, Voila…) utilisent des logiciels appelés robots, bots, spiders ou crawlers pour référencer les sites web qu'ils proposent dans leurs réponses. Ces "sales bestioles" se baladent de site en site en suivant les liens hypertexte, et analysent les pages qu'elles visitent.

Si certains robots sont très puissants par leurs algorithmes (Googlebot), la discrétion n'est pas leur fort. Les informations qu'ils transmettent dans le header http permettent en général de les identifier sans équivoque. Leurs USER-AGENT portent les doux noms de Googlebot, Slurp@inktomi ou Scooter, et ils ne dissimulent nullement leurs adresses IP. Un vrai bonheur pour le webmaster-cloakeur qui peut alors s 'en donner à cœur-joie pour les "arnaquer" en leur présentant des pages optimisées pour le référencement, qu'aucun internaute humain ne verra jamais.

Les 2 façons de cloaker les moteurs de recherche

Il est théoriquement possible de cloaker un robot en détectant son USER-AGENT (user-agent cloaking) ou en détectant son adresse IP (IP cloaking).

Dans la pratique l'IP cloaking est beaucoup plus fiable que le user-agent cloaking. En effet, les moteurs de recherche, un peu honteux de se faire cloaker, combattent ouvertement cette pratique. Un site pris en flagrant délit de cloaking a de fortes chances de se faire "blacklister", c'est à dire de disparaitre des réponses des moteurs de recherche.

la gueule de l'emploi S'il est très facile de maquiller ou de modifier son user-agent - et on peut penser que les robots ne s'en privent pas à l'occasion pour vérifier les sites qu'ils indexent (n'est-ce pas AltaVista?) - il est en revanche très compliqué de maquiller son adresse IP. D'où la préférence pour l'IP cloaking.

Le site WANNABrowser propose un outil en ligne sympathique qui permet de surfer sous l'user-agent de son choix. A titre de curiosité, allez donc voir si vos concurrents ne seraient pas de "vilains petits cloakeurs" en visitant leurs sites sous l'identité du tout-puissant Googlebot/2.1 (+http://www.google.com/bot.html)

» La suite - Optimisez votre référencement dans les moteurs de recherche - Démarrer...

Vos réactions à cet article :::

le 26/06/2004 à 23:19De: [Site web]
on va verifier tout ca !! hein actulab !! non je lol ;o)
++
le 21/07/2004 à 03:58De: [Site web]
pratique cet outil, suffit de coller le code html de sortie dans frontpage par exemple et on a l apercu de la page avec le user agent de notre choix ;o)
++
lorantino - Shasma - Mangas, BD, Business
le 17/09/2004 à 17:26De: [Site web]
C'est vrai que c'est vraiment pratique...
le 01/10/2004 à 23:30De:
Belle trouvaille :)
le 09/03/2005 à 04:11De: alphega [Site web]
[quote]Depuis, les moteurs de recherche ignorent les metas et focalisent sur le contenu des pages...[/quote]
Il est pourtant courant de lire sur les forums de webmasters des conseils aux débutants de type : "Commence par rajouter tes metas..."
Qui oserait ne pas mettre au moins une meta description et keywords ? Pas actulab en tout cas:
<meta name="description" lang="fr" content="Optimisez le référencement et.....
<meta name="keywords" lang="fr" content="referencement,cloaking .......
:D
le 15/03/2005 à 10:24De: xenon [Site web]
J'ai pas trop compris comment il fallait faire pour se faire passer pour Google sur ce site :
WANNABrowser
Pourtant par curiosité ... ça m'interesserait de voir ça !
le 04/04/2005 à 00:19De: Raphael [Site web]
pareil, je n'ai pas trouvé comment se faire passer pour google. Au passage l'article est tres interessant => 2 ans apres, les moteurs ont ils evolués ???
le 18/06/2005 à 15:17De: grevok
bonjour
IL faut faire un copie coller de "Googlebot/2.1 (+http://www.google.com/bot.html)"
dans le formulaire > HTTP User Agent: [ use current agent ] <
et apres sa roule boule tout seul !
Gr3vok

Ajoutez un commentaire en direct :::

Il est temporairement impossible de poster un commentaire: nos modos sont en vacances. A bientôt;)

[Envoyer cette page à un ami | Créer un lien vers cette page | Ajouter cette page à vos favoris]
36.835.109 pages vues - Déjà 3.185 aujourd'hui - 17 visiteurs connectés
100 dossiers en ligne - Copyleft © 2003-2008 ActuLab :::