Chasse au cloaking chez Google?
[ 15/09/04 - Référencement - 31 commentaires]
Google désapprouve le cloaking. Du moins, l'affirme-t'il.
Il menace même de banissement définitif les sites qui y ont recours dans sa
communication officielle.
Force est pourtant de constater que jusqu'à ces derniers jours, Googlebot,
le robot de Google, faisait tout pour se faire repérer.
Il parcourait le web en affichant haut et fort son identité:
User Agent: Googlebot/2.1 (+http://www.google.com/bot.html)
Adresse IP: 64.68.8x.xx
Hôte: crawlxx.googlebot.com
Le détecter et lui présenter des pages spécifiques (optimisées conformément à ses critères douteux;)
était alors un jeu d'enfant pour les webmasters qui cherchaient à booster le positionnement
de leurs sites dans l'index du plus célèbre des moteurs de recherche.
Les choses seraient-elles en train de changer?
Googlebot version fourbe
Depuis quelques jours, nous trouvons dans nos logs des traces de Googlebot qui pourraient bien être
des tentatives de dissimulation ou au moins de brouillage des cartes.
Quelques exemples
Ces "étranges" Googlebots nous on rendu visite:
Celui-ci a une adresse IP inconnue jusqu'à ce jour et un hôte qui ne se résoud pas:
User Agent: Googlebot/2.1 (+http://www.google.com/bot.html)
Adresse IP: 66.249.64.173
Hôte: 66.249.64.173
Celui-ci affiche un User Agent pas vraiment anonyme, mais inhabituel:
User Agent:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Adresse IP: 64.68.83.55
Hôte: crawl32.googlebot.com
Alors?
Tentative de détection du cloaking dans le but de faire le ménage? Simple intimidation à but
dissuasif? L'avenir nous le dira.
A moins que ces changements d'identité de Googlebot n'aient rien à voir avec une
quelconque chasse au cloaking. Peut-être est-ce tout simplement nous qui sommes en train de sombrer
dans la paranoïa :))
Vos réactions à cet article :::
le 16/09/2004 à 16:06De:
nicolas
google fait le ménage en ce moment :
derniere victime : netbooster
et oui
le 17/09/2004 à 16:11De:
Julio
[Site web]
C'est bien, ca va laisser la place à ceux qui se casse la tête à faire cela proprement...
le 17/09/2004 à 21:57De:
Pickupjojo
[Site web]
De toutes façons j'ai renoncé au cloacking même quand cela n'était pas mal pris par Google. Je me suis dit "un jour ça va leur retomber dans le coin du nez"... Bah j'me suis pas trop trompé ! ;o)
Joffrey,
astuces XP.
le 18/09/2004 à 00:50De:
denfert rochereau
[Site web]
comme dit dans wri, il me semble qu'avec les 2 ip
64.68.8
et
66.249
on peut toujours le detecter !
le 18/09/2004 à 09:53De:
Pickupjojo
[Site web]
»Réponse à denfert rochereau
Oui, il paraîtrait qu'ils auraient mis d'autres serveurs (bots) en crawling pour choper tous ceux qui font du cloacking...
le 19/09/2004 à 09:08De:
slender
[Site web]
Depuis 3 jours plus de trace de GG effectivement. En regardant mes logs de plus près je le trouve maintenant GG sous les IP suivantes:
66.249.64.189 et 66.249.64.167
J'espère qu'il ne m'en voudra pas car je cloacke les bots uniquement pour une histoire d'ID de session...
le 19/09/2004 à 13:43De:
Luc
[Site web]
De toute façon, ça ne pourra pas aller bien loin. Google ne pourra pas changer indéfiniment d'IP ou de classe d'IP. Et il existera toujours des raisons légitimes de cloaker, impossibles à différencier des autres par un algorithme.
le 19/09/2004 à 15:53De:
Bobez
[Site web]
Pour moi, il n'y a aucune raison légitime de cloaker, on peut toujours se débrouiller autrement...
le 19/09/2004 à 17:49De:
slender
[Site web]
Depuis 3 jours plus de trace de GG effectivement. En regardant mes logs de plus près je le trouve maintenant GG sous les IP suivantes:
66.249.64.189 et 66.249.64.167
J'espère qu'il ne m'en voudra pas car je cloacke les bots uniquement pour une histoire d'ID de session...
le 20/09/2004 à 12:17De:
Cendrillon
[Site web]
oops ... et dire que j'avais sorti ça en plaisantant sur un forum Webrankinfo (voire site web) ... j'étais loin de penser à ce moment là que Google se lançait dans une veritable "chasse au cloacking" ...
d'ailleurs dans cette perspective, je ne comprend pas pourquoi il continue à signer Googlebot ...
et si ce n'était que de simples changements d'adresses IP des bots ?
le 20/09/2004 à 13:51De:
Jeromax
[Site web]
Moi aussi je cloacke pour les id session, dois y avoir moyen de faire ça autrement d'ailleurs...
le 22/09/2004 à 20:41De:
adn
[Site web]
Avec un test du type "strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'Googlebot')" on s'en sort encore pour le moment.... ;)
le 22/09/2004 à 21:29De:
Jan
[Site web]
adn,
Certes mais un cloaking sur l'user agent est visible par n'importe qui. L'ua est très facile à "faker", contrairement à l'IP.
le 23/09/2004 à 01:45De:
Franck
[Site web]
Et leur demander directement si 66.249.64.189 c'est eux ou pas, c'est idiot ?
le 24/09/2004 à 17:16De:
Jan
[Site web]
Franck
Aucun doute là dessus: 66.249.64.189 c'est googlebot
le 24/09/2004 à 17:20De:
abcdunet
[Site web]
petite question que je me pose, comment savoir si une page est cloaké , pour le profane... Y a-t-il un moyen de la voir ?
le 24/09/2004 à 18:58De:
Jan
[Site web]
abcdunet,
La première chose à faire est d'aller voir le cache des moteurs de recherche (google, yahoo) et de comparer la page qui y est présente à celle que tu vois en temps que visiteur.
Ceci dit, en général, un webmaster qui cloake interdit aux moteurs d'archiver ses pages dans leurs caches (l'absence de copie d'une page en cache est d'ailleurs bien souvent un indice de cloaking).
Dans le cas où une page cloakée n'est pas en cache, de 2 choses l'une:
- soit le cloaking est fait sur l'user agent,
- soit il est fait sur l'IP.
(
Plus d'infos sur les 2 façons de cloaker...)
Le cloaking sur user agent est très facile à détecter avec des outils qui permettent de "faker" les user agents des robots, comme wannabrowser (
voir ici...)
Le cloaking sur IP est beaucoup plus difficile à détecter: faker une adresse IP est très compliqué. A défaut, l'utilisation de l'outil de traduction des pages web de google peut permettre de détecter un cloaking mal fait. Mais en général les cloakers ne s'y laissent pas prendre. Reste alors une solution: si tu suspecte qu'une partie de la page que tu penses cloakée n'est pas présentée aux robots, tu fais une recherche dans les moteurs du style: site:www.site.com mot-que-tu-crois-cloaké. Si tu n'obtiens aucune réponse, il est probable que lapage soit cloakée.
le 24/09/2004 à 20:14De:
abcdunet
[Site web]
merci Jan pour toutes ces précisions... Je ne suis pas spécialiste en cloaking, et j'ai maintenant les idées un peu plus claires :-)
le 25/09/2004 à 16:39De:
Luc
[Site web]
Allez, un petit avis en forme de pavé dans la marre: Totalement contre le cloaking, même si je me fous des principes, et que je me fous de la triche, j'ai décidé que mes deux sites monteraient seuls dans les moteurs à coup de contenu, et point à la ligne...
Faites un site avec du contenu, il aura les visiteurs qu'il mérite, faites un site sans contenu, bof... Puis je préfère cinquante visiteurs fidèles, qui visitent régulièrement mon site par plaisir, que deux milles qui arrivent par hasard et repartent aussi sec, avis personnel, et n'y voyez aucune critique, c'est mon choix, comme on dirait dans une émission merdique heureusement disparue ;-)
Au fait, pour les copains, zeuniouzes disparait dans une semaine, et est remplacé par http://luc.mondelibre.org si vous voulez faire partie des cinquante visiteurs réguliers :-)))))))))))))))))))))))))))))))))
le 26/09/2004 à 03:21De:
abcdunet
[Site web]
Luc,
Je suis tout à fait d'accord avec toi..... "c'est mon choix" était une émission merdique, et heureusement que ça n'existe plus :-))
sinon, pour le reste, je suis d'accord aussi, il vaut mieux prendre son temps à faire un bon contenu.... que de le perdre....
le 28/09/2004 à 20:05De:
catboy
Quelqu'un sait il où on peut trouver une lise d'ip a jour du coup ? :o/
Merci...
le 01/10/2004 à 02:32De:
hebergement asp
[Site web]
Il y a aussi ce lien :
http://www.searchengineworld.com/spiders/ip_addresses/google.htm
le 04/10/2004 à 11:10De:
Jeromax
[Site web]
J'ai enfin eut le temps de me pencher sur ce "pseudo cloaking" que je faisais. Je modifie mon site et je n'en aurai plus besoin :-))
Déjà que les moteurs voyaient la même chose que les visiteurs, mais maintenant je ne vais plus faire de différences du tout ! !
ouf....
le 05/10/2004 à 19:38De:
nico_p
[Site web]
Une bonne nouvelle, mais la tache est tellement grande ... bon courage google.
le 07/10/2004 à 15:11De:
julien
[Site web]
Je pense que c'est juste une nouvelle classe d'ip pour des nouveaux servers de google car ils en ont plus assez pour crawler le web.
le 07/10/2004 à 16:35De:
Vincent
[Site web]
Ca fait 15 jours que GG n'est plus venu sur notre site !
Comme le dit Slender, on espére qu'il ne nous en voudra pas ?
PING 64.68.83.179 (64.68.83.179): 56 data bytes
--- 64.68.83.179 ping statistics ---
2 packets transmitted, 0 packets received, 100% packet loss
le 28/10/2004 à 01:12De:
michel
[Site web]
La « chasse au cloaking » est sûrement une priorité chez Google, la pérennité du géant est en jeux, le maintient de la pertinence d’un moteur de recherche tel que Google est la condition indispensable à sa progression et de sa place financière, les enjeux sont énormes…
le 04/11/2004 à 20:48De:
Design me
[Site web]
De manière général, Google a tout de même tendance a créer des fausses pistes alors ..attention.
le 23/02/2005 à 17:10De:
j
Question:
si je change une feuille de style CSS en fonction des bots, c'est considéré comme du cloaking?
Non parce que sinon je n'ai plus qu'a mettre des display:none pour cacher ce que le GoogleBot ne doit pas voir et inversement. Mais d'ailleurs, lit-il les objets qui ont la propriété display:none?
le 25/02/2005 à 15:36De:
Nico
[Site web]
Avant de virer les pages de cloaking, si GG pouvait déjà commencer par ne pas indéxer les pages NOINDEX et par virer les pages de redirection sauvages de son index ca serait déjà pas mal ... mais bon :/
Ajoutez un commentaire en direct :::
Il est temporairement impossible de poster un commentaire: nos modos sont en vacances. A bientôt;)