Vous n'êtes pas identifié(e).
Pages :: 1
Hey,
Y a pas mal de script php qui servent à cloaker GG et comme une fois n'est pas coutume, voici la trame d'un probable script de cloaking qui pourrait être le mien (je ne le pratique pas -> encore).
Attention: Script à améliorer (range ip) et peut-être pas viable non plus niveau technique, je le partage simplement.
// Récupère l'IP de l'internaute / robot
$IP = GetIP();
// Regarde si le host est bien un bot.
$Cloak = CheckHostName($IP);
// Regarde si l'IP correspond à GBot.
$IPRange = CheckIP($IP);
if ( ($Cloak == 1) && ($IPRange == 1) ) {
return 1;
} else {
return 0;
}
}
// Regarde si l'IP commence
// bien par l'IP des Google bot..
function CheckIP($IP) {
// IP Gbot (début d'IP)
if (preg_match("/^66.249.*/i", $IP)) {
return 1;
} else {
return 0;
}
}
// Récupère l'IP courante de l'utilisateur
// ou du robot.
function GetIP() {
return $_SERVER["REMOTE_ADDR"];
}
// Main fonction de vérification.
// Check le nom de host.
function CheckHostName($IP) {
$hostname = gethostbyaddr($IP);
$p1 = CheckHostGCom($hostname);
$p2 = CheckHostGBotCom($hostname);
if ( ($p1 == 1) || ($p2 == 1) ) {
return 1;
} else {
return 0;
}
}
// Check si la fin de l'host est bien
// xxx.google.com.
function CheckHostGCom($hostname) {
if (preg_match("/.google.com$/i", $hostname)) {
return 1;
} else {
return 0;
}
}
// Check si la fin de l'host est bien
// xxx.googlebot.com.
function CheckHostGBotCom($hostname) {
if (preg_match("/.googlebot.com$/i", $hostname)) {
return 1;
} else {
return 0;
}
}
echo Cloak();
Je me suis concentré sur 2 éléments: le range ip et le host name, il y a peut-être d'autres sécurités à vérifier avant que ce script fonctionne mais il a le mérite d'être partagé!
Si vous avez des retours, n'hésitez pas.
skype : blaise.clement
🔴 Hors ligne
Merci, pas mal l'idée de checker la range avant de faire le reverse dns, ça fait gagner des ressources, à vérifier que toutes les ips sont dans cette range mais j'imagine que t'as checké.
Par contre, attention sur ta regex, googlebot, ça finit soit par googlebot.com soit par google.com, tester ce cas là aussi.
https://support.google.com/webmasters/answer/80553?hl=fr
"/.google(bot)?.com$/i" => devrait gérer les deux cas.
🔴 Hors ligne
Comme je le dis dans le topic initial, il y a sans doute des ranges d'ips non couvertes dans le script, il faudra l'amléiorer.
J'ai également bien vu le thread de chez Google sur le sujet mais je gère plusieurs sites et après avoir look les logs, GG ne passe jamais avec ce DNS. Mais à ajouter effectivement, sait-on jamais !
skype : blaise.clement
🔴 Hors ligne
Merci pour le partage.
ça ressemble presque à mon script perso. Je vais juste modifier pour y intégrer la REGEX de mitsu
J'ai toujours été nul avec mes REGEX ^^
"Deux choses sont infinies, l'univers et la bêtise humaine. Pour l'univers, j'en suis pas sur ..."
🔴 Hors ligne
Attention avec le lien Google partagé par Mitsu => https://support.google.com/webmasters/answer/80553?hl=fr
Il y a un peu de désinformation, lisez bien la première phrase du document
Vous pouvez vérifier que le robot d'exploration qui accède à votre serveur est réellement Googlebot (ou un autre user-agent Google).
Dans l'exemple 2 à ma connaissance il ne s'agit pas de Googlebot mais de Feedburner et Googlebot utilise toujours le serveur de noms googlebot.com et non google.com. Attention
🔴 Hors ligne
Microlight contrib, voici la ligne modifiée avec plusieurs ranges d'IP
C'est toutes les ip connues de google bot que j'ai pu trouver.
@pascal_ccbb | LOCAL SEO | Agence de com' locale
🔴 Hors ligne
Pages :: 1