Vous n'êtes pas identifié(e).

  • Contributions :
  • Vos boîtes de messages privés sont vides.

#1 2017-12-01 11:53:43

Mention AhmedSEO
Recruit
Lieu : Paris
Inscription : 2017-04-25
Messages : 21

Scraping
Netlinking
Content Spinning
Développement PHP

comment gérer les captchas sur google

Bonjour à tous,

Si des pro du scrape sont présents, merci pour votre aide smile

j'aimerais gérer les captchas lorsque je scrape google, les étapes sont les suivantes :

Je demande une page à google
si un captcha est détecté, je l'envoi à un service  qui me le résout et me retourne un code réponse

La question est : qu'est ce que je fais de ce code réponse ? Il est dit qu'il faut l'injecter dans le textarea avec l'id "g-recaptcha-response" puis de cliquer sur envoyer.
Mais dans ce cas il faut que je scrape avec un navigateur type phantomjs ?
Ou y'a t-il un autre moyen de valider le captcha tout en continuant à scrapper avec un simple curl ?

Autre question : J'ai aussi tenté de valider le captcha manuellement depuis un navigateur via l'ip du proxy utilisé, mais lorsque je refait un curl, je me prend quand meme un captcha ?

Je vois aussi qu'une solution comme serposcope gère les captcha (recaptcha v2), si quelqu'un a des infos ?

Dernière modification par AhmedSEO (2017-12-01 15:48:36)

Hors ligne

#2 2017-12-08 22:35:45

Mention cb_nalex
Soldier
Inscription : 2014-04-26
Messages : 736

Html Css
Netlinking
Sémantique
Audit et Analyse

Re : comment gérer les captchas sur google

tu veux forcément le faire en curl ?


°¨¨°³º¤£ [  COOLBYTES  ] £¤º³°¨¨° - Skype: cb_nalex_levrai

Hors ligne

#3 2017-12-09 08:33:58

Mention chn16000
Scout
Inscription : 2017-04-07
Messages : 634

Netlinking
Sémantique
Marketing
Audit et Analyse

Re : comment gérer les captchas sur google

Tu prends Zenno big_smile


Soyez vous-même, les autres sont déjà pris

Hors ligne

#4 2017-12-09 18:51:40

Mention AhmedSEO
Recruit
Lieu : Paris
Inscription : 2017-04-25
Messages : 21

Scraping
Netlinking
Content Spinning
Développement PHP

Re : comment gérer les captchas sur google

Merci pour vos réponses.

cb_nalex a écrit :

tu veux forcément le faire en curl ?

chn16000 a écrit :

Tu prends Zenno big_smile

En faite, je dois absolument passer par un développement sur lequel j'ai la main, donc pas de zenno.

Je scrape via nodejs. J'ai de bon temps de repos entre les requetes (1 à 2 minutes par proxy), il arrive que des proxies se prennent des captchas, j'aimerais pouvoir les gérer pour continuer le scrape plutot que de mettre à l'arret un moment les proxies qui commencent à se prendre des captcha. (les requetes sont de simple mots clés, pas footprint spéciaux)

Dernière modification par AhmedSEO (2017-12-09 18:55:31)

Hors ligne

Pied de page des forums