Vous n'êtes pas identifié(e).
Bonjour à tous,
Si des pro du scrape sont présents, merci pour votre aide
j'aimerais gérer les captchas lorsque je scrape google, les étapes sont les suivantes :
Je demande une page à google
si un captcha est détecté, je l'envoi à un service qui me le résout et me retourne un code réponse
La question est : qu'est ce que je fais de ce code réponse ? Il est dit qu'il faut l'injecter dans le textarea avec l'id "g-recaptcha-response" puis de cliquer sur envoyer.
Mais dans ce cas il faut que je scrape avec un navigateur type phantomjs ?
Ou y'a t-il un autre moyen de valider le captcha tout en continuant à scrapper avec un simple curl ?
Autre question : J'ai aussi tenté de valider le captcha manuellement depuis un navigateur via l'ip du proxy utilisé, mais lorsque je refait un curl, je me prend quand meme un captcha ?
Je vois aussi qu'une solution comme serposcope gère les captcha (recaptcha v2), si quelqu'un a des infos ?
Dernière modification par AhmedSEO (2017-12-01 15:48:36)
🔴 Hors ligne
Merci pour vos réponses.
tu veux forcément le faire en curl ?
Tu prends Zenno
En faite, je dois absolument passer par un développement sur lequel j'ai la main, donc pas de zenno.
Je scrape via nodejs. J'ai de bon temps de repos entre les requetes (1 à 2 minutes par proxy), il arrive que des proxies se prennent des captchas, j'aimerais pouvoir les gérer pour continuer le scrape plutot que de mettre à l'arret un moment les proxies qui commencent à se prendre des captcha. (les requetes sont de simple mots clés, pas footprint spéciaux)
Dernière modification par AhmedSEO (2017-12-09 18:55:31)
🔴 Hors ligne
Tu prends Zenno
je n'aurai pas dit mieux
Pour revenir à la question initiale : tous les logiciels anti captchas simulent une connexion à un service anti captcha (api)
il suffit d'utiliser une api dans ton nodejs et si l'api fonctionne tu peux installer un logiciel comme capmonster2 etc qui va intercepter la connexion au service que tu auras choisis (en modifiant le fichier Host de ton windows) donc le logiciel sera transparent pour ton programme
Enjoy !
Seoxis
Dernière modification par Seoxis (2021-10-06 04:01:44)
Envie de me faire plaisir , achetez les mêmes proxys que j'utilise via ce lien : -=[ buyproxies.org ]=- (15€ pour 10 proxys dédiés)
Envie de tester ZennoPoster c'est par ici : -=[ ZennoPoster ]=- (à partir de 87$)
🔴 Hors ligne
chn16000 a écrit :Tu prends Zenno
je n'aurai pas dit mieux
Pour revenir à la question initiale : tous les logiciels anti captchas simulent une connexion à un service anti captcha (api)
il suffit d'utiliser une api dans ton nodejs et si l'api fonctionne tu peux installer un logiciel comme capmonster2 etc qui va intercepter la connexion au service que tu auras choisis (en modifiant le fichier Host de ton windows) donc le logiciel sera transparent pour ton programme
Enjoy !
Seoxis
"Ca paraît si simple à faire, pourtant mon écoute est claire"
2008, Ghiata Pierre premier site et premier pas dans le SEO. Depuis le SEO ne m'a jamais quitté...
🔴 Hors ligne