Pages :: 1
Hello,
Je sais qu'il est aujourd'hui très difficile si ce n'est impossible de scraper Google en illimité, mais qu'elles seraient les applications que vous feriez si demain vous pouviez scraper Google en illimité sans restrictions ?
A quoi cela vous servirez de pouvoir scrapper Google en illimité ?
🔴 Hors ligne
Bah c'est possible de scrapper GG en illimité, c'est juste qu'il faut de bons proxies et/une bonne rotation, et quand c'est plus possible de scrapper GG bah on scrape Bing (qui lui est infiniment plus permissif !).
Je scrape des millions de target par jour (avant nettoyage) pour GSA SER (entre autre) et je n'ai jamais eu de souci...
🔴 Hors ligne
Bah c'est possible de scrapper GG en illimité, c'est juste qu'il faut de bons proxies et/une bonne rotation, et quand c'est plus possible de scrapper GG bah on scrape Bing (qui lui est infiniment plus permissif !).
Je scrape des millions de target par jour (avant nettoyage) pour GSA SER (entre autre) et je n'ai jamais eu de souci...
Pourquoi payer des proxies quand tu peux utiliser/déployer des CSE ?
🟢 En ligne
Sogliath a écrit :Bah c'est possible de scrapper GG en illimité, c'est juste qu'il faut de bons proxies et/une bonne rotation, et quand c'est plus possible de scrapper GG bah on scrape Bing (qui lui est infiniment plus permissif !).
Je scrape des millions de target par jour (avant nettoyage) pour GSA SER (entre autre) et je n'ai jamais eu de souci...
Pourquoi payer des proxies quand tu peux utiliser/déployer des CSE ?
Car mes tools ne sont pas compatibles nativement tout simplement et aussi car c'est plus simple de cramer des proxies que de déployer des CSE !
Pour le custom j'ai pris l'habitude de scrapper avec Beautiful Soup sinon... Mais oui, c'est une piste intéressante !
Dernière modification par Sogliath (2021-01-15 21:39:51)
🔴 Hors ligne
si tu veux scraper google en illimité suffit simplement de demander
regarde le code source et inspire toi en pour l'adapter au seo
l'idée ici est de passer par facebook qui n'est pas bridé pour afficher des aperçus de google
nécessite juste un compte FB afin de récupérer les cookies de connexion et enjoy !
Seoxis
Envie de me faire plaisir , achetez les mêmes proxys que j'utilise via ce lien : -=[ buyproxies.org ]=- (15€ pour 10 proxys dédiés)
Envie de tester ZennoPoster c'est par ici : -=[ ZennoPoster ]=- (à partir de 87$)
🔴 Hors ligne
Excellent, merci Seoxis !
Edit : Ce script est juste énorme !
Dernière modification par Sogliath (2021-01-16 23:19:00)
🔴 Hors ligne
Très interessant ça, merci
Bon, faut que je me perfectionne un peu en bash pour le modifier mais c'est pas grave .
🔴 Hors ligne
Très interessant ça, merci
Bon, faut que je me perfectionne un peu en bash pour le modifier mais c'est pas grave .
Heuu non faut juste être curieux , même si tu ne comprends rien (comme tlm au début) essayer de tirer des infos pour tenter de comprendre et un jour à force de tenter tu finiras par le comprendre
perso c'est un script plutôt destiné pour le hack mais l'exploit est utilisable par tous (SEO compris)
après je suis en train de me faire un programme basé sur ça pour pouvoir l'utiliser avec n'importe quel logiciel mais j'hésite à le communiquer je me dis que si tlm l'a , l'exploit peut être patché rapidement
c'est pour cela que je vous ai juste fourni le script en bash , celui qui a les capacités pour trouver comment faire devrait comprendre qu'il faut le garder pour lui
pour infos , l'exploitation fonctionne super bien (testé hier) avec un tempo de 2s entre les requêtes c'est du régal
pour l'utiliser il suffit juste de trouver la bonne url et mettre les cookies (j'en dirai pas +)
c'est un peu comme des challenges hack , je compte sur vous pour ne pas diffuser la méthode mais si vous arrivez à l'exploiter faites le moi savoir
Enjoy !
Seoxis
Envie de me faire plaisir , achetez les mêmes proxys que j'utilise via ce lien : -=[ buyproxies.org ]=- (15€ pour 10 proxys dédiés)
Envie de tester ZennoPoster c'est par ici : -=[ ZennoPoster ]=- (à partir de 87$)
🔴 Hors ligne
Ah non mais je pense pouvoir le modifier sans trop de problèmes, c'est juste que je ne suis pas trop habitué a coder en bash mais bon ça devrait le faire.
Je m'y pencherai à l'occasion pour me faire une petite api pour aller faire quelques requêtes un peu relou style des site: qui sont "chères" sur dataforseo quand on commence à en faire pas mal.
Ou alors je le recoderai a ma sauce en suivant juste le fonctionnement... on verra. Mais j'aimais bien le principe du petit script bash en ligne de commande.
En tout cas merci pour le partage.
Dernière modification par Ziltosh (2021-01-17 20:46:04)
🔴 Hors ligne
A titre perso, même si ça paraît séduisant, au final je n'en ferai pas grand chose.
Récupérer de la data c'est cool mais il faut la stocker et la traiter...
Pour une agence ou un référenceur avec des clients, ça peut déjà être plus utile.
🔴 Hors ligne
Je ne pigeais pas ce que venait faire un audit de dorks ici, quand soudain...
Merci Seoaxis, c'est enorme comme exploit !
Dernière modification par Atomium (2021-02-09 22:51:37)
🔴 Hors ligne
Je sais pas si il y a plus simple, mais Nord VPN suffit pour un script en local (testé sur 1000+ à la suite)
Une ligne de commande pour changer d'ip quand le captcha est détecté et hop c'est reparti
🔴 Hors ligne
Ah yes le proxy dev de facebook , j'avais partagé ce tips sur tw en 2019. A l'origine c'est @s0md3v (https://github.com/s0md3v/goop) qui à relayé la "faille" à Facebook et qui finalement, n'a pas trouvé utile de la patcher.
Il suffit de faire une requête vers cette url :
. Facile à implémenter sous zenno, curl, py etc.. C'est assez permissif et selon les jours, on peut largement dépasser les 500k url's avant de tomber sur un captcha. Pensez simplement à utiliser la même ip pour générer le cookie que pour votre scraper. Idem pour le user agent
Dernière modification par descent (2021-09-18 13:25:16)
@JesuispasSEO
🔴 Hors ligne
Suivant des KW scrappe de la SERP pour ensuite récupérer le contenu des X premiers sites de la SERP.
Ce contenu permettrait alors d'entrainer des modèles d'IA pour la génération de texte.
🔴 Hors ligne
Ah yes le proxy dev de facebook , j'avais partagé ce tips sur tw en 2019. A l'origine c'est @s0md3v (https://github.com/s0md3v/goop) qui à relayé la "faille" à Facebook et qui finalement, n'a pas trouvé utile de la patcher.
Il suffit de faire une requête vers cette url :https://developers.facebook.com/tools/debug/echo/?q=urlascrapper. Facile à implémenter sous zenno, curl, py etc.. C'est assez permissif et selon les jours, on peut largement dépasser les 500k url's avant de tomber sur un captcha. Pensez simplement à utiliser la même ip pour générer le cookie que pour votre scraper. Idem pour le user agent
Patché depuis plus d'un an, vous connaissez une autre faille de ce type ?
https://twitter.com/YvanSEO
Passionné par l'automatisation ▶ ZennoPoster
🔴 Hors ligne
Pages :: 1