Vous n'êtes pas identifié(e).
Pages :: 1
Je suis tombé sur ce bouquin en faisant des recherches sur cURL, il s'agit d'un gros bouquin sur les spider, bot et scraper. ll y a de nombreux exemples sur l'utilisation de cURL avec PHP (mais pas que, d'après le sommaire de je vois du iMacro, des commandes shell..). Cookie, proxy, authentification, lecture d'email, ..etc tout y passe!
Je crois que je n'ai pas vu de curl_multi, dommage... A part ça, il semble être vraiment complet. J'ai hâte de le lire!
Le nom du livre: Webbots, Spiders, And Screen Scrapers, 2nd Edition par Michael Schrenk.
Voici le lien de téléchargement
Je suis content d'avoir trouvé ce bouquin, mais je n'ai pas trouvé de réponse à mes questions... Je tente ici.
Comment limiter le nombre de thread avec curl?
Dernière modification par LostSEO (2013-06-02 17:00:13)
"Si vous ne faites pas d'erreurs, vous ne faites probablement pas grand chose..."
🔴 Hors ligne
je crois que tu ne peux pas limiter le nombre de thread, pour la question.
Pour le bouquin, un grand merci, au nom de la communauté
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking 2022 (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🟢 En ligne
Oui c'est vrai qu'il n'y a pas de moyen de limiter les thread via la fonction. Mais j'étais plus à la recherche d'un exemple de script avec une fonction permettant de le faire.
J'ai vu deux méthodes, la première consiste à utiliser array_chunk() qui permet de découper un tableau en plusieurs tableau plus petit et la seconde solution, consiste à faire une simple boucle en début de code, lorsqu'une url a été chargée, on passe à la suivante.
Voici l'exemple avec la boucle ici (voir partie WordPress Link Checker, utile pour vérifier vos liens morts) et voici le second exemple avec array_chunk (un exemple de brute force, pas de bêtise hein!)
Dernière modification par LostSEO (2013-02-06 04:17:51)
"Si vous ne faites pas d'erreurs, vous ne faites probablement pas grand chose..."
🔴 Hors ligne
De rien Je travaille justement sur ta classe SimpleURL, je la modifie un peu pour intégrer la limitation de thread et j'ai fait deux trois autres modifications. Une fois que j'ai fini, je poste!
"Si vous ne faites pas d'erreurs, vous ne faites probablement pas grand chose..."
🔴 Hors ligne
Plateforme.
Jolie le petit page rank de 3 sur ton site wordpress avec un thème de base et sans garniture le pire GG
Ventes privées de grandes marques, fin de séries de vêtements, chaussures, prêt-à-porter et accessoires de mode.
Livraison et rertour Gratuit en Colissimo. 50 grandes marques tendances. Vos envies à tout prix !
🔴 Hors ligne
Hello,
J'arrive après la guerre, le lien est plus valide, mais je veux bien le livre
Fan de WP, de spin et de génération de contenu en général.
Penguinzophren : lex est quod referencus
🔴 Hors ligne
Top cool, merci tout plein
Fan de WP, de spin et de génération de contenu en général.
Penguinzophren : lex est quod referencus
🔴 Hors ligne
merci lost
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking 2022 (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🟢 En ligne
Merci beaucoup pour le partage.
Perso, pour scraper les résultats de google ce que je fais je fais une boucle sur le script avec curl.
Par exemple, quand je cherche le positionnement d'un site sur certain MC, un cron lance le script à 0h, le script cherche la position du site sur le 1er mot clé puis, en fin de script, je curl le script qui se relance donc comme ça à l'infini. Si je n'ai plus de mot à checker on ne s'auto curl plus et le script s'arrête.
hello,
y-aurait-il moyen d'avoir cet ebook ?
sinon dimanche soir (because au boulot et en week -end ensuite) je vous posterais un lien sur le même sujet , mais en ruby
c'est assez pratique, toutes les lib sont a dispo pour scraper, parser, etc
d'ailleurs je vois qu'il n'y a pas de section dev en ruby et ruby on rails
🔴 Hors ligne
d'ailleurs je vois qu'il n'y a pas de section dev en ruby et ruby on rails
Je crée la section si tu veux
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking 2022 (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🟢 En ligne
bah écoute je serais pas contre , j'ai pratiqué le php antérieurement mais depuis que je fais du ruby, je suis à fond dessus
pareil dimanche soir ou semaine pro je peux commencer à mettre qlqs posts, genre comment utiliser une lib en ruby qui utilise ouvre un navigateur et comment l'utiliser en headless sur un serveur distant
je peux faire un pti tuto avec un add on firefox que te permet de générer des macro pour watir
bref tout un tas de pti trucs sympa
🔴 Hors ligne
Pages :: 1