Pages :: 1
bonjour..
je recherche un script pour scraper un Wp ( text) ....hors scrape box ou genre..juste qqe chose qui aspire le texte
dans un fichier texte..a partir de son url..(niveau page categories avec pagination )..merci ! (payant ou pas)..
🔴 Hors ligne
ca pourrai se developper mais il faudra que tu donne plus de détail sur ce que tu souhaite
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🔴 Hors ligne
Bonjour Jaffaar,
En fait, se caler sur une url WP d'affichage de categories qui reçoit des pages (accessible par pagination bas de page), et récupérer les textes , uniquement, dans un fichier texte au plus simple.
🔴 Hors ligne
Hello
C'est possible via une analyse du code (en DotNet on fait ça super facilement via un objet XElement et Linq to XML)
Par contre ça dépend des templates utilisés. Tu peux repérer les pages article via l'attribut Class de la balise Body (qui contiendra "single-post" ; rechercher "single" seul si tu veux pages et articles) puis prendre le contenu dans la balise "div" de class "content" ou "entry", selon le thème utilisé, ou même la balise "article" de classe "post" si le thème est en HTML5...)
J'ai déjà réfléchi à me développer mon propre scraper de contenu, mais bon pas encore fait aujourd'hui par manque de temps...
effiSpin, c'est moi ;-)
🔴 Hors ligne
Oui c'est l'exercice parfait pour zennoposter ça.
Il faudrait faire une sorte de cahier des charges, processus complet du début à la fin avec étapes détaillées pour commencer.
Automatisation puissante et simple des tâches web avec Zennoposter
http://zennolab.com/en/buy-it-now/versi … 0290a31898
Skype : laurent_sauvage
🔴 Hors ligne
Il faudrait faire une sorte de cahier des charges, processus complet du début à la fin avec étapes détaillées pour commencer.
+1
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🔴 Hors ligne
Et pour le scrappage facile de toutes les pages, tu peux utiliser le sitemap.xml
(c'est ce que j'ai fait dans effiSocial par exemple)
Tiens c'est une idée d'article ça :-)
effiSpin, c'est moi ;-)
🔴 Hors ligne
Pages :: 1