Vous n'êtes pas identifié(e).
Alors là : c'est la petite colle que tout référenceur black aimerai voire solvée avec un script en libre téléchargement sur blackhatworld : mais non, il n'y a rien !!!!
Comment récupérer tout un site présent sur la wayback machine...
Vous avez une idée ??
J'ai essayer WinHTTtracks : mais je n'y arrive pas
Arnaud BOYER, eMarketing Manager @ Label Group
🔴 Hors ligne
wayback download fonctionne bien
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking 2022 (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🟢 En ligne
Oh je connaissais pas !!!!
Tu as une alternative gratuite ??
C'est fou, je l'ai pas trouvé : en même temps j'étais resté bloqué sur le terme "scraper" et pas "download" ^^
Arnaud BOYER, eMarketing Manager @ Label Group
🔴 Hors ligne
avec un petit peu de php + https://github.com/internetarchive/wayb … cdx-server
skype: davidcz1
Service de backorders de domaines
Le PBN par prnator
🔴 Hors ligne
avec un petit peu de php + https://github.com/internetarchive/wayb … cdx-server
Oui l'API de wayback est pas mal
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking 2022 (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🟢 En ligne
Super les gars, merci : un bon weekend en perspective du coup
Arnaud BOYER, eMarketing Manager @ Label Group
🔴 Hors ligne
Il y a celui-ci qui est bien, y'a même une version demo
http://www.webarchivedownloader.com/
Je ne sais pas si c'est celui dont parlait jaffaar
Automatisation puissante et simple des tâches web avec Zennoposter
http://zennolab.com/en/buy-it-now/versi … 0290a31898
Skype : laurent_sauvage
🔴 Hors ligne
Oui, en fait il y en a à foison : j'ai plus qu'à trouver celui qui me le fera gratuit ou à bidouiller l'api comme l'a suggéré @Davidc1
Arnaud BOYER, eMarketing Manager @ Label Group
🔴 Hors ligne
je me permet d'intervenir dans la conversation. j'ai essayé webarchivedownloader ca a l'air pas mal donc j'hésites à me prendre une licence. Il y en a qui l'utilise ? J'aimerai avoir le retour d'un utilisateur.
MErci.
www.audience-seo.com : Besoin de booster son trafic ?
🔴 Hors ligne
@napoleon59 : je t'invite à venir te présenter ici : http://www.scripts-seo.fr/forum-6-0-pre … age-1.html
⌕ Comment Ranker ?
▶ Nouveauté : Ninja Web Pro Pack copies limitées !
▶ Ebook : Ninjalinking 2022 (-25% : labo25e)
▶ Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )
🟢 En ligne
Perso j'ai testé il y a quelques mois http://www.webarchivedownloader.com/, je me souviens avoir été très déçu du résultat, sur une dizaine d'essai j'ai eu un site à peu près potable de récup (une petite dizaine de page html statiques) pour le reste c'est très limité. Quand il y a du JS, des designs un peu poussés ou autre c'est un gros bordel... Mieux vaut partir sur un template fait main et y intégrer le résultat d'un scrap du contenu du site
J'ai le coeur d'un artiste et les dents d'un vélociraptor
🔴 Hors ligne
@Jaffaar : Présentation faite. C'est la moindre des choses :-)
@Andes : Tu as surement raison en plus avec un outil comme rddz tu scrapes le contenu facile. Mais étant assez nouveau dans le monde des ndd expirés et du BH en général je recherche toujours la facilité et je trouve que scraper pour tout remettre à la main c'est long :-)
Si certain on des pistes pour m'aider je suis preneur. :-)
www.audience-seo.com : Besoin de booster son trafic ?
🔴 Hors ligne
@Napoleon59 Alors as-tu testé webarchive downloader? Cela donne quoi..
Work hard, Have fun & Have fun !
🔴 Hors ligne
non pas eut le temps pour le moment
www.audience-seo.com : Besoin de booster son trafic ?
🔴 Hors ligne
On peut facilement récupérer un site avec cURL (sous linux).
Le problème ensuite c'est de modifier les liens et dégager toute la surcouche de scripts ajoutés par la waybackmachine
Je vais faire un tuto la dessus dans les prochains mois avec tout le détail + le script PHP
Jérôme - Générer des revenus avec les NDD expirés (formation) | Blog perso jeromeweb.net
🔴 Hors ligne
Salut,
J'ai dev un tools pour faire cela : il récupère toutes les pages disponibles ( avec les css et les js ) et les ré écrit proprement afin d'être up directement sur le ftp. ( efface les différents tag wayback )
Le souci est que des fois, notamment sur des gros sites, toutes les pages ne sont pas dispo. dans ce cas il faut faire une 301.Amicalement, SkeeZ.
Tu arrives à recuperer les image qui sont appelées via les *.css? Moi je bloque sur ce point avec wget?
Jérôme - Générer des revenus avec les NDD expirés (formation) | Blog perso jeromeweb.net
🔴 Hors ligne
Merci skeez de ta réponse.
Je voulais essayer de trouver une solution à la racine (au niveau du wget) mais finalement je vais faire comme tu dis, recuperer ensuite. bonne journée!
Jérôme - Générer des revenus avec les NDD expirés (formation) | Blog perso jeromeweb.net
🔴 Hors ligne
Bonsoir,
Je suis en train de terminer le développement de mon outils de récupération de sites depuis wayback.
Actuellement il marche niquel pour des petits sites, et je suis en train de le peaufiner pour des sites plus complexe et plus volumineux. Je sur en train de terminer mes testes sur un site avec plus de 1500 éléments (pages, css, js, images, zip ...).
Il est vraiment très efficace et propose de nombreuses fonctionnalités : réécriture des liens, forcage du mimetype pour les liens non typé, nettoyage des pages etc... Je me tâte même à ajouter une protection pour supprimer automatiquement les liens en 404.
Vu le temps passé en développement et la nécessité d'utiliser un serveur dédié relativement puissant, je suis prêt à le mettre à disposition en échange d'une petite contribution (5 à 10€ en fonction de la taille du site).
Vous pensez que ça vaut le coup ?
🔴 Hors ligne
Je viens de dev un tool moi aussi...
Au menu:
1) récup des ndd qui vont bien (j'en ai pris une trentaine pour le moment pour tester la rentabilité...)
2) remontage du site avec les datas wayback avec un tracking des visiteurs...
3) revente du ndd (avec en bonus les datas wayback) | vente de lien | monétisation pub
skype: davidcz1
Service de backorders de domaines
Le PBN par prnator
🔴 Hors ligne