Vous n'êtes pas identifié(e).

  • Contributions :
  • Vos boîtes de messages privés sont vides.

🟣 recuperation contenu et site sur le wayback machine


#1 2015-06-01 08:36:00

Mention arafetovich
🥉 Grade : Scout

Auxiliaire
Inscription : 2015-05-14
Messages : 36
Likes : 0
Site Web

recuperation contenu et site sur le wayback machine

Bonjour,

SVP quelqu’un peut me dire comment télécharger/aspirer un site archivé sur web.archive.org ???
En effet j'ai besoin de contenu d'un site expiré mais  c'est un peut dure de le récupérer manuellement (y a des centaines des pages à copier sad  ), et je n'arrive pas à configurer  ni IDM ni httrack pour le télécharger.

Dernière modification par arafetovich (2015-06-01 09:57:44)


Externaliser toutes les tâches de SEO  ▶ Référenceur en freelance en Tunisie

0
J'aime ❤️

🔴 Hors ligne

#2 2015-06-01 09:00:50

Mention Cyd
🥉 Grade : Scout

AuxiliaireStratège1000 messagesMembre Hospitalier
Lieu : Rennes
Inscription : 2013-01-18
Messages : 1 566
Likes : 3

Audit et Analyse
Netlinking
Cloaking
Marketing

Re : recuperation contenu et site sur le wayback machine

Hello,

tu peux voir ça directement avec @Yeurl, il propose un tarif super intéressant !


Work Hard In Silence, Let Success Make The Noise !
--> cedricguerin.fr

0
J'aime ❤️

🔴 Hors ligne

#3 2015-06-01 09:18:33

Mention arafetovich
🥉 Grade : Scout

Auxiliaire
Inscription : 2015-05-14
Messages : 36
Likes : 0
Site Web

Re : recuperation contenu et site sur le wayback machine

Merci Cyd, mais
J'ai un soucis avec le paiement en ligne actuellement (problème lié à la verification de mon paypal), c'est pour cette raison que je cherche un soft ou une solution que puisse m'aider en attendant la résolution de mon prob.


Externaliser toutes les tâches de SEO  ▶ Référenceur en freelance en Tunisie

0
J'aime ❤️

🔴 Hors ligne

#4 2015-06-01 09:23:21

Mention Cyd
🥉 Grade : Scout

AuxiliaireStratège1000 messagesMembre Hospitalier
Lieu : Rennes
Inscription : 2013-01-18
Messages : 1 566
Likes : 3

Audit et Analyse
Netlinking
Cloaking
Marketing

Re : recuperation contenu et site sur le wayback machine

Avant j'utilisais ça : hxxps://www.httrack.com/. Tu peux toujours essayer.


Work Hard In Silence, Let Success Make The Noise !
--> cedricguerin.fr

0
J'aime ❤️

🔴 Hors ligne

#5 2015-06-01 09:49:15

Mention lapido
🥉 Grade : Scout

Auxiliaire10likes
Inscription : 2014-12-14
Messages : 394
Likes : 22

Re : recuperation contenu et site sur le wayback machine

Il y a aussi Zenno voir avec @seoxis

0
J'aime ❤️

🔴 Hors ligne

#6 2015-06-01 09:53:57

Mention arafetovich
🥉 Grade : Scout

Auxiliaire
Inscription : 2015-05-14
Messages : 36
Likes : 0
Site Web

Re : recuperation contenu et site sur le wayback machine

peut tu me faire une petite copie d’écran de httrack, partie configuration.
Car j'arrive pas à télécharger le site, Httrack me donne juste deux pages !!


Externaliser toutes les tâches de SEO  ▶ Référenceur en freelance en Tunisie

0
J'aime ❤️

🔴 Hors ligne

#7 2015-06-01 10:05:33

Mention Kankun
🥉 Grade : Scout

Auxiliaire
Inscription : 2015-05-15
Messages : 96
Likes : 0

Re : recuperation contenu et site sur le wayback machine

Si le Template de toutes les pages que tu veux récupérer est le même (ou si une partie est similaire ce qui est sans doute le cas) tu peux par exemple récupérer la liste de toutes les urls de wayback Machine avec Kimono (en utilisant cette structure de page : http://web.archive.org/web/*/http://www.example.com)/* ), puis faire une deuxième api Kimono qui cette fois récupère le contenu même de chacune des pages en te basant sur les urls de 1ere api (c'est une option a choisir dans un menu déroulant de l'api).

Ca te permettra peut-être pas de récupérer la totalité du site mais au moins toutes les pages dont le template est similaire. Peut être que le restant pourra se faire plus facilement à la main ?

0
J'aime ❤️

🔴 Hors ligne

#8 2015-06-01 10:07:10

Mention Cyd
🥉 Grade : Scout

AuxiliaireStratège1000 messagesMembre Hospitalier
Lieu : Rennes
Inscription : 2013-01-18
Messages : 1 566
Likes : 3

Audit et Analyse
Netlinking
Cloaking
Marketing

Re : recuperation contenu et site sur le wayback machine

Sorry ça fait trop longtemps que je ne l'ai pas utilisé.
Honnêtement, pour 12€ la récupération d'un site avec @Yeurl, je ne me prends plus la tête !!


Work Hard In Silence, Let Success Make The Noise !
--> cedricguerin.fr

0
J'aime ❤️

🔴 Hors ligne

#9 2015-06-01 10:21:32

Mention arafetovich
🥉 Grade : Scout

Auxiliaire
Inscription : 2015-05-14
Messages : 36
Likes : 0
Site Web

Re : recuperation contenu et site sur le wayback machine

Oui t'as raison, le service de @Yeurl est super.
Le prob qu'en Tunisie, impossible pour le moment d'avoir un compte paypal vérifié. c'est illégal. sad


Externaliser toutes les tâches de SEO  ▶ Référenceur en freelance en Tunisie

0
J'aime ❤️

🔴 Hors ligne

#10 2015-06-01 21:29:05

Mention t5hak
🥉 Grade : Scout

Auxiliaire
Inscription : 2015-04-24
Messages : 98
Likes : 1

Re : recuperation contenu et site sur le wayback machine

J'avoue que 12€ si tout est récupéré proprement c'est donné.

Pour Httrack, j'ai essayé la semaine dernière et je n'avais que la 1ère page qui se téléchargeait. Je crois que c'est dû au fait qu'il y a une redirection sur tous les liens de wayback machine vers un répertoire parent différent.

ex :
tu est sur la page A https://web.archive.org/web/20150326080730/http://exemple.com/a.html
tu clique sur un lien pour aller sur la page B https://web.archive.org/web/20150326080730/http://exemple.com/b.html
et tu es redirigé vers la page https://web.archive.org/web/20140514215913/http://exemple.com/b.html

et vu que Httrack est un crawler qui ne suit pas les redirections...

0
J'aime ❤️

🔴 Hors ligne

Pied de page des forums