Scrapper les H2 d'un site

AlexB · #1 2017-05-17 17:49:50

Bonjour à tous,

Je cherche à scrapper le contenu des H2 sur une liste d'urls.

Je n'ai pas trouvé de solution via scrapebox. Il n'y en a pas ?

Autrement j'ai réussi à laborieusement implanter ça dans un google sheet avec cette formule : =IMPORTXML(A3; "//h2/text()")

Là j'obtiens quelques résultats, mais dès qu'il y a plusieurs H2 j'obtiens un #REF! et sur certaines urls je ne peux pas avoir mieux que #N/A alors qu'il y a bien un H2 dans le code source.

Auriez-vous une technique ou un tool (RDZ ou GScraper font ça ?) qui permette de scrapper des contenus de balises à me conseiller ?

jeromeweb · #2 2017-05-17 18:14:21

tu n'as pas RDDZ?
C'est un scrapper comme scrapebox mais tu peux gerer comme tu veux tes moteurs de scrap avec xpath et récupérer ce que tu veux en info

AlexB · #3 2017-05-17 18:57:32

Merci pour le tuto et pour le conseil RDDZ. GScraper ferait le job également ?

Mitsu · #4 2017-05-17 19:58:39

Sinon avec screaming frog en mode liste tu balance ta liste, configuration->custom->extraction, tu prend xpath et //h2.

AhmedSEO · #5 2017-05-17 20:34:06

Mitsu a écrit :

Sinon avec screaming frog en mode liste tu balance ta liste, configuration->custom->extraction, tu prend xpath et //h2.

+1

AlexB · #6 2017-05-18 17:18:48

Finalement j'utilise Screaming Frog qui fait le job dans l'interface par défaut. J'utilisais Xenu qui répond à mes besoins de crawl, et avais zappé SC pour sa limite en version gratuite. Au premier abord je m'aperçois qu'il va m'être bien utile. Merci pour le conseil

fdms · #7 2022-01-11 18:23:59

Il me semble qu'Octoparse pourrait te permettre de faire çà (à vérifier je suis absolument débutant)

🟣 Scrapper les H2 d'un site

#1 2017-05-17 17:49:50

Scrapper les H2 d'un site

#2 2017-05-17 18:14:21

Re : Scrapper les H2 d'un site

#3 2017-05-17 18:57:32

Re : Scrapper les H2 d'un site

#4 2017-05-17 19:58:39

Re : Scrapper les H2 d'un site

#5 2017-05-17 20:34:06

Re : Scrapper les H2 d'un site

#6 2017-05-18 17:18:48

Re : Scrapper les H2 d'un site

#7 2022-01-11 18:23:59

Re : Scrapper les H2 d'un site

Pied de page des forums