Vous n'êtes pas identifié(e).
Pages :: 1
Bonjour à tous,
Je cherche à scrapper le contenu des H2 sur une liste d'urls.
Je n'ai pas trouvé de solution via scrapebox. Il n'y en a pas ?
Autrement j'ai réussi à laborieusement implanter ça dans un google sheet avec cette formule : =IMPORTXML(A3; "//h2/text()")
Là j'obtiens quelques résultats, mais dès qu'il y a plusieurs H2 j'obtiens un #REF! et sur certaines urls je ne peux pas avoir mieux que #N/A alors qu'il y a bien un H2 dans le code source.
Auriez-vous une technique ou un tool (RDZ ou GScraper font ça ?) qui permette de scrapper des contenus de balises à me conseiller ?
🔴 Hors ligne
tu n'as pas RDDZ?
C'est un scrapper comme scrapebox mais tu peux gerer comme tu veux tes moteurs de scrap avec xpath et récupérer ce que tu veux en info
Jérôme - Générer des revenus avec les NDD expirés (formation) | Blog perso jeromeweb.net
🔴 Hors ligne
Sinon avec screaming frog en mode liste tu balance ta liste, configuration->custom->extraction, tu prend xpath et //h2.
🔴 Hors ligne
Sinon avec screaming frog en mode liste tu balance ta liste, configuration->custom->extraction, tu prend xpath et //h2.
+1
🔴 Hors ligne
Finalement j'utilise Screaming Frog qui fait le job dans l'interface par défaut. J'utilisais Xenu qui répond à mes besoins de crawl, et avais zappé SC pour sa limite en version gratuite. Au premier abord je m'aperçois qu'il va m'être bien utile. Merci pour le conseil
🔴 Hors ligne
Pages :: 1