Vous n'êtes pas identifié(e).

  • Contributions :
  • Vos boîtes de messages privés sont vides.

Annonce

Progressez rapidement avec notre gamme de formations SEO Skills en ligne | Automatisez facilement votre production de contenu de qualité avec le SEO QUARTZ !

#1 2016-12-15 08:26:16

Mention Gones
Recruit
Lieu : 63
Inscription : 2015-05-23
Messages : 24

Développement PHP
Développement Python
Développement JS
Scraping

Re : Regex & Sitemap

(.*\.html)$ ça devrait marcher.

Un site utile pour tester tes regex => https://www.regex101.com/

Hors ligne

#2 2016-12-15 08:33:52

Mention Mitsu
Soldier
Inscription : 2014-11-17
Messages : 2 011

Développement PHP
Développement JS
Audit et Analyse
Netlinking
Site Web

Re : Regex & Sitemap

Regex : <loc>([^\.]+.html)</loc>

Sinon en xpath avec //loc puis tu filtre ensuite sur .html dans excel.

Tu peux aussi ouvrir un sitemap avec excel , il te liste toutes les urls, ensuite tu fais un filtre sur .html.

Dernière modification par Mitsu (2016-12-15 08:34:35)

Hors ligne

#3 2016-12-15 09:33:26

Mention Linuxma
Soldier
Inscription : 2015-05-13
Messages : 864

Netlinking
Scraping
Automatisation Web
Comunity Management
Site Web

Re : Regex & Sitemap

@Dukofo essaie avec : .*\.html

En ligne

#4 2016-12-15 09:59:22

Mention Gones
Recruit
Lieu : 63
Inscription : 2015-05-23
Messages : 24

Développement PHP
Développement Python
Développement JS
Scraping

Re : Regex & Sitemap

Dans la Search Console tu auras le détails pour chaque sitemap lister dans ton siteindex.

Hors ligne

#5 2016-12-15 10:54:05

Mention nides
Scout
Inscription : 2016-04-13
Messages : 198

Sémantique
Netlinking
Audit et Analyse

Re : Regex & Sitemap

Il suffira que sur la Search Console, dans les sitemap, tu cliques sur ton fichier index et tu verras le nombre d'URL envoyées/indexées pour chaque sitemap.


Achat/échange BL thémas Chien, Chat, Sport et Puériculture  - Je peux proposer généraliste, santé, sport, immo, animaux...

Hors ligne

#6 2016-12-15 13:56:14

Mention razbithume
Scout
Inscription : 2013-09-17
Messages : 827

Audit et Analyse
Scraping
Marketing
Site Web

Re : Regex & Sitemap

et si tu fais juste include .*html ca ne marche pas ?


Vive les regex et le xpath !

Hors ligne

#7 2016-12-15 14:11:30

Mention Gones
Recruit
Lieu : 63
Inscription : 2015-05-23
Messages : 24

Développement PHP
Développement Python
Développement JS
Scraping

Re : Regex & Sitemap

^(?!.*\.html).*

pour exclure les urls qui ne contiennent pas .html

Hors ligne

#8 2016-12-15 14:53:36

Mention Mitsu
Soldier
Inscription : 2014-11-17
Messages : 2 011

Développement PHP
Développement JS
Audit et Analyse
Netlinking
Site Web

Re : Regex & Sitemap

Tu peux m'envoyer l'url de ton fichier sitemap index par mp ? A partir de ça tu veux toutes les urls en .html de tous les sitemap lié à l'index ?

Je peu regardé si tu veux, ça doit pas être bien méchant.

Hors ligne

#9 2016-12-15 17:41:30

Mention razbithume
Scout
Inscription : 2013-09-17
Messages : 827

Audit et Analyse
Scraping
Marketing
Site Web

Re : Regex & Sitemap

//a[not(contains(@href,"ton nom de domaine"))]/@href

en xpath, tu prends toutes les balises a dont le href ne contient pas ton nom de domaine


Vive les regex et le xpath !

Hors ligne

Pied de page des forums