J'avais besoin de récupérer les URLs d'articles du Monde, suite à une recherche sur leur site.
J'ai mis un peu de temps mais ça fonctionne, pour ceux qui ont Zenno c'est un poil plus simple et Cedric peut aider sur le sujet
TAG POS=1 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=2 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=3 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=4 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=5 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=6 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=7 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=8 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=9 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
TAG POS=10 TYPE=H3 ATTR=CLASS:txt4_120*
TAG POS=R1 TYPE=* ATTR=* EXTRACT=
TAG POS=R-1 TYPE=A ATTR=HREF:* EXTRACT=HREF
SAVEAS TYPE=EXTRACT FOLDER=* FILE=links_{{!VAR1}}_lemonde.txt
WAIT SECONDS=3
La prochaine étape c'est d'améliorer le script pour ouvrir un prompt et directement demander quel mot clé/expression on souhaite chercher, puis scraper.
Dernière modification par Cherubin (2016-01-06 22:54:16)
🔴 Hors ligne
Merci pour le partage @Cherubin !! Cool que tu aies fini par t'en sortir.
Qu'est-ce qui bloquait finalement ?
Pour ceux qui voudraient faire la même chose sur Zenno, voilà la regex à utiliser :
Dernière modification par Cyd (2016-01-07 05:29:47)
Work Hard In Silence, Let Success Make The Noise !
--> cedricguerin.fr
🔴 Hors ligne
En fait fallait jouer avec les positions relatives d'imacro, les R1, R-1.
Là où je trouve le système con, c'est qu'il a fallu que j'en enchaine deux pour avoir celui que je voulais car je ne sais pas pourquoi mais il saute le premier tag, ce qui m'oblige à revenir en arrière...
Ya pas à dire, avec zenno c'est bien plus simple !
🔴 Hors ligne
Ca me manque quand même les positions relatives d'iMacros ! Merci pour le script & regex !
_________
.
🔴 Hors ligne
🔴 Hors ligne
Ouai imacro c'est trop cool c'est simple et efficace
°¨¨°³º¤£ [ COOLBYTES ] £¤º³°¨¨° - Skype: cb_nalex_levrai
🔴 Hors ligne