Scraper une valeur

Bonjour,

J’essaie de me concevoir un début de logiciels.
Je voudrai surveiller des valeurs sur internet. Par exemple : des prix, des versions, ou encore des mots.

Ma première étape c’est de capturer la page web.

J’ai tester avec wget mais cela n’a pas été concluant.
J’ai tester avec w3m. Il y a eu du mieux.
Enfin avec lynx c’est bon

lynx -dump -nolist url_qui_m-interesse

Par contre ça me sort un fichier

   VENTE FLASH Plus que 2h 48m et 47s

   299,90 €*149^€90

   Dont 2,00 € d'éco participation
   [ ]

J’aimerai surveiller la valeur 149.
J’ai trouvé une première solution : du grep

grep -oP “299,90\K.*” lynx-test.list

Le rendu n’est pas encore la

 €
 €
 €
 €*149^€90

Pouvez vous m’aider?

Salut,

Tu veux absolument le coder toi-même (peut-être dans un but didactique), ou tu es ouvert à une solution toute faite ? Dans le dernier cas, il n’y a pas longtemps un membre du forum avait suggéré le site https://changemon.com/. J’avais testé et trouvé ça pas mal, pour un scraping rapido.

Edit : dans le premier cas, où tu voudrais le coder toi-même, il existe des modules/frameworks pour te pré-mâcher le travail, j’en connais notamment sous Python.

Bonjour

merci de ta réponse.
Je connais changemon.

Par contre j’ai peur que le service ferme un jour.
C’est pour ca que je me lance dans le dev.

Dans ce cas je ne peux que t’encourager à choisir ton langage de prédilection, et un module/package/framework/… de scraping pour ce langage.

merci beaucoup

Merci seb

j’ai trouver ceci qui correspond à ce que je chercher.

https://korben.info/extraire-donnee-pages-web.html

+1 pour Scrapy, si vous vous débrouillez en Python ;-).

Juste pour info.

Un nouveau projet est arrivé et il est déjà complet pour les débutants.

Il se base sur chromium.

Bref je vous laisse découvrir.