shot-scraper : un outil pour sauvegarder des pages web
Posté : 29 déc. 2022 15:08
Bien souvent, lorsque l'on trouve une information précieuse sur le web, on sauvegarde le lien vers le site contenant l'info dans ses favoris pour pouvoir y revenir quand ce sera nécessaire.
C'est très pratique et rapide, mais ... parfois, avec le temps, le site disparaît, change de nom, le webmaster supprime l'article, etc. bref, on a perdu l'info cruciale que l'on souhaitait conserver
Une solution consiste à faire une copie des pages web que l'on veut sauvegarder.
J'utilise shot-scraper qui fait simplement et consciencieusement le job.
Voici le lien vers le site : https://shot-scraper.datasette.io/en/stable/index.html
Je vous laisse découvrir les explications et la doc.
Pour un démarrage rapide, l'installation : puis
et un exemple d'utilisation qui donne en réponse :
avec un joli fichier de toute la première page de PiBlog.
C'est très pratique et rapide, mais ... parfois, avec le temps, le site disparaît, change de nom, le webmaster supprime l'article, etc. bref, on a perdu l'info cruciale que l'on souhaitait conserver
Une solution consiste à faire une copie des pages web que l'on veut sauvegarder.
J'utilise shot-scraper qui fait simplement et consciencieusement le job.
Voici le lien vers le site : https://shot-scraper.datasette.io/en/stable/index.html
Je vous laisse découvrir les explications et la doc.
Pour un démarrage rapide, l'installation :
Code : Tout sélectionner
pip install shot-scraperCode : Tout sélectionner
shot-scraper installCode : Tout sélectionner
shot-scraper piblog.wikaba.comCode : Tout sélectionner
Screenshot of 'http://piblog.wikaba.com' written to 'piblog-wikaba-com.png'