Récupération des podcasts de France Musique
Go to file
Yohann Dedy cc4c73e57d README.md 2019-11-29 01:38:15 +01:00
FMScraper Préparatifs scraping des infos de l'émission 2019-11-29 01:13:26 +01:00
README.md README.md 2019-11-29 01:38:15 +01:00
scrapy.cfg first commit 2019-11-26 22:02:40 +01:00

README.md

Scraper des émission de France Musique

Pourquoi

  • Parce que les podcasts n'ont qu'une durée de vie de trois ans (et parfois moins via flux RSS)
  • Les informations complémentaires comme les playlists ou les interprêtes ne sont pas visibles dans le flux RSS
  • Parce qu'à assassiner le service public, certains dirigeants seraient capables de brûler des archives comme ils brûlent déjà des postes par souci de soit disante économie.

À faire/étudier

  • Récupérer les informations de l'émission
  • Importer les informations dans une base de données
  • Mettre à disposition un script pour créer la BDD
  • Automatiser le téléchargement des éléments vers un point donné
  • Récupérer les images illustrant les épisodes