1. Andreas Christoffersen
  2. Politikere i medierne

Overview

HTTPS SSH

How often is certain political figures mentioned in the news?

Keywords: Screenscraping, flask, python URL: Website

(danish text from here on out)

En læringsprojekt i flask.

Relativ simple flask app, som helt basalt gør følgende:

  1. Henter rå html for hver af de fire netaviser (information, berlingske, politiken ong JP).
  2. Finder forekomster af politikernavne/alias'er
  3. Viser antal forekomster på en graf
  4. Gemmer hver forekomst, inkl. kontekst i en mongodatabase

P.t. sker ovenstående een gang i timen. Dette styres via et simpelt cronjob som kalder get_em.py. Nogen forsøger at overbevise mig om at Celery ikke er overkill til det her.

Har du ideer er du velkommen til at tilføje issues, eller ligefrem forke koden og lave en pull request.

License: Open Source - completely free - MIT license. Take it, use it :-)