Dit is een scraper voor de website van de Groene Amsterdammer. Met behulp van deze scraper kan een abonnee automatisch de PDF downloaden van de Groene Amsterdammer van deze week.
$ git clone
$ cd GroeneScrapy
$ sudo pip install -r requirements.txt
Als je problemen hebt met het installeren van Scrapy, zie http://doc.scrapy.org/en/0.24/intro/install.html.
Stel de volgende dingen in in GroeneScrapy/settings.py:
GROENE_USERNAMEis je gebruikersnaam (e-mailadres);GROENE_PASSWORDis je wachtwoord;GROENE_PDF_PATHis de directory waar de PDF's worden opgeslagen (standaard:GroenePDF).
Gebruik dit in de root van de repository.
$ scrapy crawl pdfspider