THUDataPiCrawler 简介 本项目由 THU 数据派研究部爬虫&可视化组 负责维护,主要为 THU 数据派研究部提供爬虫技术支持,根据需要从互联网爬取相应的数据。 已经完成 《顶级数据团队建设全景报告(第一版)》职位信息爬取。目前,源代码存放在 THUDataPiCrawler(old version) 中。主要包括对拉勾网、前程无忧等网站中,有关于 “大数据”、“数据分析” 等关键词的职位信息的爬取代码。 正在进行 《顶级数据团队建设全景报告(第二版)》职位信息数据爬取。