内容采集，从各个cp方采集书籍到植宇内容中台

tgz a9faf878b9 README.md		2 anos atrás
content_spider	cdc8eb06a5 liuyue	2 anos atrás
.gitignore	ab0342a55b spider init	2 anos atrás
README.md	a9faf878b9 README.md	2 anos atrás
scrapy.cfg	ab0342a55b spider init	2 anos atrás

采集脚本

cd /home/www/wangdu_spider

7lou采集

全部采集,有去重 scrapy crawl 7lou
部分采集,不去重 scrapy crawl zbone -a bid=xx,xx,xxx

趣阅采集

全部采集,有去重 scrapy crawl shuangduxs
部分采集,不去重 scrapy crawl sdone -a bid=xxx,xxx,xxx

百川采集

scrapy crawl baichuanzw

wangyou忘忧:

文件目录: content_spider/spiders/wangyou 采集命令: scrapy crawl wangyou 更新命令: scrapy crawl wangyouupdate 更新完结状态: scrapy crawl wangyoubookinfo 覆盖命令： scrapy crawl wangyoufix -a bid=bid1,bid2

feiyuyuedu飞鱼阅读:

文件目录: content_spider/spiders/feiyuyuedu 采集命令: scrapy crawl feiyuyuedu 更新命令: scrapy crawl feiyuyueduupdate 更新完结状态: scrapy crawl feiyuyuedubookinfo 覆盖命令： scrapy crawl feiyuyuedufix -a bid=bid1,bid2

## liuyue六月: 文件目录: content_spider/spiders/liuyue 采集命令: scrapy crawl liuyue 更新命令: scrapy crawl liuyueupdate 更新完结状态: scrapy crawl liuyuebookinfo 覆盖命令： scrapy crawl liuyuefix -a bid=bid1,bid2

README.md