This website works better with JavaScript
Головна сторінка
Огляд
Довідка
Реєстрація
Увійти
zhiyu
/
zhiyu_content_spider
Слідкувати
6
Зірка
0
Відгалуження
0
Файли
Проблеми
0
Запити на злиття
0
Wiki
内容采集,从各个cp方采集书籍到植宇内容中台
8
Коміти
1
Гілки
0
Релізи
Дерево:
efca3015e0
Гілки
Теги
master
zhiyu_conten...
HTTP
SSH
ZIP
TAR.GZ
zhaoyang
efca3015e0
setting
2 роки тому
content_spider
efca3015e0
setting
2 роки тому
.gitignore
ab0342a55b
spider init
2 роки тому
README.md
ab0342a55b
spider init
2 роки тому
scrapy.cfg
ab0342a55b
spider init
2 роки тому
README.md
采集脚本
cd /home/www/wangdu_spider
7lou采集
全部采集,有去重 scrapy crawl 7lou
部分采集,不去重 scrapy crawl zbone -a bid=xx,xx,xxx
趣阅采集
全部采集,有去重 scrapy crawl shuangduxs
部分采集,不去重 scrapy crawl sdone -a bid=xxx,xxx,xxx