Scrapy-Redis分布式爬虫小白问题记录
发布日期:2022-03-30 18:18:25
浏览次数:55
分类:博客文章
本文共 657 字,大约阅读时间需要 2 分钟。
1、首先我是将Redis装在了阿里云的一台CentOS6.8上,使用ps -ef|grep redis查看是否成功运行
2、CentOS安装scrapy请参考 http://blog.csdn.net/u012375924/article/details/51244485
3、setting.py里 REDIS_URL 的配置如下
master端 :
REDIS_HOST = 'localhost'REDIS_PORT = 6379
slave端,没有账号密码直接填ip就可以 :
REDIS_URL = 'redis://user:pass@hostname:6379'
这个master端的意思如果你需要在安装redis的机器上也跑爬虫的话就这样配置,不过后面的写法会覆盖前面
4、CentOS默认安装的是Python2,需要升级的同学请看 http://blog.csdn.net/hobohero/article/details/54381475
5、连接Redis,输入start_url启动爬虫
redis-cli -h 192.168.1.112 -p 6379
192.168.1.112:6379>lpush myspider:start_urls http://xxx.com/xxx
注意这里的 myspider:start_urls 是你爬虫的redis_key,如果不设置会有默认值,如果你在lpush的时候写错,爬虫就获取不到start_url,爬虫也就一直在等待没有响应
转载地址:https://www.cnblogs.com/code0001/p/7442406.html 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
留言是一种美德,欢迎回访!
[***.207.175.100]2024年04月17日 15时59分23秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
phpize
2019-04-27
PHP安装eAccelerator
2019-04-27
PHP新的垃圾回收机制:Zend GC详解
2019-04-27
linux上使用strace查看C语言级别的php源码【一种方法】
2019-04-27
ACCEPT()和ACCEPT4()
2019-04-27
php内核探索方法与资源
2019-04-27
PHP安装扩展mcrypt以及相关依赖项 【PHP安装PECL扩展的方法】
2019-04-27
Javascript到PHP加密通讯的简单实现
2019-04-27
德国SNS交友/视频网站Poppen.de的技术架构分享
2019-04-27
UNIX环境编程
2019-04-27
一笔画问题【数据结构-图论】
2019-04-27
红黑树
2019-04-27
安装多个gcc
2019-04-27
Linux0.01内核根目录Makefile注释
2019-04-27
【CSDN2012年度博客之星】需要您的一票,感谢大家的支持
2019-04-27
PHP对于浮点型的数据需要用不同的方法去解决
2019-04-27
Tokyo Cabinet 安装
2019-04-27
Flink在美团的应用与实践听课笔记
2019-04-27
Java多线程的11种创建方式以及纠正网上流传很久的一个谬误
2019-04-27
JDK源码研究Jstack,JMap,threaddump,dumpheap的原理
2019-04-27