scrapy分布式爬虫编写流程
发布日期:2021-05-07 03:43:25 浏览次数:13 分类:精选文章

本文共 154 字,大约阅读时间需要 1 分钟。

  1. 编写普通爬虫
    创建项目
    明确目标
    创建爬虫
    保存内容
  2. 改成分布式爬虫
    1. 改造爬虫
      1. 导入scrapy_redis中的分布式爬虫类
      2. 继承类
      3. 注销 start_url & allowed-domains
      4. 设置redis_key获取start_url
      5. 设置__init__ 获取允许的域
    2. 改造配置文件
      copy配置参数
上一篇:【第一周】第 3 节:Python基本数据类型和结构
下一篇:scrapy中间件的使用

发表评论

最新留言

做的很好,不错不错
[***.243.131.199]2025年04月06日 17时17分15秒