热搜：编程 Python Microsoft 编程语言 C++

基于scrapy的redis安装和配置方法

发布时间：2023-04-18 09:40:22 来源：网络

.

远远地眺望，草地上有团团白云在蠕动，原来这是牧场的羊群，一只只白生生的，肥壮可爱，使草原更加生的小鸟儿唧唧喳机勃勃。

在定向爬虫的制作过程中，使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库，它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

以下您可能有感兴趣的文章:

标签： scrapy redis

Python最新文章

python编程-将Python程序转化为可执行程序[整理]

Python交换变量

rhythmbox中文名乱码问题解决方法

python备份文件的脚本

Python 文件操作技巧(File operation) 实例代码分析

Python热点排行

在线教程
开发软件

查看更多软件 

基于scrapy的redis安装和配置方法

为您推荐

Python实现个人微信号自动监控告警的示例

Python的函数如何使用详解

Python标准库os常用函数和属性详解

django 配置阿里云OSS存储media文件的例子

支持python的分布式计算框架Ray详解

Python最新文章