Scrapy框架可以通过设置DOWNLOAD_DELAY参数来控制下载延迟,即每次请求之间的时间间隔。您可以在settings.py文件中进行设置,示例如下:
DOWNLOAD_DELAY = 2 # 设置下载延迟为2秒
您还可以通过在Spider类中设置download_delay属性来实现相同的效果,示例如下:
class MySpider(scrapy.Spider): name = 'my_spider' start_urls = ['http://example.com'] download_delay = 2 # 设置下载延迟为2秒 def parse(self, response): # 爬虫逻辑代码
设置下载延迟可以有效地降低对目标网站的访问频率,避免对服务器造成过大的压力,也可以模拟人类的浏览行为,减少被反爬虫机制封锁的风险。