创建自己的管道
使用 scrapy startproject myproject
创建 scrapy 项目时,你会发现已有一个 pipelines.py
文件可用于创建自己的管道。在此文件中创建管道不是强制性的,但这是一种很好的做法。我们将解释如何使用 pipelines.py
文件创建管道:
pipelines.py
class MyPipeline(object):
def process_item(self, item, spider):
# process your `item` here
return item
现在要启用它,你需要指定它将在你的设置中使用。转到你的 settings.py
文件并搜索(或添加)ITEM_PIPELINES
变量。使用管道类的路径及其优先于其他管道的路径更新它:
settings.py
ITEM_PIPELINES = {
'myproject.pipelines.MyPipeline': 300,
}
现在,你的蜘蛛返回的每个项目都将通过此管道。