Python-scrapy爬虫

发表于2023-06-28更新于2025-03-13

字数总计:63阅读时长:1分钟阅读量: 哈尔滨

编程分享

Python-scrapy爬虫

郭顺发2023-06-282025-03-13

scrapy API | 开源project-github

1. demo

import scrapy
class QuotesSpider(scrapy.Spider):
    name = 'quotes'    start_urls = [
        'http://quotes.toscrape.com/tag/humor/',
    ]
    def parse(self, response):
        for quote in response.css('div.quote'):
            yield {
                'author': quote.xpath('span/small/text()').get(),
                'text': quote.css('span.text::text').get(),
            }