博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python-第一个scrapy程序
阅读量:3771 次
发布时间:2019-05-22

本文共 950 字,大约阅读时间需要 3 分钟。

scrapy常用指令

在这里插入图片描述

在这里插入图片描述

创建一个Scrapy工程

1.命令行输入该指令

在这里插入图片描述
2.
在这里插入图片描述
3.新建一个爬虫文件demo.py
在这里插入图片描述

import scrapyclass DemoSpider(scrapy.Spider):    name = "demo"    start_urls = ['http://python123.io/ws/demo.html']    def parse(self, response):        fname = response.url.split('/')[-1]        with open(fname, 'wb') as f:            f.write(response.body)        self.log('Save file %s.' % fname)

4.开始执行scrap crawl demo

在这里插入图片描述
这个时候需要切换cmd的目录到新建的python123demo目录下(该目录下有scrap.cfg文件)
在这里插入图片描述
不然会报错:
在这里插入图片描述
5.这个时候会出现
在这里插入图片描述

优化

demo.py

import scrapyclass DemoSpider(scrapy.Spider):    name = "demo"    # 优化区别 start_urls = ['http://python123.io/ws/demo.html']    def start_requests(self): #新增        urls = ['http://python123.io/ws/demo.html']        for url in urls:            yield scrapy.Request(url=url, callback=self.parse)  #可以暂时挂起,下次进入    def parse(self, response):        fname = response.url.split('/')[-1]        with open(fname, 'wb') as f:            f.write(response.body)        self.log('Save file %s.' % fname)

转载地址:http://uyhpn.baihongyu.com/

你可能感兴趣的文章
最小权点覆盖集 与 最大权独立集
查看>>
POJ 2125 Destroying The Graph && Acwing 2325. 有向图破坏(拆点+最小权点覆盖集)
查看>>
计算几何基础知识整理大全 代码模板与证明过程 (直线、向量、多边形、三维计算几何、凸包、半平面交、最小圆覆盖)
查看>>
计算几何之 判断两线段是否相交 代码模板与证明
查看>>
三维计算几何之三维凸包 增量法
查看>>
MySQL变量,存储过程,函数,流程控制详解(小白都能懂哦)
查看>>
9篇小白都能懂系列博客学完MySQL基础
查看>>
还在为Linux入门发愁?
查看>>
如何优雅而又不失内涵的在centos7下安装tree命令
查看>>
彻底掌握Linux文件与目录管理命令?进来看看硬核总结
查看>>
一文搞定Vim/Vi编辑器
查看>>
剑指offer之斐波那契问题(C++/Java双重实现)
查看>>
Linux网络命令
查看>>
一天教会三岁表弟HTML,你值得拥有
查看>>
CSS基础汇总
查看>>
SpringCloud服务注册与发现
查看>>
SpringCloud Stream 消息驱动
查看>>
SpringCloud Sleuth 分布式请求链路
查看>>
SpringCloud Alibaba Nacos 服务注册和配置中心
查看>>
poi读写Excel
查看>>